北大人工智慧研究院,院长办公室。
朱宋纯教授正戴着眼镜,审阅着一份关于「通用人工智慧(AGI)」的战略报告。作为享誉全球的计算机视觉与认知科学专家,他回国后一直致力于推动华国原创AI理论的发展。
「叮咚。」
邮箱提示音响起。
朱宋纯扫了一眼屏幕。
【发件人:徐辰(数学科学学院)】
【主题:关于大模型逻辑推理能力的一点思考(附论文初稿)】
「徐辰?」
朱宋纯放下手中的报告,眼中闪过一丝好奇。
「原来刚才张伟平特意发微信来打招呼的就是他啊。这小子不是搞数论的吗?怎麽突然跨界搞起AI来了?」
徐辰这个名字,最近在北大可是如雷贯耳。数院那个搞定哥德巴赫猜想的大一新生,连他这个外院的人都听说了。
带着一丝疑惑,他点开了邮件。
「朱老师您好,我是数院的徐辰。最近闲暇之馀,我对大语言模型的逻辑推理问题做了一些研究,提出了一种基于几何嵌入的新方法。考虑到该技术的敏感性,特请您指正……」
「闲暇之馀?」朱宋纯笑了笑,「现在的年轻人,口气倒是不小。」
他随手点开了附件里的PDF。
映入眼帘的第一个标题,就让他愣了一下。
《Logic Is Also You Need》
「嚯,这标题,够狂的啊。」
朱宋纯挑了挑眉。
在AI界,虽然起标题向来比较随意,什麽「YOLO」丶「BERT」满天飞。
但敢直接对标谷歌那篇奠基之作《Attention Is All You Need》的,要麽是哗众取宠的水文,要麽……就是真的觉得自己搞出了能与之比肩的颠覆性成果。
「初生牛犊不怕虎。」
朱宋纯心里并没有太当回事。每年都有无数这种「标题党」论文,声称拳打GPT,脚踢Transformer,结果打开一看,全是些微创新或者缝合怪。
……
他带着几分审视,翻到了摘要和引言部分。
「符号逻辑推理模块(SLRM)……将一阶谓词逻辑引入Transformer……」
看到这里,朱宋纯的眉头微微皱了起来,眼中闪过一丝失望。
「又是符号AI的老路子吗?」
作为业内泰斗,他太清楚符号主义的弊端了。
上世纪的专家系统就是符号AI的巅峰,逻辑严密,可解释性强。但它有一个致命的死穴——「符号落地问题」。符号是离散的丶刚性的,而现实世界是连续的丶模糊的。
更要命的是,符号逻辑是不可微的。这意味着它无法像神经网络那样,通过「梯度下降」算法进行大规模的自我学习和训练。
「想把刚性的逻辑规则,硬生生嫁接到柔性的神经网络上,这就像是想把齿轮装进水流里,只会卡死。」
朱宋纯心里暗叹,觉得这个数学天才可能在工程上还是太天真了,低估了「神经-符号」融合的难度。
「年轻人有想法是好的,但这个问题困扰了学界几十年,哪有那麽容易……」
……
朱宋纯带着一丝审视,继续往下看。
然而,当他耐着性子翻到第二页,看到那个复杂的「Gumbel-Box」几何模型定义时,他的瞳孔猛地收缩了一下。
「等等……」
「这是……?」