网易首页 > 网易号 > 正文 申请入驻

LLM为何频频翻车算术题?最新研究追踪单个神经元,「大脑短路」才是根源

0
分享至


新智元报道

编辑:peter东 乔杨

【新智元导读】大模型在数学问题上的表现不佳,原因在于采取启发式算法进行数学运算的,通过定位到多层感知机(MLP)中的单个神经元,可以对进行数学运算的具体过程进行解释。

由于缺少对运行逻辑的解释,大模型一向被人称为「黑箱」,但近来的不少研究已能够在单个神经元层面上解释大模型的运行机制。

例如Claude在2023年发表的一项研究,将大模型中大约500个神经元分解成约4000个可解释特征。

而10月28日的一项研究,以算术推理作为典型任务,借鉴类似的研究方法,确定了大模型中的一个模型子集,能解释模型大部分的基本算术逻辑行为。


论文地址:https://arxiv.org/abs/2410.21272

该研究首先定位了Llama3-8B/70B, Pythia-6.9B及GPT-J四个模型中负责算术计算的模型子集。

如图1所示,少数注意力头对大模型面对算术问题的正确率有显著影响。第一个 MLP(多层感知机) 明显影响操作数和操作符位置,而中间层和后期层的 MLP 将token信息投影到最后位置,提升正确答案的出现概率。


图1:Llama3-8B中发现算术相关的模型子集

该研究聚焦于单个神经元层面,发现了一组重要的神经元,它们实现了简单的启发式算法。只需要关注特定的极少量神经元,就能正确预测大模型进行算术运算的结果(图2)。


图2:大模型 中每层神经元中只需要关注1.5%的少数子集,就能预测大模型进行四则运算的结果

举个例子:当输入的提示词为“ 226−68= ”时,神经元24|12439在结果介于150和180的减法提示下显示出高激活值,可被视为一个启发式算法。而每个启发式算法识别一个数值输入模式,并输出相应的答案。

具体可分为两种不同的激活模式:第一种直接启发式指的是在某些神经元中,激活模式取决于两个操作数,值向量编码了算术计算的预期结果(图 3b,c)。

第二种间接激活模式取决于单个操作数对应的神经元中,值向量通常编码下游处理的特征,而不是直接的计算结果(图3a)。


图3:启发式方法的可视化

神经元和运算的因果联系

该如何确认特定神经元和相关数学运算之间存在因果关系?一种常见的方法是消融分析,即将大模型大模型中特定的神经元敲除,看看模型的效果会有何改变,结果如图4所示。


图4:四则运算中敲除对应的算术神经元后模型的性能对比

去掉了对应神经元后,模型的运算准确性无论加减乘除都显著下降。

不仅如此,相比去除特定算术神经元时造成的性能下降,可以发现,去除随机神经元的影响相对较小,而且这种效应在模型8B和70B不同参数量中普遍存在。


图5:敲除与算术相关的启发式算法的神经元(实线)相比与算术无关的相同数量的随机神经元(虚线)

上述结果表明,可仅根据其相关启发式算法来识别对特定对大模型进行算术重要的神经元,也证明了属于几个启发式算法的神经元与提示正确完成之间的因果关系。

此外,该结果还支持了启发式算法集合的主张:即每个启发式算法仅略微提高正确答案的几率,但它们结合在一起,使得大模型以高概率产生算术题的正确答案。

大模型为何做不对算术题

Llama3-8B模型无法可靠地对每道算术题时给出正确的回答。基于启发式规则,该研究阐述了模型为何会做错,可能的机制共有两种:

第一,由于参数量的限制,大模型缺乏足够的算术神经元,无法针对每一种情况都给出应对。

第二种原因是,可能存在回忆不完整的情况,比如某个启发式规则对应的神经元没有在运算时被触发。


图6:随机抽取了50个正确完成和50个错误完成的算术题目,考察大模型中被正确和错误激活的算术神经元个数

如图6所示,在大模型回答正确及错误时,激活的算术神经元个数不存在差异,这不支持前述的第一种算术神经元个数不足的假设。

然而,在大模型回答正确的情况下,更多比例的正确神经元被激活了,而回答错误的案例中,应当被激活的神经元激活概率反而较小。

这意味着大模型在特定算术题上失败的主要原因是对能得出正确答案的神经元缺少泛化能力,而不是算术神经元的数量不足。

「算术神经元」何时诞生

由于其训练检查点可供公众获取,该研究采用Pythia-6.9B来考察大模型过程中算术神经元的出现阶段。

结果显示,大模型在训练过程中逐渐发展其最终的算术启发式机制,且算术神经元在模型训练早期就已出现。


图7 :启发式的算术神经元的百分比随着训练增加

在模型训练的不同阶段,移除特定的启发式神经元会大幅降低模型在所有训练检查点的准确性,这表明算术准确性主要来自启发式,即使在早期阶段也是如此。算术启发式神经元与大模型算术能力的因果关系在整个训练过程中都存在。


图8:不同阶段敲除算术神经元对大模型进行算术运算准确性的影响

结论

理解大模型如何进行数学运算,不仅可以打开大模型内部运行的黑箱,解释它们为何在简单的数学题上翻车,例如最著名的「9.11和9.8哪个大」。

这项研究告诉我们,并不是因为大模型缺少相关训练,而是激活了错误的启发式神经元,例如将这个问题当成了询问哪个版本更大。

理解了大模型的算术运算,是依赖于启发式方法集,而非单纯的依靠记忆(背题目)或学会规则,这表明提高大模型的数学能力可能需要训练和架构的根本性改变,而不是像激活引导这样的小修小补。

对训练过程的分析结果指出,大模型在训练早期就学会了这些启发式方法,并随时间推移逐渐强化。这可能会导致模型过度拟合到早期的简单策略,因此可作为之后优化方向的参考。

参考资料:

https://arxiv.org/abs/2410.21272

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
U19国青vs吉尔吉斯斯坦U19:毛伟杰、杜月徵首发,朱鹏宇替补

U19国青vs吉尔吉斯斯坦U19:毛伟杰、杜月徵首发,朱鹏宇替补

懂球帝
2024-11-19 17:51:33
辽宁通报5起违规吃喝典型问题

辽宁通报5起违规吃喝典型问题

封面新闻
2024-11-19 17:07:08
《推背图》预言:2025 乙巳之变,青龙化蛇,三人大旺三人劫难

《推背图》预言:2025 乙巳之变,青龙化蛇,三人大旺三人劫难

心灵短笛
2024-11-18 16:57:50
大型社死现场!男子睡午觉盖6层被子不料被“封印”,惊动消防!

大型社死现场!男子睡午觉盖6层被子不料被“封印”,惊动消防!

极目新闻
2024-11-19 09:31:52
晚上18点,央视转播U19熊猫杯,中国队冲冠军,球迷要注意一变化

晚上18点,央视转播U19熊猫杯,中国队冲冠军,球迷要注意一变化

极度说球
2024-11-19 09:42:37
特朗普团队放大招!这次90%要被遣返,这些人的绿卡要吹了!

特朗普团队放大招!这次90%要被遣返,这些人的绿卡要吹了!

美移移民小美
2024-11-19 11:28:19
特朗普确认上任后“第一把火”要这样烧

特朗普确认上任后“第一把火”要这样烧

大象新闻
2024-11-19 17:42:09
姜还是老的辣,特朗普给马斯克下达任命书,想不到背后却留了一手

姜还是老的辣,特朗普给马斯克下达任命书,想不到背后却留了一手

蓝色海边
2024-11-19 00:45:59
乌克兰公布射程半径

乌克兰公布射程半径

那山星火
2024-11-19 08:36:37
费德勒长文致敬纳达尔:你让整个网坛骄傲,我是你的粉丝

费德勒长文致敬纳达尔:你让整个网坛骄傲,我是你的粉丝

雷速体育
2024-11-19 16:26:10
董洁晒板栗红烧肉,百万网友围观,评论区爆了,网友:好喜欢吃!

董洁晒板栗红烧肉,百万网友围观,评论区爆了,网友:好喜欢吃!

阿龙美食记
2024-11-15 15:35:35
“不给钱,就要付出代价”,古特雷斯当着世界各国领导人的面放话

“不给钱,就要付出代价”,古特雷斯当着世界各国领导人的面放话

王大健美食日常
2024-11-19 17:47:56
斯诺克最新战报!白雨露今日首胜,中国军团不败,4强专业户反超

斯诺克最新战报!白雨露今日首胜,中国军团不败,4强专业户反超

刘姚尧的文字城堡
2024-11-19 18:39:16
最高检要求依法从重从严从快惩治重大恶性犯罪

最高检要求依法从重从严从快惩治重大恶性犯罪

最高人民检察院
2024-11-19 14:09:31
周侗十个传人的先后顺序:史文恭第二,林冲第三,岳飞是关门弟子

周侗十个传人的先后顺序:史文恭第二,林冲第三,岳飞是关门弟子

小啾咪侃侃史
2024-11-19 07:05:18
斯诺克最新战报!吴宜泽王雨晨3-1,4强专业户逆转,4冠王翻车?

斯诺克最新战报!吴宜泽王雨晨3-1,4强专业户逆转,4冠王翻车?

刘姚尧的文字城堡
2024-11-19 18:56:31
大S请求北京法庭判张兰进监狱3年?曾设计制造车祸给汪小菲?

大S请求北京法庭判张兰进监狱3年?曾设计制造车祸给汪小菲?

圈里的甜橙子
2024-11-19 15:40:02
中国大使馆迁新址,做墙体检查时,发现35枚“中国制造”的窃听器

中国大使馆迁新址,做墙体检查时,发现35枚“中国制造”的窃听器

华人星光
2024-11-13 12:51:33
11月19日俄乌最新:谎报军情

11月19日俄乌最新:谎报军情

西楼饮月
2024-11-19 20:21:03
公示中,浙江将新设一所大学

公示中,浙江将新设一所大学

中国远程教育杂志
2024-11-19 17:51:07
2024-11-19 21:27:00
新智元
新智元
AI产业主平台领航智能+时代
11762文章数 65671关注度
往期回顾 全部

科技要闻

小鹏三季度营收101亿元,毛利率15.3%

头条要闻

乌军使用6枚美制导弹袭击俄本土目标 俄国防部发声

头条要闻

乌军使用6枚美制导弹袭击俄本土目标 俄国防部发声

体育要闻

15胜0负的骑士,真的在模仿勇士

娱乐要闻

金鸡奖颁奖,流量至上,都在座位表上体现了

财经要闻

专家称我国还缺1亿套保障房

汽车要闻

后排够大 智能化提升 全新探岳L是你的菜么?

态度原创

家居
数码
教育
公开课
军事航空

家居要闻

纯白极简 现代简约

数码要闻

漫步者蓝牙监听音箱 MR3BT 发售,499 元

教育要闻

谈谈心里话 子女一定要告诉父母的八句话

公开课

一块玻璃,如何改变人类世界?

军事要闻

印度首枚高超导弹有些与众不同

无障碍浏览 进入关怀版