网易首页 > 网易号 > 正文 申请入驻

学术分享丨精度与通用性不可兼得,北大华为理论证明低精度下scaling law难以实现

0
分享至

转自 机器之心

本工作来自北京大学智能学院王立威、贺笛老师课题组与华为诺亚方舟实验室李震国、孙嘉城研究员。作者包括智能学院博士生冯古豪、古云天、罗胜杰;信息科学技术学院本科生杨铠、艾心玥。

大模型量化通过将模型参数从较高的精度(如 bfoat16)压缩到低精度(如 int8 或 int4)来降低模型推理的开销,提高模型推理的速度。在大语言模型的实际部署中,量化技术能够显著提高大语言模型推理的效率。但近日,来自哈佛大学,MIT,CMU,斯坦福大学和 Databricks 的研究团队通过大量实验总结出了大语言模型关于精度的 Scaling Law,实验发现

无独有偶,来自北大和华为的研究团队近期则从理论角度研究了量化对于大模型通用性的影响。具体而言,研究者关注了量化对于大模型数学推理能力的影响。其研究理论表明足够的模型精度是大模型解决基本数学任务的重要前提,而量化会大大降低大模型在基本数学任务上的表现,甚至提升足够参数量也无法弥补。


论文链接:https://arxiv.org/abs/2410.13857

量化降低了模型的基本数学能力

数学推理能力是大语言模型的一项重要能力,也是大语言模型走向通用人工智能的关键能力之一。然而,相较于经典的自然语言处理任务,数学推理往往需要严格的逻辑和准确的中间结果。在各种各样的数学推理任务中,算术能力是大语言模型解决各类复杂的数学问题的基础。更需要注意的是,大模型在处理数值的时候,会将一个数 “切分” 成一段一段的数字,例如:数字 1234.5678 在大模型中可能被编码为 “12” “34” “.” “56” “78”,如此编码后的信息是否可以被正确理解进而完成算术任务也是一个疑问。

本工作研究者以基本的算术能力为切入点,研究了不同精度的 Transformer 在解决基本数学任务上的能力差异。下图展示了一些相应的例子。为了反映大模型对长数字的实际解码方式,在这些任务中,运算数中的每一数位均以一个独立的 token 作为大模型的输入,大模型的输出也是从高位往低位逐数位地输出。


在本工作中,研究者分别使用对数精度 Transformer 和常数精度 Transformer 的理论模型来刻画标准精度大语言模型和量化后的低精度大语言模型。其中,对数精度指的是 Transformer 内部单个的神经元至多能够存储由 O(logn) 比特表示的实数,这里 n 指的是模型所能处理的最大序列长度。 而常数精度指的是 Transformer 内部单个的神经元只能够存储至多 c 比特表示的实数,这里的 c 是一个与序列长度无关的小常数。 这里,实数可以由定点数或者浮点数格式表示。

当前主流的大语言模型,包括 GPT 系列、Claude 系列或者开源的 LLAMA 系列,能够处理的最大序列长度一般在 4k 到 128k 不等。在这样的序列规模下,对数精度和常数精度较好地刻画了量化前后的精度差异。

之前的研究结果表明,标准精度 Transformer 具备解决这些基本算术任务的能力。这表明合适的精度能够保证大模型具有解决相应基本数学任务的能力。然而本工作理论证明当大语言模型经过量化、精度降低后,模型的能力受到了显著的影响。当使用低精度模型时,模型在多整数相加、整数相乘的任务上需要超多项式的模型参数量。这表明当精度不足时,即便充分增大模型尺寸 (scaling parameters),其也难以获得完成这些基本算术任务的能力。

下表总结了相应的理论结果,表明了不同精度下各基本算术任务所需模型宽度的理论结果。其中,蓝色代表模型可以在较小的尺寸内解决相应的任务,而红色代表模型无法在可接受的尺寸内解决相应的问题。可以发现,标准精度的大语言模型能够轻松解决算术的任务,然而经过量化后低精度的大模型,在解决基本算术任务上的能力出现了明显的缺失。


实验验证

除了理论推导,研究者进行了大量实验来验证理论结果。研究者在算术运算的数据集上训练了一系列小模型,在小模型上的训练结果表明,在多整数相加和整数相乘任务上,提升精度能够使相同尺寸的模型解决更大规模的问题。


此外,研究者还在 LLaMA3.1-8B 模型上进一步进行了一些系列实验,实验结果同样证实,在使用 int4 进行量化之后,在大语言模型各基本算术任务上的表现均出现了相应的下降。对于最为困难的整数相乘任务,其性能下降最为明显。


总而言之,模型的量化压缩会明显损害大语言模型在数学推理问题上的性能,为了解决复杂的数学推理问题,足够的精度是必不可少的。这也说明,在实际部署大语言模型的过程中,不能够一味追求量化带来的效率,也要考虑到应用场景,采用合适的部署策略,同时兼顾大语言模型的实际性能和运行效率。

【免责声明】转载出于非商业性的教育和科研目的,只为学术新闻信息的传播,版权归原作者所有,如有侵权请立即与我们联系,我们将及时删除。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
场均轰28+8+2!又兑现乔丹天赋,你再超神下去,火箭能直接争冠了

场均轰28+8+2!又兑现乔丹天赋,你再超神下去,火箭能直接争冠了

巴叔GO聊体育
2025-01-10 14:51:36
布林肯留下四个字,尹锡悦妻子罪行被确定,有人怀疑总统已跑路

布林肯留下四个字,尹锡悦妻子罪行被确定,有人怀疑总统已跑路

莫问先生
2025-01-10 14:30:41
铲除妙瓦底需要什么:能击败六千民团的军队和稳定的缅甸政府

铲除妙瓦底需要什么:能击败六千民团的军队和稳定的缅甸政府

小宇宙双色球
2025-01-09 14:07:10
特鲁多参加卡特葬礼!座位被安排在爱德华王子旁边,这回没带女儿

特鲁多参加卡特葬礼!座位被安排在爱德华王子旁边,这回没带女儿

老鹈爱历史
2025-01-10 11:46:54
突发!一飞机降落时爆炸

突发!一飞机降落时爆炸

FM93浙江交通之声
2025-01-10 08:11:04
年薪1500万!拜仁左路飞翼将续约留队 皇马无限接近却空欢喜一场

年薪1500万!拜仁左路飞翼将续约留队 皇马无限接近却空欢喜一场

雪狼侃体育
2025-01-10 15:16:20
燕冬萍离婚案持续发酵!女主私生活被扒出,终是老实人扛下了所有

燕冬萍离婚案持续发酵!女主私生活被扒出,终是老实人扛下了所有

小淇言说
2025-01-09 09:16:05
消息已久的“疯狂小杨哥”传来最新动向,昔日假茅台事件爆发,“疯狂小杨哥”及三只羊等被起诉,月饼事件之后究竟还能否复播?

消息已久的“疯狂小杨哥”传来最新动向,昔日假茅台事件爆发,“疯狂小杨哥”及三只羊等被起诉,月饼事件之后究竟还能否复播?

金融界
2025-01-09 19:42:54
证监会“亡羊补牢”!1月10日,今日爆出的四大消息全面发酵!

证监会“亡羊补牢”!1月10日,今日爆出的四大消息全面发酵!

风口招财猪
2025-01-10 07:39:51
新骗局来了:既不需要转账,也不需要输密码,骗子就能轻松“得手”

新骗局来了:既不需要转账,也不需要输密码,骗子就能轻松“得手”

星光历史
2025-01-09 17:56:08
不排除入侵!特朗普“开疆”又加一块地,直接要了北约的命

不排除入侵!特朗普“开疆”又加一块地,直接要了北约的命

允华说
2025-01-10 14:52:09
皇马3-0验出争冠真核!21岁巨星爆发:12场造13球,还激活姆巴佩

皇马3-0验出争冠真核!21岁巨星爆发:12场造13球,还激活姆巴佩

球场没跑道
2025-01-10 08:03:53
“从头再来”!崔永熙晒出一张自己烫头的照片:新的开始

“从头再来”!崔永熙晒出一张自己烫头的照片:新的开始

直播吧
2025-01-10 08:33:49
摊牌了,不装了!巴特勒正式通知全联盟!湖人老板脸彻底黑了

摊牌了,不装了!巴特勒正式通知全联盟!湖人老板脸彻底黑了

毒舌NBA
2025-01-10 10:19:15
美国官员都惊呆啦!乌克兰F16飞行员大显神威,空战中创世界第一

美国官员都惊呆啦!乌克兰F16飞行员大显神威,空战中创世界第一

国际情爆猿
2025-01-08 00:01:18
稳如泰山!哈克斯关键三分杀死比赛 全场11中7贡献20分7板7助2断

稳如泰山!哈克斯关键三分杀死比赛 全场11中7贡献20分7板7助2断

直播吧
2025-01-10 12:36:32
被烧怕了?年轻车主重新选择传统大厂,兜底安全才能放心出行

被烧怕了?年轻车主重新选择传统大厂,兜底安全才能放心出行

汽场汽车APP
2025-01-08 14:29:25
“火再不灭,洛杉矶要烧没了”

“火再不灭,洛杉矶要烧没了”

每日经济新闻
2025-01-10 14:13:10
建议:不要和任何人说太多话

建议:不要和任何人说太多话

洞读君
2025-01-09 11:45:34
陕西一女子晨跑时失踪,7年后才被发现已遇害,真凶身份令人意外

陕西一女子晨跑时失踪,7年后才被发现已遇害,真凶身份令人意外

五元讲堂
2025-01-08 16:21:05
2025-01-10 16:12:49
中国人工智能学会
中国人工智能学会
中国人工智能学会网易官方账号
3112文章数 1465关注度
往期回顾 全部

科技要闻

王啸:我看好应用层,一直没投基础大模型

头条要闻

韩国总统警卫处处长朴钟俊递交辞呈

头条要闻

韩国总统警卫处处长朴钟俊递交辞呈

体育要闻

骑士VS雷霆,这是真正的高水平

娱乐要闻

好消息,王星10号返回中国!

财经要闻

财政部:更加积极的财政政策可期

汽车要闻

10万元级无图智驾 悦也PLUS全路况实测

态度原创

健康
家居
艺术
手机
教育

抑郁症患者称好的“乌托邦”宝地

家居要闻

深浅搭配 放大视觉空间

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

手机要闻

OPPO Find N5外观曝光:用上钛材质,厚度低于9.2mm

教育要闻

小升初附加题,难倒尖子生,长方形面积为120,求阴影面积

无障碍浏览 进入关怀版