网易首页

无障碍浏览进入关怀版

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

谷歌揭秘大模型不会数r原因：嵌入维度是关键，不止分词器问题

2024-09-04 20:40:45　来源: 量子位

上海举报

0

分享至

克雷西发自凹非寺
量子位 | 公众号 QbitAI

大模型做奥赛题游刃有余，简单的数数却屡屡翻车的原因找到了。

谷歌的一项新研究，发现大模型不会数数的原因，并不是简单的tokenizer所致，而是没有足够的空间来存储用于计数的向量。

数出一段话中某个单词出现的次数，这样简单的任务可以难倒许多大模型，GPT-4o、Claude 3.5也无法幸免。

如果再进一步，想要找到出现频率最高的一个词，更是难如登天，即便能蒙对给出的具体数量也是错的。

有人认为是词汇的token化导致了大模型看到的“词”和我们的看法不一致，但论文表明，实际情况并不是这么简单。

想数清单词，嵌入维度要够大

Transformer的计数能力与其嵌入维度d和词汇量m（指词汇表中词的数量，非序列长度）的关系密切相关。

详细的原因，就涉及到了Transformer统计词频时的机制。

Transformer通过一种特殊的嵌入方式，利用嵌入空间的线性结构，巧妙地将计数问题转化为了向量加法。

具体说是将每个词映射到一个独特的正交向量上，在这种表示下，词频可以通过对这些正交向量求和来简单地计算。

然而，这种机制的局限性在于，它要求词汇表中的每个词都有一个独立的正交向量表示，因此嵌入维度必须大于词汇量。

嵌入维度不足时，词向量就无法保持正交性，词频的线性叠加也就无法实现了。

此时Transformer要实现计数，可以通过注意力机制（CountAttend）来实现，但需要一个随序列长度n线性增长的大型“逆转MLP”层。

具体来说，模型首先通过注意力赋予被查询词较大的权重，再利用位置编码将注意力权重提取到值向量的最后一个元素，这个元素实际记录了被查询词的出现频率的倒数。

这意味着，模型需要一个大小为O(n)的MLP层来计算1/x函数（x为某个词出现的次数）。

但进一步分析表明，任何常数层ReLU网络都无法在o(n)的神经元数量下逼近1/x函数。

因此，对于固定规模的Transformer，这种方案无法推广到任意长度的序列。当序列长度超出训练集长度时，模型的计数能力会急剧恶化。

长度非主要因素，词汇表中数量是关键

为了验证这一结论，作者一共进行了两个实验。

第一个实验，是在一个从头开始训练的Transformer模型上进行的，具体有关参数如下：

使用一个由两个Transformer层、四个注意力头组成的标准模型；
嵌入维度d的取值范围为8到128；
对每个固定的d，词汇量m从5到150变化，分别测试20个不同的值；
模型使用Adam优化器从零开始训练，批量大小为16，学习率为10^-4，训练10万步。

训练和评测数据通过随机采样生成。首先从大小为m的词汇表中均匀采样n个词，构成一个长度为n的序列。

序列长度n设置为n=10m，平均每个词出现的次数固定为10次，一共使用了1600个样本进行测试。

作者发现，随着词汇量的增加，模型的计数准确率呈阶梯状下降，临界点恰好出现在词汇量超过嵌入维度的时刻。

为了进一步量化模型的计数能力，作者定义了一个指标m_thr，表示模型的计数准确率下降到80%时的临界词汇量。

直观地说，m_thr反映了在给定嵌入维度下，模型可以“承受”的最大词汇量，m_thr越大说明模型的计数能力越强。

结果显示，对于计数（QC）和找出最高频词（MFC）的任务，m_thr都随嵌入维度d的增大而近似线性增长。

第二个实验则是在预训练的Gemini 1.5模型上开展，在这个实验中，作者更关注词汇量对计数能力的影响。

他们设计了一系列计数任务，每个任务使用不同大小的词汇表，并把每个词在序列中出现的平均次数固定。

这意味着，在实验组当中，词汇量越大，序列长度也就越长。

作为对照，作者还设置了一个“Binary Baseline”，词汇表中只有固定为两个词，但序列长度与主实验组相同。

这样一来，就可以判断出带来模型计数误差的究竟是词汇量还是序列长度。

实验结果显示，随着词汇量的增加，Gemini 1.5在计数任务上的平均绝对误差显著上升，而“Binary Baseline”的误差要低得多。

这表明，词汇量的增加，而非序列长度的增长，是导致大模型计数能力下降的主要原因。

不过作者也表示，虽然这项研究一定程度上划定了大模型计数能力的上下界，但这些界限还不够紧致，距离理想的结果还有一定差距。

同时，作者也没有探究增加Transformer的层数是否会改变这一结论，需要未来开发新的技术工具才能进一步验证。

论文地址：
https://arxiv.org/abs/2407.15160

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/阅读下一篇/

一张小卡片敢卖999？原来是智能体AI硬件

返回网易首页下载网易新闻客户端

相关推荐

热点推荐

免费、开源！谷歌Gemini CLI彻底火了，平替Claude Code

机器之心Pro 2025-06-26 14:19:28
2 跟贴 2
扩散语言模型九倍推理加速！KV Cache并非自回归模型专属

量子位 2025-05-27 17:02:02
0 跟贴 0

10岁女孩被囚山西地窖，果农伯伯拿鞭子、针管、刑具玩游戏

午夜故事会 2023-08-14 17:40:00

LLM进入「拖拽时代」！只靠Prompt，几秒定制一个大模型，效率飙升12000倍

新智元 2025-06-24 12:38:07
4 跟贴 4

逃脱记录末日&黑白世界

专栏脑洞故事板精选板

无损减少80%激活值内存，提升5倍训练序列长度，仅需两行代码

机器之心Pro 2025-06-23 15:55:45
0 跟贴 0
陈丹琦团队如何「抓住」关键缓存，解放LLM内存？

机器之心Pro 2025-06-24 22:35:45
0 跟贴 0

十分科学——硬核前沿科普

专栏科学消息

港大等开源GoT-R1：强化学习解锁视觉生成推理新范式

机器之心Pro 2025-06-25 17:49:23
7 跟贴 7

他是矮矬穷却拥有让所有男人嫉妒的大家伙，因太受富婆喜爱被FBI调查

魏惊蛰 2023-06-29 21:51:37

谷歌AlphaGenome横空出世！40亿年生命代码一键破解，或再夺诺奖

新智元 2025-06-26 13:38:49
48 跟贴 48
谷歌首个！机器人有了“离线大脑”，没网也能干活

机器之心Pro 2025-06-25 19:36:06
0 跟贴 0

去医院做妇科手术，医生竟然是我的前男友，他让我躺上去……

公主小故事 2023-04-18 11:00:20

谷歌发布Gemini Robotics On-Device，断网也能听指令做任务

量子位 2025-06-25 18:16:42
0 跟贴 0
一台观察人类DNA的AI“显微镜”：谷歌AlphaGenome问世

智东西 2025-06-26 00:20:25
97 跟贴 97
给机器人装上“离线大脑”+“安卓系统” 谷歌端上“自家最强”VLA模型

财联社 2025-06-26 15:58:10
0 跟贴 0
谷歌I/O大会放狠招，终极AI助手已来

机器之心Pro 2025-05-21 13:09:12
0 跟贴 0
刚刚，OpenAI苏黎世办公室被Meta一锅端，三名ViT作者被挖走

机器之心Pro 2025-06-26 14:56:39
0 跟贴 0

一对老人五台山寺庙供奉大米遭和尚嫌弃怒扔门口！

爆料视频 2025-06-26 09:27:24
35177 跟贴 35177
图像分词器造反了！华为 Selftok：自回归内核完美统一扩散模型

机器之心Pro 2025-05-22 10:38:46
0 跟贴 0
上海AI独角兽，连放大招

财天COVER 2025-06-25 16:31:20
1 跟贴 1
量子计算机刚刚重现了恐龙灭绝的原因，它与我们想象的不同！

素玉姑娘 2025-06-25 03:16:40
0 跟贴 0
俄专机降落在纽约俄外交部回应

环球网资讯 2025-06-26 17:12:09
7718 跟贴 7718

中国为何力挺伊朗？战略核心维度的五大关联！

华山穹剑 2025-06-25 22:14:07
1 跟贴 1
男人摆弄模型，小镇就发生变化

吾李有剧 2025-06-25 20:24:49
0 跟贴 0
大模型再「战」高考：从一本直升 985

极客公园 2025-06-26 17:59:59
0 跟贴 0
科学家研制具身智能巡检机器人，对自然语言理解准确率超过96%

DeepTech深科技 2025-01-11 18:34:23
0 跟贴 0
中国反隐身技术：米波雷达与量子雷达如何让B-2无处藏身

书写传奇 2025-06-26 01:14:45
0 跟贴 0

小扎AI复仇进行时！OpenAI苏黎世办公室被端，650亿储备金狂烧不止

新智元 2025-06-26 17:58:31
0 跟贴 0
1475高中数学：求F(X)解析式。换元+赋值法是求这类抽象函数的克

我服子佩 2025-06-24 22:04:42
1 跟贴 1
AI理解语言的终极密码，千问3向量模型开源，性能超谷歌OpenAI

机器之心Pro 2025-06-11 19:17:56
0 跟贴 0
AI辅助编码带来思维方式转变：从人写代码到人审代码

量子位 2025-04-18 17:04:43
0 跟贴 0
铭记历史，致敬先烈，我们要保卫我们的国家——序列 01

麦麦侃片v 2025-06-25 17:02:13
0 跟贴 0

面向科学任务、自动评估多模态智能体评测环境ScienceBoard来了

机器之心Pro 2025-06-26 16:02:44
0 跟贴 0
OceanBase全面拥抱AI新进展：OB Cloud支持十亿级多类型向量数据

量子位 2025-06-26 13:25:14
0 跟贴 0
谷歌CEO：中国在AI前沿竞争力不容忽视

财联社 2025-05-19 17:56:27
0 跟贴 0
谷歌走在通往AGI的路上，哈萨比斯：一个艰难但正确的决定

机器之心Pro 2025-05-23 13:40:49
0 跟贴 0
中国光电系统与量子雷达破解B-2隐身神话

辉煌靠自我 2025-06-25 04:15:02
0 跟贴 0
本科生推翻姚期智40年前的猜想，提出哈希表算法突破搜索效率极限

DeepTech深科技 2025-02-11 13:24:34
16 跟贴 16
WAIC 2025倒计时30天！40+大模型、50+AI终端、60+智能机器人即将重磅登场

财联社 2025-06-26 17:12:08
0 跟贴 0
一个模型搞懂黑洞形成原理

小糖发财 2025-06-22 05:34:00
0 跟贴 0
科学家验证强柏拉图表征假说，证明模型会收敛于相同通用意义几何

DeepTech深科技 2025-05-27 18:40:11
0 跟贴 0
工人徒手掰断钢筋河北一楼盘被曝光住建部门：质监站已介入

比奇看有趣 2025-06-26 13:59:23
4322 跟贴 4322
伊朗遭袭防长在青岛感谢中国：希望中方继续主持公道

澎湃新闻 2025-06-26 09:22:28
59 跟贴 59
博主探店一碗面558元还要收筷子费？杭州面馆店长：明码标价，配合拍4小时反遭网暴

潇湘晨报 2025-06-24 12:31:54
7438 跟贴 7438

恩怨勾销，莫迪离开G7峰会，上专机前终于谈妥，印度威胁退出金砖

恩怨勾销，莫迪离开G7峰会，上专机前终于谈妥，印度威胁退出金砖

红色鉴史官

2025-06-25 20:50:03

冠心病去世的人越来越多？医生劝告：天热宁可喝冰水，也别吃6物

冠心病去世的人越来越多？医生劝告：天热宁可喝冰水，也别吃6物

泠泠说史

2025-06-25 14:59:41

职场迷雾中的暧昧：一场危险的情感博弈

职场迷雾中的暧昧：一场危险的情感博弈

青苹果sht

2025-06-26 05:26:57

记者：赛后王钰栋告诉我确实有点累，初步检查左腿有一定损伤

记者：赛后王钰栋告诉我确实有点累，初步检查左腿有一定损伤

懂球帝

2025-06-26 14:17:18

沙特豪掷千金购买中国武器，背后动机曝光，大手笔却注定要失望

沙特豪掷千金购买中国武器，背后动机曝光，大手笔却注定要失望

智观科技

2025-06-20 00:57:17

下头！洪森算计佩通坦，泰国交投名状，得到一张到访北京的机票

下头！洪森算计佩通坦，泰国交投名状，得到一张到访北京的机票

忠诚TALK

2025-06-26 10:07:45

存到100万后，我发现很多人不是需要一份工作，而是活下去的生活模式

存到100万后，我发现很多人不是需要一份工作，而是活下去的生活模式

蝉衣儿

2025-06-25 13:36:18

茅台批发价再一次跳水！恐将跌到“白菜价”，酒商：根本不让人活

茅台批发价再一次跳水！恐将跌到“白菜价”，酒商：根本不让人活

南南说娱

2025-06-26 10:29:17

当今社会最可怕的现象，傻子共振已开始大规模流行

当今社会最可怕的现象，傻子共振已开始大规模流行

枫冷慕诗

2025-06-11 17:04:12

研究发现：有肺结节的人若无这3种特征，可以放宽心，恶变风险低

研究发现：有肺结节的人若无这3种特征，可以放宽心，恶变风险低

鬼菜生活

2025-06-26 15:02:48

洪森恼羞成怒，竟曝光英拉秘事，佩通坦绝地反击，泰专机直飞中国

洪森恼羞成怒，竟曝光英拉秘事，佩通坦绝地反击，泰专机直飞中国

叹知

2025-06-23 10:34:33

特变电工：公司作为国内领先的变压器制造商，为多个核电项目提供变压器等核心设备

特变电工：公司作为国内领先的变压器制造商，为多个核电项目提供变压器等核心设备

每日经济新闻

2025-06-26 17:08:10

娘家给的500万陪嫁,婆婆偷转给小姑子400万,老公一句话婆婆脸白了

娘家给的500万陪嫁,婆婆偷转给小姑子400万,老公一句话婆婆脸白了

今天说故事

2025-06-26 18:38:05

我妈48岁提出离婚，我爸果断签字同意，离婚当天我妈：记得收快递

我妈48岁提出离婚，我爸果断签字同意，离婚当天我妈：记得收快递

凯裕说故事

2025-06-25 16:19:35

氧化镓雷达测试成功，中国六代机“超视距之眼”即将成真！

氧化镓雷达测试成功，中国六代机“超视距之眼”即将成真！

杨风

2025-06-25 22:24:48

泰国上门请教解放军：歼10C到底怎么打掉阵风的？印度彻底破防

泰国上门请教解放军：歼10C到底怎么打掉阵风的？印度彻底破防

头条爆料007

2025-06-26 10:58:46

2005年贵州男子娶弟媳为妻，帮弟弟养三个孩子，5年后被侄子杀害

2005年贵州男子娶弟媳为妻，帮弟弟养三个孩子，5年后被侄子杀害

悬案解密档案

2025-06-26 09:20:18

俄罗斯必须直面现实：归还领土100万，换取中国的全力支持

俄罗斯必须直面现实：归还领土100万，换取中国的全力支持

科技虎虎

2025-06-16 17:40:21

伊朗宣布自己大胜，全国民众庆贺一天

伊朗宣布自己大胜，全国民众庆贺一天

远方青木

2025-06-26 00:14:44

围棋名将常昊近况：不顾恩师反对，娶大8岁的二婚师姑，携手至今

围棋名将常昊近况：不顾恩师反对，娶大8岁的二婚师姑，携手至今

博卜talk

2025-06-16 17:30:37

追踪人工智能动态

10736文章数 176172关注度

往期回顾全部

一张小卡片敢卖999？原来是智能体AI硬件
2025-06-26 15:08
国产大模型高考出分了：裸分683，选清华还是北大？
2025-06-26 15:06
OceanBase全面拥抱AI新进展：OB Cloud支持十亿级多类型向量数据
2025-06-26 13:25

科技要闻

小米首款AI眼镜来了，售价1999元起

头条要闻

于东来宣布将关闭半年营收超8亿的门店大计划被披露

体育要闻

蓄谋已久的开拓者，就是最适合杨瀚森的球队

娱乐要闻

倪妮，怎么突然下桌了？

财经要闻

牛市主力！上半年超7200亿资金南下港股

汽车要闻

智界全系2万元现金减免豪华智能限时普惠

态度原创

数码

健康

游戏

公开课

军事航空

数码要闻

小米首款小尺寸！小米手表S4 41mm发布：999元起

呼吸科专家破解呼吸道九大谣言！

买游戏送写真！《明末渊虚之羽》在日本平台开售

公开课

李玫瑾：为什么性格比能力更重要？

军事要闻

满足特朗普要求北约峰会通过5%军费目标

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉 Reporting Infringements