网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

Ilya认错，Scaling Law崩了？自曝SSI秘密技术路线取代OpenAI

2024-11-12 13:06:15　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：Aeneas 好困

【新智元导读】Ilya终于承认，自己关于Scaling的说法错了！现在训练模型已经不是「越大越好」，而是找出Scaling的对象究竟应该是什么。他自曝，SSI在用全新方法扩展预训练。而各方巨头改变训练范式后，英伟达GPU的垄断地位或许也要打破了。

就在刚刚，路透社也发文表示，由于当前方法受到限制，OpenAI和其他公司正在寻求通向更智能AI的新途径。

有趣的是，昨天拱火的The Information，今天又急忙发出一篇文章来灭火。

他们强调，昨天的文章只是在说改进大模型必须找到新方法，并不是说Scaling Law已经终结。

但一个不争的事实就是：硅谷几大主要AI实验室正在陷入困境。训练这些大规模的LLM动辄需要花费数千美元，但复杂系统还经常崩溃。往往需要数月时间，才知道模型能否按预期工作。

比起GPT-4o，Orion几乎没有任何改进；谷歌的Gemini 2.0，被曝也存在同样问题；Anthropic据传也已暂停Opus 3.5模型的工作。

据悉，谷歌正准备在12月推测出最新的Gemini 2.0，它可能无法实现DeepMind创始人Demis Hassabis团队预期的显著性能改进，但会有引入一些有趣的新功能

Anthropic首席执行官Dario Amodei 表示，「我们的目标是改变曲线，然后在某个时候成为Opus 3.5」

而离职创业的OpenAI元老则Ilya Sutskever则表示，现在重要的是「扩大正确的规模」。

「2010年代是scaling的时代，现在，我们再次回到了奇迹和发现的时代。每个人都在寻找下一个奇迹。」

对经营着自己的AI实验室SSI的Ilya来说，这是一个很大的改变。

曾经在推动OpenAI的GPT模型时，他的准则是「越大越好」。但在SSI的最近一轮融资中，Ilya开始希望尝试一种与OpenAI不同的Scaling方法。

Scaling Law大家都说得够多了。但有一个问题，却被每个人都忽略了——我们说scaling的时候，究竟在scaling什么？

如今，Ilya抛出了这个振聋发聩的疑问。

Scaling正确的东西，比以往任何时候都更重要

毕竟，超大规模语言模型的ROI实在太低了。

虽然在GPT-4发布后，各大AI实验室的研究人员都竞相追赶，发布了超过GPT-4的大模型，但他们更多的感觉是失望。

因为要同时运行数百个芯片，这种超大参数模型的训练可能要花费数千万美元，系统太复杂还可能会出现硬件故障。但只有经过数月，等到运行结束后，研究人员才能知道模型的最终性能。

另一个问题，就是LLM吞噬了大量数据，而世界上易于获取的数据，几乎已经被耗尽了！

同时，由于过程中需要大量能源，电力短缺也成为训练AI的严重阻碍。

论文题目：「The Unseen AI Disruptions for Power Grids: LLM-Induced Transients」

替代Scaling的新方法，Ilya已经有了？

面对这种种现状，Ilya最近在路透社的采访中表示，扩展训练的结果，已经趋于平稳。

也就是说，用大量未标记数据来理解语言模式和结构的训练阶段到头了。

以前，Ilya是暴力scaling的早期倡导者之一，那时有一种想法广泛认为，通过预训练中使用更多的数据和算力，能让AI模型的性能暴涨。

OpenAI团队2020年提交的arXiv论文中最先提出这一概念：LLM性能与计算量、参数量、数据量三者呈现幂律关系

的确，沿着这条路线，最终ChatGPT诞生了。

ChatGPT发布后，从AI热潮中受益颇多的科技公司都公开声称，这种通过增加数据和算力来「scale up」的方法，能显著改善模型性能。

可是现在，Scaling Law已经碰壁了！越来越多的AI科学家，对于这种「越大越好」（bigger is better）的哲学产生了质疑。

2010年代属于Scaling，但大模型要继续发展下去，需要一个新的奇迹。

Ilya的SSI团队是否找到了呢？

对此，Ilya拒绝透露，只是表示，SSI正在研究一种全新的替代方法，来扩展预训练。

再领先三步？OpenAI破局新方法：测试时计算

同时，OpenAI仿佛也找到了新方法——通过开发使用更类人思维的算法训练技术，或许就能克服在追求更大规模LLM过程中遇到的意外延迟和挑战。

已经有十几位AI科学家、研究人员和投资者告诉路透社，他们认为正是这些技术，推动了OpenAI最近发布的o1模型。

而它们，可能会重塑AI竞赛的格局，让AI公司们不再对能源和芯片资源产生无限制的需求。

有没有这么一种新方法，让AI模型既能摆脱对数据的依赖，又不再需要动辄吞噬整个国家乃至全球的电力？

为了克服这些挑战，研究人员正在探索一项「测试时计算」的技术。

上图即是OpenAI解释o1的博文，x轴标记为「训练时计算」和「测试时计算」。

左图是OpenAI发现的Scaling Law，意味着在模型上投入更多训练时间（GPU周期）时，我们可以获得更好的结果。

右图则暗示了我们尚未触及的一套全新的Scaling Law。「测试时计算」意味着，给模型更多的「思考时间」（GPU周期）时，它会思考出更好的结果。

测试时计算技术，能在推理阶段（模型被使用时）就将模型增强，比如，模型可以实时生成和评估多种可能性，而不是理解选择单一答案。最终，模型就可以选择出最佳路径。

这种方法可以允许模型将更多的处理能力，用于数学、编码问题等具有挑战性的任务，或者需要类人推理和决策的复杂操作。

传统的Scaling Law，专注于用更长时间训练大模型，但如今o1系列模型scaling有了两个维度——训练时间和测试（推理）时间

早在上个月的旧金山TED AI会议上，曾参与o1开发的OpenAI研究员Noam Brown就提出——

事实证明，让一个机器人在一局扑克中思考仅20秒，其性能提升与将模型规模扩大10万倍并训练10万倍时间相同。

o1模型以前曾被称为「Q*」和「Strawberry」。现在，它能够以多步骤方法思考问题，类似于人类推理。

现在，模型不再受限于预训练阶段，还可以通过增加推理计算资源，来提升表现

而且，它还涉及了来自博士和行业专家策划的数据和反馈。

o1系列的秘密武器，是在GPT-4等基础模型上进行的另一套训练，OpenAI还计划，将这种技术应用于更多更大的基础模型。

OpenAI的首席产品官Kevin Well在十月的一次科技会议表示——

我们看到很多可以快速改进这些模型的机会，而且非常简单。到人们赶上来的时候，我们会尝试再领先三步。

通过思维链提示，o1模型可以经过训练生成长长的输出，并通过答案进行推理

全球顶尖AI实验室开卷，英伟达垄断地位有望打破？

OpenAI说要领先三步，其他顶尖AI实验室岂甘落后？

据知情人士透露，来自Anthropic、xAI和谷歌DeepMind的研究人员，也已经奋力开卷了！

比如Meta最近提出了「思维偏好优化」TPO，这种方法旨在教会LLM在回答一般任务（而不仅仅是数学或逻辑问题）之前「思考」，而不需要特殊的训练数据。

论文地址：https://arxiv.org/pdf/2410.10630

而谷歌也在开发一种新模型，同样使用CoT方法解决多步骤问题、生成多个答案，评估后选择最佳答案。

这个过程同样可以通过在推理中使用更多算力来增强，而非仅仅增加训练数据和算力，这就为扩展AI模型开辟了一条新道路。

论文地址：https://arxiv.org/pdf/2408.03314

这会导致什么后果？

很有可能，对英伟达GPU巨大需求主导的AI硬件竞争格局，将从此改变。

这是因为，通过增加训练时间和测试（推理）时间，可能会获得更好的结果，模型就不再需要那么大的参数。

而训练和运行较小模型会更便宜，因此，在给定固定计算量的情况下，我们可能会突然从小模型中获得更多收益。

突然之间，模型参数、训练时间和测试时间计算之间的关系变得复杂了，也就让我们看到了下一代GPU的可能。

比如Groq这样的公司，恰巧就在为这类任务制造专门的芯片。

红杉资本和A16z在内的著名风投机构，如今已经投入了数十亿美元，资助OpenAI、xAI等多家AI实验室的开发。

他们不可能不注意到最近圈内盛传的Scaling Law碰壁事件，而重新考虑自己的昂贵投资是否会打水漂。

红杉资本合伙人Sonya Huang表示，这种转变，将使我们从大规模预训练集群转向推理云，即分布式的、基于云的推理服务器。

大模型热以来，对英伟达尖端AI芯片的需求，已经让它崛起为全球最有价值的公司，并且市值超越了苹果。

今年以来，英伟达股价了约186%，而苹果仅上涨了17%

虽然在训练芯片的市场，英伟达已经占据主导地位，但它在推理市场，可能还会面临更多竞争。

而o1模型背后技术，意味着对推理芯片的需求也会随着增加。

「我们现在发现了第二个Scaling Law，这是在推理阶段的Scaling Law……所有这些因素导致对Blackwell的需求非常高。」

在英伟达GTC大会上，黄仁勋也讲到，如果要训练一个1.8万亿参数量的GPT模型，需要8000张H100 GPU，消耗15兆瓦的电力，连续跑上90天

随着Scaling Law碰壁，各大公司纷纷开启新路线，英伟达是否还会继续坐火箭般的辉煌呢？

再见，GPT。你好，推理「o」

The Information今天的解释文章，标题意味深长：《再见，GPT。你好，推理「o」》。

文章内容是这样的。

月初，一位Reddit用户曾在QA种问道，OpenAI的下一代旗舰大语言模型何时发布。

对此，Altman回答说：「今年晚些时候，我们会发布一些非常不错的产品，但并不会叫做GPT-5。」随后他又补充道，有限的计算资源意味着很难同时推出过多的项目。

当时我们并未多想。

但如今，我们更能理解Altman的评论了——以及他为何专注于推出o系列推理模型而非另一版本的GPT 。

所谓GPT，即生成式预训练Transformer模型，是ChatGPT和大多数其他生成式人工智能产品的基石。

原因正如之前报道的那样，GPT的改进速度正在放缓。

2023年初登场的上一代旗舰级模型GPT-4，凭借着巨大的性能提升在科技行业引发了轰动。

Orion比GPT-4更好，但其质量提升与GPT-3和GPT-4之间的差距相比略显逊色。甚至，可能会让OpenAI放弃自2018年推出GPT-1起使用的「GPT」命名惯例。

因此，当Altman写道「o1及其后续版本」时，可能意味着Orion将与推理融合并被命名为「o2」。

随着一种Scaling Law的消退，另一种定律取而代之

让我们回到GPT发展放缓这个问题上。

传统的Scaling Law不仅仅意味着在大语言模型训练过程中需要更多的数据和计算能力才能获得更好的结果。OpenAI的研究人员还做了各种其他有趣的事情，才使得GPT-4比GPT-3有了大幅提升。比如，引入被称为模型稀疏性的概念。

随着推理范式的出现，预训练改进的放缓变可以得到弥补——从本质上讲，它可能代表了一种新的Scaling Law。

OpenAI一再表示，推理模型的性能在回答问题前有更多时间思考时会变得更好，这被称为对数线性计算扩展。

那么，这些变化是否意味着OpenAI的1000亿美元超级计算集群的梦想正在消退呢？对于这个问题，可以肯定的是，所有主流的AI开发者都在全速推进极其昂贵的集群建设。

一方面是，大型集群上可以更好地在预训练后改进这些模型、在后训练阶段处理强化学习以及更新或微调模型。

另一方面是，即便预训练模型的改进速度放缓，但只要自己能训出比竞争对手略好的模型，就值得增加的数据中心投入。毕竟，LLM越好，将推理模型融入模型后获得的结果就越好。

最后，如果GPT的发展没有加速，是不是就意味着末日论者错了——AI不会进入所谓的递归自我改进循环，在这个循环中，AI会一次又一次地找出如何制造下一个更好版本的自己（然后也许会征服我们所有人）？

对此，Marc Andreessen认为，这种明显的平台期意味着这样的恐惧目前看来是没有根据的。

参考资料：

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

OpenAI CEO深度访谈：1人+10000块GPU，能创收数十亿美元

智东西 2024-11-12 21:43:08
0 跟贴 0
微软AI CEO苏莱曼：AI被低估了，它应该用于解决全球社会挑战｜钛媒体AGI

钛媒体APP 2024-11-12 22:36:18
48 跟贴 48

Hinton揭秘Ilya成长历程：Scaling Law是他学生时代就有的直觉

量子位 2024-05-26 15:58:07
0 跟贴 0

搭载ChatGPT的《星际穿越》机器人爆火，马斯克：想要！ ChatGPT复刻版《星际穿越》机器人T

量子位 2024-07-09 12:03:11
0 跟贴 0
抢疯了，腾讯给大模型人才，定了一个前所未有的标准

机器之心Pro 2024-06-21 15:20:08
89 跟贴 89

最有打工天赋的机器人出现了！一镜到底的连续大负载搬运，动态超稳，来自国产的逐际动力

量子位 2024-08-12 10:39:39
0 跟贴 0

肌肉骨骼居然和人类一样。外网爆火的克隆机器人，灵活性超高，胸腔里还复刻了人类的心脏瓣膜，宛如《西部世

量子位 2024-10-26 12:28:00
0 跟贴 0
全世界跑得最快的人形机器人，还能跳科目三都知道波士顿动力的机器人会空翻，那你知道中国品牌宇树科技有

爱范儿 2024-07-04 20:41:36
6217 跟贴 6217

一句话开发AI智能体，有人靠它一单赚10万！80万开发者已入局

新智元 2024-11-13 19:16:59
4 跟贴 4
全球最远1.4米！国产宇树创人形机器人跳远纪录，外网惊叹碾压特斯拉

量子位 2024-10-19 12:16:06
2824 跟贴 2824
Scaling Laws终结，量化无用，AI大佬都在审视这篇论文

机器之心Pro 2024-11-13 14:33:30
2 跟贴 2
AlphaFold3重磅开源，诺奖级AI颠覆世界！GitHub斩获1.8k星，本地即可部署

新智元 2024-11-12 13:05:51
10 跟贴 10
OpenAI 联合创始人回来了，还是总裁，将更专注重大技术挑战

机器之心Pro 2024-11-13 14:12:25
11 跟贴 11
不会写代码全交给AI，它能写出完整的APP吗？这是我们的测试结果

量子位 2024-09-04 13:29:57
0 跟贴 0
大疆前高管带6人创业，做出了类目Top1的割草机器人

钛媒体APP 2024-05-30 14:49:18
0 跟贴 0
告别屈膝小碎步让机器人像人一样走路国产团队造出“钢铁侠”

量子位 2024-10-24 11:42:12
0 跟贴 0
AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

量子位 2024-09-08 13:27:35
49 跟贴 49
Transformer打破三十年数学猜想！Meta研究者用AI给出反例，算法杀手攻克数学难题

新智元 2024-11-13 19:16:59
1 跟贴 1
网友一个定积分的WIFI密码，测出了AI数学之王。Grok超强数学思维碾压ChatGPT，引马斯克点

量子位 2024-10-31 18:55:41
0 跟贴 0
人形机器人狂奔！山地、草地、公路无障碍，原速演示全程高能

量子位 2024-10-14 13:19:05
0 跟贴 0
机器人身穿衣服做家务被质疑！来自OpenAI押注的独角兽因过于逼真被怀疑是真人套壳——人形机器人初

量子位 2024-09-04 18:16:57
0 跟贴 0
AI是怎么认出AI视频的？人类靠寻找“违和感”，AI靠的是

量子位 2024-11-08 18:51:54
0 跟贴 0
8岁小孩哥上手用AI制作游戏，全程2小时，引来50多万人围观

机器之心Pro 2024-09-03 14:38:55
0 跟贴 0
第一个100%开源的MoE大模型，7B的参数，1B的推理成本

机器之心Pro 2024-09-05 10:30:36
0 跟贴 0
最会赚钱的制造商，从一张铝皮到一辆特斯拉，事故频发却销量暴涨

小花综艺汇 2024-11-11 15:13:18
186 跟贴 186
8年前阿法狗的一个“错误”，竟成大模型研究新方向！大模型之争进入新阶段，从拼“模仿”转向拼“推理”

量子位 2024-10-19 12:06:26
195 跟贴 195
11月9日浙江，小机器人“拐走”12个机器人

BRTV新闻 2024-11-11 16:09:24
195 跟贴 195
整天自主研发，一断供，你咋不自主研发了？

北京作家编剧肥猪满圈 2024-11-13 18:14:16
1365 跟贴 1365
曝某手机厂商暂停大折叠产品线，支支吾吾，就是没人敢提是谁！

你食不食油饼 2024-11-12 12:04:48
15451 跟贴 15451
穿上感觉像轻了27斤！三万块一条的裤子，竟然卖爆了？谷歌孵化的公司Skip联手始祖鸟推出了全球首条

量子位 2024-08-17 13:10:59
20 跟贴 20
双座歼20来了，创下五代机第一，走美国技术路线，让美国无路可走

记者陈彬 2024-11-11 18:09:21
0 跟贴 0
特朗普组阁彭佩奥出局！台积电恃宠而骄停供大陆先进芯片

人猿星球观天下 2024-11-12 09:17:00
2 跟贴 2
妻子吐槽丈夫晚上给自己打电话没人接时，竟直接远程关了电视和灯，网友突然就不想要全屋智能了

先锋音乐 2024-11-13 11:05:55
3 跟贴 3
几行乱码让大模型获得科学思维，这个神奇的提示词突然火了

机器之心Pro 2024-09-04 22:17:21
49 跟贴 49
奥特曼专访自曝OpenAI掌握AGI密钥，2025年降临！1人1万块GPU缔造十亿独角兽

新智元 2024-11-10 12:36:51
4 跟贴 4
掘开决胜擒敌，这三分的技术含量太高了

潘有辉骑行11周年 2024-11-10 00:15:01
0 跟贴 0
奔驰男子违规停车，交警劝离被大吼：“你管我干什么”

陈渤看看 2024-11-12 10:10:45
3 跟贴 3
特斯拉全车无实体按键，老年人真开不惯，后排屏幕太鸡肋！

大妞小兰 2024-11-11 15:26:08
34 跟贴 34
OpenAI：可以变质，绝不倒闭！

林亦LYi 2024-11-09 18:41:51
0 跟贴 0
微软是如何重新崛起的？

钛媒体APP 2024-06-20 08:40:14
461 跟贴 461

中国哪的酱油最好吃？经评比，这6种酱油榜上有名，网友：没听过

中国哪的酱油最好吃？经评比，这6种酱油榜上有名，网友：没听过

小谈食刻美食

2024-11-13 19:24:08

美国国务卿有悬念，不是反华先锋卢比奥，特朗普在考虑我国感受？

美国国务卿有悬念，不是反华先锋卢比奥，特朗普在考虑我国感受？

DS北风

2024-11-13 14:56:10

辽宁大姐嫌公司食堂4菜1汤要15元，还不如自己带饭，网友：不知足

辽宁大姐嫌公司食堂4菜1汤要15元，还不如自己带饭，网友：不知足

阿龙美食记

2024-11-13 13:05:41

重庆15岁女孩遭母亲男友砍伤十多处其父质疑：行凶者仅被行拘10天

重庆15岁女孩遭母亲男友砍伤十多处其父质疑：行凶者仅被行拘10天

极目新闻

2024-11-13 20:38:57

延长股市交易时间！11月14日，深夜的三大消息正式出炉！

延长股市交易时间！11月14日，深夜的三大消息正式出炉！

风口招财猪

2024-11-14 03:08:29

涂磊出院后憔悴露面，哽咽回应妻子去世传闻，去年因谣言影响康复

涂磊出院后憔悴露面，哽咽回应妻子去世传闻，去年因谣言影响康复

水泥土的搞笑

2024-11-13 18:20:39

立冬后一定要吃它！公认的“肾黄金”→

立冬后一定要吃它！公认的“肾黄金”→

上海宝山

2024-11-11 19:15:29

张雪峰：千万不要混，一个月五千，20岁混到 30 岁就混了六十来万

张雪峰：千万不要混，一个月五千，20岁混到 30 岁就混了六十来万

清风拂心

2024-11-13 14:43:39

黄仁勋，重大宣布！英伟达将与软银合作在日本建AI基础设施，英伟达与软银试运行全球首个“AI+5G”

黄仁勋，重大宣布！英伟达将与软银合作在日本建AI基础设施，英伟达与软银试运行全球首个“AI+5G”

每日经济新闻

2024-11-13 17:28:11

确认了！正式解约退出CBA！对阵美国男篮轰下25分……

确认了！正式解约退出CBA！对阵美国男篮轰下25分……

篮球实战宝典

2024-11-13 22:22:17

马斯克确认将领导“政府效率部”对抗官僚主义：你可不知道这将产生多大影响

马斯克确认将领导“政府效率部”对抗官僚主义：你可不知道这将产生多大影响

界面新闻

2024-11-13 09:31:28

1974年陈毅妻子去世前，交待3个儿子：妹妹结婚后，你们才能分家

1974年陈毅妻子去世前，交待3个儿子：妹妹结婚后，你们才能分家

红色先驱

2024-11-11 09:34:08

吴卓林：被成龙“抛弃”的女儿，如今彻底走上“疯狂”的报复之路

吴卓林：被成龙“抛弃”的女儿，如今彻底走上“疯狂”的报复之路

娱乐的小灶

2024-11-12 09:27:26

川普任命国安顾问向俄发强烈信号，冷门防长

川普任命国安顾问向俄发强烈信号，冷门防长

移光幻影

2024-11-13 11:29:57

成都一区花12亿建对外交流中心被通报当地回应：严肃查处

成都一区花12亿建对外交流中心被通报当地回应：严肃查处

环球网资讯

2024-11-13 06:48:08

突然公告！上海电气、中科曙光、恒瑞医药等六家公司发布重要消息

突然公告！上海电气、中科曙光、恒瑞医药等六家公司发布重要消息

蓝色海边

2024-11-13 22:14:27

朝鲜女兵自述：入伍自动绝经，七年服务百位长官，退役后无人愿娶

朝鲜女兵自述：入伍自动绝经，七年服务百位长官，退役后无人愿娶

历史八卦社

2023-11-14 22:06:29

今夜，见证历史...

中国基金报

2024-11-14 00:11:50

重磅！北约高官震撼真心发言：若无核武，俄罗斯早已被“征服”！

重磅！北约高官震撼真心发言：若无核武，俄罗斯早已被“征服”！

国际情爆猿

2024-11-13 20:10:23

老人说：“门前一支香，家财全败光”，什么叫一支香？有啥讲究

老人说：“门前一支香，家财全败光”，什么叫一支香？有啥讲究

月涵书舍

2024-11-13 16:55:02

AI产业主平台领航智能+时代

11742文章数 65672关注度

往期回顾全部

科技要闻

孙正义首次透露！曾三次尝试买下英伟达

头条要闻

拜登与特朗普在白宫会面：呼吁总统权力平稳过渡

头条要闻

拜登与特朗普在白宫会面：呼吁总统权力平稳过渡

体育要闻

卡尔伯格：肩负瑞典乒乓的荣光

娱乐要闻

李子柒全面复出！还有大动作待宣布

财经要闻

楼市重磅利好，税收优惠新政出炉！

汽车要闻

广汽传祺S7领衔广汽集团自主新车阵容发布

态度原创

亲子

教育

数码

手机

公开课

亲子要闻

“我还不是妈妈，但我正成长为他们的‘妈妈’”

教育要闻

“清华武状元”火了，高考722分，入学2个多月就殴打北航辅导员

数码要闻

石头科技双十一战报：清洁电器品牌 TOP1、洗衣机黑马品牌 TOP1

手机要闻

荣耀MagicOS9.0公测突然来袭：涵盖多款老机型，且带来YOYO智能体

公开课

AI如何揭开大自然和宇宙的奥秘

© 1997-2024 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版