网易首页 > 网易号 > 正文 申请入驻

Scaling Law原来源于百度?!Anthropic创始人的爆料外网都震惊了

0
分享至

11月27日消息,“大多数人不知道,关于Scaling Law的原始研究来自2017年的百度,而不是2020年的OpenAI。”

近日一则上述内容刷爆AI圈子,引发对百度研究能力的赞叹。

而事情的起因,则是Anthropic创始人Dario Amodei在一档播客节目中爆料:最早在百度工作时发现Scaling Law。



Dario Amodei是AI届的大牛,很多人知道他曾是OpenAI的初期员工,后来离开并创办Anthropic。事实上,Dario Amodei也是百度的“前员工”。

公开资料显示,Dario Amodei于2014 年 11 月至2015 年 10 月期间在百度工作,当时他在百度硅谷人工智能实验室(SVAIL)工作,致力于将深度学习模型扩展到大规模高性能计算系统。

再回到这则爆料中,这里先介绍一下Scaling Law(尺度定律):当模型的参数量、训练数据量和计算量增加时,模型的性能会按照一定的幂律关系提升‌。

如同芯片领域的从业者会以“摩尔定律”来理解、前瞻、指导芯片发展一样,Scaling Law被大语言模型(LLMs)研究者们认为是理解大模型发展的“金科玉律”,其重要性不言而喻。

这次Dario Amodei的爆料,可谓给Scaling Law的发现来了个“正本清源”,把百度推上了大模型研究先锋的位置上。

Anthropic创始人Dario
爆出Scaling Law“正源”

今年11月12日,在Lex Fridman的播客节目中,Anthropic的联合创始人&CEO Dario Amodei探讨了Claude、AI模型的扩展规律、AGI、AI未来等多个话题, 其中,在谈到大模型的扩展规律(Scaling Laws)与模型发展,他提到“他的观察最早来自于此前在百度工作时对语音识别系统的研究。”

Dario Amodei称,2014年与吴恩达在百度研究AI的时候,他就已经发现了模型发展的规律Scaling Law,“随着你给它们提供更多数据,随着你让模型变大,随着你训练它们的时间越来越长,模型的表现开始越来越好。当时我并没有精确地衡量,但我和同事们都非常非正式地感觉到,给这些模型的数据越多、计算越多、训练越多,它们的表现就越好。”

后来在Open AI的GPT-1的语言模型中得到了验证。他认为,随着模型变得越来越大,它们能够捕捉到更复杂的语言和认知模式,这一规律不仅适用于语言模型,还适用于图像、视频等其他领域。

随着Dario Amodei的爆料,更多行业人士扒出了关于Scaling Law起源的线索。

一位Meta研究员再次发布推文爆料:



"大多数人不知道,关于缩放定律的原始研究来自 2017 年的百度,而不是 2020 年的 OpenAI。

他们描述了模型参数和数据集标记对损失的影响。还对图像和音频进行了测试。

他们只是用 LSTM 代替了 Transformers,而且没有将他们的发现命名为“定律”。"

百度2017年论文被扒出
一作研究被OpenAI 引用

上述推文将Scaling Law起源的讨论热度再度推高,有媒体人士跟帖贴出了百度在2017年发表的《DEEP LEARNING SCALING IS PREDICTABLE, EMPIRICALLY》论文。该论文详细讨论了机器翻译、语言建模等领域的Scaling现象。




百度《DEEP LEARNING SCALING IS PREDICTABLE, EMPIRICALL》

此前曾在Open AI工作,参与了GPT-3等重要项目开发的AI专家Gwern Branwen曾较早注意到了Scaling Law 。他经常提起:百度的这篇论文确实被忽视了。



这个故事还有后续。到2019年,百度的几位研究员Joel hestness、Gregory Diamos继续这项研究,再次发表了一篇论文《Beyond human-level accuracy: computational challenges in deep learning》。



而这篇论文,被OpenAI引述在其2020年的论文《Scaling Laws for Neural Language Models》中——这也是OpenAI举世闻名Scaling Law发现之作。


来源:OpenAI 论文《Scaling Laws for Neural Language Models》

扒到这里,Scaling Law原来源于百度的结论算是实锤了。

尽管外部对百度对Scaling Law的研究贡献因为爆料才刚刚被认知,对于百度而言可能“略感遗憾”。

不过也正是对Scaling Law的早期研究,让百度早在多年前就投入了AI大模型研究,并在2019年发布了第一代文心大模型——几乎与OpenAI处于同一时期。2023年,更是成为全球第一家推出生成式AI产品的科技大厂。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
宝石老舅酒后失态发酵:预估损失上千万,粉丝脱粉,连累多位艺人!

宝石老舅酒后失态发酵:预估损失上千万,粉丝脱粉,连累多位艺人!

春序史
2024-12-27 14:53:53
有哪些性病,戴避孕套也防不住?

有哪些性病,戴避孕套也防不住?

医客
2024-12-27 12:11:27
陶琳:特斯拉电池无一进入填埋场 90%以上得到再利用

陶琳:特斯拉电池无一进入填埋场 90%以上得到再利用

手机中国
2024-12-26 11:00:16
美国开始从八个液化天然气设施出口天然气给欧洲

美国开始从八个液化天然气设施出口天然气给欧洲

财联社
2024-12-27 01:15:08
演员徐娇劝阻吸烟,被抢手机、扔烟头!各方回应

演员徐娇劝阻吸烟,被抢手机、扔烟头!各方回应

鲁中晨报
2024-12-27 08:07:06
“台独”终于怕了!美国人亲口承认,这才是援台真正目的?不简单

“台独”终于怕了!美国人亲口承认,这才是援台真正目的?不简单

视野聚椒
2024-12-27 14:36:51
痛心!广东两姐妹家中遇害 一个21岁一个18岁 前男友作案后自杀

痛心!广东两姐妹家中遇害 一个21岁一个18岁 前男友作案后自杀

社会观察员吴洺
2024-12-27 08:58:07
“英雄团长”祁发宝,晋升为副司令,军衔为何是大校而不是将军?

“英雄团长”祁发宝,晋升为副司令,军衔为何是大校而不是将军?

Ck的蜜糖
2024-12-27 13:12:55
官宣!欧洲豪门正式换帅,执教仅1个月就下课,新帅博尔热斯上任

官宣!欧洲豪门正式换帅,执教仅1个月就下课,新帅博尔热斯上任

球场没跑道
2024-12-26 17:30:36
继卖酒失败以后,李亚鹏又开始卖陈皮了,改换赛道的速度也太快了

继卖酒失败以后,李亚鹏又开始卖陈皮了,改换赛道的速度也太快了

人情皆文史
2024-12-22 02:51:04
彭德怀和林彪、刘伯承、粟裕之间的恩怨纠葛

彭德怀和林彪、刘伯承、粟裕之间的恩怨纠葛

星河逍遥游
2024-12-24 10:15:48
皮克:如果世界杯决赛有点球,我选择让梅西而不是C罗踢!

皮克:如果世界杯决赛有点球,我选择让梅西而不是C罗踢!

历史第一人梅西
2024-12-26 17:22:33
蒋欣揭开自己的蜡像,根本笑不出来,再好的演技都装不出来吧!

蒋欣揭开自己的蜡像,根本笑不出来,再好的演技都装不出来吧!

美食阿鳕
2024-12-27 03:55:38
林徽因美到窒息的情话:酒不好,可让我入睡;你很好,却让我难眠

林徽因美到窒息的情话:酒不好,可让我入睡;你很好,却让我难眠

清风拂心
2024-11-22 10:15:02
影响太大,“樊振东宣布退出世界排名”20分钟内登上热搜第一

影响太大,“樊振东宣布退出世界排名”20分钟内登上热搜第一

懂球帝
2024-12-27 11:56:19
中央决定:免去张克俭同志国防科工局党组书记职务

中央决定:免去张克俭同志国防科工局党组书记职务

核电那些事
2024-12-27 06:41:15
“2年被家暴16次”案开庭审理 被害人:贺某阳全程装傻 并拒绝回答律师的任何问题

“2年被家暴16次”案开庭审理 被害人:贺某阳全程装傻 并拒绝回答律师的任何问题

闪电新闻
2024-12-26 10:07:44
林彪坠机现场,唯一女尸身上有避孕药且过于年轻,难道叶群没死?

林彪坠机现场,唯一女尸身上有避孕药且过于年轻,难道叶群没死?

拙言问史
2024-12-25 19:18:20
因出演“人体模特”丈夫和她离婚,还遭父母嫌弃,今48岁孤身一人

因出演“人体模特”丈夫和她离婚,还遭父母嫌弃,今48岁孤身一人

老闫侃史
2024-12-21 16:45:03
男子3500元“实体娃娃”4天就玩坏了,店家:你这也太能折腾了!

男子3500元“实体娃娃”4天就玩坏了,店家:你这也太能折腾了!

猫小狸同学
2024-12-13 15:50:03
2024-12-27 16:15:00
TechWeb incentive-icons
TechWeb
做有态度的互联网资讯。
8092文章数 42880关注度
往期回顾 全部

科技要闻

中国团队600万美元训出匹敌GPT-4o大模型

头条要闻

婴儿随母姓医院要求签"免责声明" 当地卫健委:挺离谱

头条要闻

婴儿随母姓医院要求签"免责声明" 当地卫健委:挺离谱

体育要闻

贝尔萨的弟子,带出一支跑不死的英超黑马

娱乐要闻

宝石老舅承认被行政拘留,深夜道歉!

财经要闻

极越汽车败局 吉利控股撤退李书福接盘?

汽车要闻

李想:三个条件足够优秀 能做出苹果一样的公司

态度原创

艺术
旅游
教育
本地
手机

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

旅游要闻

太美了!上海宝藏“点位”走红 官方“攻略”来了

教育要闻

首师大附中昌平学校创客社团作品荣获国家级创意作品奖

本地新闻

好吃潮州|尝一口,这里的美食有点“潮”

手机要闻

手机行业内卷耐用科技,为何OPPO A5 Pro独树一帜?

无障碍浏览 进入关怀版