网易首页 > 网易号 > 正文 申请入驻

撞上数据墙?OpenAI模型提升速度放缓 着手调整开发策略

0
分享至

《科创板日报》11月10日讯 高质量数据不够用,拖累AI模型改进速度——OpenAI这位AI领头羊又遇到了难题。

一些测试过Orion的OpenAI员工发现,虽然Orion的性能超过了OpenAI现有的所有模型,但其性能质量提升程度远远小于从GPT-3到GPT-4的飞跃。这意味着,随着高质量数据趋于有限,AI模型的改进速度可能会放缓

不仅如此,Orion的训练中涉及来自旧模型(例如GPT-4与一些推理模型)的AI生成数据,这可能导致其重现旧模型的一些行为。

为此,OpenAI成立了一个“基础”团队,以在高质量新数据供应减少的情况下,研究能让AI模型保持改进的新方法。据悉,公司计划基于AI合成数据训练Orion,并在后期训练中对模型作出更多改进

目前,OpenAI正在推进Orion的安全测试,计划于明年年初发布这一模型,其可能会打破“GPT-X”的命名惯例,以反映模型开发的变化。

值得注意的是,OpenAI在今年收购了Chat.com域名,该域名已重定向至OpenAI的AI驱动聊天机器人ChatGPT。

▌“撞上数据墙”

早在2020年,OpenAI就曾在一篇论文中提出Scaling law定律,意指大模型的最终性能主要与计算量、模型参数量和训练数据量三者的大小相关,而与模型的具体结构(层数/深度/宽度)基本无关。换言之,仅仅增加模型规模和训练数据,就能显著提升人工智能能力,而无需取得根本性的算法突破。

AI界许多公司都一度将Scaling Law奉为圭臬,但如今,也有越来越多的质疑声出现。

Meta AI人工智能研究院(FAIR)研究员及高级经理田渊栋指出,“我画过一张图,一开始数据量越大,模型性能表现越好,但模型离人类越近就越难获得新的数据,模型就越来越难以改进,最后总会有些corner case(边角案例,即无法想到的或不常见的案例)解决不了,这是data driven(数据驱动)最大的问题。”

非营利研究机构Epoch AI在今年7月更新的一篇论文中指出,未来数年内,(原始)数据增长的速度将难以支撑AI大模型扩展发展的速度,在2026-2032年之间的某个时间点,数据存量将耗尽。


实际上,OpenAI已不是第一次遭遇“数据资源不足”的问题。此前已有媒体报道指出,在训练GPT-5时,OpenAI因文本数据不足,正在考虑使用YouTube公开视频转录出的文本。

如今OpenAI再度碰上数据资源难题,甚至因此影响到了新模型进展。“但这代表‘天塌了,’”The Information这篇文章的作者之一Amir Efrati指出,OpenAI正在作出调整,或许将有新的Scaling Law取代旧Scaling Law。

值得一提的,当地时间11月9日,OpenAI安全系统团队负责人翁荔(Lilian Weng)宣布将离开已经工作了近7年的OpenAI。她公开分享了发给团队的离职信,但其中并未言明具体离职原因及未来职业去向,仅表示“是时候重新出发,探索新的领域了”。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
被中国制裁后,黄仁勋抵达深圳高调周游中国,他不怕被逮捕扣押?

被中国制裁后,黄仁勋抵达深圳高调周游中国,他不怕被逮捕扣押?

石辰搞笑日常
2025-01-17 17:59:32
IMDb冲到9.7分!今年首部王炸美剧终于来了

IMDb冲到9.7分!今年首部王炸美剧终于来了

来看美剧
2025-01-17 21:29:37
俄乌局势大反转!193架北约飞机飞往乌克兰,俄罗斯突然停下脚步

俄乌局势大反转!193架北约飞机飞往乌克兰,俄罗斯突然停下脚步

圆点视讯
2025-01-15 17:21:36
小米陈波:NAS 已进入到开发的尾声,外观会比较简约、优雅、高级

小米陈波:NAS 已进入到开发的尾声,外观会比较简约、优雅、高级

IT之家
2025-01-17 23:48:30
中央决定:陈怀宇履新

中央决定:陈怀宇履新

中国基金报
2025-01-17 20:31:53
这一次,李宁赢了安踏一把

这一次,李宁赢了安踏一把

财经天下WEEKLY
2025-01-17 18:09:08
曝知名演员赵毅欠债百万不还!对方晒转账记录,两人已相识10年

曝知名演员赵毅欠债百万不还!对方晒转账记录,两人已相识10年

小咪侃娱圈
2025-01-16 09:27:53
最强防空导弹现世,可打卫星核弹,中国求购对方提条件

最强防空导弹现世,可打卫星核弹,中国求购对方提条件

April工作室
2025-01-17 14:05:12
长得美若天仙,私下却是“文盲”的5位女星,孙俪、周也出乎意料

长得美若天仙,私下却是“文盲”的5位女星,孙俪、周也出乎意料

不似少年游
2025-01-18 08:50:03
“百千万”冲上新高度!广东亮“真功夫”

“百千万”冲上新高度!广东亮“真功夫”

广东发布
2025-01-17 22:39:57
惊魂九小时,美航母终于逃出生天,丢失的“东西”再也无法找回?

惊魂九小时,美航母终于逃出生天,丢失的“东西”再也无法找回?

文理TALK
2025-01-15 10:23:41
一场2-1逆转,让利物浦榜首不保!落后4分,11亿豪门重燃争冠希望

一场2-1逆转,让利物浦榜首不保!落后4分,11亿豪门重燃争冠希望

小彭美识
2025-01-18 04:32:18
一场大火,烧没了一个经济特区,汕头“火烧芹菜”真相

一场大火,烧没了一个经济特区,汕头“火烧芹菜”真相

苍山有雪
2023-12-28 17:52:19
在秦城监狱里面,有这么五个事情是不允许做的

在秦城监狱里面,有这么五个事情是不允许做的

贱议你读史
2025-01-17 22:34:14
越南改革进入深水区,关闭国家主要电视台发出改革官僚机构信号

越南改革进入深水区,关闭国家主要电视台发出改革官僚机构信号

火星宏观
2025-01-18 00:38:10
消息称华为手机将重返全球市场:计划进军 60 个国家和地区

消息称华为手机将重返全球市场:计划进军 60 个国家和地区

IT之家
2025-01-17 09:50:21
津媒:时间紧迫,国足已做好小奥斯卡、塞鸟3月无法出战准备

津媒:时间紧迫,国足已做好小奥斯卡、塞鸟3月无法出战准备

直播吧
2025-01-17 09:52:22
乌国选举变天,泽连斯基以1敌4,亲俄总统或胜选,绰号石油女王

乌国选举变天,泽连斯基以1敌4,亲俄总统或胜选,绰号石油女王

影孖看世界
2025-01-16 23:39:13
年报业绩,同比增长100%公司(精心梳理)

年报业绩,同比增长100%公司(精心梳理)

小波股事历程
2025-01-18 01:23:03
全明星投票第三阶段:詹姆斯领先库里80万票!

全明星投票第三阶段:詹姆斯领先库里80万票!

历史第一人梅西
2025-01-17 11:54:00
2025-01-18 09:36:49
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
534699文章数 1003344关注度
往期回顾 全部

科技要闻

荣耀IPO前管理层"地震" 赵明为什么被换掉

头条要闻

一文读懂:特朗普承诺上台第一天就要做的10件事

头条要闻

一文读懂:特朗普承诺上台第一天就要做的10件事

体育要闻

谷爱凌坡面障碍赛世界杯赛季4连冠

娱乐要闻

杨泽琪平安归来!斗争时指甲盖被拔

财经要闻

重磅!2024年中国GDP同比增长5%

汽车要闻

10万元级无图智驾 悦也PLUS全路况实测

态度原创

艺术
教育
数码
公开课
军事航空

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

教育要闻

2025年寒假致中小学生家长的一封信

数码要闻

海尔三翼鸟HomeGPT Edge备案通过 行业首个“端+云”双模型

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

以色列和哈马斯签署加沙停火换俘协议

无障碍浏览 进入关怀版