网易首页 > 网易号 > 正文 申请入驻

撞上数据墙?OpenAI模型提升速度放缓 着手调整开发策略

0
分享至

《科创板日报》11月10日讯 高质量数据不够用,拖累AI模型改进速度——OpenAI这位AI领头羊又遇到了难题。

一些测试过Orion的OpenAI员工发现,虽然Orion的性能超过了OpenAI现有的所有模型,但其性能质量提升程度远远小于从GPT-3到GPT-4的飞跃。这意味着,随着高质量数据趋于有限,AI模型的改进速度可能会放缓

不仅如此,Orion的训练中涉及来自旧模型(例如GPT-4与一些推理模型)的AI生成数据,这可能导致其重现旧模型的一些行为。

为此,OpenAI成立了一个“基础”团队,以在高质量新数据供应减少的情况下,研究能让AI模型保持改进的新方法。据悉,公司计划基于AI合成数据训练Orion,并在后期训练中对模型作出更多改进

目前,OpenAI正在推进Orion的安全测试,计划于明年年初发布这一模型,其可能会打破“GPT-X”的命名惯例,以反映模型开发的变化。

值得注意的是,OpenAI在今年收购了Chat.com域名,该域名已重定向至OpenAI的AI驱动聊天机器人ChatGPT。

▌“撞上数据墙”

早在2020年,OpenAI就曾在一篇论文中提出Scaling law定律,意指大模型的最终性能主要与计算量、模型参数量和训练数据量三者的大小相关,而与模型的具体结构(层数/深度/宽度)基本无关。换言之,仅仅增加模型规模和训练数据,就能显著提升人工智能能力,而无需取得根本性的算法突破。

AI界许多公司都一度将Scaling Law奉为圭臬,但如今,也有越来越多的质疑声出现。

Meta AI人工智能研究院(FAIR)研究员及高级经理田渊栋指出,“我画过一张图,一开始数据量越大,模型性能表现越好,但模型离人类越近就越难获得新的数据,模型就越来越难以改进,最后总会有些corner case(边角案例,即无法想到的或不常见的案例)解决不了,这是data driven(数据驱动)最大的问题。”

非营利研究机构Epoch AI在今年7月更新的一篇论文中指出,未来数年内,(原始)数据增长的速度将难以支撑AI大模型扩展发展的速度,在2026-2032年之间的某个时间点,数据存量将耗尽。


实际上,OpenAI已不是第一次遭遇“数据资源不足”的问题。此前已有媒体报道指出,在训练GPT-5时,OpenAI因文本数据不足,正在考虑使用YouTube公开视频转录出的文本。

如今OpenAI再度碰上数据资源难题,甚至因此影响到了新模型进展。“但这代表‘天塌了,’”The Information这篇文章的作者之一Amir Efrati指出,OpenAI正在作出调整,或许将有新的Scaling Law取代旧Scaling Law。

值得一提的,当地时间11月9日,OpenAI安全系统团队负责人翁荔(Lilian Weng)宣布将离开已经工作了近7年的OpenAI。她公开分享了发给团队的离职信,但其中并未言明具体离职原因及未来职业去向,仅表示“是时候重新出发,探索新的领域了”。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2名女子穿内衣内裤游泳,被小男孩趁机揩油,关键不能对他怎么样

2名女子穿内衣内裤游泳,被小男孩趁机揩油,关键不能对他怎么样

唐小糖说情感
2024-09-05 11:50:34
已传染3个班!一小学紧急停课!多地发布提醒:近期,这种传染病高发!小心孩子身上这些症状

已传染3个班!一小学紧急停课!多地发布提醒:近期,这种传染病高发!小心孩子身上这些症状

育儿网官方号
2024-11-13 12:23:19
国内多名玩家超低价购买的PS5 Pro被强制砍单

国内多名玩家超低价购买的PS5 Pro被强制砍单

游民星空
2024-11-13 14:10:21
刘晓庆咏鹅视频被曝后首现身,网友好奇耳朵咋又变长了,又拉皮了

刘晓庆咏鹅视频被曝后首现身,网友好奇耳朵咋又变长了,又拉皮了

古今历史记
2024-11-13 10:50:54
卡萨诺:基耶萨究竟怎么了?在利物浦甚至连10分钟都没踢过

卡萨诺:基耶萨究竟怎么了?在利物浦甚至连10分钟都没踢过

星耀国际足坛
2024-11-13 08:48:53
揭秘女性性生活欲望强烈的四大原因

揭秘女性性生活欲望强烈的四大原因

智见派
2024-07-06 16:33:34
27岁三陪女被50岁富豪包养,哺乳期还约男人上门,下体被塞擀面杖

27岁三陪女被50岁富豪包养,哺乳期还约男人上门,下体被塞擀面杖

胖胖侃咖
2024-11-13 08:00:06
中医建议,让我连喝一周苹果水,坚持喝了一周,脾胃真的太舒服了

中医建议,让我连喝一周苹果水,坚持喝了一周,脾胃真的太舒服了

苏瑶的美食
2024-11-10 17:22:36
民法典:楼上漏水楼下受损,谁负责赔偿?赔多少,怎么赔?

民法典:楼上漏水楼下受损,谁负责赔偿?赔多少,怎么赔?

周军律师聊案子
2024-10-27 10:49:04
阿根廷10月通胀率为2.7%

阿根廷10月通胀率为2.7%

界面新闻
2024-11-13 07:35:25
广东惠州:“惠医保2025”正式发布 公益普惠再出发

广东惠州:“惠医保2025”正式发布 公益普惠再出发

环球网资讯
2024-11-13 16:00:08
仅差6个!哈登迎来神级里程碑,库里的三分王纪录很难破

仅差6个!哈登迎来神级里程碑,库里的三分王纪录很难破

世界体育圈
2024-11-13 10:54:50
这4菜是便秘的“克星”,中老年隔天吃一种,通便排毒,身心舒畅

这4菜是便秘的“克星”,中老年隔天吃一种,通便排毒,身心舒畅

小茉莉美食记
2024-11-12 07:12:53
志愿军松骨峰血战背后:团长范天恩私自率部赶入战场,却永入史册

志愿军松骨峰血战背后:团长范天恩私自率部赶入战场,却永入史册

李满
2023-10-09 08:53:33
3404点沪指止跌反弹,但沪市成交额仅剩8000亿,风险还没有消除

3404点沪指止跌反弹,但沪市成交额仅剩8000亿,风险还没有消除

投资观
2024-11-13 14:52:17
韩国人工肌肉突破!软似果冻硬如钢,可举起自身3690倍重量

韩国人工肌肉突破!软似果冻硬如钢,可举起自身3690倍重量

徐德文科学频道
2024-11-12 21:23:04
拾荒父亲供儿子上大学,儿子婚礼叫父亲上台,岳父听到竟直接跪下

拾荒父亲供儿子上大学,儿子婚礼叫父亲上台,岳父听到竟直接跪下

今天说故事
2024-09-24 18:07:26
世界乒联官宣!樊振东、马龙、陈梦退出总决赛,外协会名将递补

世界乒联官宣!樊振东、马龙、陈梦退出总决赛,外协会名将递补

全言作品
2024-11-13 16:24:17
老哥密码忘记了11年的34个比特币,终于找回来了! 这其中也是波折…

老哥密码忘记了11年的34个比特币,终于找回来了! 这其中也是波折…

英国那些事儿
2024-10-28 23:18:49
李子柒回归!视频单平台播放过亿,知情人士:停更对李子柒来说是一种闭关修炼

李子柒回归!视频单平台播放过亿,知情人士:停更对李子柒来说是一种闭关修炼

极目新闻
2024-11-12 22:46:35
2024-11-13 17:18:44
财联社
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
506045文章数 1000503关注度
往期回顾 全部

科技要闻

孙正义首次透露!曾三次尝试买下英伟达

头条要闻

赖清德被指向特朗普纳上"投名状" 涉及150亿美元军购

头条要闻

赖清德被指向特朗普纳上"投名状" 涉及150亿美元军购

体育要闻

NBA球星越来越脆了,是错觉吗?

娱乐要闻

李子柒全面复出!还有大动作待宣布

财经要闻

严介和家族还不上数十万元小账单?

汽车要闻

广汽传祺S7领衔 广汽集团自主新车阵容发布

态度原创

健康
艺术
手机
房产
数码

花18万治疗阿尔茨海默病,值不值?

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

手机要闻

红魔 10 Pro 系列手机屏幕支持高频 PWM 调光、DC 调光

房产要闻

太猛了!三亚大规模城市开发突然加速,1600亩征收计划曝光!

数码要闻

天玑9400平板只卖2000多?这一波新平板太香了

无障碍浏览 进入关怀版