网易首页 > 网易号 > 正文 申请入驻

OpenAI发布最强推理模型o1,公司计划以1.07万亿估值进行新一轮融资|钛媒体AGI

0
分享至


北京时间9月13日凌晨,美国OpenAI公司发布全新模型技术产品o1,包括两种版本o1-preview 和 o1-mini,前者具有高级推理功能,在推理数学、编程、科学等问题的能力上有显著提高,性能接近理化生博士水平;后者则是一款更小巧、专为代码生成优化的模型。

这就是此前传言中高级推理能力强大模型的“Strawberry”项目。也有人分析称,o1是Orion大模型简称。


OpenAI表示,对于复杂推理任务而言,新模型代表着 AI 能力的崭新水平,因此值得将计数重置为1,给它一个有别于“GPT-4”系列的全新名号。同时,这也预示着,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型重要到来。

需要注意的是,o1 目前的聊天体验还比较基础。不同于其前身 GPT-4o,o1 目前无法浏览网页或处理文件分析功能。尽管它具备图像分析功能,但该功能暂时关闭,等待进一步测试。此外,o1 还有消息量限制——目前 o1-preview 每周限额30条、o1-mini每周50条。

即日起,o1-preview 和 o1-mini两个版本已经在ChatGPT Plus/Team和API接口渠道上线,企业和教育用户将于下周初获得优先访问权限。

OpenAI CEO奥尔特曼(Sam Altman)表示,“这是我们迄今为止功能最强大、最一致的模型系列 o1,也是迄今为止我们最好的推理模型。虽然o1仍然存在缺陷并有限,但使用时的感觉依然更加令人印象深刻。”


具体来看,OpenAI o1可以解决比以前GPT时期的科学、编码和数学模型更难的问题。

OpenAI的研究负责人Jerry Tworek透露,o1模型背后的训练与之前的产品有着根本性的区别。之前的GPT模型旨在模仿其训练数据中的模式,而o1的训练旨在让其独立解决问题。在强化学习的过程中,使用奖励和惩罚机制来“教育”AI使用“思维链”来处理问题,就像人类习得拆解、分析问题的方式一样。

o1上线之后,现在ChatGPT可以在回答问题前先仔细思考,而不是立即脱口而出答案。就像人类大脑的系统 1 和系统 2,ChatGPT 已经从仅使用系统 1(快速、自动、直观、易出错)进化到了可使用系统 2 思维(缓慢、深思熟虑、有意识、可靠)。这让它能够解决以前无法解决的问题。

所谓推理大模型,就是AI会在回答之前花更多时间进行思考,就像人类思考解决问题的过程一样,而非预测单词生成的序列。比如通过文字点开AI思考的过程,还会出现AI表示“我在思考这个事情这么做行不行”、“啊时间不够了得尽快给出答案”等。OpenAI确认,这里展示的并不是原始的思维链,而是“模型生成的摘要”,公司也坦率承认这里有保持“竞争优势”的因素。

根据测试,在国际数学奥林匹克(IMO)资格考试中,GPT-4o 仅正确解答了 13% 的问题,而 o1 模型正确解答了 83% 的问题。而在编程能力比赛Codeforces中,o1模型拿到89%百分位的成绩,而GPT-4o只有11%。

OpenAI 发现,随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算),o1 的性能持续提高。而且扩展这种方法的限制与大模型预训练的限制有很大不同,OpenAI 也还在继续研究。

OpenAI技术文件称,实验结果表明:o1 超越了人类专家的表现,性能接近理科博士水平,成为第一个在该基准测试中做到这一点的模型。而在下一个更新的版本中,AI在物理、化学和生物学的挑战性基准测试中,表现能够与博士生水平类似。

除了OpenAI o1-preview外,OpenAI今晨也同步推出了o1-mini模型,更快、更便宜,定价也比preview版本降低了80%,适用于需要推理但不需要广泛世界知识的场景。


很显然,尽管新的OpenAI o1还不具备更全面问题解决能力,但显著提升的推理能力使其在科学、编程、数学等专业领域具备了更大的用途,以及 AI Agent 相关技术的下限和上限被整体拉高,大幅提升科学研究和生产端的能力,对于消费端来说意义不算太大。

英伟达首席科学家Jim Fan表示,新的o1需要消耗更大的算力和数据,并且能够形成数据飞轮效应,正确的答案及其思考过程可以成为很好的训练数据。从而不断改进推理核心,类似AlphaGo的价值网络随着MCTS生成更多精炼数据而改进。

天风国际称,OpenAI o1系列模型大幅增强推理能力,并宣布新的Scaling范式:通过RL解锁Test time compute(推理时间)。

此外,9月11日彭博社报道称,OpenAI正在商谈以1500亿美元(约合10675.35亿元,1.07万亿元)的估值进行新一轮融资,有望从投资者那里筹集65亿美元,投资方包括苹果、英伟达、微软等。同时,OpenAI还在谈判以循环信贷安排的形式从银行借款50亿美元。

成立于2015年的OpenAI,一直处于科技行业向 AI 快速转变的中心,其发布的聊天机器人产品ChatGPT于2022年首次亮相,引发全球 AI 投资热潮。OpenAI首席财务官Sarah Friar近日在内部备忘录中表示,新一轮融资将支持公司对计算能力和其他运营费用的需求。她强调,该公司的目标是允许员工在今年晚些时候的收购要约中出售部分股份。

(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
卫生巾全面塌房!网友怒斥:这狗血的社会,唯独没怀疑过卫生巾!

卫生巾全面塌房!网友怒斥:这狗血的社会,唯独没怀疑过卫生巾!

华人星光
2024-11-26 14:20:43
东北局地特大暴雪已破纪录 明天南北方气温再创新低

东北局地特大暴雪已破纪录 明天南北方气温再创新低

财联社
2024-11-26 18:26:04
这大概是章泽天最真实的照片了,抛弃一切身份,此时她只是位母亲

这大概是章泽天最真实的照片了,抛弃一切身份,此时她只是位母亲

人情皆文史
2024-10-13 00:04:08
癌症晚期已转移,浙江女子悔惨:不痛不痒!医生:本来可以避免……

癌症晚期已转移,浙江女子悔惨:不痛不痒!医生:本来可以避免……

FM93浙江交通之声
2024-11-26 16:30:43
新冠疫情时名声大噪的4位专家,为何后来口碑出现逆转?

新冠疫情时名声大噪的4位专家,为何后来口碑出现逆转?

李昕言温度空间
2024-11-25 10:14:27
想让男孩情绪稳定,这9句话要频繁对他说

想让男孩情绪稳定,这9句话要频繁对他说

男孩派
2024-11-25 15:12:36
这张照片捕捉了一个历史性的瞬间,带我们回到了20世纪60年代

这张照片捕捉了一个历史性的瞬间,带我们回到了20世纪60年代

洞鉴历史
2024-11-22 12:55:03
中超豪门或遭降级!足协罚单突生变数,宋凯铁面无私

中超豪门或遭降级!足协罚单突生变数,宋凯铁面无私

拳击时空
2024-11-26 06:29:11
太突然!著名导演凌晨去世

太突然!著名导演凌晨去世

鲁中晨报
2024-11-24 09:24:08
央视曝光“羽绒骗局”!你的孩子可能正在穿

央视曝光“羽绒骗局”!你的孩子可能正在穿

澎湃新闻
2024-11-25 09:58:27
未来两个月,否极泰来,运势大逆袭的三个星座

未来两个月,否极泰来,运势大逆袭的三个星座

小晴星座说
2024-11-26 20:58:27
中欧协议取消关税在望,欧盟将中国告到WTO,并计划制裁中企

中欧协议取消关税在望,欧盟将中国告到WTO,并计划制裁中企

王晋博士
2024-11-26 22:00:03
蔡英文曝光蒋介石手令,国人一片哗然!

蔡英文曝光蒋介石手令,国人一片哗然!

霹雳炮
2024-11-26 00:01:32
“黄色网站”上的女生,都是怎么被偷拍的?

“黄色网站”上的女生,都是怎么被偷拍的?

书画艺术收藏
2024-10-29 19:10:02
黄渤、沈腾主演电影《疯狂的外星人》将于12月20日重映

黄渤、沈腾主演电影《疯狂的外星人》将于12月20日重映

新京报
2024-11-26 10:53:27
喜讯!津门虎一分钱不花就从全北现代挖走大牌指挥官,冬窗入队

喜讯!津门虎一分钱不花就从全北现代挖走大牌指挥官,冬窗入队

小海要说球
2024-11-26 20:34:50
突然关闭,多家门店人去楼空,有人刚交了80万元

突然关闭,多家门店人去楼空,有人刚交了80万元

中吴网
2024-11-24 12:30:08
46岁滨崎步在成都被粉丝要签名,穿深V显傲人上围,性感不减当年

46岁滨崎步在成都被粉丝要签名,穿深V显傲人上围,性感不减当年

南城无双
2024-11-18 01:11:22
安徽一家上市公司涨疯了,股价单日涨超2200%,创A股历史记录!

安徽一家上市公司涨疯了,股价单日涨超2200%,创A股历史记录!

胡华成
2024-11-26 15:40:16
华为“用力过猛”,16GB+512GB跌价2820元,为Mate70加速让路

华为“用力过猛”,16GB+512GB跌价2820元,为Mate70加速让路

科技阿维
2024-11-25 13:54:44
2024-11-26 22:43:00
钛媒体APP
钛媒体APP
独立财经科技媒体
110527文章数 859415关注度
往期回顾 全部

科技要闻

"这是国产化最高,也是史上最强的Mate"

头条要闻

买房"免息垫首付"暴雷:深莞多楼盘卷入 个别涉千万元

头条要闻

买房"免息垫首付"暴雷:深莞多楼盘卷入 个别涉千万元

体育要闻

37岁,他用“半条右腿”重返巅峰

娱乐要闻

权威奖项沦为资本工具?谁来管一管

财经要闻

洪灏刘煜辉对谈实录 涉及A股、债务等!

汽车要闻

解决油车无法处理的难题 仰望U7数字底盘这么强

态度原创

艺术
数码
房产
家居
健康

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

数码要闻

【IT之家评测室】小巧体积,强大性能,DJI Mic Mini 上手体验

房产要闻

大动作!新世界·天馥全线上新,锚定广州置业安全网第一标准!

家居要闻

色彩搭配 活跃空间气氛

花18万治疗阿尔茨海默病,值不值?

无障碍浏览 进入关怀版