网易首页 > 网易号 > 正文 申请入驻

OpenAI发布o1模型:错误率减少34%,速度提升50%,月付200美元Pro会员无限制调用 | 最前线

0
分享至

文 | 田哲

编辑 | 苏建勋

12月6日凌晨2点,OpenAI开启了12天工作日的首场直播。此次直播,OpenAI推出了o1模型,以及新的订阅服务ChatGPT Pro。自今天起,o1模型将取代o1-preview模型,ChatGPT Plus和Pro订阅用户均可使用。

今年9月,OpenAI正式推出o1大模型,可针对科学、代码和数学等领域的复杂问题解答,不过,彼时仅推出o1-preview、o1 mini两个版本,未解锁o1模型的全部能力。而此次发布会推出的o1模型,在智能化、多模态输入、思考速度等方面均有所提高。

OpenAI联合创始人、首席执行官Sam Altman表示,相对o1-preview,o1模型的重大错误率相比o1-preview减少了约 34%,而思考速度提升了约 50%。

他介绍,o1之所以与众不同,是其每次在回答之前都会思考,这使得它能够提供比其他模型更详细、更正确的答案。

o1的智能化体现在数学等复杂问题具备更高的准确率。据悉,o1模型在解答AIME 2024数学竞赛、博士级科学问题的准确率分别达到78.3%、75.6%,比o1-Preview的准确率分别高出28.3%,1.5%。

回答速度方面,o1也有所提升。在离线测试情况下,o1的平均响应速度比 O1 预览版快了约 60%。OpenAI员工在直播中提出一个问题,分别要求o1、o1-Preview列举公元2世纪的罗马皇帝,并简述他们的生平。结果显示,o1只花了约14秒解答,而o1-Preview耗费33秒。

OpenAI还注意到模型之前对所有问题都有较长的相应时间,他们已经修复这一问题。现在,如果你提出一个简单的问题,o1会快速作答;如果提出了一个复杂的问题,它会花更长的时间思考。

此外,o1新增多模态输入能力,能同时处理图片和文本内容,并进行推理。

OpenAI展示了一张手绘草图的A4纸,画有太阳、冷却系统等物体,以及不同数值,拍照上传给o1。o1在没有任何提示的情况下,生成用户可能想问的问题,并自动解答。接着在不到10秒的时间,o1不仅成功理解了草图的问题要求,还意识到没有提供的参数,自我推理给出了正确答案。

考虑到用户希望不受调用限制使用模型的需求,OpenAI此次推出了新的订阅机制ChatGPT Pro,用户每月付费200美元即可无限制使用更强的o1模型——o1 Pro。

OpenAI展示了o1-Preview、o1、o1 Pro在数学竞赛、代码竞赛、博士级科学问题的回答差异,在每个问题询问四次后,o1 Pro的可靠准确率最高,分别为80.0%、74.9%、74.2%。

来源:OpenAI

在直播中,OpenAI提出了一个o1-Preview回答错误的化学问题,要求o1 Pro找到符合特定标准的蛋白质。结果显示,o1 Pro仅耗费53秒完成答题,并允许用户查看思考过程。

OpenAI表示,他们计划让o1 Pro支持更多高计算密集型任务,允许处理更长和更复杂的任务。此外,o1 Pro还将新增网络浏览、文件上传和增强的API支持(例如结构化输出、函数调用和图像理解)功能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
Open AI创始人山姆·奥特曼最新访谈:您会建议孩子学什么,才能确保 30 年后不被 AI 取代?

Open AI创始人山姆·奥特曼最新访谈:您会建议孩子学什么,才能确保 30 年后不被 AI 取代?

算法与数学之美
2026-03-12 19:27:52
以色列何去何从,历史惊人的相似,犹太人在打中国的主意

以色列何去何从,历史惊人的相似,犹太人在打中国的主意

赵枹是个热血青年
2026-03-05 21:34:25
4次挑衅中国!乌克兰名将:感谢支持乌克兰 伊朗让我们上不了头条

4次挑衅中国!乌克兰名将:感谢支持乌克兰 伊朗让我们上不了头条

念洲
2026-03-13 09:51:31
上海首轮土拍,意外还是发生了

上海首轮土拍,意外还是发生了

风声声
2026-03-13 18:51:55
洗草莓时,有人放食盐,有人放面粉,果农:都不对,教你正确做法

洗草莓时,有人放食盐,有人放面粉,果农:都不对,教你正确做法

阿龙美食记
2026-02-28 10:49:43
24小时内,美国喊话中俄,普京憋了一肚子火,幸亏中国留了一手

24小时内,美国喊话中俄,普京憋了一肚子火,幸亏中国留了一手

知鉴明史
2026-03-14 06:40:06
70岁以上老人,比存钱更重要的10件事,血的教训,要刻在脑子里

70岁以上老人,比存钱更重要的10件事,血的教训,要刻在脑子里

暖风吹过竹林
2026-03-12 17:38:11
男人的生理需求能有多难忍?网友:我对我老公只有动物本能

男人的生理需求能有多难忍?网友:我对我老公只有动物本能

带你感受人间冷暖
2026-02-07 03:58:56
美国人预测:未来20年,世界上最强大的7个国家,看都有谁?

美国人预测:未来20年,世界上最强大的7个国家,看都有谁?

顾史
2026-02-15 19:36:00
瓜帅:我在欧冠各个阶段都输过很多次,但我仍然在这个位置上

瓜帅:我在欧冠各个阶段都输过很多次,但我仍然在这个位置上

懂球帝
2026-03-13 21:53:36
刺激夜:都灵4-1,门兴2-0,马赛1-0,比利亚雷亚尔1-1,穆帅前东家0-2

刺激夜:都灵4-1,门兴2-0,马赛1-0,比利亚雷亚尔1-1,穆帅前东家0-2

侧身凌空斩
2026-03-14 06:14:01
特朗普表态48小时内,朝鲜宣布参战,俄总统罕见发声

特朗普表态48小时内,朝鲜宣布参战,俄总统罕见发声

等风上青云
2026-03-12 17:50:24
“这种衣服咋能穿出门?”女孩被3.9万人围观,家教太松不是好事

“这种衣服咋能穿出门?”女孩被3.9万人围观,家教太松不是好事

妍妍教育日记
2026-03-08 08:00:10
航班超售拒载赴沪就医旅客?东航回应:不让谁登机靠现场工作人员判断 | 有料315

航班超售拒载赴沪就医旅客?东航回应:不让谁登机靠现场工作人员判断 | 有料315

天气观察站
2026-03-13 17:21:54
伊犁条约割让大片土地给沙俄,为何依旧算是胜利?左宗棠已经尽力

伊犁条约割让大片土地给沙俄,为何依旧算是胜利?左宗棠已经尽力

铭记历史呀
2026-03-11 18:24:15
92年分家,小叔分砖房,我家分土房,多年后接到通知,小婶红了眼

92年分家,小叔分砖房,我家分土房,多年后接到通知,小婶红了眼

人间百态大全
2026-03-14 06:50:05
河南一女演员突发意外!高空表演时不慎坠落,目击者:铁架被砸变形,已被送往医院

河南一女演员突发意外!高空表演时不慎坠落,目击者:铁架被砸变形,已被送往医院

大风新闻
2026-03-13 15:14:10
《好好的时光》结局:单宝昆回来了!王元义成白眼狼,他最有出息

《好好的时光》结局:单宝昆回来了!王元义成白眼狼,他最有出息

糖逗在娱乐
2026-03-14 00:12:40
阿德巴约:没人会在那时申请下场 如果你因83分生气我也不在乎

阿德巴约:没人会在那时申请下场 如果你因83分生气我也不在乎

北青网-北京青年报
2026-03-13 19:25:05
92岁的老太累坏两个女儿后,被小儿子扔进养老院,邻居:做的真对

92岁的老太累坏两个女儿后,被小儿子扔进养老院,邻居:做的真对

千秋文化
2026-03-13 20:57:00
2026-03-14 07:32:49
36氪 incentive-icons
36氪
让一部分人先看到未来
150853文章数 2848393关注度
往期回顾 全部

科技要闻

龙虾热卷到AI硬件 “无脑”硬件或被淘汰

头条要闻

穆杰塔巴"亮相"没讲话 伊朗学者:其处境可能非常危险

头条要闻

穆杰塔巴"亮相"没讲话 伊朗学者:其处境可能非常危险

体育要闻

叕战奥运,张雨霏要做回“小将”

娱乐要闻

广电总局公布演员将用姓氏笔画定番位

财经要闻

“十五五”规划纲要,全文来了!

汽车要闻

置换补贴价8.68万 五菱缤果S 525km旗舰款上市

态度原创

房产
健康
亲子
家居
教育

房产要闻

不容易啊!海口终于又要卖地了!

转头就晕的耳石症,能开车上班吗?

亲子要闻

育儿思路:思考快与慢

家居要闻

艺术之家 法式优雅

教育要闻

中华中学2026年招生工作正式启动!

无障碍浏览 进入关怀版