网易首页 > 网易号 > 正文 申请入驻

受DeepSeek影响?OpenAI上线O3 Mini,推理模型首次免费

0
分享至

本文作者:何浩

来源:硬AI

当地时间1月31日周五,OpenAI正式推出了全新推理模型o3-mini,并首次向免费用户开放推理模型。这是OpenAI推理系列中最新、成本效益最高的模型,OpenAI称该模型能够进行类似人类的推理,现在已经在ChatGPT和API中上线。随着DeepSeek发布开源模型震撼全球,OpenAI的这款新品备受关注。

o3-mini能够以更低的成本、更快的响应速度,为用户提供STEM能力,在科学、数学和编程领域表现尤为出色,同时延续了o1-mini等之前版本的低成本和低延迟特点。值得一提的是,开发者可以根据需求在低、中、高三种不同的“推理努力”选项中进行选择。

OpenAI表示,虽然OpenAI o1仍然是用于一般知识推理的广泛模型,但OpenAI o3-mini为那些需要精确性和快速响应的技术领域提供了一个专门的替代方案。o3-mini采用中等推理努力,在速度与准确性之间实现了平衡。

支持更多开发者功能

o3-mini是第一个支持开发者常用功能的小型推理模型,包括:

函数调用:可以直接调用预设函数,实现更高效的任务处理。
结构化输出:让模型输出的信息更规整,便于解析和应用。
开发者消息:为开发者提供更多调试和信息反馈手段。

与之前的o1-mini一样,最新的o3-mini同样支持流式输出。

OpenAI介绍称,o3-mini支持开发者调整“AI推理努力程度”,分为低、中、高三个级别。这种灵活性使得o3-mini可以在面对难题时“更努力思考”,而需要效率时优先考虑回应速度。

o3-mini不支持视觉能力,因此对于需要进行图像处理或视觉推理任务的用户,仍需使用OpenAI的o1模型。

广泛的接入方式

对于不同类型用户,o3-mini可以通过多个渠道接入:

  • API用户:在Chat Completions、Assistants和Batch API中,o3-mini已经向部分API用户开放(适用于使用层级3-5的用户)。
  • ChatGPT用户:ChatGPT Plus、Team和Pro用户从周五开始即可使用,企业用户则将在一周后获得访问权限。
  • 免费用户:免费用户也能通过选择“推理模式”或重新生成回答的方式体验o3-mini。这是首次免费用户可以使用具备推理能力的模型。

OpenAI表示,o3-mini将取代模型选择器中的OpenAI o1-mini。所有付费用户可以在模型选择器中选择o3-mini-high——一个智力更强、但生成响应速度略慢的版本。

Pro用户可无限制地使用o3-mini和o3-mini-high。OpenAI将Plus和Team用户的日消息限额从o1-mini的50条提高到o3-mini的150条。

此外,o3-mini现已支持搜索功能,能够查找最新答案并提供相关网页链接。这是一个早期原型,OpenAI称正在努力将搜索功能整合到所有推理模型中。

模型性能亮点

据OpenAI披露,在2024年美国数学邀请赛(AIME 2024)的测试中,低推理努力的o3-mini准确率为60%,与o1-mini差不多,但速度更快;而在中等努力下,o3-mini的准确率能够提升到79.6%,与o1模型相当;在最高努力水平时,o3-mini的准确率则能进一步提升至87.3%。

在博士级科学问题(GPQA Diamond)方面,三种努力程度模型的准确率分别为70.6%、76.8%和79.7%。

FrontierMath前沿数学与Codeforces等编程竞赛方面,o3-mini也显示出明显优势,甚至在某些评测中远超前代模型。

在SWE-bench Verified软件工程任务测试中,o3-mini高推理版本的准确率达到了超过49%,优于旧版本。

通用知识方面,在各种知识评测中,o3-mini的表现也超过了o1-mini,能够为用户提供更准确的答案。

在智能水平与o1相当的前提下,o3-mini提供了更快的性能和更高的效率。除了上述提及的STEM评估之外,采用中等推理努力的情况下,o3-mini在数学和事实性评估中也展现出更出色的表现。在A/B测试中,o3-mini的响应速度比o1-mini快24%,其平均响应时间为7.7秒,而o1-mini为10.16秒。延迟方面,o3-mini的首个token平均比o1-mini快2500毫秒。

安全性与风险防控

OpenAI表示,o3-mini采用了“深思熟虑的对齐”方法,即在回答用户问题之前,让模型先思考人类制定的安全规则。与o1模型类似,o3-mini在应对复杂安全挑战和防止绕过安全措施(jailbreak)上,比GPT-4o表现得更出色。

在发布前,OpenAI采用了全面的安全准备、外部红队测试和多种安全评估方法,对o3-mini的风险进行了严格评估。相关的详细评估结果和风险防控措施,均记录在o3-mini的系统卡中。

未来展望

OpenAI公司表示,o3-mini的发布标志着OpenAI在推动低成本智能边界方面又迈出了一步。通过为STEM领域优化推理能力,同时保持低成本,使高质量的人工智能变得更加普及。OpenAI指出,该模型延续了不断降低智能成本的传统——自推出GPT-4以来,每个token的定价降低了95%——同时依然保持顶级的推理能力。

OpenAI表示,随着人工智能的广泛应用,将继续走在前沿,构建在智能、效率和安全性上取得平衡的大规模模型。

o3-mini发布前夕

o3-mini的发布背景颇为引人注目。

在此前OpenAI宣布Operator AI代理之后仅一天,特朗普政府就公布了大规模的“星际之门”AI资助项目。

随后,DeepSeek R1的崛起震惊全球,对市场造成冲击,AI领域竞争加剧,OpenAI加快了o3-mini发布进程,以维持其在AI领域的领先地位。在o3-mini正式发布前就有消息称,OpenAI准备本周五发布新一代推理模型ChatGPT o3-mini,该模型是o3系列的精简版本,专为特定任务优化,速度更快且更具成本效益。

OpenAI CEO Sam Altman于1月17日在社交平台X上表示,ChatGPT o3-mini的最终版本已经完成,正在进入发布流程。当时他预计新版本将在"大约几周后"推出。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
四川一彩民花18元中2576万元大奖!店主:中奖者常年外出打工,是老客户,偶尔买彩票,号码都是自己选

四川一彩民花18元中2576万元大奖!店主:中奖者常年外出打工,是老客户,偶尔买彩票,号码都是自己选

三湘都市报
2026-05-28 18:53:47
刚刚,黄仁勋加入清华大学

刚刚,黄仁勋加入清华大学

AppSo
2026-05-28 13:03:25
巴西宣布内马尔腿伤缺阵2-3周 基本无缘世界杯首战 或被临阵替换

巴西宣布内马尔腿伤缺阵2-3周 基本无缘世界杯首战 或被临阵替换

我爱英超
2026-05-28 20:42:00
384:0全票通过!普京已签字,俄罗斯放出终极底牌,中国该效仿吗

384:0全票通过!普京已签字,俄罗斯放出终极底牌,中国该效仿吗

流史岁月
2026-05-28 19:45:03
法网大冷!世界第一辛纳2-3遭塞伦德罗逆转 疑似中暑终结30连胜

法网大冷!世界第一辛纳2-3遭塞伦德罗逆转 疑似中暑终结30连胜

醉卧浮生
2026-05-28 21:51:56
郑钦文输球仅1天,让人愤怒的一幕出现,现在的她印证了李娜的话

郑钦文输球仅1天,让人愤怒的一幕出现,现在的她印证了李娜的话

青橘罐头
2026-05-28 09:51:56
正大量上市,钾含量是苹果8倍,6月使劲吃,腿脚有劲,精神饱满

正大量上市,钾含量是苹果8倍,6月使劲吃,腿脚有劲,精神饱满

阿龙美食记
2026-05-28 16:48:12
病历和裸检视频被泄露!医生群聊晒30厘米黄金肛塞合照

病历和裸检视频被泄露!医生群聊晒30厘米黄金肛塞合照

北京郑律师
2026-05-28 12:03:28
A股:紧急提醒2.5亿股民!从5月29日起,明天A股或将历史再次重演?

A股:紧急提醒2.5亿股民!从5月29日起,明天A股或将历史再次重演?

趋势清风侠
2026-05-28 18:20:07
货车在南京一小区内超速撞击4岁幼童致重伤,奶奶为护孩子不幸身亡

货车在南京一小区内超速撞击4岁幼童致重伤,奶奶为护孩子不幸身亡

大风新闻
2026-05-28 21:25:04
被指造假压榨学生5年,网传北航这位博导遭“天花板”处分,学术路全断了

被指造假压榨学生5年,网传北航这位博导遭“天花板”处分,学术路全断了

互联网大观
2026-05-28 16:45:38
反转再反转!“女教师给领导打伞”最新:不是领导,也不是父亲?

反转再反转!“女教师给领导打伞”最新:不是领导,也不是父亲?

乌娱子酱
2026-05-28 15:14:43
蔚来汽车李斌对整个行业悲观,称中国汽车很难回到过去的“黄金时代"

蔚来汽车李斌对整个行业悲观,称中国汽车很难回到过去的“黄金时代"

齐天候
2026-05-28 17:30:13
荷兰军官:我们进入南海,遇到了解放军,他们没说这里是他们领土

荷兰军官:我们进入南海,遇到了解放军,他们没说这里是他们领土

阿龙聊军事
2026-05-28 15:58:13
总分超王治郅历史第7!胡金秋20+8完胜王哲林 难阻遗憾惜败

总分超王治郅历史第7!胡金秋20+8完胜王哲林 难阻遗憾惜败

醉卧浮生
2026-05-28 21:39:12
毒杨梅事件升级!央视再暗访,会长真面目曝光,1天亏几亿不算完

毒杨梅事件升级!央视再暗访,会长真面目曝光,1天亏几亿不算完

小樾说历史
2026-05-28 11:36:56
震惊!网传武汉一婚介所男性资料只剩20多份,女性激增到3500多份

震惊!网传武汉一婚介所男性资料只剩20多份,女性激增到3500多份

火山詩话
2026-05-28 13:25:07
亏损超62亿,一代空调大王爆雷!

亏损超62亿,一代空调大王爆雷!

蒋东文
2026-05-26 21:05:52
注意了!印度来华人数飙升,深圳是最受欢迎城市,评论区全是担忧

注意了!印度来华人数飙升,深圳是最受欢迎城市,评论区全是担忧

谭谈社会
2026-05-28 11:41:20
前调查记者揭矿难黑幕:逃生者被老板雇人砸回矿井里,因为死了比救治重伤赔得少

前调查记者揭矿难黑幕:逃生者被老板雇人砸回矿井里,因为死了比救治重伤赔得少

可达鸭面面观
2026-05-28 16:52:14
2026-05-28 22:12:49
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
146783文章数 2653724关注度
往期回顾 全部

科技要闻

利润跌27%:快手只剩“可灵”这张牌?

头条要闻

20万飞天茅台搭售40万黔茅酒 老板参加"峰会"后称被耍

头条要闻

20万飞天茅台搭售40万黔茅酒 老板参加"峰会"后称被耍

体育要闻

如果雷霆拼图是这水平 马刺确实打不过

娱乐要闻

林俊杰七七与大哥嫂子的瓜剪不断理还乱

财经要闻

长鑫科技IPO过会,市值会到几万亿?

汽车要闻

新款吉利星愿6.18万起售 一镜到底寻找爆款密码

态度原创

数码
教育
亲子
本地
公开课

数码要闻

618装机最后一环,这台1899元的2K 380Hz电竞屏把FPS体验拉满了

教育要闻

满老师把"压箱底"的升学数据公开了!近万份报告随便查,腾讯ima内测

亲子要闻

专家解读|孩子不爱吃蔬菜怎么办?

本地新闻

用剪纸的方式,打开江苏扬州

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版