网易首页 > 网易号 > 正文 申请入驻

急了?OpenAI首次向免费用户开放推理功能

0
分享至

当地时间1月31日,美国OpenAI公司正式上线推理模型o3-mini,并首次向免费用户开放推理模型,一同亮相的还有“满血版”的o3模型。

来源:OpenAI

OpenAI表示,o3具备更先进、近似人类的推理能力,在解决编程、数学、科学等理工科问题方面均超越现役的o1模型。该公司曾表示,o3-mini会在1月底先上架,o3则“会在不久之后推出”。

根据介绍,o3-mini支持开发者调整“AI推理努力程度”的选项——分为低、中、高三个级别。这种灵活性使得o3-mini可以在面对难题时“更努力思考”,而需要效率时优先考虑回应速度。开发者可根据需求选择推理强度,平衡思考深度和响应速度,但不支持视觉任务,视觉推理仍需使用o1。

在新闻稿中,OpenAI披露,在2024年美国数学邀请赛(AIME 2024)的测试中,低推理努力的o3-mini准确率(60%)与o1-mini差不多,但速率更快;而在中等努力下,o3-mini准确率能够提升到79.6%,与o1模型相当。在最高努力水平时,o3-mini的准确率则能进一步提升至87.3%。

在博士级科学问题(GPQA Diamond)方面,三种努力程度模型的准确率分别为70.6%、76.8%和79.7%,该测试主要用于衡量模型在博士级别物理、生物和化学问题上的表现。

有外媒还将o3-mini和DeepSeek的R1模型进行了对比。

在AIME 2024测试中,o3-mini仅在高推理强度下表现优于R1(79.8%)。在以编程为重点的SWE-bench Verified基准测试中,o3-mini同样仅在高推理强度下以微弱优势(0.1 分)领先R1。在低推理强度下,o3-mini在GPQA Diamond基准测试中落后于R1(71.5%)。

OpenAI宣布,从当天开始,免费ChatGPT用户也能通过在编辑器中选择“推理”来尝试o3-mini模型,这也是公司的推理模型首次向免费用户开放。

对于付费用户,o3-mini将在模型选择器中替代o1-mini。作为升级的一部分,每月花费20美元左右的ChatGPT Plus和Team用户,速率限制也从o1-mini的每天50条,提升到o3-mini的150条。每月支付200美元的ChatGPT Pro用户,能无限制地访问o3-mini。

近期,爆火的DeepSeek-R1模型对OpenAI构成了竞争压力,尤其在成本方面呈现出显著差异。

OpenAI 的推理模型o1系列相对成本较高,o1模型的API定价为每百万输入tokens 15美元,每百万输出tokens 60美元,而DeepSeek R1的API定价为每百万输入tokens 0.14美元(缓存命中)/0.55美元(缓存未命中),每百万输出tokens 2.19美元。

这次发布中,OpenAI强调了成本问题。与OpenAI的o1-mini相比,o3-mini的价格降低了63%。o3-mini定价为每百万输入tokens 1.10美元,每百万输出tokens 4.40美元,。不过,相比DeepSeek-R1,o3-mini的价格依然高出了不少。

安全方面,OpenAI表示,在训练o3-mini以实现安全响应的过程中,采用了一种关键技术--“深思熟虑的对齐(deliberative alignment)”。

通过这种方法,OpenAI训练模型在回答用户提示之前,先对人类编写的安全规范进行推理。可以理解为,OpenAI希望确保o3-mini生成的内容更加安全、符合道德,并降低了模型生成不良或有害响应的风险。

本文系观察者网独家稿件,未经授权,不得转载。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
革命卫队计算错误,以为谁都离不开霍尔木兹海峡,其实伊朗最需要

革命卫队计算错误,以为谁都离不开霍尔木兹海峡,其实伊朗最需要

云鹏叙事
2026-04-24 11:06:24
轰的一声,日本传来一声巨大爆响,自卫队伤亡惨重,尸体横倒竖卧

轰的一声,日本传来一声巨大爆响,自卫队伤亡惨重,尸体横倒竖卧

青烟小先生
2026-04-24 09:55:09
体制内硬刚领导会是什么下场?网友"铁头娃"式回答,大彻大悟

体制内硬刚领导会是什么下场?网友"铁头娃"式回答,大彻大悟

夜深爱杂谈
2026-04-24 07:32:39
抢走王朔,睡遍京圈,定居国外9年的“坏种”徐静蕾,成最终赢家

抢走王朔,睡遍京圈,定居国外9年的“坏种”徐静蕾,成最终赢家

日落于西
2026-04-15 16:04:57
释永信“开光”真相大白,过程不堪入目,易中天也被牵连

释永信“开光”真相大白,过程不堪入目,易中天也被牵连

往史过眼云烟
2026-03-24 17:05:24
刚刚,全线跳水!美军,动手了!

刚刚,全线跳水!美军,动手了!

中国基金报
2026-04-23 14:34:47
谁能想到啊,一个天才榜眼,22岁入选全明星,29岁无球可打

谁能想到啊,一个天才榜眼,22岁入选全明星,29岁无球可打

球毛鬼胎
2026-04-24 16:33:16
斯诺克世锦赛16强全出炉:15位种子选手平纪录,中国选手4人入围

斯诺克世锦赛16强全出炉:15位种子选手平纪录,中国选手4人入围

全景体育V
2026-04-24 06:18:50
美国11名顶尖科学家连续离奇失踪或死亡,特朗普:相当严重

美国11名顶尖科学家连续离奇失踪或死亡,特朗普:相当严重

新民周刊
2026-04-23 18:56:16
老人睡工地3年工头从不赶他,工程完工那天,他对工头说去见个人

老人睡工地3年工头从不赶他,工程完工那天,他对工头说去见个人

流萤叙情
2025-08-20 18:24:36
攻不了也守不住!中国空军在西藏上空,被印度空军足足欺负了40年

攻不了也守不住!中国空军在西藏上空,被印度空军足足欺负了40年

古事寻踪记
2026-04-02 07:28:50
5月1日断供!俄宣布关闭“友谊”管道,德国90%以上汽车面临停摆

5月1日断供!俄宣布关闭“友谊”管道,德国90%以上汽车面临停摆

万物知识圈
2026-04-24 11:47:53
女子吐槽“老公养的盆栽”,太丑了,网友:不懂,别乱说话

女子吐槽“老公养的盆栽”,太丑了,网友:不懂,别乱说话

观察鉴娱
2026-04-19 16:03:01
歌尔股份2025年营收965.5亿元,归母净利润增长近五成,2026年Q1延续增势

歌尔股份2025年营收965.5亿元,归母净利润增长近五成,2026年Q1延续增势

风口财经
2026-04-24 08:23:17
负债60亿!年销8.4万台豪车的百亿巨头破产,浙商大佬全被套牢

负债60亿!年销8.4万台豪车的百亿巨头破产,浙商大佬全被套牢

青眼财经
2026-04-16 22:01:48
特朗普访华倒计时,美方已经提出首个条件,希望中方不要见死不救

特朗普访华倒计时,美方已经提出首个条件,希望中方不要见死不救

鸟儿太能吃
2026-04-24 15:25:13
中信证券2026年第一季度营收231.55亿元,归母净利润102.16亿元,同比增长超50%,券商板块呈现极低估值、业绩爆发、并购催化多重共振

中信证券2026年第一季度营收231.55亿元,归母净利润102.16亿元,同比增长超50%,券商板块呈现极低估值、业绩爆发、并购催化多重共振

金融界
2026-04-24 09:59:28
最高可判死罪!奥巴马晚节不保?特朗普要一箭三雕!

最高可判死罪!奥巴马晚节不保?特朗普要一箭三雕!

小蔑谈事
2026-04-24 15:26:52
大老师,这也太美了!

大老师,这也太美了!

贵圈真乱
2026-04-24 10:50:13
AI光通信两大核心:磷化铟+薄膜铌酸锂,10家龙头全梳理

AI光通信两大核心:磷化铟+薄膜铌酸锂,10家龙头全梳理

Thurman在昆明
2026-04-24 08:08:57
2026-04-24 17:27:00
观察者网 incentive-icons
观察者网
全球视野,中国关怀
139652文章数 1850478关注度
往期回顾 全部

科技要闻

DeepSeek V4牵手华为,价格依然"屠夫级"

头条要闻

男子拍下蒋介石故居对面别墅区两厕所 两年来无法使用

头条要闻

男子拍下蒋介石故居对面别墅区两厕所 两年来无法使用

体育要闻

里程碑之战拖后腿,哈登18分8失误

娱乐要闻

停工16个月!赵露思证实接拍新剧

财经要闻

19家企业要"铝代铜",格力偏不

汽车要闻

零跑Lafa5 Ultra北京车展上市:11.88-12.48万

态度原创

亲子
艺术
房产
时尚
手机

亲子要闻

新生儿纸尿裤怎么选?五大选择黄金要素发布

艺术要闻

新地标!阿里中心·杭州未科,gmp设计

房产要闻

三亚安居房,突然官宣!

水晶专场 || 一眼就沦陷的绝美水晶,百元级的快乐

手机要闻

荣耀畅玩70C手机上架,799元起

无障碍浏览 进入关怀版