网易首页 > 网易号 > 正文 申请入驻

OpenAI发布o3和o4mini,看图不过脑子的大模型开窍了

0
分享至

来不及怀念月底即将消亡的GPT4了!

也来不及取笑价格最高,号称最强非推理模型的GPT4.5反而要被GPT4.1 API取代了!

现在迎面走来的是,取代 o1、o3-mini 和 o3-mini-high 的:

o3、o4-mini和o4-mini-high

说实话,我刚看到的时候是懵的,

凭借着隔壁好邻居 Grok3,才算是整理出了这次更新的所有内容,先来说说结论:

  • 推理模型首次能自主组合 GPT 里所有工具,包括网页搜索、Python 编程、图像分析、文件解析和图像生成。

  • o3、o4-mini是首个能“思考”图像内容,将图像信息整合到思维链的模型

  • 支持完整工具集的 o3-pro 将在几周后推出,不过o1-pro还活着,暂时不会被下架

  • 使用 Responses API 新支持了推理摘要功能, 通过保留调用各种工具时的思考过程来提升性能

  • 目前 Plus、Pro、Team 用户可使用

发布会里演示的“看图思考”就让o3在图里找出最大的船只、以及推测这首船最后会停靠在哪里。

按照官方技术报告,o3、o4-mini的具体能力是能识别图表、扫描页、截图、手绘图等复杂图像。还可以主动放大、旋转、裁剪图像,作为思考的一部分。

所以我尝试在一次对话让o3把所有工具都用一遍:

切割查看图里的每一个组件,结合联网搜索,解释它们的定义,并以代码形式告诉我如何最简单做一个mcp server,最后生成一张同样的图,但是解释的文字用中文

直接看看结果,

o3 是真的可以在单轮对话里兼顾图像分析、生图、代码生成和联网搜索,我的评价是比 Deep Research好玩多了。

接下来我还给o3安排了一个看花眼的任务:

找不同,并用红框框出来

这个输出就更离谱了,

从 o3 的思考过程看出,它能加载图像并将其分成两半(左侧图像将从 x=0 裁剪到 319,右侧图像从 x=320 裁剪到 639)。然后,通过Python代码将两半图像都转换为灰度图、应用阈值并使用形态学运算进行清理来查看它们之间的差异。

换句话来说,

以后我们应该都不需要上传图片后,

还自己手动给模型补充背景知识了。

那再来看看具体的数值表现:

  1. o3 刷新 Codeforces、SWE‑bench 及多模态 MMMU 纪录

  2. o4‑mini 在 AIME 2024/2025 与 GPQA Diamond 等基准上,明显优于 o3-mini。

  3. API 定价上,o3比o1便宜33%,o4‑mini跟o3-mini、o1-mini保持了一样的价格。

上面这幅定价图就是我跟o3对话生成的,

几轮对话体验后,个人感觉是思考动画质感有提升(跟 Grok3 有点像),能明显感到思考时间提升,以及搜索网页数量的增多。

BTW,这里有个小彩蛋,内部测试的管 o3 叫精简版 Deep Research。

小遗憾的是,主打能将图片放入思考过程的 o3 和 o4-mini 目前在多模态能力平台上没打过Gemini 2.5 Pro

除了模型之外,OpenAI这次没有按照惯例追着 Gemini 打了。

反而是推出了一个叫开源的Codex CLI的 Agent,再加上前天发布,也是重点提升了编程能力的 GPT4.1,很难不临想到针对的是隔壁的编程之王Claude.

简单来说,Codex CLI可以运行在本地的终端上,并作为一个链接模型和本地代码的接口。

o3、o4-mini 的登场,

像是给 GPT4 的离去献上了一场盛大烟花,

我一开始没写 GPT4.1,是因为觉得它的诞生是为了取代 GPT4.5 超高的成本。

GPT4 需要一个真正意义上,在 ChatGPT 这个页面上完全能取代它的新模型。

继承大家对它,对 AGI 的期待。

在模型更新迭代上,

我们告别了GPT3.5、GPT4,

见证了 OpenAI 从 GPT 系列转向以推理为核心的o系列,

甚至还将迎来第一个推理模型o1的离去。

有时候,我还是希望这些模型只是短暂沉睡在自己的权重文件里,

等待着我们重新唤醒TA,

再一次说声Hi,GPT!

@ 作者 / 卡尔@ 动手学AI知识库 / learnprompt.pro

最后,感谢你看到这里如果喜欢这篇文章,不妨顺手给我们点赞|在看|转发|评论更多的内容正在不断填坑中……

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
丁俊晖:就算赵心童状态不好也能世锦赛卫冕,他比所有球员都厉害

丁俊晖:就算赵心童状态不好也能世锦赛卫冕,他比所有球员都厉害

杨华评论
2026-04-26 21:47:34
51岁周迅变样:满头白发脸松垮,瘪嘴像老奶奶,无儿无女成遗憾

51岁周迅变样:满头白发脸松垮,瘪嘴像老奶奶,无儿无女成遗憾

悦君兮君不知
2026-03-20 12:19:00
她只是去超市买油,却再也没回家:北京独生女留学加拿大之死

她只是去超市买油,却再也没回家:北京独生女留学加拿大之死

阅微札记
2026-03-07 12:02:00
罗马诺:曼联已和巴莱巴达成口头加盟协议!皇马了解穆帅希望回归

罗马诺:曼联已和巴莱巴达成口头加盟协议!皇马了解穆帅希望回归

足球侦探
2026-04-27 08:35:08
血管堵塞的6个信号,别等堵死才发现!错过可能拖成大病

血管堵塞的6个信号,别等堵死才发现!错过可能拖成大病

孟大夫之家1
2026-04-27 13:20:05
新华社发声!深圳站台吸烟升级,女子身份被扒,男子处理结果公布

新华社发声!深圳站台吸烟升级,女子身份被扒,男子处理结果公布

青橘罐头
2026-04-27 07:54:22
深圳抽烟民警和女博主均被网友开盒,照片等信息在网上到处散播

深圳抽烟民警和女博主均被网友开盒,照片等信息在网上到处散播

映射生活的身影
2026-04-26 21:20:08
瓜迪奥拉暗示他下赛季会重返曼城!

瓜迪奥拉暗示他下赛季会重返曼城!

夜白侃球
2026-04-27 10:01:14
11685人涌入,连糖水铺也带火了!粤超8.8元一票难求

11685人涌入,连糖水铺也带火了!粤超8.8元一票难求

21世纪经济报道
2026-04-26 20:07:59
王牌被废!伊朗破解美军“地堡杀手”,14枚实战钻地弹尽数报废

王牌被废!伊朗破解美军“地堡杀手”,14枚实战钻地弹尽数报废

健身狂人
2026-04-27 08:40:19
山东税务局三年录用3872人!我发现了一个残酷的真相:选对大学比考高分更重要

山东税务局三年录用3872人!我发现了一个残酷的真相:选对大学比考高分更重要

老满说高考
2026-04-26 20:05:33
吉利汽车集团发布中国首款原生开发Robotaxi原型车

吉利汽车集团发布中国首款原生开发Robotaxi原型车

新京报
2026-04-26 00:08:05
丁俊晖:对球的感知能力不如以前了;希望别给赵心童太多压力

丁俊晖:对球的感知能力不如以前了;希望别给赵心童太多压力

懂球帝
2026-04-27 05:54:39
罗翔:如果一个人突然努力工作,业余时间开始学习,不再参加社交活动,那么,身边的人可能不仅不会帮他,还会拉他下来,原因就一个!

罗翔:如果一个人突然努力工作,业余时间开始学习,不再参加社交活动,那么,身边的人可能不仅不会帮他,还会拉他下来,原因就一个!

谭老师地理大课堂
2026-04-22 00:03:57
近千年历史证明:当大陆实力处于绝对优势时,日本没有一点机会!

近千年历史证明:当大陆实力处于绝对优势时,日本没有一点机会!

鹤羽说个事
2026-04-25 22:47:11
政坛变天!俄罗斯10天180°变脸,抛弃16年老友,靠一点拿捏匈牙利

政坛变天!俄罗斯10天180°变脸,抛弃16年老友,靠一点拿捏匈牙利

墨兰史书
2026-04-27 17:20:03
61岁何智丽现状:从日本回老家上海,与老友聚餐,面色红润没发福

61岁何智丽现状:从日本回老家上海,与老友聚餐,面色红润没发福

以茶带书
2026-04-14 14:09:22
004核航母落空?美媒:除关键术落后,多个原因让中国没必要造它

004核航母落空?美媒:除关键术落后,多个原因让中国没必要造它

说历史的老牢
2026-04-26 11:21:48
“高净值家庭”标准出炉,全中国共有512.8万户,你家达标了吗?

“高净值家庭”标准出炉,全中国共有512.8万户,你家达标了吗?

毒sir财经
2026-04-26 21:11:44
全员大乱斗!德比大战爆发群殴,门将染红后当众重拳打脸对手

全员大乱斗!德比大战爆发群殴,门将染红后当众重拳打脸对手

夜白侃球
2026-04-27 09:03:26
2026-04-27 18:11:00
卡尔的AI沃茨 incentive-icons
卡尔的AI沃茨
前大厂算法工程师,3家科技公司技术总监|致力打造最系统的Al学习体系,让1万人通过Al提高生产力
252文章数 129关注度
往期回顾 全部

科技要闻

DeepSeek V4上线三天,第一批实测出来了

头条要闻

伊朗:发现15枚美军未爆重型导弹 逆向研发仿制

头条要闻

伊朗:发现15枚美军未爆重型导弹 逆向研发仿制

体育要闻

最抽象的天才,正在改变瓜迪奥拉

娱乐要闻

黄杨钿甜为“耳环风波”出镜道歉:谣言已澄清

财经要闻

国家发改委:依法禁止外资收购Manus

汽车要闻

不那么小众也可以 smart的路会越走越宽

态度原创

艺术
旅游
家居
公开课
军事航空

艺术要闻

你绝对想不到,摄影能让她成为女神!

旅游要闻

上海迪士尼游客劝阻吸烟被殴打,警方介入!乐园吸烟区外禁烟

家居要闻

江景风格 流动的秩序

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗外长折返伊斯兰堡内情披露

无障碍浏览 进入关怀版