网易首页 > 网易号 > 正文 申请入驻

谷歌版o1来了:思考速度比所有模型快5倍,水平堪比理科博士

0
分享至

文章编译自「量子位」、「AI 前线」。

谷歌版o1来了! 在OpenAI十二天发布季倒数第二天——

他们发布Gemini 2.0 Flash Thinking,顾名思义,以闪电般的速度解决复杂问题并展示其思考过程的实验模型。

从姐夫哥展示出的Demo来看,它能在几秒钟之内解决一个物理问题,并且给出思考过程。

还可以给一张图,同时涉及视觉和文本线索的谜题。

如何用其中三个数字加起来等于30?

结果同样也是短短几秒,思考了好几种方案,最终确定是需要将9号球翻转为6号球,以实现6+13+11等于30这样一个结果。

所有综合类别指标中显示,目前Gemini 2.0 Flash Thinking排名第一,包括数学、代码、指令跟随、长QA、创意写作等等各方面。

目前在谷歌AI Studio就可以免费使用。

01谷歌版o1第一波实测

从众多网友实测中,主要分为两大“派系”,一种是纯文本型,另一种是视觉类谜题。

最明显感知的就是一个快字。

它还可以解决像抛硬币这样的概率问题:如果我一直抛硬币,直到得到HHH或HTH,那么得到这两个几率之比是多少?

甚至它还可以解析摩斯代码,让网友直呼:怪吓人的。

有解决这种视觉类谜题的,比如找出这里面的字母和数字,并且说明出现了多少次。

结果它都一一指出来了。

DeepMind首席科学家拿出了他当年面试时遇到第一个问题,是用笔和纸写下的一道关于数论的问题。

结果它也秒秒钟回答了出来。

目前仅支持32k上下文窗口,也不支持联网。不过主创表示接下来会在新的一年里快速跟进,提供更长的token、更多的工具支持等。

今天之所以推出这个实验版,主要是为了接受大家的反馈意见。

02更易于理解和更透明的推理

在开发者文档中,谷歌解释说,“思考模式的响应推理能力比基础版 Gemini 2.0 Flash 模型更强”,而基础版 Gemini 2.0 Flash 模型是谷歌最新、最出色的模型,仅在 8 天前发布。

新模型仅支持 32000 个标记输入(约 50-60 页文本),并且每个输出响应可以产生 8000 个标记。在 Google AI Studio 的侧面板中,该公司声称它最适合“多模式理解、推理”和“编码”。

该模型的训练过程、架构、许可和成本的完整细节尚未公布。目前,它在 Google AI Studio 中显示每个令牌的成本为零。

与 OpenAI 的竞争推理模型 o1 和 o1 mini 不同,Gemini 2.0 允许用户通过下拉菜单访问其逐步推理,从而更清晰、更透明地了解模型如何得出结论。

通过允许用户了解决策过程,Gemini 2.0 解决了人们对人工智能作为“黑匣子”运行的长期担忧,并使该模型(许可条款仍不明确)与竞争对手的其他开源模型相提并论。

03原生支持图像上传和分析

Gemini 2.0 Flash Thinking 是对竞争对手 OpenAI o1 系列的进一步改进,旨在处理跳跃中的图像。

o1 最初是纯文本模型,但后来扩展到包括图像和文件上传分析。目前,这两种模型也只能返回文本。

根据开发者文档显示,Gemini 2.0 Flash Thinking 目前还不支持与谷歌搜索落地,也不支持与其他谷歌应用和外部第三方工具集成。

Gemini 2.0 Flash Thinking 的多模式能力扩展了其潜在用例,使其能够应对结合不同类型数据的场景。

例如,在一项测试中,该模型解决了一个需要分析文本和视觉元素的难题,展示了其跨格式集成和推理的多功能性。

开发人员可以通过 Google AI Studio 和 Vertex AI 利用这些功能,其中模型可供实验。

随着人工智能领域的竞争日趋激烈,Gemini 2.0 Flash Thinking 可能标志着问题解决模型新时代的开始。它能够处理多种数据类型、提供可视化推理并大规模执行,这使它成为推理人工智能市场的有力竞争者,可与 OpenAI 的 o1 系列及其他产品相媲美。

转载原创文章请添加微信:founderparker

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
涉案金额过亿,释永信一审被判有期徒刑24年

涉案金额过亿,释永信一审被判有期徒刑24年

界面新闻
2026-05-29 19:31:49
老房子可原拆原建,引爆地产股!万科、碧桂园集体涨停!

老房子可原拆原建,引爆地产股!万科、碧桂园集体涨停!

说财猫
2026-05-29 13:46:05
20岁大学生祝小丹确诊癌症,颜值超高,因脖子长包确诊,常熬夜

20岁大学生祝小丹确诊癌症,颜值超高,因脖子长包确诊,常熬夜

180视角
2026-05-29 12:02:12
时隔13年回归!曝63岁穆帅已与皇马签约3年:6月7日官宣 佛爷钦点

时隔13年回归!曝63岁穆帅已与皇马签约3年:6月7日官宣 佛爷钦点

风过乡
2026-05-29 22:44:31
王思聪基本上不会再回来了。

王思聪基本上不会再回来了。

流苏晚晴
2026-05-28 18:06:51
台积电首次回应华为韬定律:概念早就有了 芯片耗电量才是关键 黄仁勋:依旧领先十年

台积电首次回应华为韬定律:概念早就有了 芯片耗电量才是关键 黄仁勋:依旧领先十年

新浪财经
2026-05-29 14:19:35
“好怕你俩亲上”,成年礼家长合照出圈,儿子的情结写在脸上

“好怕你俩亲上”,成年礼家长合照出圈,儿子的情结写在脸上

蝴蝶花雨话教育
2026-05-29 00:05:17
武契奇带着遗憾离京:几十份大单都签了,唯独少了歼-10CE

武契奇带着遗憾离京:几十份大单都签了,唯独少了歼-10CE

策前论
2026-05-29 12:51:13
襄阳割麦反转?官方回应“割四赔五”是旧俗,可麦烂地里只是开始

襄阳割麦反转?官方回应“割四赔五”是旧俗,可麦烂地里只是开始

奇思妙想草叶君
2026-05-29 16:32:56
昨晚跑滴滴拉了两个女孩,上车后满车都是臭味,我转头一看傻眼了

昨晚跑滴滴拉了两个女孩,上车后满车都是臭味,我转头一看傻眼了

千秋文化
2026-05-27 20:04:55
铁了心要灭掉中国?一股可怕力量来了!

铁了心要灭掉中国?一股可怕力量来了!

回京历史梦
2026-05-29 18:33:48
错把鱼目当珍珠,2026世界杯最大败笔,就是请Lisa来唱开幕式

错把鱼目当珍珠,2026世界杯最大败笔,就是请Lisa来唱开幕式

冷紫葉
2026-05-28 21:33:12
定了!人社部正式发文!7月1日全国落地,在职、退休人员一起受益

定了!人社部正式发文!7月1日全国落地,在职、退休人员一起受益

石辰搞笑日常
2026-05-29 20:26:56
本届将诞生新科大满贯,德约2-3遭丰塞卡逆转止步法网第三轮

本届将诞生新科大满贯,德约2-3遭丰塞卡逆转止步法网第三轮

懂球帝
2026-05-30 03:06:43
冲上热榜!王曦雨首进法网16强赢麻了:排名超郑钦文+狂揽225万元

冲上热榜!王曦雨首进法网16强赢麻了:排名超郑钦文+狂揽225万元

大秦壁虎白话体育
2026-05-29 19:48:47
烂透了!当下食品行业的道德底线,早已被贪婪的利益彻底碾碎。

烂透了!当下食品行业的道德底线,早已被贪婪的利益彻底碾碎。

二大爷观世界
2026-05-29 00:21:23
中方有三艘护卫舰,围堵荷兰一艘护卫舰,歼16战机带实弹参与驱离

中方有三艘护卫舰,围堵荷兰一艘护卫舰,歼16战机带实弹参与驱离

国平视野
2026-05-29 15:54:56
女乘客在网约车上排泄,司机称清洁无效需更换座椅,滴滴出行:将承担相关费用,并配合警方跟进

女乘客在网约车上排泄,司机称清洁无效需更换座椅,滴滴出行:将承担相关费用,并配合警方跟进

极目新闻
2026-05-29 17:07:17
华为徐直军:“韬定律”需要整个产业界参与进来,不打算去说服谁

华为徐直军:“韬定律”需要整个产业界参与进来,不打算去说服谁

IT之家
2026-05-29 15:40:18
新加坡香会取消了中国专场!李显龙没料到,这次中方不陪他们玩了

新加坡香会取消了中国专场!李显龙没料到,这次中方不陪他们玩了

影孖看世界
2026-05-29 23:54:06
2026-05-30 05:23:00
FounderPark incentive-icons
FounderPark
关注AI创业,专注和创业者聊真问题
1225文章数 162关注度
往期回顾 全部

科技要闻

Claude Opus 4.8凌晨突发上线

头条要闻

释永信被判24年 中国佛教协会:完全是咎由自取

头条要闻

释永信被判24年 中国佛教协会:完全是咎由自取

体育要闻

即使是文班亚马,也做不到这件事

娱乐要闻

奚梦瑶何猷君将于6月在法国举行婚礼

财经要闻

近3个月跌超20% 黄金"猴市"下的众生相

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

房产
教育
游戏
时尚
旅游

房产要闻

顺德澐璟「澐冠」再出圈:顶阶人群不是买房,是追加“传世资产”

教育要闻

“不漂亮,还很吓人!”大眼睛艺考生走红,颜值却令网友感到不适

Sky&Infi领衔参赛!2026 GG全能王赛重磅开启,7月线下决战

推广中奖名单-更新至2026年4月28日推广

旅游要闻

云南文旅数智升级,旅游小镇游客满意度提升超过30%

无障碍浏览 进入关怀版