网易首页 > 网易号 > 正文 申请入驻

靠性价比狙击OpenAI!谷歌上线Gemini 2.5 Flash,关闭“思考”成本可降600%

0
分享至

大数据文摘受权转载自头部科技

文丨丁灵波

继昨天OpenAI发布o3和o4-mini出尽风头之后,长期对线的老对手谷歌迅速做出回应。

今天,谷歌在AI Studio和Vertex AI的Gemini API中推出了Gemini 2.5 Flash早期预览版模型,该版本基于2.0 Flash发展而来,在推理能力方面实现了重大升级,兼顾性能、速度和成本,并可根据需求控制模型推理的程度。

尽管o3和o4-mini模型在主流评测排行榜上表现着实好,但有一个很突出的缺点:贵,这给了谷歌很大的市场进击空间。

Gemini 2.5 Flash是一个混合推理模型,可让开发者开启或关闭“思考”功能,还允许开发者设定“思考预算”,以在质量、成本和延迟之间找到适合自己需求的平衡点,而即使关闭“思考”,官方宣称也能保持2.0 Flash的快速运行速度和性能。

使用Gemini 2.5 Flash时,开发者每百万个代币的输入成本为0.15美元,输出成本则根据推理设置而不同:启用思考时为每百万个代币3.50美元,而关闭思考功能每百万个代币仅为0.60美元,接棒DeepSeek在行业中杀出了一条更高的性价比路线。

可灵活控制“思考”预算

开启和关闭“思考”近六倍的差价反映了当下模型推理过程的计算强度差异,谷歌引入所谓的“思考预算”机制,旨在解决当今AI市场的一个根本矛盾:更复杂的推理模型通常以更高的延迟和更高的价格为代价。

Gemini 2.5 Flash会根据具体任务的复杂性智能计算出要使用多少思考预算,如果开发者想在保持最低成本和延迟的同时,仍能提升2.0 Flash的性能,可为思考阶段设置特定的预算,预算范围为0到24576个token,随着思考预算的增加,推理质量得到提高,让开发者灵活掌握对质量和成本的细粒度调整。

在一些关键基准测试中,Gemini 2.5 Flash展现出颇具竞争力的性能优势,同时保持了比其他同类产品更小的模型规模。

例如在“人类的最后考试”(高难度推理与通用智力测试)中,Gemini 2.5 Flash的得分为12.1%,优于Anthropic的Claude 3.7 Sonnet(8.9%)和DeepSeek R1(8.6%),略低于OpenAI刚推出的o4-mini(14.3%)。

在GPQA Diamond(研究生水平的专家推理测试)中,Gemini 2.5 Flash得分78.3%,高于DeepSeek R1(71.5%),和Claude 3.7 Sonnet旗鼓相当。

在LiveCodeBench V5评测中,Gemini 2.5 Flash代码相关能力与上代2.0版本相比实现了翻倍提升,接近DeepSeek R1的水平。

谷歌AI Studio负责人Logan Kilpatrick表示该模型编码进展超快,后续还有更多精彩升级推出。

今天,除了发布Gemini 2.5 Flash之外,谷歌还宣布所有美国大学生在2026年春季之前都可以免费使用Gemini Advanced,分析师将此举解读为谷歌正在努力提高未来AI人才对Gemini平台的忠诚度,目光已经着眼渗透下一代市场。

不是最强,但便宜好用

一些网友对Gemini 2.5 Flash测试后认为,Flash的持续迭代可能会是AI行业的全新转折点——模型将会变得快速、智能、价格实惠,如果谷歌继续保持这种性价比竞争势头,接下来的人工智能竞赛将会变得更加有趣。

除了能胜任常见的旋转框弹跳小球的测试,该模型甚至还帮用户完成了更复杂的编码挑战。

例如提示模型使用JavaScript和2D物理引擎模拟分5步创建一个独立的HTML文件,直观地演示多个球穿过桩子并收集到箱中时,正态分布(或二项分布)的形成过程,确保物理参数(恢复、摩擦力、密度)和球的落球率经过调整,以便流畅清晰地演示分布。

有网友使用Gemini 2.5 Flash构建MCP AI代理,模型仅用30行Python代码就搭建了起来,可访问AirBnB和Google Maps。

还能帮助开发者轻松搞定一个网页小游戏开发,综合来看,虽然价格便宜,但谷歌没有太减配,Gemini 2.5 Flash编码能力的可用性和实用性都还不错。

有开发者对当前顶尖模型性能进行了所有基准测试,提供了更宽泛的视角,将Gemini 2.5 Flash添加到了对战列表与o3、o4-mini、Sonnet 3.7、o1、DeepSeek R1等进行比较。

经过一番对比,目前的结论如下,谷歌Gemini 2.5系列模型的市场竞争优势比较全面:

代码编辑:Gemini 2.5 Pro、o3

智能体编程(自主性编程):Sonnet 3.7、o3

长文本上下文处理:Gemini 2.5 Pro、o3

多模态推理:Gemini 2.5 Pro、o3

数学、科学领域:o4-mini、o3、Gemini 2.5 Pro

成本效益:Gemini 2.5 Flash、DeepSeek R1

性价比大战暗流涌动

为了应对谷歌掀起的新一轮性价比大战,OpenAI今天悄悄针对o3和o4-mini型号推出了弹性处理(Flex processing)API选项,目前正处于测试阶段。

Flex处理可显著降低成本,代价是响应时间较慢且偶尔会出现资源不可用的情况,但它非常适合非生产或低优先级任务,例如模型评估、数据丰富或异步工作负载等。

从价格来看,经过Flex处理能将API成本可以降低整整一半。例如针对o3,Flex处理费用为每百万输入tokens为5美元,每百万输出tokens为20 美元,而标准处理费用为每百万输入tokens为10美元,每百万输出tokens达40美元。

Flex处理的推出,正值前沿人工智能价格持续攀升,而竞争对手纷纷推出更廉价、更高效的经济型模型之际,尽管OpenAI依靠o3和o4-mini再次取得了领先同行的模型优势,但远高于同行的高昂定价一直是最大的槽点,如果模型的实际表现差不多,而价格差太多,很可能把用户拱手送给老对手谷歌,这是OpenAI不愿看到的局面。

另外,新一轮顶尖模型的PK较量,正在一步步拉开模型之间的性能代差,无论是谷歌还是OpenAI都有着充足的AI算力保障,竞争处境最艰难的便是DeepSeek,特朗普政府本周采取行动,开始限制英伟达向中国出售H20等AI芯片,据纽约时报报道称,特朗普政府还在考虑进一步采取措施,阻止DeepSeek购买美国技术,并正在讨论禁止美国人使用其服务。

作为OpenAI和谷歌都难以忽视的对手,开源性价比之王DeepSeek能否冲破枷锁给市场带来新的惊喜和奇迹,很多开发者都在默默期待着。

GPU算力按需租用

A100/H100 GPU算力按需租用,

秒级计费,平均节省开支30%以上!

扫码了解详情☝

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李连杰再回应换心脏、换血、打干细胞谣言:说我无所谓,但是说一个无辜的20多岁的年轻武僧,这种二次伤害对其家人非常严重

李连杰再回应换心脏、换血、打干细胞谣言:说我无所谓,但是说一个无辜的20多岁的年轻武僧,这种二次伤害对其家人非常严重

台州交通广播
2026-05-24 23:22:27
留神峪矿难家属讲述:丈夫是外包工,逃生时晕倒三四次还帮人逃生;女儿打来视频电话,还没开口父女俩都哭了

留神峪矿难家属讲述:丈夫是外包工,逃生时晕倒三四次还帮人逃生;女儿打来视频电话,还没开口父女俩都哭了

大风新闻
2026-05-24 09:55:04
终于撑不住了!特朗普重大让步!美伊迎来惊天逆转!

终于撑不住了!特朗普重大让步!美伊迎来惊天逆转!

大嘴说天下
2026-05-24 21:17:22
"碳水脸"的原因绝不是碳水!

"碳水脸"的原因绝不是碳水!

FitEmpire健身领域
2026-05-24 10:41:03
江苏常熟一仓库发生火灾,系隆力奇产品仓库,工作人员:火灾为晚间发生,未造成人员伤亡,经济损失暂无统计报告

江苏常熟一仓库发生火灾,系隆力奇产品仓库,工作人员:火灾为晚间发生,未造成人员伤亡,经济损失暂无统计报告

台州交通广播
2026-05-24 17:51:29
让耿同学博士肄业!女博导怕了吗?她与董小姐的情夫肖飞啥关系?

让耿同学博士肄业!女博导怕了吗?她与董小姐的情夫肖飞啥关系?

大江看潮
2026-05-24 09:14:45
庾澄庆歌手一轮游惨遭淘汰,前任伊能静一句话隔空撑腰太体面

庾澄庆歌手一轮游惨遭淘汰,前任伊能静一句话隔空撑腰太体面

童叔不飙车
2026-05-24 18:56:15
马刺103-82轻取雷霆2-2扳平,文班亚马33+8+5,亚历山大19+7

马刺103-82轻取雷霆2-2扳平,文班亚马33+8+5,亚历山大19+7

懂球帝
2026-05-25 10:55:08
两性关系:55-65岁这十年,惜命最好的方式,不是锻炼,做好这6点

两性关系:55-65岁这十年,惜命最好的方式,不是锻炼,做好这6点

三农老历
2026-04-13 17:10:06
国药控股吉林公司被禁止参加全军物资工程服务采购活动3年

国药控股吉林公司被禁止参加全军物资工程服务采购活动3年

齐鲁壹点
2026-05-25 10:11:22
徐帅有三次机遇,如果把握住任何一次,都不会只是“第八元帅”

徐帅有三次机遇,如果把握住任何一次,都不会只是“第八元帅”

旧书卷里的长安
2026-05-24 23:59:26
王鹤棣迎全网骂潮,只因他踩中了大众最讨厌的三个雷区!

王鹤棣迎全网骂潮,只因他踩中了大众最讨厌的三个雷区!

一盅情怀
2026-05-25 09:24:35
太揪心了!山西煤矿矿难,有博主灵魂拷问:你们是干什么吃的!

太揪心了!山西煤矿矿难,有博主灵魂拷问:你们是干什么吃的!

丫头舫
2026-05-24 10:13:49
航天员黎家盈怎样成长起来的?姐姐黎家敏这样说

航天员黎家盈怎样成长起来的?姐姐黎家敏这样说

Thurman在昆明
2026-05-25 03:04:39
留神峪煤矿工人:连一双手套都没发过

留神峪煤矿工人:连一双手套都没发过

极目新闻
2026-05-24 20:08:34
中东核基地被炸成火海!伊朗先下手为强,特朗普紧急叫停决战

中东核基地被炸成火海!伊朗先下手为强,特朗普紧急叫停决战

最新声音
2026-05-23 19:32:27
中国打出最强一拳!日本终于扛不住,当着全球的面,日方提出条件

中国打出最强一拳!日本终于扛不住,当着全球的面,日方提出条件

阿伧说事
2026-05-24 13:00:35
1994年大案:“变态色魔”王万明,他的荒淫无耻,比你想的更恶劣

1994年大案:“变态色魔”王万明,他的荒淫无耻,比你想的更恶劣

莫地方
2026-05-25 01:05:03
《给阿嬷的情书》破10亿,李思潼签约进圈,王晓慧回归平淡

《给阿嬷的情书》破10亿,李思潼签约进圈,王晓慧回归平淡

书慧我心
2026-05-25 03:24:41
最佳二阵5人场均26+!一阵有多强?三阵争议最大,华子成最大遗珠

最佳二阵5人场均26+!一阵有多强?三阵争议最大,华子成最大遗珠

你的篮球频道
2026-05-25 08:30:32
2026-05-25 11:11:00
大数据文摘 incentive-icons
大数据文摘
专注大数据,每日有分享!
6865文章数 94545关注度
往期回顾 全部

科技要闻

华为发表半导体演进新定律

头条要闻

重庆农家乐3000多斤特色鱼几乎全被洪水冲走 老板发声

头条要闻

重庆农家乐3000多斤特色鱼几乎全被洪水冲走 老板发声

体育要闻

如果不好好守门,他可能早就继承家业了

娱乐要闻

洪涛回应歌手淘汰庾澄庆:难以理喻

财经要闻

退市!33年“A股不死鸟”落幕

汽车要闻

国民家轿再上新 帝豪向上系列限时5.59万起

态度原创

家居
房产
艺术
亲子
军事航空

家居要闻

低调传承 温润沉静

房产要闻

疯狂周末,海口楼市突然爆了!

艺术要闻

他把葡萄画成了美少女

亲子要闻

福州儿童/青少年配眼镜深度推荐:拒绝“模板化”,科学护航孩子的“远视储备”

军事要闻

俄军出动“榛树”导弹袭击乌克兰

无障碍浏览 进入关怀版