网易首页 > 网易科技 > 网易科技 > 正文

日均调用量106倍狂飙 豆包抢滩“Agent生态卡位战”

0
分享至

出品 | 网易科技《态度》栏目

作者 | 李姝

编辑 | 丁广胜

当DeepSeek以开源策略席卷开发者社区时,火山引擎用闭源的方式展示了另一种可能性。

“截至2025年3月底,豆包大模型日均tokens调用量已超过12.7万亿,是2024年12月的3倍,是一年前刚刚发布时的106倍。”

4月17日,在火山引擎FORCE LINK AI创新巡展上,火山引擎总裁谭待亮出一组数据,为闭源大模型的生存战注入强心剂。

如今,豆包大模型已成为众多企业AI转型的核心利器。就在巡展当日,面向企业市场,全新的豆包1.5·深度思考模型正式登场,同时升级文生图模型3.0及视觉理解模型,还推出了OS Agent解决方案和AI云原生推理套件。

这一系列动作表明,在模型性能竞赛转向 “Agent生态卡位战” 的当下,火山引擎已精准锚定新的发展方向。

加量不加价,豆包深度思考模型开放API

官方技术报告显示,豆包深度思考模型采用MoE架构,总参数200B,激活参数仅20B,以较小参数实现了媲美顶尖模型的效果。得益于高效算法和高性能推理系统,豆包模型的API服务在保证高并发的同时,将延迟降至20毫秒,目前已通过火山引擎开放供用户体验。

在数学推理、编程竞赛、科学推理等专业领域,豆包模型的性能与OpenAI o3-mini-high、Gemini 2.5 Pro等模型不相上下。

在通用任务上,豆包深度思考模型的人类评估表现比DeepSeek R1高出8%,单位推理成本更是降低了50%,完美实现了性能与效率的平衡。

相较于仅限文字理解的 DeepSeek,豆包深度思考模型的多模态能力优势显著。

谭待介绍,升级后的豆包・视觉理解模型具备强大的视觉理解能力,使模型不仅 “会看会想”,还能进行立体思考。从识别菜单内容,根据用户口味和过敏食物提供点餐推荐,到分析航拍图上的颜色、形状等信息并结合地貌进行深度研判,豆包的多模态应用场景丰富且实用。

豆包・文生图模型3.0同样表现亮眼,其文字排版和图像生成能力进一步增强,支持2K高清图片生成,在影视、海报、绘画等领域应用广泛。在最新的文生图领域权威榜单Artificial Analysis竞技场中,豆包・文生图3.0模型已跻身全球第一梯队。

豆包这一次放的大招,可谓威力十足。目前豆包已经在AppStore内免费APP排行榜成功登顶,超越位居第三的DeepSeek和第九的腾讯元宝。

迎接Agent元年,“应用Agent”+“OS Agent”双管发力

强大的模型性能为AI Agent的发展奠定了坚实基础。

谭待指出:“AI Agent应用主要分为应用型Agent和OS Agent两个方向。应用型Agent专注于特定领域任务,如客服Agent、数据Agent、代码Agent 等;OS Agent则具备跨场景通用性和灵活性,可操作浏览器、电脑、手机等设备,完成复杂任务。”

在应用型Agent领域,面向专业开发者的代码Agent——Trae重磅推出。相较于传统AI插件产品,Trae将AI与IDE深度融合,带来更智能的开发体验。

在OS Agent方面,火山引擎正式发布OS Agent解决方案,整合豆包UI-TARS模型,以及veFaaS函数服务、云服务器、云手机等产品,实现对代码、浏览器、电脑、手机及其他Agent的高效操作。

针对Agent带来的大量推理消耗问题,火山引擎推出ServingKit推理套件,可在2分钟内完成671B DeepSeek R1的下载和预热,13秒完成推理引擎加载。

同时,通过优化火山引擎EIC,将KV cache命中率提高10倍,在100% cache命中场景下,TPS吞吐量提升至5倍以上;对算子、AI网关、VKE编排调度的升级,也大幅降低了GPU消耗。

对于GPU的折旧问题,谭待认为:“如果把软件层面的工作做好,硬件的生命周期是可以拉长的。而且不同的场景对模型的延迟、吞吐要求是不一样的。更重要的是在软件层面和运营层面做好相关工作,这样就能使硬件的生命周期和投资回报率(ROI)都达到最佳状态。

模型好坏比开源闭源更关键,对豆包充满信心

“模型好坏,与开源闭源无关。火山引擎在适配DeepSeek方面表现出色,对豆包充满信心。”火山引擎总裁谭待在交流中直言。

面对豆包大模型日均tokens调用量百倍的增长,谭待表示,技术发展短期易被高估、长期易被低估,tokens增长量取决于模型突破,如视觉推理、Agent等方面的进展,对未来模型调用量百倍增长持谨慎乐观态度。

2025年被称为Agent元年,但谭待认为:“能写诗的不是Agent,能跑通供应链的才是。” 这一观点凸显了火山引擎的务实布局。

谭待指出,“我们希望AI能够解决更复杂,更完整的问题,不再仅仅是对信息的感知、处理和生成,而是能端到端的处理任务。AI能做到这些,才能称之为一个合格的Agent。”

他认为,实现这一目标需完成三大技术突破:首先最核心的是要有更强的模型。要做好Agent,模型需要有能力做好思考、计划和反思,而且要一定得支持多模态。其次,开发OS Agent架构体系,实现数字与物理世界的双向交互。最后,通过AI云原生技术实现推理成本与延迟的指数级下降,支撑大规模应用落地。

目前,火山引擎已支持MCP协议,统一协议有助于降低开发成本、加速行业发展。未来,火山引擎不仅会推出数据智能体Data Agent等垂直类Agent产品,还将为通用Agent开发提供工具和方案。在谭待看来,判断真正的Agent,关键要看其能否完成复杂任务、是否运用深度思考模型。

当闭源模型凭借成本优势挑战开源阵营,当开源生态反哺商业创新,这场大模型竞争早已超越技术层面,演变为组织能力与生态运营的全方位较量。

可以预见的是,在Agent战场中,唯有那些将技术深度融入行业各个环节的参与者,才能最终脱颖而出。

延伸阅读
相关推荐
热点推荐
牛股尾盘瞬间闪崩12个点,33万股民懵了!网友调侃:炒股千万别用曲面屏;多次严重异动为何不停牌?公司回应

牛股尾盘瞬间闪崩12个点,33万股民懵了!网友调侃:炒股千万别用曲面屏;多次严重异动为何不停牌?公司回应

每日经济新闻
2025-12-20 16:38:14
“中国保险经纪第一人”、江泰保险经纪董事长沈开涛疑似失联,此前公司有多人被带走协查

“中国保险经纪第一人”、江泰保险经纪董事长沈开涛疑似失联,此前公司有多人被带走协查

红星新闻
2025-12-19 20:27:12
卫报:马雷斯卡现在是一副盼着被解雇的模样,公然叫板高层

卫报:马雷斯卡现在是一副盼着被解雇的模样,公然叫板高层

懂球帝
2025-12-20 20:10:06
3000 名老红军达不到授衔要求,解决方案迟迟未决,毛主席一锤定音:全部授予少校

3000 名老红军达不到授衔要求,解决方案迟迟未决,毛主席一锤定音:全部授予少校

源溯历史
2025-12-19 17:57:09
黄有龙做梦也没想到,自己花重金培养大的女儿,竟给赵薇做了嫁衣

黄有龙做梦也没想到,自己花重金培养大的女儿,竟给赵薇做了嫁衣

查尔菲的笔记
2025-12-16 15:14:06
媒体人:北京国安前锋王子铭基本确定不去云南玉昆了

媒体人:北京国安前锋王子铭基本确定不去云南玉昆了

懂球帝
2025-12-20 15:09:22
金饰克价涨到1362元

金饰克价涨到1362元

财联社
2025-12-20 09:25:08
洛城德比,哈登复出!若输就是西部倒数第一,鲍尔默需向球迷解释

洛城德比,哈登复出!若输就是西部倒数第一,鲍尔默需向球迷解释

一登侃球
2025-12-20 17:52:34
84万余元补缴款引关注 “烧伤超人阿宝”回应税收举报:非偷税漏税

84万余元补缴款引关注 “烧伤超人阿宝”回应税收举报:非偷税漏税

封面新闻
2025-12-20 21:17:06
全新一代奥迪Q7曝光,外观很霸气,分体式大灯,能否被大家认可?

全新一代奥迪Q7曝光,外观很霸气,分体式大灯,能否被大家认可?

红涛说車
2025-12-20 17:24:46
博主:申花门将鲍亚雄、前锋费尔南多无限接近加盟云南玉昆

博主:申花门将鲍亚雄、前锋费尔南多无限接近加盟云南玉昆

懂球帝
2025-12-20 11:16:27
耗资33亿,首日票房仅5000万,卡梅隆懵了:中国观众凭啥不买账?

耗资33亿,首日票房仅5000万,卡梅隆懵了:中国观众凭啥不买账?

八卦南风
2025-12-19 14:40:36
知名主持王小骞崩溃大哭!自称女儿患上“正食症”,心率高达120

知名主持王小骞崩溃大哭!自称女儿患上“正食症”,心率高达120

娱说瑜悦
2025-12-20 19:22:14
央视点名,张本智和夺冠才5天,意外发生,牵连王楚钦、林诗栋

央视点名,张本智和夺冠才5天,意外发生,牵连王楚钦、林诗栋

林子说事
2025-12-20 15:43:45
邢自强:如果房地产不实现止跌回稳,很难打破消费疲软等问题

邢自强:如果房地产不实现止跌回稳,很难打破消费疲软等问题

新浪财经
2025-12-18 15:48:03
CBA三个外援实力下降明显,上海就占两名

CBA三个外援实力下降明显,上海就占两名

大眼瞄世界
2025-12-20 01:37:07
女CEO刚上任就开除我,晚上她竟在我家,我爸:这是你未来媳妇儿

女CEO刚上任就开除我,晚上她竟在我家,我爸:这是你未来媳妇儿

萧竹轻语
2025-12-18 15:34:55
证监会重磅!A股,大消息!

证监会重磅!A股,大消息!

新浪财经
2025-12-20 17:29:22
黄磊孙莉二女儿“泪痣”引热议:这不是痣,是独一无二的“星光”

黄磊孙莉二女儿“泪痣”引热议:这不是痣,是独一无二的“星光”

情感大头说说
2025-12-20 09:49:52
云南美女陈菊去世,年仅25岁!7天前才结婚,长得漂亮,家属发声

云南美女陈菊去世,年仅25岁!7天前才结婚,长得漂亮,家属发声

深析古今
2025-12-19 11:27:21
2025-12-20 21:56:49

科技要闻

许四清:具身智能的"ChatGPT时刻"还未到来

头条要闻

网友称"烧伤超人阿宝"补缴税款84万余元 当事人发声

头条要闻

网友称"烧伤超人阿宝"补缴税款84万余元 当事人发声

体育要闻

我开了20年大巴,现在是一名西甲主帅

娱乐要闻

2026央视跨年晚会阵容曝光,豪华阵仗

财经要闻

求解“地方财政困难”

汽车要闻

岚图推进L3量产测试 已完成11万公里实际道路验证

态度原创

时尚
游戏
家居
房产
军事航空

真爱大牌 || 用了5年才敢说,多亏它帮我守住了发际线

《机甲战魔:神话之裔》更新档发布 添加BOSS挑战

家居要闻

高端私宅 理想隐居圣地

房产要闻

广州有态度,一座国际化社区给出的城市答案

军事要闻

泽连斯基:前线局势愈发艰难

无障碍浏览 进入关怀版
×