网易首页 > 网易号 > 正文 申请入驻

豆包1.5深度思考模型发布:暴砍参数量,能看图思考,数学编程超DeepSeek-R1

0
分享至

智东西4月17日报道,今天,火山引擎正式发布了豆包1.5·深度思考模型,采用MoE架构,总参数量为200B,激活参数仅20B,在多项基准测试中达到或接近全球第一梯队水平。

在数学、编程、科学领域,豆包1.5·深度思考模型的测试表现超过DeepSeek-R1、QwQ-32B等国产推理模型,与OpenAI o1、o3-mini-high等模型能力相仿。在高难度通用人工智能测试ARC-AGI上,其得分更是超过了OpenAI o1和o3-mini-high。

豆包1.5·深度思考模型具有“边想边搜”、“视觉理解”等实用能力,即日起,企业用户可以在火山方舟平台使用豆包1.5·深度思考模型。火山引擎还升级了豆包·文生图模型3.0、豆包·视觉理解模型。

数据显示,截至2025年3月底,豆包大模型日均tokens调用量已超过12.7万亿,是2024年12月的3倍,是一年前刚刚发布时的106倍。IDC报告显示,2024年中国公有云大模型调用量激增,火山引擎以46.4%的市场份额位居中国市场第一。

一、高并发场景延迟仅20毫秒,可边想边搜、视觉理解

豆包1.5·深度思考模型较小的参数量和激活参数量,使其具备更低的训练和推理成本,可在高并发场景实现20毫秒低延迟

搜索能力是豆包1.5·深度思考模型的亮点之一。与其他推理模型“先搜索再思考”的模式不同,豆包App基于豆包1.5·深度思考模型进行了定向训练,可以“边想边搜”。

例如,在给用户推荐露营装备时,豆包1.5·深度思考模型可以拆解每个具体需求的注意事项,规划信息,自行判断信息是否完备,并补充搜索信息。在3轮搜索后,豆包1.5·深度思考模型给出了预算范围内、细致周到的推荐。

豆包1.5·深度思考模型还具备视觉理解能力,能基于文字、图像信息进行思考。在下方场景中,豆包1.5·深度思考模型就做到了理解菜单内容,分析每道菜的组成、照顾不同人的口味和过敏食物,给出预算内的点餐推荐。


据火山引擎介绍,为了提升豆包1.5·深度思考模型的通用能力,模型团队优化了数据处理策略,把可验证数据与创意性数据进行融合处理,满足各类任务的需求。

此外,大规模强化学习是训练推理模型的关键技术,通过采用创新的双轨奖励机制,兼顾“对错分明”和“见仁见智”的任务,有效实现了算法的可靠优化。

二、多项跑分打平OpenAI推理模型,AGI测试优势明显

火山引擎公布了豆包1.5·深度思考模型在多项权威基准测试上的跑分结果。

在AIME 2024、AIME 2025这类数学测试中,豆包1.5·深度思考模型的得分与OpenAI o3-mini-high基本打平,但在难度更高的Beyond AIME上仍与后者有明显差距。

在博士级推理难题测试集GPQA Diamond上,豆包1.5·深度思考模型的得分为77.3,与OpenAI o1、o3-mini-high仅有微小差距。

在编程基准测试Code Forces和SWE-bench上,豆包1.5·深度思考模型实现了接近或超越DeepSeek-R1的成绩。

在高难度通用人工智能测试ARC-AGI上,其得分更是大幅超过了OpenAI o1和o3-mini-high,达39.9分。

在创意写作等非推理任务中,豆包1.5·深度思考模型也展示出泛化能力,能够胜任更广泛和复杂的使用场景。

三、直出2K高清图片,还能搜索视频内容

全新升级的豆包·文生图模型3.0,能够实现更好的文字排版表现、实拍级的图像生成效果,以及2K的高清图片生成方式。

▲豆包·文生图模型3.0生成的2K人像(图源:火山引擎)

豆包·文生图模型3.0还可广泛应用于影视、海报、绘画、玩偶设计等营销、电商、设计场景,生成的文字准确无误,画面有设计感。

▲豆包·文生图模型3.0生成的海报(图源:火山引擎)

在最新的文生图领域权威榜单Artificial Analysis竞技场中,豆包·文生图3.0模型已超越业界诸多主流模型,排名全球第一梯队。

新版本的豆包·视觉理解模型则具备更强的视觉定位能力,支持多目标、小目标、通用目标的框定位和点定位,并支持定位计数、描述定位内容、3D定位。可应用于线下门店的巡检场景、GUI agent、机器人训练、自动驾驶训练等。

将一盒草莓的图片发送给豆包·视觉理解模型,它能迅速数出有多少草莓,并框定其位置。

同时,新版本在视频理解能力上也有大幅提升,比如记忆、总结理解、速度感知、长视频理解等。豆包·视觉理解模型结合向量搜索,可直接对视频进行语义搜索,广泛适用于安防、家庭看护等商业化场景。

结语:国产推理模型角逐激烈

推理模型已经成为国内各大模型厂商角逐的重要方向。本次豆包1.5·深度思考模型在推理成本、视觉理解等方面的新能力,或许将成为下一轮推理模型升级的重要方向。

同日,火山引擎还发布了OS Agent解决方案、GUI Agent大模型(豆包1.5·UI-TARS);面向大规模推理,发布AI云原生·ServingKit推理套件。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
60万持仓长江电力12年:分红42万总收益180万 武汉医生股息养老记

60万持仓长江电力12年:分红42万总收益180万 武汉医生股息养老记

真实人物采访
2026-01-01 17:00:03
1499元飞天茅台秒售罄?别急,每人每天都有机会抢12瓶!

1499元飞天茅台秒售罄?别急,每人每天都有机会抢12瓶!

证券时报e公司
2026-01-01 17:49:58
新年第一天,乌克兰战场传来好消息

新年第一天,乌克兰战场传来好消息

难得君
2026-01-01 21:40:23
佛山水价暴涨!将生活垃圾处理费按自来水消费量计收,引发争议

佛山水价暴涨!将生活垃圾处理费按自来水消费量计收,引发争议

火山詩话
2026-01-01 11:00:44
曾承诺“湘超”夺冠就送车的老板被传“失联” 永州文旅工作人员:对方称正出差,元旦假期后会跟球队协商

曾承诺“湘超”夺冠就送车的老板被传“失联” 永州文旅工作人员:对方称正出差,元旦假期后会跟球队协商

红星新闻
2026-01-01 17:43:27
大学生吐槽一个月2500生活费像低保户,父母:是我们一个月血汗钱

大学生吐槽一个月2500生活费像低保户,父母:是我们一个月血汗钱

诗意世界
2026-01-01 16:13:56
新兵擦重机枪发现受潮,向上级申请打两枪,日军大将专机恰好出现

新兵擦重机枪发现受潮,向上级申请打两枪,日军大将专机恰好出现

老谢谈史
2025-12-29 10:58:43
效力20个赛季的球星生涯总得分如何?詹科历史前4,卡特保罗呢?

效力20个赛季的球星生涯总得分如何?詹科历史前4,卡特保罗呢?

大卫的篮球故事
2026-01-01 13:13:52
普京官邸被炸1小时后,特朗普通告全球: 谈判破裂,俄乌将接着打

普京官邸被炸1小时后,特朗普通告全球: 谈判破裂,俄乌将接着打

十三级台阶
2026-01-02 17:28:43
再有钱又怎样?印度首富小儿子300斤生娃难,两代人全靠高科技生

再有钱又怎样?印度首富小儿子300斤生娃难,两代人全靠高科技生

毒舌小红帽
2025-12-16 19:06:34
从承诺归还抢走的土地,到提出出海权,俄国时隔100年又服软了?

从承诺归还抢走的土地,到提出出海权,俄国时隔100年又服软了?

近史博览
2025-12-20 10:50:02
为什么要加入CPTPP?啃不下这6块硬骨头,未来中国可能会很难!

为什么要加入CPTPP?啃不下这6块硬骨头,未来中国可能会很难!

鲁八两
2025-12-05 23:39:44
NBA战报:76人123-108独行侠,马克西34+8+10

NBA战报:76人123-108独行侠,马克西34+8+10

懂球帝
2026-01-02 11:46:10
“刺杀普京”真相揭开了?不是乌克兰,也不是欧盟,而是一旁的它

“刺杀普京”真相揭开了?不是乌克兰,也不是欧盟,而是一旁的它

岁暮的归南山
2026-01-01 16:26:14
48小时反杀!委内瑞拉硬刚美国!中俄齐声警告:守主权,反霸权

48小时反杀!委内瑞拉硬刚美国!中俄齐声警告:守主权,反霸权

起喜电影
2026-01-02 17:42:08
这一次,再多的名和利,也拯救不了副军级职位的阎维文

这一次,再多的名和利,也拯救不了副军级职位的阎维文

阿芒娱乐说
2026-01-02 11:41:22
中国游客缺席的京都

中国游客缺席的京都

东京在线
2026-01-01 21:19:01
伊朗多省爆发抗议,伊朗总统呼吁对话重建信任

伊朗多省爆发抗议,伊朗总统呼吁对话重建信任

凤凰卫视
2026-01-02 12:28:04
45岁富哥“北京肖哥”去世,前一天还晒老婆,死因曝光仇人都惋惜

45岁富哥“北京肖哥”去世,前一天还晒老婆,死因曝光仇人都惋惜

嫹笔牂牂
2025-12-31 07:07:52
利兹联主帅:不知补时的六分钟是哪来的;红军的绝对机会不多

利兹联主帅:不知补时的六分钟是哪来的;红军的绝对机会不多

懂球帝
2026-01-02 04:30:22
2026-01-02 19:39:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11001文章数 116935关注度
往期回顾 全部

科技要闻

新势力年榜:零跑险胜华为,蔚来小鹏新高

头条要闻

媒体:赖清德叫嚣"中共不敢越雷池" 转头就被狠抽耳光

头条要闻

媒体:赖清德叫嚣"中共不敢越雷池" 转头就被狠抽耳光

体育要闻

英超离谱夜?4战全平3场0-0 曼城红军翻车

娱乐要闻

田亮一家新年全家福!森碟变清纯少女

财经要闻

8200亿扩产潮下的锂电供应链之战

汽车要闻

奇瑞汽车12月销量超23万辆 全年超263万辆

态度原创

健康
艺术
教育
数码
房产

元旦举家出行,注意防流感

艺术要闻

神似章子怡?这个越南模特火了,天生长了一张电影脸啊~

教育要闻

高分段人数居区域前列!南京东南实验小学、初中、高中成绩曝光

数码要闻

三星发布The Freestyle+便携投影仪 亮度翻倍并加入多项AI功能

房产要闻

海大誉府新年家年华暨2号楼耀世加推发布会圆满落幕

无障碍浏览 进入关怀版