网易首页 > 网易号 > 正文 申请入驻

在DeepSeek老家发新模型,豆包怎么想的?

0
分享至

豆包的思考模型终于正式揭开面纱。

4月17日,火山引擎总裁谭待现身杭州,分享近四个月以来字节豆包大模型的研发进展。

其中最值得关注的,是思考模型Doubao-1.5-thinking-pro的正式上线。目前,其已通过火山引擎正式开放体验接口。

一季度,AI赛道天翻地覆。

DeepSeek最先凭借推理模型震惊海外,大厂的步伐相对滞后,这让去年AI战略被打满分的字节跳动略显尴尬。

不过,有行业人士对凤凰网科技表示,“豆包的步伐会慢,跟它用户量级大有关,如何平衡投入产出比是个问题”。

据谭待表述,豆包大模型在3月底日均tokens使用量已超12.7万亿,是2024年12月的3倍,一年前的106倍。

在基座大模型愈发呈现寡头之势的当下,豆包大模型的一举一动也备受外界关注。

根据官方测评,豆包深度思考模型的人类评估表现超出DeepSeek R1 8%,同时单位推理成本相比DeepSeek R1降低了50%。

在数学推理、编程竞赛、科学推理等专业任务领域,该模型性能相较OpenAI o3-mini-high、Gemini 2.5 Pro等模型同样并不逊色。用谭待的话来说,就是“均达到或接近全球第一梯队”。

另一亮点是多模态的能力,毕竟DeepSeek迟迟不支持除文字以外的内容。

本次豆包深度思考模型专门打造了一款视觉版,具有原生多模态深度思考能力,可以一键拍图识别地点、识别外文菜单。

豆包大模型总算是扳回了一局。

目前,在AppStore内豆包已重回免费榜第一,DeepSeek目前排名第三,元宝则位于第八。

用多模态打DeepSeek?

相比元宝赤裸裸的借DeepSeek的东风,豆包的姿态略显摇摆。

2月初,火山引擎官方即全面支持DeepSeek系列大模型,但另一边,豆包自身还在铆足劲进行模型研发投入。

当月下旬,字节跳动旗下AI助手豆包开始小范围测试深度思考模型的消息,彼时豆包相关负责人对媒体回应称,豆包App在测试的是其深度思考模型的不同实验版本;3月5日,豆包宣布上线深度思考推理模式,并以输入框的“深度思考”按钮为功能入口。

不过这些小试牛刀未能溅起多大水花。

直到本次推理模型全面上线,坦诚讲,虽然没有DeepSeek R1出现时的那种惊艳,但大厂全面作战的能力更强,在产品细节上的打磨更为细致。

比如基于豆包·深度思考模型,豆包App进行了定向训练,让模型具备了“边想边搜”的能力。思考过程中,豆包可基于推理,多次调用工具、搜索信息,提供更加全面、准确的结果。

除此之外,视觉理解模型解决了DeepSeek R1只能做文字输入的最大难点。

这一次在发布现场,谭待演示了一个很好的应用案例:

出国旅游时遇到的最大难题之一——点菜。“只翻译菜单是不够的,能直接点菜才是完美”。除此之外,模型还要思考如何换算汇率来控制预算,还要弄懂外文菜单的意思,如果有老人、孩子,要照顾他们的喜好,是否过敏等等。根据谭待现场所举的例子,豆包深度思考模型首先兑换货币控制预算,周全考虑老人孩子喜好,还细致避开过敏菜肴,非常出色地完成了任务。

豆包仍在憋大招

过去一个多月,是豆包团队紧锣密鼓的一个月。

人员架构上引入新的技术大拿,最著名的当属从谷歌加入字节的、曾参与Gemini开发的Google follow吴永辉博士。

此后其便领导豆包大模型团队加足马力,与此同时朱文佳继续负责模型应用相关工作。

尽管研发模型是当前的紧要任务,但凤凰网科技从豆包内部人士处了解到,内部对应用层的投入同样不低。“最近一个多月,各个产品部门都拉满了,个别部门还在憋大招。”

去年5月“豆包大模型家族”正式发布时惊艳四座,价格屠夫成为字节在大模型市场的一个新标签。

今年2月,百度智能云事业群总裁沈抖还曾在全员会上暗戳戳的表示,“国内大模型去年‘恶意’的价格战,导致行业整体的创收相较于国外差了多个数量级”。当时,谭待通过朋友圈回应称,大模型降价是通过技术创新实现的,大家应像DeepSeek一样聚焦基本功,少做无端猜测。

不过,本次发布的Doubao-1.5-thinking-pro模型没有特别突出它的API价格。

凤凰网科技在查询官方后发现,豆包推理模型的输入、输出价格分别为0.004元/千token和0.002元/千token,同等级模型,阿里qwen-plus输入价格可做到0.0008元/千token,输出价格与豆包模型一样。DeepSeek R1的API价格在忙时段,输入和输出分别可达0.001元/千token和0.016元/千token。

另据官方表示,豆包深度思考模型采用MoE(混合专家)架构,总参数为200B,每次推理时激活的参数为20B,可以更低延迟。相比之下,DeepSeek-R1总参数规模为671B,激活参数为37B。

在提及本次模型更新中的难点时,谭待表示,整体来说是实现效果好最难。“因为要先用各种方法达到最好的效果,在这个基础上再用各种方式去降低成本,这是一个优化的过程”。其认为,好效果能带来更大的突破,解锁更多的场景,吸引更多的用户和企业使用。所以得以预见,豆包推理模型的API价格未来还将处于动态调整的过程中。

包括朱啸虎在内的一众行业人士均认为,当前国内已经有很好的开源模型,这使得应用市场出现了显著的机会。业内越来越多人亦认为大模型的竞争最后只会剩下几家。

如李开复所言,“中国大模型未来大概率只剩下DeepSeek、阿里和字节跳动三家”。不过即便如此,相较于DeepSeek和阿里,字节仍旧需要走出自己的路。

本文源自:凤凰网科技

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刚刚,哈佛长新冠研究突破!发现背后黑手

刚刚,哈佛长新冠研究突破!发现背后黑手

徐德文科学频道
2025-12-18 21:44:08
坠机!55岁美国冠军车手不幸遇难,7人死亡:包括妻子+2个孩子

坠机!55岁美国冠军车手不幸遇难,7人死亡:包括妻子+2个孩子

念洲
2025-12-19 09:19:44
不干涉他国内政

不干涉他国内政

周边问题研究所
2025-12-18 21:22:36
太平天国最大贡献:一场14年的“外科手术”,掏空清廷统治根基

太平天国最大贡献:一场14年的“外科手术”,掏空清廷统治根基

远方风林
2025-12-18 23:49:15
反转反转再反转!狄龙自杀式防守送勇士两罚1掷 太阳最后罚球绝杀

反转反转再反转!狄龙自杀式防守送勇士两罚1掷 太阳最后罚球绝杀

Emily说个球
2025-12-19 12:45:42
日本迫使苹果调整iOS规则大幅降低苹果税,中国继续人傻钱多?

日本迫使苹果调整iOS规则大幅降低苹果税,中国继续人傻钱多?

风向观察
2025-12-18 16:40:37
“南京博物院藏仇英名作现身拍卖市场”追踪

“南京博物院藏仇英名作现身拍卖市场”追踪

新华社
2025-12-19 00:20:41
88比11!CBA最悬殊的比分诞生了:篮协看到这一幕后该懵了?

88比11!CBA最悬殊的比分诞生了:篮协看到这一幕后该懵了?

篮球快餐车
2025-12-19 01:21:14
《江南春》不在场:8800万元,不是最可怕的数字

《江南春》不在场:8800万元,不是最可怕的数字

呦呦鹿鸣
2025-12-18 16:15:41
掘金逆转魔术:约基奇三双助攻超张伯伦中锋历史第一 班凯罗三双

掘金逆转魔术:约基奇三双助攻超张伯伦中锋历史第一 班凯罗三双

醉卧浮生
2025-12-19 12:59:04
张雨绮换脸成功!说不出来哪里变了,好像又都变了

张雨绮换脸成功!说不出来哪里变了,好像又都变了

爆角追踪
2025-12-18 16:05:56
乐山一小区网捕流浪猫致幼猫死亡引争议 记者走访:多只流浪猫被紧急收养,公安已介入调查

乐山一小区网捕流浪猫致幼猫死亡引争议 记者走访:多只流浪猫被紧急收养,公安已介入调查

封面新闻
2025-12-19 12:05:46
停播7年,那个挽救无数司机的“网红交警”谭乔,却挽救不了自己

停播7年,那个挽救无数司机的“网红交警”谭乔,却挽救不了自己

以茶带书
2025-12-18 17:14:01
单扛强突+MVP!22岁中锋带队进决赛:离开曼联半年12球3助

单扛强突+MVP!22岁中锋带队进决赛:离开曼联半年12球3助

叶青足球世界
2025-12-19 08:29:19
梅艳芳母亲100岁大寿留影,四个孩子离世仨,如今过的比谁都潇洒

梅艳芳母亲100岁大寿留影,四个孩子离世仨,如今过的比谁都潇洒

万物知识圈
2025-12-18 09:12:45
南京不少市民反映导航失灵?高德回应:信号干扰源导致定位异常

南京不少市民反映导航失灵?高德回应:信号干扰源导致定位异常

极目新闻
2025-12-18 15:26:27
54岁陈松伶减重27斤,皮松脸黑括号纹很深,和老公站一起像两代人

54岁陈松伶减重27斤,皮松脸黑括号纹很深,和老公站一起像两代人

娱圈小愚
2025-12-19 10:03:35
南京博物院盗卖文物,捐赠后人追查十年遭打码“证据”糊弄,失踪五件国宝还有多少黑幕

南京博物院盗卖文物,捐赠后人追查十年遭打码“证据”糊弄,失踪五件国宝还有多少黑幕

爆角追踪
2025-12-18 15:36:33
小学生吃早餐视频火了,116万网友点赞:这就是有父母兜底的幸福

小学生吃早餐视频火了,116万网友点赞:这就是有父母兜底的幸福

妍妍教育日记
2025-12-18 20:23:32
迷人的大腿:生命的等高线

迷人的大腿:生命的等高线

疾跑的小蜗牛
2025-12-19 07:25:05
2025-12-19 13:39:00
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 545595关注度
往期回顾 全部

科技要闻

2025新一代人工智能创业大赛总决赛收官

头条要闻

团播女生私下卖力维护"大哥":经常擦边 有女生会被约走

头条要闻

团播女生私下卖力维护"大哥":经常擦边 有女生会被约走

体育要闻

没有塔图姆,还有塔秃姆

娱乐要闻

曲协表态仅6天,郭德纲担心的事还是发生

财经要闻

非法集资911亿!"金融大鳄"终审被判无期

汽车要闻

最便宜GLS 2026款奔驰GLS经典版售96.8万

态度原创

家居
游戏
时尚
本地
艺术

家居要闻

高端私宅 理想隐居圣地

经典剧情RPG神作《空之轨迹 the 1st》冬促来袭!

“烟管裤”今年冬天爆火,怎么搭都时髦!

本地新闻

云游安徽|访黄山云海古村,读一城山水风骨

艺术要闻

诸乐三的写意花鸟

无障碍浏览 进入关怀版