网易首页 > 网易号 > 正文 申请入驻

一手实测「豆包」深度思考模式:能超越 DeepSeek 吗?

0
分享至

AI新浪潮观察

4min read

一手实测「豆包」深度思考模式:能超越 DeepSeek 吗?

连然2025/02/26

摘要

「元宝」给了「豆包」压力?

字节跳动旗下AI助手豆包正在小范围测试深度思考模型,据豆包相关负责人对极客公园表示,当前测试的是自家深度思考模型的不同实验版本。

另外有报道称,豆包正在测试的深度思考模型是基于豆包1.5基座模型研发。

其实此前在1月中旬,在豆包大模型团队发布豆包1.5Pro时,就已宣布了深度推理模型Doubao-1.5-pro-AS1-Preview的存在,并称「在完全不使用其他模型数据的条件下,通过 RL 算法的突破和工程优化,充分发挥 Test Time Scaling 的算力优势,完成了 RL Scaling ,研发了 Doubao 深度思考模式。」

极客公园实测发现,与豆包对话时后者生成的答案确实有开始显示推理过程的思维链,不过并不稳定出现。目前在豆包对话页面也尚未出现「深度思考」功能的入口。

从2月22日开始,豆包就被腾讯旗下的AI应用「腾讯元宝」压了一个身位,位居中国区苹果应用商店免费APP下载排行榜第三位(第一名还是deepseek),在腾讯、百度多个应用接入deepseek后,字节豆包会如何处之就成为大家关注的焦点,如今答案正在显现。


1 豆包也上「深度思考」了?

最早具备深度思考能力的模型是OpenAI于2023年12月推出的o1系统,但其采用闭源策略而且仅限付费用户使用(每月200美元)。而DeepSeek则通过开源策略、成本降低以及交互创新,成为首个将深度思考能力大规模普及的AI公司——DeepSeek于2024年11月20日发布R1-Lite-Preview,成为国内首个对标o1的推理模型,并在2025年1月20日开源了R1模型。

R1模型的创新点在于:透明化思维链;展示完整的推理过程,包括自我质疑、假设验证等拟人化思考路径;低成本与开源;R1模型的推理成本仅为OpenAI o1的1/27,且代码完全开放。

DeepSeek的深度思考模式是一种通过显性化AI模型的推理过程来增强用户理解的功能,思维链(Chain of Thought, CoT)是支撑这一模式的核心技术。

简单来说,深度思考模式可以让用户直观看到模型的思考过程,这中间涉及思维链的展示,也就是COT(Chain of Thought)——思维链是模拟出来的,通过训练让模型输出中间步骤,比如自我质疑和反思,虽然只是文字序列,但看起来像人类的思考过程。

在深度思考模式下,用户不仅能看到AI的最终答案,还能观察到模型解决问题的完整逻辑链条,包括自我质疑、假设验证、错误修正等步骤。比如,在解决数学题时,模型会展示其从问题拆解、多方法验证到最终结论的全过程。

结合实时联网功能后,模型可抓取最新信息并进行逻辑整合。25日,Anthropic 发布了Claude 3.7 Sonnet 混合推理模型,阿里云 Qwen 推理模型「QwQ-Max 预览版」也亮相了,我让豆包评价了一下这两款推理模型:

可以看到豆包搜到9篇资料并进行了「深入思考」|图片来源:极客公园

豆包展示了思考过程|图片来源:极客公园

思考完毕的豆包输出了对这两款模型的评价|图片来源:极客公园

思考过程的展示,让用户能够清晰地看到模型的推理步骤,而不仅仅是最终结果,这样一来,用户能够感受到模型的决策是有依据的,对模型输出的结果也会更有信任感。


2 豆包 vs deepseek,各有千秋

因为还在测试中,目前在豆包对话页面暂未显示「深度思考」功能的入口,输入消息时也没有像其他接入deepseek的产品一样有选择框可以选择是否开启「深度思考」功能,只是被灰度到的用户在问一些问题时会触发该功能。

我拿几个问题同时问了一下豆包和deepseek,看下两者在「深度思考」上会有哪些不同表现。


经典的数学问题:「9.11和9.9谁大」

先看下豆包的思考过程:

先说一下,在测试中,我发现豆包的「深度思考」模式出现得并不稳定,在第一次输入「9.11和9.9谁大」后,它只是简单地回应了我一下:

图片来源:极客公园

但在我又输入了一遍「9.11和9.9谁大」想试试会不会触发「深度思考」模式时,还真出现了:

豆包详细地考虑了为什么我会第二次问它这个问题……|图片来源:极客公园

可以看到,虽然豆包意识到刚刚已经回答过我,但它还是贴心地考虑了多种也许我没理解前面答案的可能性,然后再给出判断方法最后输出结果。

再看一下deepseek的思考过程:

可以看出,虽然这是一个「看起来很简单」的问题,deepseek的思考过程同样很详细,要比豆包的思考过程更全面。

在这个简单数学题上,豆包和deepseek都遵循了小数比较的基本规则,并采用多种方法验证;不同点在于豆包注重教学引导和考虑到用户可能的误解,而DeepSeek则更现自我质疑和反复验证,思考过程更复杂。


哲学问题:意识的本质是什么?AI会获得自我意识吗?

先来看豆包的回答:

再来看看deepseek的回答:

可以看出,DeepSeek的回答分为科学理论、AI意识路径、伦理框架和解决路径四个部分,引用了神经科学、量子理论等,还提到了法律案例和具体数据;而豆包的回答更偏向哲学理论分类,列举了物理主义、二元论等,并讨论了支持与反对AI权利的观点,不过没有深入技术细节。

两者都承认意识本质尚无共识,也都提到了哲学和科学理论、伦理问题,不同则在于深度和技术细节,DeepSeek更技术导向,涉及神经形态计算、量子封印技术等,而豆包更侧重哲学流派和现有伦理指南。

通过本次实测,我们看到了豆包在深度思考模式上的初步表现,虽然目前处于测试阶段,且功能的稳定性和入口尚未完全开放,但其对推理过程的初步展示已为用户带来了更直观的理解路径。

字节跳动豆包deepseek

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为什么往死里扫黄?网友分享太真实了,一次说透

为什么往死里扫黄?网友分享太真实了,一次说透

另子维爱读史
2026-05-27 20:16:03
父亲当街多次脚踹女儿,路过男子制止时将其放倒致轻伤;一审被判构成故意伤害罪,二审发回重审

父亲当街多次脚踹女儿,路过男子制止时将其放倒致轻伤;一审被判构成故意伤害罪,二审发回重审

极目新闻
2026-05-27 18:44:06
即将体检!巴萨8000万欧签下25岁戈登 或不买断拉什福德+退回曼联

即将体检!巴萨8000万欧签下25岁戈登 或不买断拉什福德+退回曼联

我爱英超
2026-05-28 06:17:11
终于弄明白了:开空调蚊子不咬人,不是冻晕,是导航系统彻底失灵

终于弄明白了:开空调蚊子不咬人,不是冻晕,是导航系统彻底失灵

辉哥说动漫
2026-05-27 15:37:07
诬告朱军性骚扰的“弦子”,终于被封禁了

诬告朱军性骚扰的“弦子”,终于被封禁了

韬闻
2026-05-27 12:46:12
震惊!河南一足疗店推出“反方向的钟”,200多给技师洗脚70分钟

震惊!河南一足疗店推出“反方向的钟”,200多给技师洗脚70分钟

火山詩话
2026-05-28 05:53:10
湖北大娘硬讹收割机后续!大批车主逃离,小麦烂地里,也没人敢去

湖北大娘硬讹收割机后续!大批车主逃离,小麦烂地里,也没人敢去

老猫观点
2026-05-28 07:26:11
年薪2000万的许垚,为什么要毒死身家百亿的林奇?

年薪2000万的许垚,为什么要毒死身家百亿的林奇?

林小明商业评说
2026-05-27 13:24:59
同事婆婆去世,请假要上传证明!她把婆婆灵堂、亡身都上传了...人事半夜审核,魂儿吓没了

同事婆婆去世,请假要上传证明!她把婆婆灵堂、亡身都上传了...人事半夜审核,魂儿吓没了

医脉圈
2026-05-27 20:42:28
一个赌徒引发的启发:赌到一半怎么分钱?逼出了改变世界的概率论

一个赌徒引发的启发:赌到一半怎么分钱?逼出了改变世界的概率论

知识圈
2026-05-27 12:09:19
央企会大批量疏解到雄安吗?知乎网友:有央企“雄安总部”只有边缘部门

央企会大批量疏解到雄安吗?知乎网友:有央企“雄安总部”只有边缘部门

六子吃凉粉
2026-05-27 17:19:22
莫言:如果你混到没人找你吃饭,没人喊你聚会,连电话也没几个,那庆祝了,你不是人缘变差,而是真正觉醒了

莫言:如果你混到没人找你吃饭,没人喊你聚会,连电话也没几个,那庆祝了,你不是人缘变差,而是真正觉醒了

品读时刻
2026-05-27 09:00:58
丈夫两年打赏女主播超1700万 妻子起诉后钱能追回吗?

丈夫两年打赏女主播超1700万 妻子起诉后钱能追回吗?

环球网资讯
2026-05-27 16:48:19
太卷了!郑州一超市水族馆竟有美人鱼表演,店方:演员为超市员工,平时上班节假日兼职表演

太卷了!郑州一超市水族馆竟有美人鱼表演,店方:演员为超市员工,平时上班节假日兼职表演

台州交通广播
2026-05-27 17:20:28
王永国同志逝世

王永国同志逝世

新京报
2026-05-27 16:18:23
谈成了?与中国会面后,巴拿马当场作承诺,但只给面子不给里子!

谈成了?与中国会面后,巴拿马当场作承诺,但只给面子不给里子!

青青子衿
2026-05-28 01:40:03
湖北大娘硬讹收割机后续!警方介入,当地人再曝恶行,根本不敢惹

湖北大娘硬讹收割机后续!警方介入,当地人再曝恶行,根本不敢惹

米果说识
2026-05-27 14:27:31
高志凯预判:12至18个月内全球或将爆发金融危机

高志凯预判:12至18个月内全球或将爆发金融危机

凤凰网财经
2026-05-27 20:16:20
王欣瑜对手:我不是一个作弊的球员;总不能平白无故把分数让给她

王欣瑜对手:我不是一个作弊的球员;总不能平白无故把分数让给她

懂球帝
2026-05-28 01:50:22
43岁香港女星在中山买房,晒房产证直呼划算,四房两厅不到200万

43岁香港女星在中山买房,晒房产证直呼划算,四房两厅不到200万

青梅侃史啊
2026-05-28 07:50:02
2026-05-28 10:12:49
极客公园
极客公园
让最棒的创新成为头条
12092文章数 78885关注度
往期回顾 全部

科技要闻

拼多多股价跌10%:管理层称业绩难免波动

头条要闻

牛弹琴:伊朗180度转弯先发制人 美国迅速回应

头条要闻

牛弹琴:伊朗180度转弯先发制人 美国迅速回应

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

一线调查丨燃油车“甩卖”也难卖

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

家居
亲子
游戏
艺术
教育

家居要闻

古老而持久 石影扶手椅

亲子要闻

孩子没被幼儿园录取没学上!网友:晚生二十年怕是只有幼儿园文凭

Deck都涨了 Steam主机只能更贵!千美元以下不现实

艺术要闻

于右任草书对联:标准草书天花板,爱好者如何不写成“天书”?

教育要闻

微信才是学英语的神器,不懂的话就亏大了!看完涨知识

无障碍浏览 进入关怀版