网易首页 > 网易号 > 正文 申请入驻

豆包重磅更新!语音对话“更像人” AI应用端或迎来变革

0
分享至

《科创板日报》1月20日讯(编辑 宋子乔) 1月20日,豆包实时语音大模型正式推出。

据介绍,豆包实时语音大模型是一款语音理解和生成一体化的模型,实现了端到端语音对话,主要面向中文语境和场景(可进行英语对话,暂不支持多语种;中文范围内,模型也仅支持小部分方言和地方口音的理解和表达,仍有较大进步空间)。

依托于语音和语义联合建模,该模型呈现出接近真人的语音表达水准,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。

打败GPT-4o?

OpenAI的最新大模型GPT-4o的高级语音功能于2025年1月开始全量推出。

值得注意的是,豆包实时语音大模型直接对标GPT-4o。豆包大模型团队介绍称,在外部真实众测中,模型整体满意度较GPT-4o有明显优势,主要体现在:

豆包大模型的语音语气自然度和情绪饱满度远高于后者,尤其情商层面,模型在情感理解、情感承接以及情感表达等方面也取得显著进展,能较为准确地捕捉、回应人类情感信息;
豆包模型贴合中国用户实际需求,发布即上线,有能力直接服务亿万用户,而非停留于演示Demo层面。

整体满意度(以5分为满分)方面,豆包实时语音大模型评分为4.36,GPT-4o为3.18。其中,50%的测试者对豆包实时语音大模型表现打出满分。 如何实现?

低延时流畅交互、拟人化的语气和情绪反馈,是分辨人与机器的两大重要特征。豆包大模型团队如何让语音大模型不再“一听就是AI”?

其团队研发出了一套端到端框架,深度融合语音与文本模态。该框架面向语音生成和理解进行统一建模,最终实现多模态输入和输出效果。

在预训练(Pretrain)阶段,团队对各模态交织数据进行深入训练,精准捕捉并高效压缩海量语音信息,通过Scaling,最大程度实现语音与文本能力深度融合和能力涌现。

在后训练阶段,团队使用了高质量数据与RL算法,进一步提供模型高情商对话能力与安全性,并在“智商”与“情商”之间寻求平衡。

更真实的情感陪伴——实时语音AI的价值

实时语音AI的价值体现在哪里?影响最直接是AI情感陪伴。

《科创板日报》实测发现,豆包的语音大模型不仅能感受到你的情感,还自带情绪和情感,可以随时打断对话,互动更加拟人。

真人级语音对话,能提供更为亲和的交互体验和情感价值,AI不再呈现冰冷的“人机感”,其考验的是AI的“人性化”程度,是人类迈向AGI(通用人工智能)的关键里程碑。

可以说,豆包在实时语音交互上的进步展现的是国产AI软件的进步,有望为AI端侧硬件开辟更广阔的空间,如AI语音助手硬件以及AI玩具等。

目前AI产品呈现多模态趋势,最为常见的是语音+文字的多模态交互,伴随Transformer架构对信息处理能力的提升,浙商证券预计,2025年开始会涌现更多综合性多模态交互,将深度结合数据集、文本、音频、视频等实现更高维度的人机交互层级,这对硬件侧主控芯片提出了更多更高的需求。该机构表示,产业链重点标的包括恒玄科技、中科蓝讯、乐鑫科技、星宸科技、瑞芯微、炬芯科技、全志科技等。

而AI玩具可以视作具备面部识别、语音识别、自然语言处理等技术,能够与用户对话的机器人。随着豆包语音大模型为代表的语言模型不断演进,AI玩具的功能将不仅限于对话,而且能够满足个性化、情感需求。广发证券表示,AI玩具赛道兼具教育与陪伴属性,是具有真实需求的AI硬件落地方向,该机构关注实丰文化、汤姆猫、奥飞娱乐、上海电影等。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
比亚迪发布自研高算力芯片“璇玑A3”,为中国首款4nm智驾芯片,并宣布为城市领航兜底服务

比亚迪发布自研高算力芯片“璇玑A3”,为中国首款4nm智驾芯片,并宣布为城市领航兜底服务

红星资本局
2026-05-28 21:54:46
24年海口飞行员离奇失踪,目击证人爆料,女友崩溃痛哭,说明真相

24年海口飞行员离奇失踪,目击证人爆料,女友崩溃痛哭,说明真相

卡西莫多的故事
2025-02-02 21:15:43
刚被“点名”发生中毒窒息事故,湖南裕能云南基地又现火情

刚被“点名”发生中毒窒息事故,湖南裕能云南基地又现火情

澎湃新闻
2026-05-28 15:52:27
章若楠空杯到底有多美?网友说:这颜值谁顶得住,难怪都想娶!

章若楠空杯到底有多美?网友说:这颜值谁顶得住,难怪都想娶!

暖心萌阿菇凉
2026-04-30 13:13:01
央视紧急预警!将有大事发生?千万别乱囤物资,这4类才是刚需

央视紧急预警!将有大事发生?千万别乱囤物资,这4类才是刚需

清晨的世界
2026-05-28 11:11:01
马斯克的用人哲学:一个员工有没有潜力,开会就能看出来,越是平庸的人,越会在这两个细节上暴露自己的“打工者思维”

马斯克的用人哲学:一个员工有没有潜力,开会就能看出来,越是平庸的人,越会在这两个细节上暴露自己的“打工者思维”

心理观察局
2026-05-25 07:20:34
西方人不解!为啥中国改朝换代那么多次,都非要承认自己是中国?

西方人不解!为啥中国改朝换代那么多次,都非要承认自己是中国?

鹤羽说个事
2026-05-28 22:56:57
被张国立儿子暴打,后嫁给大17岁富豪,如今多年过去童瑶怎么样了

被张国立儿子暴打,后嫁给大17岁富豪,如今多年过去童瑶怎么样了

青橘罐头
2026-05-28 14:49:56
黄土高原变身陕西退路,西安2万房价逼走的年轻人,转身开始回流陕北,刨出了新活法

黄土高原变身陕西退路,西安2万房价逼走的年轻人,转身开始回流陕北,刨出了新活法

林子说事
2026-05-28 18:17:22
惨!于和伟《森中有林》上映6天就被匆匆抬走,1.5亿投资血亏出局

惨!于和伟《森中有林》上映6天就被匆匆抬走,1.5亿投资血亏出局

八卦南风
2026-05-28 15:26:19
白宫称伊朗媒体发布的美伊谅解备忘录内容“不实”

白宫称伊朗媒体发布的美伊谅解备忘录内容“不实”

澎湃新闻
2026-05-27 23:16:06
历史不会重演,但会惊人相似:新能源车,极可能重走燃油车的老路

历史不会重演,但会惊人相似:新能源车,极可能重走燃油车的老路

侃故事的阿庆
2026-05-28 14:28:28
TA:拉莫斯牵头财团收购塞维利亚的谈判已破裂

TA:拉莫斯牵头财团收购塞维利亚的谈判已破裂

懂球帝
2026-05-28 21:28:13
总分超王治郅历史第7!胡金秋20+8完胜王哲林 难阻遗憾惜败

总分超王治郅历史第7!胡金秋20+8完胜王哲林 难阻遗憾惜败

醉卧浮生
2026-05-28 21:39:12
3艘俄影子舰队油轮在黑海遭无人机袭击

3艘俄影子舰队油轮在黑海遭无人机袭击

桂系007
2026-05-28 23:59:13
莫言:告诉你一个基本不会得罪人的方法,那就是当别人找你帮忙时,你一定要痛痛快快地拒绝,犹犹豫豫地同意

莫言:告诉你一个基本不会得罪人的方法,那就是当别人找你帮忙时,你一定要痛痛快快地拒绝,犹犹豫豫地同意

每日一首古诗词
2026-04-09 06:06:47
浙江70岁大爷觉得浑身没劲,每天吃3、4根香蕉,连吃半个月,结果把自己“吃进”了EICU!医生:确诊高钾血症

浙江70岁大爷觉得浑身没劲,每天吃3、4根香蕉,连吃半个月,结果把自己“吃进”了EICU!医生:确诊高钾血症

环球网资讯
2026-05-28 12:36:15
快讯!印尼这手确实狠!

快讯!印尼这手确实狠!

故事终将光明磊落
2026-05-28 17:34:16
心理学上有个词叫:逆火效应(永远不要指出你身边人的任何问题,包括你的亲戚朋友。成年人的最大清醒就是不介入他人的生活)

心理学上有个词叫:逆火效应(永远不要指出你身边人的任何问题,包括你的亲戚朋友。成年人的最大清醒就是不介入他人的生活)

德鲁克博雅管理
2026-05-18 17:11:20
一周暴涨50%,资金疯狂加仓!

一周暴涨50%,资金疯狂加仓!

君临财富
2026-05-28 18:58:50
2026-05-29 00:48:49
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
724894文章数 1021122关注度
往期回顾 全部

科技要闻

利润跌27%:快手只剩“可灵”这张牌?

头条要闻

媒体:特朗普犯下两个致命失误 美方谈判底线持续退让

头条要闻

媒体:特朗普犯下两个致命失误 美方谈判底线持续退让

体育要闻

唐斯经历的一切,此刻的他与尼克斯

娱乐要闻

林俊杰七七与大哥嫂子的瓜剪不断理还乱

财经要闻

小米仍需一次创业

汽车要闻

宋Ultra DM-i售12.99万起 选装天神之眼B承诺一年城市领航兜底

态度原创

房产
旅游
数码
本地
公开课

房产要闻

突发重磅!三亚新机场公司正式成立!

旅游要闻

游客在九寨沟被索要"照镜费" 景区:店家随口说的

数码要闻

慧荣发布AI负载优化SSD主控SM2524XT:14GB/s,DRAM-less

本地新闻

用剪纸的方式,打开江苏扬州

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版