网易首页 > 网易号 > 正文 申请入驻

豆包大模型披露2024技术进展,亮相7个月综合能力全面对齐GPT-4o

0
分享至


12月30日,字节豆包大模型对外披露2024全领域技术进展。距5月15日首次亮相仅7个月,豆包大模型在通用语言、视频生成、语音对话、视觉理解等方面模型能力均已跨入国际第一梯队。豆包大模型团队表示,“从孩童般学语,到懵懂看世界,到为创作者绘出想象中的奇幻梦境,一切依然处于最早期。”

截至2024年12月,最新版豆包通用模型Doubao-pro-1215,综合能力较5月提升32%,已全面对齐GPT-4o,在数学、专业知识等部分复杂场景任务中,效果表现甚至更好。通过海量数据优化、提升模型稀疏度、引入强化学习、系统性工程优化等方式,团队大幅提升了Doubao-Pro理解精度和生成质量,并实现了性能与效率的平衡,推理服务价格仅为GPT-4o的八分之一。

Doubao-pro在主流评测集上能力全面对齐GPT-4o


图像与视频能力方面,团队于9月推出两款豆包视频生成模型PixelDance与Seaweed,主打复杂提示词精准理解、镜头一致、多交互主体和镜头灵活控制。豆包文生图模型不断迭代,还推出了通用图像编辑能力,让“一句话P图”和“一键海报生成”成为现实。此外,12月发布的豆包视觉理解模型Doubao-vision,可融合视觉与语言多感官深度思考和创作,目前模型能力在十多个主流数据集上比肩Gemini2.0与GPT-4o。

Doubao-vision在主流评测集上能力比肩Gemini2.0、GPT-4o


语音大模型赋予机器“听”与“说”的能力,豆包大模型团队今年推出了全新的语音识别模型Seed-ASR和语音生成基座模型Seed-TTS,通过引入多样、广泛的数据,融合推理链,赋予模型极强的泛化性。据悉,豆包语音模型可听懂20种以上方言夹杂的对话,也能边听边思考,并在会话中表达情感,保留吞音、口音等人类习惯,甚至在交互中可随时被打断。

较语音更进一步,豆包大模型已拥有高品质的“唱作”能力,从词曲编辑、演奏生成到人声演唱,“一个AI也可以是一个乐队”已经成为现实。其背后依托的音乐生成模型框架Seed-Music,结合了语言模型与扩散模型的优势,实现了音乐生成的通用框架,拥有极高的编辑可控性。

团队还首次对外披露了豆包大模型300万字窗口的长文本能力,可一次轻松阅读上百篇学术报告,每百万tokens处理延迟仅需15秒。这一上下文窗口长度和时延水平达到目前业界极限。背靠STRING等上下文关联数据算法和模型加速优化,团队大幅提升了LLM利用海量外部知识的能力,并通过稀疏化及分布式方案将时延降到十秒级。

代码能力方面,豆包代码大模型Doubao-coder编程能力达到专业级,深度支持超16种编程语言、11类真实应用场景,可满足前后端开发、机器学习等全栈编程开发需求。

成立极短时间内,豆包大模型团队还对AI基础研究深入布局。过去几个月,团队57篇论文中选ICLR、CVPR、NeurIPS等顶会,研究成果包括下载量超百万的开源项目及GitHub万星爆款。

豆包大模型团队披露2024研究关键词


同时,豆包大模型团队与近20所高校深入合作,支持超过40位顶尖学者参与关键AI技术攻坚,并与清华AIR、北大分别成立联合实验室。为储备最具潜力的研究人才,豆包大模型团队启动了“TopSeed人才计划”,在全球范围招募顶尖博士毕业生加入,共同挑战世界级AI课题。

根据披露,豆包大模型相关技术能力目前支撑了包括豆包、即梦、豆包MarsCode等50多个C端应用场景,其中,豆包APP已成为国内最受欢迎的AI产品。通过火山引擎,豆包大模型服务了30多个行业,日均tokens调用量超4万亿,较5月发布时增长33倍。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
杨绛:真正有头脑的女人,一辈子两不管,越不管越好命

杨绛:真正有头脑的女人,一辈子两不管,越不管越好命

心理观察局
2026-05-26 06:36:06
“自己都不敢吃”700年历史的漳州杨梅,一夜之间被全国封杀背后

“自己都不敢吃”700年历史的漳州杨梅,一夜之间被全国封杀背后

菁菁子衿
2026-05-26 21:49:54
美军称在霍尔木兹海峡击沉两艘伊朗布雷船

美军称在霍尔木兹海峡击沉两艘伊朗布雷船

新京报
2026-05-26 09:51:05
中方通告全球,对菲律宾发布66号公告:马科斯明白,中国动真格了

中方通告全球,对菲律宾发布66号公告:马科斯明白,中国动真格了

混沌录
2026-05-26 22:05:46
鸿蒙智行全新一代问界M9宣传视频陷AI争议,现场实拍画面曝光

鸿蒙智行全新一代问界M9宣传视频陷AI争议,现场实拍画面曝光

IT之家
2026-05-26 11:17:30
演员袁立辟谣 "抗癌成功" ,称颈部纱布实为眼罩,怒斥平台封其账号却放任谣言传播,同时回应被陈建斌、朱媛媛与辛柏青“欺负”之说

演员袁立辟谣 "抗癌成功" ,称颈部纱布实为眼罩,怒斥平台封其账号却放任谣言传播,同时回应被陈建斌、朱媛媛与辛柏青“欺负”之说

鲁中晨报
2026-05-25 16:23:16
嘉靖第一悬案,悬了500年

嘉靖第一悬案,悬了500年

最爱历史
2026-05-26 14:06:05
五年后,王钰栋在国家队打不上主力

五年后,王钰栋在国家队打不上主力

中场阴谋家
2026-05-26 09:45:22
接触的人多了,你就会发现:吃饭慢,走路稳,脾气好的人特别可靠

接触的人多了,你就会发现:吃饭慢,走路稳,脾气好的人特别可靠

木言观
2026-05-26 21:41:19
安徽一老光棍撞脸普京,成名后被俄罗斯富婆倒追,如今怎样了?

安徽一老光棍撞脸普京,成名后被俄罗斯富婆倒追,如今怎样了?

刀刃历史
2024-06-16 10:34:26
两日连坠毁两架,还都是中国战机!巴基斯坦一口咬定:非人为失误

两日连坠毁两架,还都是中国战机!巴基斯坦一口咬定:非人为失误

琴音缭绕回
2026-05-24 02:38:27
率1.7万国军起义却被错杀,究竟是谁的错?

率1.7万国军起义却被错杀,究竟是谁的错?

芊芊子吟
2026-05-26 19:40:03
28岁男子云南出差失联一年多,其母亲:孩子最后定位已经显示境外

28岁男子云南出差失联一年多,其母亲:孩子最后定位已经显示境外

好词好文
2026-05-26 11:01:26
同是窦唯女儿,一个在香港被大佬捧,一个北京租房打工,差距明显

同是窦唯女儿,一个在香港被大佬捧,一个北京租房打工,差距明显

白面书誏
2026-05-25 16:12:15
女婿正国级,儿子副国级,这位厉害母亲给中国留下最宝贵遗产!

女婿正国级,儿子副国级,这位厉害母亲给中国留下最宝贵遗产!

近史谈
2026-05-24 01:00:15
刚刚!雷霆交易前三顺位签,这操作大秀了

刚刚!雷霆交易前三顺位签,这操作大秀了

体育新角度
2026-05-26 20:58:45
巴里-布朗:总决赛必定会非常艰难,别的都不重要我们只要胜利

巴里-布朗:总决赛必定会非常艰难,别的都不重要我们只要胜利

懂球帝
2026-05-26 13:15:25
全英吃瓜!35岁蛇蝎宝妈跨国勾结迪拜大毒枭,实时定位泼硫酸把毒贩渣夫嘎了?

全英吃瓜!35岁蛇蝎宝妈跨国勾结迪拜大毒枭,实时定位泼硫酸把毒贩渣夫嘎了?

英国报姐
2026-05-19 21:42:03
高山变深坑!亚洲最深铁矿一百多年被挖700米,如今要用13年回填

高山变深坑!亚洲最深铁矿一百多年被挖700米,如今要用13年回填

全城探秘
2026-05-19 15:11:51
科学证实:女人真正着迷的,不是身高和肌肉

科学证实:女人真正着迷的,不是身高和肌肉

月亮打烊了发
2026-05-24 00:20:54
2026-05-26 22:51:00
产业家
产业家
产业互联网第一媒体
1152文章数 1339关注度
往期回顾 全部

科技要闻

中国AI要向外卷,而不只是做第二个OpenAI

头条要闻

留神峪煤矿"暗面"矿工发声:遇检查时矿上就提前封堵

头条要闻

留神峪煤矿"暗面"矿工发声:遇检查时矿上就提前封堵

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

教育
艺术
家居
健康
时尚

教育要闻

教育的最高境界就是把孩子培养成幸福的普通人。

艺术要闻

中国之美,美到极致!

家居要闻

生与命相依 旧公寓改造

外泌体抗衰,什么时候能用上?

蓝色系穿搭太适合夏天了!快来看看这些穿搭示范,美得不重样

无障碍浏览 进入关怀版