网易首页 > 网易号 > 正文 申请入驻

受DeepSeek-R1启发,小米大模型团队登顶音频推理MMAU榜

0
分享至

3月17日,小米技术官方微博发文称,小米大模型团队在音频推理领域取得突破性进展,受 Deepseek-R1 启发,团队率先将强化学习算法应用于多模态音频理解任务,仅用一周时间便以64.5%的 SOTA 准确率登顶国际权威的 MMAU 音频理解评测榜首。现同步开源。

据介绍,MMAU(Massive Multi-Task Audio Understanding and Reasoning)评测集是音频推理能力的量化标尺,它通过一万条涵盖语音、环境声和音乐的音频样本,结合人类专家标注的问答对,测试模型在27种技能,如跨场景推理、专业知识等应用上的表现,期望模型达到接近人类专家的逻辑分析水平。

作为基准上限,人类专家在 MMAU 上的准确率为 82.23%。目前 MMAU 官网榜单上表现最好的模型是来自 OpenAI 的 GPT-4o,准确率为 57.3%。紧随其后的是来自 Google DeepMind 的 Gemini 2.0 Flash,准确率为 55.6%。

来自阿里的 Qwen2-Audio-7B 模型在此评测集上的准确率为 49.2%。由于它的开源特性,小米大模型团队尝试使用一个较小的数据集,清华大学发布的 AVQA 数据集,对此模型做微调。AVQA 数据集仅包含 3.8 万条训练样本,通过全量有监督微调(SFT),模型在 MMAU 上的准确率提升到了 51.8%。

DeepSeek-R1 的发布为小米大模型团队在该项任务上的研究带来了启发。DeepSeek-R1 的 Group Relative Policy Optimization (GRPO) 方法,让模型仅通过"试错-奖励"机制就能使自主进化,涌现出类似人类的反思、多步验证等推理能力。

小米大模型团队尝试将 DeepSeek-R1 的 GRPO 算法迁移到 Qwen2-Audio-7B 模型上。最终,在仅使用 AVQA 的 3.8 万条训练样本的情况下,强化学习微调后的模型在 MMAU 评测集上实现了 64.5% 的准确率,这一成绩比目前榜单上第一名的商业闭源模型 GPT-4o 有近10个百分点的优势。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
芯片松绑4个月,中国一块也没买,中国不急美国急,形势反转了

芯片松绑4个月,中国一块也没买,中国不急美国急,形势反转了

王新喜
2026-04-23 20:37:56
校庆我捐700万被安排在角落,我愣了3秒,校长道:不坐就走不差你

校庆我捐700万被安排在角落,我愣了3秒,校长道:不坐就走不差你

吃货的分享
2026-04-22 20:30:21
英特尔美股盘后涨幅扩大至18%

英特尔美股盘后涨幅扩大至18%

每日经济新闻
2026-04-24 05:27:07
央视小尼离婚后单身至今,原因曝光:不是放不下前妻,是放不下她

央视小尼离婚后单身至今,原因曝光:不是放不下前妻,是放不下她

翰飞观事
2026-04-10 14:59:12
一鸡爆火,老板直接累瘫了

一鸡爆火,老板直接累瘫了

南风窗
2026-04-23 16:11:15
50亿!国产保温杯卖爆美国:为了成为中国人,这帮老外也是拼了!

50亿!国产保温杯卖爆美国:为了成为中国人,这帮老外也是拼了!

李砍柴
2026-04-23 16:41:54
羡慕!某研究所员工晒出26年前三个月收入

羡慕!某研究所员工晒出26年前三个月收入

微微热评
2026-04-23 22:11:36
“19岁女生受邀去泰国泼水节被转卖电诈园”最新消息:园区初步同意放人,可迟迟不给具体位置,双方仍在协商接人事宜

“19岁女生受邀去泰国泼水节被转卖电诈园”最新消息:园区初步同意放人,可迟迟不给具体位置,双方仍在协商接人事宜

三湘都市报
2026-04-23 17:18:29
炫富网红蓝战非不装了,疯狂带货捞金

炫富网红蓝战非不装了,疯狂带货捞金

电商派Pro
2026-04-23 10:09:20
去掉机顶盒!我国一体化电视全国推广正式启动

去掉机顶盒!我国一体化电视全国推广正式启动

IT之家
2026-04-23 17:16:54
继人民日报发声后,官媒再次三问董宇辉,言辞犀利,字字揭他老底

继人民日报发声后,官媒再次三问董宇辉,言辞犀利,字字揭他老底

离离言几许
2026-04-23 20:04:00
于海青:为何说在飞机上声称南方空姐的女士给自己惹了大麻烦?

于海青:为何说在飞机上声称南方空姐的女士给自己惹了大麻烦?

于海青
2026-04-23 18:02:43
天平开始倾斜?最新伤病报告:杜兰特添新伤,里夫斯G3有望复出

天平开始倾斜?最新伤病报告:杜兰特添新伤,里夫斯G3有望复出

移动挡拆
2026-04-24 07:14:22
揪心!女生受邀赴泰过泼水节,被转卖缅甸电诈园,20万元赎金付完仍被困……

揪心!女生受邀赴泰过泼水节,被转卖缅甸电诈园,20万元赎金付完仍被困……

新民周刊
2026-04-23 18:53:58
知名歌手因抢不到五一高铁票取消演唱会!

知名歌手因抢不到五一高铁票取消演唱会!

深圳晚报
2026-04-23 19:29:44
记者:湖人调整里夫斯出战情况,球员有望G3复出

记者:湖人调整里夫斯出战情况,球员有望G3复出

懂球帝
2026-04-24 07:30:36
女子买12万黄金首饰,金店为何报警?起底退费骗局

女子买12万黄金首饰,金店为何报警?起底退费骗局

环球网资讯
2026-04-23 16:39:17
上海地铁站内,这个“高素质”习惯爆发冲突!上海已叫停多年!很多人改不过来……

上海地铁站内,这个“高素质”习惯爆发冲突!上海已叫停多年!很多人改不过来……

环球网资讯
2026-04-23 11:11:44
4.24日早评|重磅公布!美伊大消息!A股要爆!

4.24日早评|重磅公布!美伊大消息!A股要爆!

龙行天下虎
2026-04-24 05:01:21
前厨师:C罗的饮食很均衡且不喝牛奶,因为这违背自然规律

前厨师:C罗的饮食很均衡且不喝牛奶,因为这违背自然规律

懂球帝
2026-04-23 23:43:03
2026-04-24 08:03:00
鞭牛士 incentive-icons
鞭牛士
准确、快速、有深度的科技媒体
106702文章数 61750关注度
往期回顾 全部

科技要闻

马斯克喊出"史上最大产品",但量产难预测

头条要闻

特朗普发文后 伊朗最高领袖、总统、议长、外长齐发声

头条要闻

特朗普发文后 伊朗最高领袖、总统、议长、外长齐发声

体育要闻

给文班剃头的马刺DJ,成为NBA最佳第六人

娱乐要闻

王大陆因涉黑讨债被判 女友也一同获刑

财经要闻

普华永道赔偿10亿 恒大股东见到"回头钱"

汽车要闻

预售30.29万起 岚图泰山X8配896线激光雷达

态度原创

本地
旅游
房产
公开课
军事航空

本地新闻

SAGA GIRLS 2026女团选秀

旅游要闻

走进榉溪村

房产要闻

三亚安居房,突然官宣!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美伊陷入互相封锁僵局

无障碍浏览 进入关怀版