网易首页 > 网易科技 > 网易科技 > 正文

无问芯穹发布首个端侧全模态理解的开源模型Megrez-3B-Omni

0
分享至
据了解,Megrez-3B-Omni 拒绝牺牲任何模态的精度,在图片、文本、音频三个模态中均取得了同尺寸下最优性能。

12月16日,无问芯穹宣布正式开源其“端模型+端软件+端IP”端上智能一体化解决方案中的小模型——全球首个端侧模态理解开源模型Megrez-3B-Omni,并同步开源了纯语言版本模型Megrez-3B-Instruct。

据介绍,Megrez-3B-Omni是一个为端而生的全模态理解模型,选择了最适合手机、平板等端侧设备的30亿参数黄金尺寸,结构规整,推理速度最大领先同精度模型300%。作为一个全模态模型,Megrez-3B-Omni同时具备图片、音频、文本三种模态数据的处理能力,并在三个模态的多种测评基准中取得了最优性能。

据了解,Megrez-3B-Omni 拒绝牺牲任何模态的精度,在图片、文本、音频三个模态中均取得了同尺寸下最优性能。无论是和同样三模态的VITA ( based on Mixtral 8×7B) 、Baichuan-Omni-7B ,还是双模态的MiniCPM-V 2.6 ( based on Qwen2-7B)、Qwen2-VL-7B、Qwen2-Audio-7B,又或是单一模态的Qwen、Baichuan 等模型相比,Megrez-3B-Omni 在主流基准测试集上的表现都毫不逊色。

在图像理解方面,Megrez-3B-Omni 作为一个体积仅为3B的模型,其综合性能表现可以全面超过34B的庞然大物,超越LLaVA-NeXT-Yi-34B 等模型,是目前OpenCompass、MME、MMMU、OCRBench等多个主流测试集上精度最高的图像理解模型之一。

与此同时,Megrez-3B-Omni 在场景理解、OCR 等任务上也具有良好表现,能够准确洞察和分析图像中的场景内容,并高效地从中提取文本信息,且无论是模糊的印刷体还是复杂的手写字,都能够轻松识别。

在文本理解方面,作为全模态理解模型,Megrez-3B-Omni 没有牺牲模型的文本处理能力,将上一代14B大模型的优秀能力压缩至3B规模,显著降低了计算成本、提升了计算效率。在C-EVAL、MMLU/MMLU Pro、AlignBench等多个权威测试集上更是取得端上模型最优精度。

在语音理解方面,Megrez-3B-Omni 的效果比肩行业主流方案。Megrez-3B-Omni不仅支持中文和英文的语音输入,还能够处理复杂的多轮对话场景,更能支持对输入图片或文字的语音提问,实现不同模态间的自由切换。用户就任意模态内容,发出语音指令,Megrez-3B-Omni 就能根据语音指令直接响应文本,让用户可以通过更少动作与模型展开更直观、自然的交互。

据介绍,模型的规模并不是决定其速度的唯一因素,因此模型小并不一定就意味着速度快。凭借对硬件特性的深入理解与利用,Megrez-3B-Omni 通过软硬件协同优化策略,确保了各参数与主流硬件高度适配,以实现硬件性能的利用最大化。与上一代及其他端侧大语言模型相比,单模态版本的Megrez-3B-Instruct 在推理速度上取得了显著提升,最大推理速度可以领先同精度模型300%。

Megrez-3B-Instruct 这次还特别提供了WebSearch 功能,这一功能使得模型能够智能地判断何时需要调用外部工具进行网页搜索,辅助回答用户的问题。用户得以构建属于自己AI搜索,通过网络获取最新信息,克服小模型的幻觉问题和知识储备不足的局限。

无问芯穹表示,Megrez-3B-Omni是一个能力预览,接下来还将持续迭代Megrez系列,提升自动化水平至“edge device use”效果,让用户只需要给出简单的语音指令,就可完成端设备的设置或应用操作,并将它作为“端模型+端软件+端IP”端上智能一体化解决方案的重要构成推向市场。

在这个方案中,除端侧全模态理解模型外,还有端上推理软件和IP设计方案,不仅支持CPU、GPU和NPU 的同时推理,更能通过跨越软硬件层次的系统优化,额外带来最高可达70%的性能提升,最大化端侧硬件性能的利用。(易智)

延伸阅读
相关推荐
热点推荐
宋喆出狱后生活曝光:隐居县城穷困潦倒,难怪马蓉不想要他了!

宋喆出狱后生活曝光:隐居县城穷困潦倒,难怪马蓉不想要他了!

丰谭笔录
2025-12-10 07:35:09
举报领导“索要奖金”的亚运冠军再发声:自己不敢再呆在家中,恳请有关部门深入调查

举报领导“索要奖金”的亚运冠军再发声:自己不敢再呆在家中,恳请有关部门深入调查

极目新闻
2025-12-16 17:46:05
中国女首富,以7800亿超越华为成为国内最大民企,她哪来那么多钱

中国女首富,以7800亿超越华为成为国内最大民企,她哪来那么多钱

牛牛叨史
2025-12-14 17:07:17
看西班牙王后穿大衣,我悟了:裙过膝,衣不花哨不紧身,高级显贵

看西班牙王后穿大衣,我悟了:裙过膝,衣不花哨不紧身,高级显贵

八分搭配
2025-11-30 00:06:13
6选1!谁才是火箭争冠的完美控卫答案?3人基本出局,1人是最优解

6选1!谁才是火箭争冠的完美控卫答案?3人基本出局,1人是最优解

毒舌NBA
2025-12-17 09:25:16
有情有义!保利尼奥拒绝巴西国家队邀约:正考虑重回中超!

有情有义!保利尼奥拒绝巴西国家队邀约:正考虑重回中超!

邱泽云
2025-12-16 23:17:24
小米车主提车当天,误踩电门撞死人!小米紧急澄清:跟车无关

小米车主提车当天,误踩电门撞死人!小米紧急澄清:跟车无关

胡严乱语
2025-12-16 20:30:41
朱孝天批F4歌不符音乐审美 张震岳喊他「脱队F1」中肯驳:很好听

朱孝天批F4歌不符音乐审美 张震岳喊他「脱队F1」中肯驳:很好听

ETtoday星光云
2025-12-17 10:10:04
一个人在体制内呆久了会变成什么样子?网友:我要笑死在评论区

一个人在体制内呆久了会变成什么样子?网友:我要笑死在评论区

夜深爱杂谈
2025-12-05 21:01:58
刚刚!A股,又见证历史了

刚刚!A股,又见证历史了

中国基金报
2025-12-17 09:53:32
太吓人!李湘一家三口在哈尔滨!李湘赘肉太多,王诗龄的胳膊好粗

太吓人!李湘一家三口在哈尔滨!李湘赘肉太多,王诗龄的胳膊好粗

小娱乐悠悠
2025-12-17 09:32:47
官方:蒙铁尔超远倒钩荣膺2025年普斯卡什奖

官方:蒙铁尔超远倒钩荣膺2025年普斯卡什奖

懂球帝
2025-12-16 22:49:04
美被爆向泽连斯基下“最后通牒”:接受美方安全保障方案,否则面临失去保障风险

美被爆向泽连斯基下“最后通牒”:接受美方安全保障方案,否则面临失去保障风险

环球网资讯
2025-12-16 20:24:24
清朝条约不让售卖之后,电商平台又上架了一批满清条约

清朝条约不让售卖之后,电商平台又上架了一批满清条约

映射生活的身影
2025-12-16 16:06:59
1992年,28岁的何晴与同学合影留念,站在C位太显眼了

1992年,28岁的何晴与同学合影留念,站在C位太显眼了

振华观史
2025-12-16 17:15:01
何晴葬礼现场曝光!不到24小时,许亚军一个举动实现口碑暴涨

何晴葬礼现场曝光!不到24小时,许亚军一个举动实现口碑暴涨

冷紫葉
2025-12-16 13:10:08
4名勇士挺身阻止悉尼枪案枪手,3人殒命,一对夫妇相拥而亡!英勇夺枪男:不后悔

4名勇士挺身阻止悉尼枪案枪手,3人殒命,一对夫妇相拥而亡!英勇夺枪男:不后悔

红星新闻
2025-12-16 19:10:32
官方:杨瀚森被开拓者下放至混音,将出战今日G联赛比赛

官方:杨瀚森被开拓者下放至混音,将出战今日G联赛比赛

懂球帝
2025-12-17 07:42:11
死了将近400年,依旧争议不休

死了将近400年,依旧争议不休

我是历史其实挺有趣
2025-12-16 10:57:14
房地产集体卷豪宅“回血”,但富人也不够用了

房地产集体卷豪宅“回血”,但富人也不够用了

每日人物
2025-12-16 12:08:40
2025-12-17 13:36:49

科技要闻

无人驾驶迈关键一步 特斯拉股价触历史新高

头条要闻

独居女子去世遗产被收归国有 远亲想帮买墓安葬遇难题

头条要闻

独居女子去世遗产被收归国有 远亲想帮买墓安葬遇难题

体育要闻

短短一年,从争冠到0胜垫底...

娱乐要闻

鞠婧祎收入曝光,丝芭称已支付1.3亿

财经要闻

"祥源系"爆雷 有投资者数百万元无法提现

汽车要闻

一车多动力+双姿态 长城欧拉5上市 限时9.18万元起

态度原创

时尚
本地
亲子
教育
手机

那些被称赞 “老得慢” 的阿姨们,这样穿,比同龄人显年轻

本地新闻

云游安徽|踏过战壕与石板,读一部活的淮北史

亲子要闻

8个多月的梅朵已经不爱喝奶粉,更喜欢吃糌粑这些辅食,会太早吗

教育要闻

重磅!深圳这所公办新校与北京十一学校合作办学!

手机要闻

苹果产品线大扩张:外媒曝2027年将推至少七款新iPhone,含折叠屏与革命性周年纪念版

无障碍浏览 进入关怀版
×