网易首页 > 网易科技 > 网易科技 > 正文

无问芯穹发布首个端侧全模态理解的开源模型Megrez-3B-Omni

0
分享至
据了解,Megrez-3B-Omni 拒绝牺牲任何模态的精度,在图片、文本、音频三个模态中均取得了同尺寸下最优性能。

12月16日,无问芯穹宣布正式开源其“端模型+端软件+端IP”端上智能一体化解决方案中的小模型——全球首个端侧模态理解开源模型Megrez-3B-Omni,并同步开源了纯语言版本模型Megrez-3B-Instruct。

据介绍,Megrez-3B-Omni是一个为端而生的全模态理解模型,选择了最适合手机、平板等端侧设备的30亿参数黄金尺寸,结构规整,推理速度最大领先同精度模型300%。作为一个全模态模型,Megrez-3B-Omni同时具备图片、音频、文本三种模态数据的处理能力,并在三个模态的多种测评基准中取得了最优性能。

据了解,Megrez-3B-Omni 拒绝牺牲任何模态的精度,在图片、文本、音频三个模态中均取得了同尺寸下最优性能。无论是和同样三模态的VITA ( based on Mixtral 8×7B) 、Baichuan-Omni-7B ,还是双模态的MiniCPM-V 2.6 ( based on Qwen2-7B)、Qwen2-VL-7B、Qwen2-Audio-7B,又或是单一模态的Qwen、Baichuan 等模型相比,Megrez-3B-Omni 在主流基准测试集上的表现都毫不逊色。

在图像理解方面,Megrez-3B-Omni 作为一个体积仅为3B的模型,其综合性能表现可以全面超过34B的庞然大物,超越LLaVA-NeXT-Yi-34B 等模型,是目前OpenCompass、MME、MMMU、OCRBench等多个主流测试集上精度最高的图像理解模型之一。

与此同时,Megrez-3B-Omni 在场景理解、OCR 等任务上也具有良好表现,能够准确洞察和分析图像中的场景内容,并高效地从中提取文本信息,且无论是模糊的印刷体还是复杂的手写字,都能够轻松识别。

在文本理解方面,作为全模态理解模型,Megrez-3B-Omni 没有牺牲模型的文本处理能力,将上一代14B大模型的优秀能力压缩至3B规模,显著降低了计算成本、提升了计算效率。在C-EVAL、MMLU/MMLU Pro、AlignBench等多个权威测试集上更是取得端上模型最优精度。

在语音理解方面,Megrez-3B-Omni 的效果比肩行业主流方案。Megrez-3B-Omni不仅支持中文和英文的语音输入,还能够处理复杂的多轮对话场景,更能支持对输入图片或文字的语音提问,实现不同模态间的自由切换。用户就任意模态内容,发出语音指令,Megrez-3B-Omni 就能根据语音指令直接响应文本,让用户可以通过更少动作与模型展开更直观、自然的交互。

据介绍,模型的规模并不是决定其速度的唯一因素,因此模型小并不一定就意味着速度快。凭借对硬件特性的深入理解与利用,Megrez-3B-Omni 通过软硬件协同优化策略,确保了各参数与主流硬件高度适配,以实现硬件性能的利用最大化。与上一代及其他端侧大语言模型相比,单模态版本的Megrez-3B-Instruct 在推理速度上取得了显著提升,最大推理速度可以领先同精度模型300%。

Megrez-3B-Instruct 这次还特别提供了WebSearch 功能,这一功能使得模型能够智能地判断何时需要调用外部工具进行网页搜索,辅助回答用户的问题。用户得以构建属于自己AI搜索,通过网络获取最新信息,克服小模型的幻觉问题和知识储备不足的局限。

无问芯穹表示,Megrez-3B-Omni是一个能力预览,接下来还将持续迭代Megrez系列,提升自动化水平至“edge device use”效果,让用户只需要给出简单的语音指令,就可完成端设备的设置或应用操作,并将它作为“端模型+端软件+端IP”端上智能一体化解决方案的重要构成推向市场。

在这个方案中,除端侧全模态理解模型外,还有端上推理软件和IP设计方案,不仅支持CPU、GPU和NPU 的同时推理,更能通过跨越软硬件层次的系统优化,额外带来最高可达70%的性能提升,最大化端侧硬件性能的利用。(易智)

延伸阅读
相关推荐
热点推荐
同样是小眼睛,李昀锐和刘宇宁的风评为何两极分化?

同样是小眼睛,李昀锐和刘宇宁的风评为何两极分化?

粉墨说戏
2024-12-16 16:20:08
纪实:山西女教师被奸杀,法医保留精斑21年,真凶让警察难以置信

纪实:山西女教师被奸杀,法医保留精斑21年,真凶让警察难以置信

晓艾故事汇
2024-11-19 09:42:06
魔兽世界:全服第一欧皇,MC首个CD拿齐双风脸,一天时间亏4000R

魔兽世界:全服第一欧皇,MC首个CD拿齐双风脸,一天时间亏4000R

胖哥游戏说
2024-12-16 17:39:30
“王的女人”诗妮娜:从护士到贵妃,被废一年强势回归

“王的女人”诗妮娜:从护士到贵妃,被废一年强势回归

柴叔带你看电影
2024-12-09 22:08:28
重庆姑娘的“一梯一户”火了,因将电梯间做玄关走红,太可爱了!

重庆姑娘的“一梯一户”火了,因将电梯间做玄关走红,太可爱了!

装修秀
2024-12-15 11:35:02
英国教授感慨:中方意外成巴沙尔垮台的受益者!

英国教授感慨:中方意外成巴沙尔垮台的受益者!

小企鹅侃世界
2024-12-14 10:55:30
芒特恐伤缺两周几近落泪,鼓励曼联获阿莫林认可!马兹拉维或轮休

芒特恐伤缺两周几近落泪,鼓励曼联获阿莫林认可!马兹拉维或轮休

罗米的曼联博客
2024-12-17 07:31:35
退休后不论男女,关系再铁也不要和这6种人搭伴旅游,谁去谁后悔

退休后不论男女,关系再铁也不要和这6种人搭伴旅游,谁去谁后悔

情感大使馆
2024-12-16 10:23:09
朝鲜军队作战视频曝光?一字纵队穿越雷场,三三制仍是看家本领?

朝鲜军队作战视频曝光?一字纵队穿越雷场,三三制仍是看家本领?

说天说地说实事
2024-12-16 19:19:51
勇士交易宣布,18+6悍将加盟库里,胖虎或加盟。

勇士交易宣布,18+6悍将加盟库里,胖虎或加盟。

千丹历史
2024-12-16 00:06:19
俄军兵临乌东重镇红军城,美媒:若乌军战败将失去顿涅茨克地区!

俄军兵临乌东重镇红军城,美媒:若乌军战败将失去顿涅茨克地区!

清风醉史
2024-12-15 12:46:32
“刀郎现象”外溢效应    多位名人明星相继发声

“刀郎现象”外溢效应 多位名人明星相继发声

邓如山
2024-11-16 08:49:06
广东大胜江苏!徐杰把功劳归功于杜锋,夸得杜锋心花怒放

广东大胜江苏!徐杰把功劳归功于杜锋,夸得杜锋心花怒放

懂球哥评球
2024-12-17 07:19:40
李佳琦直播间佣金被曝20%,业内:国货美妆品牌可达50%

李佳琦直播间佣金被曝20%,业内:国货美妆品牌可达50%

南方都市报
2024-12-13 13:45:17
范冰冰现身富商家宴,跟“风流船王”喝酒尬舞,回应定居香港传言

范冰冰现身富商家宴,跟“风流船王”喝酒尬舞,回应定居香港传言

八卦先生
2024-12-14 17:02:24
有人问:哪吒的脾气能暴躁到什么程度,要被评论区笑死了

有人问:哪吒的脾气能暴躁到什么程度,要被评论区笑死了

奇特短尾矮袋鼠
2024-12-07 18:40:14
2名“内鬼”,被查!

2名“内鬼”,被查!

鲁中晨报
2024-12-16 15:00:14
罕见!他二次被查

罕见!他二次被查

新京报政事儿
2024-12-16 19:05:51
一个电话20万元没了!来看“机票退改签”骗局的千层套路

一个电话20万元没了!来看“机票退改签”骗局的千层套路

鲁中晨报
2024-12-16 12:36:03
66岁迟志强现状:身体发福大变样,现定居黑龙江,儿子是他的骄傲

66岁迟志强现状:身体发福大变样,现定居黑龙江,儿子是他的骄傲

历史求知所
2024-12-16 08:00:12
2024-12-17 08:52:49

科技要闻

中国版"星链"发射成功!与马斯克的有啥不同

头条要闻

8年未开新店 知名美食品牌在广州最后一家店正式歇业

头条要闻

8年未开新店 知名美食品牌在广州最后一家店正式歇业

体育要闻

曼柿德比?阿莫林:打他个滕枯瓜落!

娱乐要闻

曝阿娇倒追余衍隆,男方神似陈冠希

财经要闻

哪吒汽车,何以至此?

汽车要闻

能便宜2万?智界R7增程版12月19日上市

态度原创

房产
教育
家居
手机
公开课

房产要闻

信号!海口二手房价,今年首次止跌!

教育要闻

一年级找规律:11,12,13,14,(),15

家居要闻

日式原木 舒适自然

手机要闻

调查显示:大多数苹果 iPhone 用户对Apple Intelligence不感兴趣

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×