网易首页 > 网易号 > 正文 申请入驻

开源视觉大模型黑马Molmo AI 来袭!超越GPT-4o 和 Claude 3.5

0
分享至

位于西雅图的非营利人工智能研究机构——艾伦人工智能研究所(Ai2)最近推出了Molmo,这是一系列多模态人工智能模型,旨在与大型科技公司如OpenAI和Anthropic的专有视觉产品相媲美。本周二,Molmo的发布没有像许多大型AI模型那样受到广泛关注,但它具备了任何顶尖视觉模型所需的所有先进功能。甚至在多个第三方基准测试中超越了 OpenAI 的 GPT-4o、Anthropic 的 Claude3.5Sonnet 和谷歌的 Gemini1.5。

Molmo小型模型比其大型模型的性能高出 10 倍。虽然当前的多模态模型可以解释多模态数据并用自然语言表达,但它们的全部潜力尚未得到充分发挥。Molmo 则更胜一筹。通过学习指向其感知到的内容,Molmo 可以实现与物理和虚拟世界的丰富交互,为能够与其环境互动的下一代应用程序提供支持。(链接在文章底部

01 模型能力对比

该系统使用了近100万张经过精心挑选的图像进行训练,这比竞争对手通常使用的数十亿张要少得多。因为数据量较小,降低了计算需求,AI的错误率也更低。Molmo系列包括多种不同大小的模型。其中,MolmoE-1B是一个混合专家模型,具有10亿个活跃参数(总共70亿个)。Molmo-7B-O是最开放的70亿参数模型,而Molmo-7B-D则是一个演示模型。最高端的Molmo-72B是该系列中最先进的模型。

02 模型开放性对比

目前最先进的多模态模型仍然是私有的,而利用开放数据构建视觉语言模型(VLM)的研究进展缓慢。为了改变这一局面,Molmo的创新在于收集了一个全新的图像标题数据集,完全由人工注释者通过语音描述创建。此外,还引入了多样化的数据集组合,允许模型用自然语言和非语言提示进行互动。

Molmo系列不仅在开放性和数据质量上超越其他模型,性能也与GPT-4o、Claude 3.5等专有系统相当。未来,将发布所有模型的权重、代码和数据,让更多开发者和研究者能够使用。

03 模型使用

逻辑理解能力:

数学能力(略差):

图片表达能力:

代码能力 :

有一点小惊喜,Molmo在官网对国产阿里QwenVL2的评价。《总体而言,学术基准结果和人类评估结果非常吻合,但 Qwen VL2 除外,它在学术基准上表现强劲,但在人类评估中表现相对较差。》

https://molmo.allenai.org/
https://huggingface.co/allenai/Molmo-7B-O-0924

欢迎交流~,带你学习AI,了解AI

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
卢秀燕纽约侨宴喊话大陆遭打脸!访美玩套路,终究是自欺欺人

卢秀燕纽约侨宴喊话大陆遭打脸!访美玩套路,终究是自欺欺人

老塕是个手艺人
2026-03-16 11:49:26
“中超神童”被盯上了!南美球探:习惯低头带球,阅读比赛稚嫩

“中超神童”被盯上了!南美球探:习惯低头带球,阅读比赛稚嫩

足球大腕
2026-03-16 20:32:31
胖东来放出狠话:如鸡蛋没问题必起诉王海

胖东来放出狠话:如鸡蛋没问题必起诉王海

映射生活的身影
2026-03-16 08:43:33
邻居婚车借用我的奥迪A6L,归还时竟重了108斤,背后真相让我震惊

邻居婚车借用我的奥迪A6L,归还时竟重了108斤,背后真相让我震惊

趣味萌宠的日常
2026-03-16 15:48:02
以军袭击德黑兰的伊斯兰革命卫队海军总部

以军袭击德黑兰的伊斯兰革命卫队海军总部

财联社
2026-03-17 04:36:06
再次落选巴西队!34岁内马尔自食其果?安帅现场考察时他选择轮休

再次落选巴西队!34岁内马尔自食其果?安帅现场考察时他选择轮休

风过乡
2026-03-17 06:08:21
央视主持人再洗牌,3人上桌,2人退场,1人换桌,新面孔大有来历

央视主持人再洗牌,3人上桌,2人退场,1人换桌,新面孔大有来历

揽星河的笔记
2026-03-13 18:02:28
315黑榜刷屏!但这几个被误解的老牌国货,从来没翻过车,放心用

315黑榜刷屏!但这几个被误解的老牌国货,从来没翻过车,放心用

泠泠说史
2026-03-16 17:57:34
49岁翁帆突传“喜讯”!丧夫5个月后高调露面,状态好到出人意料

49岁翁帆突传“喜讯”!丧夫5个月后高调露面,状态好到出人意料

查尔菲的笔记
2026-03-16 19:12:07
周知!惠州这33所幼儿园已停办

周知!惠州这33所幼儿园已停办

南方都市报
2026-03-16 17:48:11
上海“东西大动脉”通车时间定了!

上海“东西大动脉”通车时间定了!

新浪财经
2026-03-17 00:19:19
专家回应无人机撒农药致大批蜜蜂死亡:油菜需及时进行菌核病防控

专家回应无人机撒农药致大批蜜蜂死亡:油菜需及时进行菌核病防控

映射生活的身影
2026-03-15 20:51:03
22岁费尔明11球15助 德转更新身价暴跌3000万欧 新晋亿欧先生

22岁费尔明11球15助 德转更新身价暴跌3000万欧 新晋亿欧先生

智道足球
2026-03-16 21:10:57
暴跌87%,大降54万!昔日加价才能买的超豪华车在中国卖不动了?

暴跌87%,大降54万!昔日加价才能买的超豪华车在中国卖不动了?

财经八卦
2026-03-15 16:29:46
金价深夜暴跌,理财群一片沉寂!1110元买三金的人彻底睡不着了

金价深夜暴跌,理财群一片沉寂!1110元买三金的人彻底睡不着了

王二哥老搞笑
2026-03-17 00:34:49
美伊战事第17天局势:白宫群英会蒋干中计

美伊战事第17天局势:白宫群英会蒋干中计

西楼饮月
2026-03-16 20:14:14
实测 Claude-Opus-4.6蒸馏版Qwen3.5,9B 已能打,用LM-Studio本地跑,对接 Claude Code

实测 Claude-Opus-4.6蒸馏版Qwen3.5,9B 已能打,用LM-Studio本地跑,对接 Claude Code

Ai学习的老章
2026-03-16 20:27:47
中美考虑建立促进双边贸易投资合作的工作机制

中美考虑建立促进双边贸易投资合作的工作机制

界面新闻
2026-03-17 06:59:32
3·15名单出来了,震惊全网

3·15名单出来了,震惊全网

李东阳朋友圈
2026-03-15 22:01:49
印度理工学生:我以为中国只比印度发达一点点,直到我去了中国

印度理工学生:我以为中国只比印度发达一点点,直到我去了中国

古史青云啊
2026-03-13 10:38:01
2026-03-17 08:00:49
带你学AI
带你学AI
分享最前沿AI知识,先进的AI工具
379文章数 8关注度
往期回顾 全部

科技要闻

黄仁勋豪言2027年AI芯片收入剑指1万亿美元

头条要闻

外媒:美国已输掉了对伊朗的战争 一个动作令中国获益

头条要闻

外媒:美国已输掉了对伊朗的战争 一个动作令中国获益

体育要闻

那个送老奶奶去医院的球员 成了队史第一人

娱乐要闻

姚晨曹郁发离婚声明 多年前已结束婚姻

财经要闻

梁文锋推迟V4,是为根治龙虾的健忘症?

汽车要闻

大众全球首款9系旗舰SUV 上汽大众ID.ERA 9X首秀

态度原创

亲子
数码
手机
房产
公开课

亲子要闻

萌娃实力吐槽妈妈做的饭难吃

数码要闻

追觅洗地机双旗舰发布,以场景化方案定义国民高端

手机要闻

华为春季发布会新品阵容来了!问界新车、畅享新手机 还有超级直播神器

房产要闻

操作真强!保利三亚,十年腊肉盘,要大规模商改住了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版