网易首页 > 网易号 > 正文 申请入驻

面壁不只要做中国Mistral,还要超过它

0
分享至


作者 | 周一笑
邮箱 | zhouyixiao@pingwest.com

时隔七十多天,面壁在发布了MiniCPM-2B后又带来四个特性鲜明的模型,同时它还官宣了数亿元的新融资。

此次融资由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。这是其成立后最大的一笔融资。这家常被拿来对标Mistral的公司,并不满足于只做一个“中国Mistral”,弹药充足后,它要把“打精锐”这件事进行到底了。

1

小而强,小而全:小钢炮四连发

今年二月初,面壁智能发布了2B参数的开源端侧模型MiniCPM-2B,并称之为“小钢炮”,在更小参数的基础上实现了Mistral-7B、Llama2-13B的性能。自发布以来,MiniCPM-2B多次登顶 GitHub Trending,还收获了HuggingFace联合创始人Thomas Wolf的称赞。

时隔七十多天,面壁智能一次性发布了四个模型,我们来看看它们的表现。

多模态模型 MiniCPM-V 2.0

MiniCPM-V 2.0是可部署在手机端的多模态大模型,规模只有2.8B左右,但在主流的评测中取得了很好的分数。OpenCompass榜单,综合11个主流评测基准,通用能力超过Qwen-VL-Chat-10B、CogVLM-Chat-17B、Yi-LV-34B。

面壁智能特别强调了MiniCPM-V 2.0的幻觉概率很低,与持平GPT-4V,在评估大模型幻觉的Object HalBench榜单上,MiniCPM-V 2.0是14.5%,GPT-4V是13.6%。


MiniCPM-V2.0在OCR能力方面,场景图片文字识别榜单TextVQA超越了全系13B量级模型,比肩Gemini Pro。MiniCPM-V2.0 还加强了对于长图的识别和理解,以及对各种尺寸图片的兼容进行了优化,支持从448x448像素,到180万像素的高清大图,也支持1:9的极限宽高比。


长文本模型MiniCPM-2B-128K

长文本已然成为大模型的一种“标配”,而MiniCPM-2B-128K用2B的规模实现了128K长文本能力,在InfiniteBench榜单的平均成绩超过Yarn-Mistral-7B-128K、Yi-6B-200K、ChatGLM3-6B-128K、LWM-Text-128K,在7B以下的模型中做到了最好的表现。

“长文本这件事情才刚刚开始,虽然是2B的模型,还是需要非常大的内存才能让模型跑起来,下一步会进一步做更加极致的技术探索,让长文本模型在端侧跑起来。”


MOE版本 MiniCPM-MoE-8x2B MoE

MiniCPM-MoE-8x2B MoE,引入了MoE架构,性能增强,能让模型在原有基础上平均水平有4.5%的提高。相比完全从头开始训练,节省训练成本。通过MOE的方式,平均激活参数只有4B,但是比LiaMA2-34B、Gemma-7B等模型效果都要好,推理成本仅为Gemma-7B的69.7%。

“更Mini”的MiniCPM-1.2B

MiniCPM-1.2B参数减少了一半,而能够保持仍保持上一代2.4B模型87%的综合性能,这其中涉及许多优化,例如把词表中不高频的词替换。在多个榜单测试中,MiniCPM-1.2B综合性能超过Qwen1.8B、llama2-7B,甚至超过llama2-13B。


通过让1.2B的模型效果超过了1.8B的模型,实现了手机端 25tokens/s。随着模型的变小,成本、和内存占用也随之降低,相比于MiniCPM-2.4B,MiniCPM-1.2B内存减少51.9%,成本下降60%。

“模型小了,使用场景大了”。MiniCPM-1.2B除了能够支持配置更低的手机,在诸如情感陪护、实时翻译等应用场景都有着广泛的应用。“他们对于更小更强的模型都是非常期待的”。

1

不止于“中国版Mistral”

面壁智能CEO李大海将此次发布的系列模型总结为“小而强,小而全”,并再次强调了面壁智能的底层逻辑:一家追求高效大模型的公司。这很容易让人联想到同样是追求高效,同样做小参数高性能模型,同样受到开源社区追捧的“欧洲Open AI”Mistral。

不过面壁智能显然不想只是做第二家Mistral,这家聚集了中国最早一批研究大模型的技术人员的公司有着自己鲜明的技术判断和产品路线。

面壁智能高效训练的方法论体现在模型训练实验科学化的思路上,在基础设施上,面壁智能很早就自研了BMTrain等框架来支撑大模型的训练,从而降低训练成本。

在算法层面上,面壁智能通过进行大量的“沙盒实验”,对模型批次大小、超参数配置等最优训练配置进行了探索,从理论上寻找最优解,用更小的成本和代价去搞清楚规律。比如在较小参数的模型上做大量沙盒实验,通过科学化实验化的“炼丹”,用小模型预估更大规模参数模型的性能、参数方案,最终实现以小博大。

“持续研究更好的ScalingLaw,用更大的模型压缩效果,用更少的数据训练出更好的模型、更小的模型。”

此外,在基础模型之外,面壁的另一个重点方向在AI Agent,这也与Mistral很不同。

面壁智能是最早进行Agent研究的团队之一,ChatDev是面壁智能联合OpenBMB 及清华大学NLP实验室开源的大模型+Agent项目,ChatDev就像是多个Agent协作运营的软件开发公司,用户指定需求后,不同角色的Agent进行交互式协同,产出包括源代码、环境依赖说明书、用户手册在内的完整软件。通过多智能体协作,可以在现有模型中产生更好的效果。这也就是吴恩达近期在红杉AI峰会上所说的GPT3.5 + Agentic Workflow >GPT4,实际上,吴恩达在演讲中直接使用了ChatDev作为案例。

Agent是面壁智能商业化的重要突破口,ChatDev也从论文研究、开源产品,开始走向了商业化,面壁智能推出了AI Agent的SaaS化产品ChatDev,尝试帮助软件开发者和创业者以更低成本和门槛完成软件开发工作。与此同时,面壁智能也在探索大模型+Agent在金融、教育、政务、智能终端等场景的商业应用落地。

OpenAI用大力出奇迹提供了一条通往AGI的路径,但抵达彼岸的方法并非只有一条。在疯狂烧钱拼算力的大模型行业,仅靠单一维度的提升会出现瓶颈,而且这种提升可能会受到边际效益递减的影响。面壁智能用实验科学的方式做基础模型研究,强调高效,某种程度上追求的是一种“性价比”。在相同资源的情况下,面壁可以利用“高效”的杠杆获得更高的收益。MiniCPM系列模型已经证明了在相同的资源内把模型做得更好是可行的,接下来可以期待面壁延续这个思路,拿出GPT-4级别的模型产品。

相较之下,Mistral虽然在推出了号称挑战GPT-4的大模型产品,但不仅在商业模式上越来越却像OpenAI,Mistral Large也不再开源,这让人开始质疑,拿了微软投资之后的Mistral,是否走上了OpenAI的老路,最终成为微软的又一个“附庸”。

如果说追求高效是面壁智能和Mistral相同之处,而对于Agent的研究投入和积累,又让面壁这家公司拥有了不同的商业化道路。从网站到App,我们见证了互联网原生应用主要载体的变迁,在AI时代,Agent具备了新的潜力,小钢炮们又成为挖掘这种潜力的最佳载体。

从对标Mistral 、再到超越Mistral,面壁智能或许选择了一条少有人走的路,但它已经有了足够的底气继续走下去。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“学术妲己”李艺飞:艺术生混进核物理,和男导师地铁上头靠着肩

“学术妲己”李艺飞:艺术生混进核物理,和男导师地铁上头靠着肩

亿通电子游戏
2024-07-01 22:43:51
中专“数学天才”姜萍,该散去了

中专“数学天才”姜萍,该散去了

刁博
2024-06-30 16:51:56
这一夜,满身赘肉的张雨绮,把她的“中年尴尬”展现得淋漓尽致

这一夜,满身赘肉的张雨绮,把她的“中年尴尬”展现得淋漓尽致

娱乐圈笔娱君
2024-02-06 18:25:43
前行政长官林郑月娥,退休后因被制裁,沦落到只能在香港租房住?

前行政长官林郑月娥,退休后因被制裁,沦落到只能在香港租房住?

史二了
2024-06-18 14:01:44
比利时头号毒瘤诞生:跟姆巴佩脸对脸吵架后,亲自送球队出局

比利时头号毒瘤诞生:跟姆巴佩脸对脸吵架后,亲自送球队出局

侧身凌空斩
2024-07-02 02:57:44
微信撤回功能变了

微信撤回功能变了

小俊分享
2024-07-01 08:39:32
从一种资源,看北方邻居的宿命

从一种资源,看北方邻居的宿命

茶狐看世界本尊
2024-07-01 18:26:25
上海这一夜,众女星争奇斗艳,都输给了戴老花镜、头发凌乱的周迅

上海这一夜,众女星争奇斗艳,都输给了戴老花镜、头发凌乱的周迅

贾文彬的史书
2024-06-30 17:34:57
王思聪这次,摊上大事儿了!

王思聪这次,摊上大事儿了!

阅毒君
2024-06-30 17:06:25
水花分手!揭秘克莱3年5000万签换独行侠:湖人报价更高为何无缘

水花分手!揭秘克莱3年5000万签换独行侠:湖人报价更高为何无缘

罗说NBA
2024-07-02 05:40:28
倪海厦:夏天巧用陈皮,将湿气逼出“骨头缝”,肌瘤、结节自然消

倪海厦:夏天巧用陈皮,将湿气逼出“骨头缝”,肌瘤、结节自然消

今日养生之道
2024-07-01 21:53:17
上海前往韩国豪华邮轮有乘客翻越栏杆落水,最新回应:系成年男性,仍在落水海域搜救

上海前往韩国豪华邮轮有乘客翻越栏杆落水,最新回应:系成年男性,仍在落水海域搜救

潇湘晨报
2024-07-01 16:21:10
大家目前都穷到什么境界了?评论区一个比一个惨啊

大家目前都穷到什么境界了?评论区一个比一个惨啊

阿康四岁啦
2024-06-15 17:37:07
看完特朗普和拜登的辩论,美国选民:感觉我们要完蛋了

看完特朗普和拜登的辩论,美国选民:感觉我们要完蛋了

齐鲁壹点
2024-06-30 21:28:12
5:0!阿根廷队踢疯了,最大争冠优势浮现,梅西有望大赛四连冠

5:0!阿根廷队踢疯了,最大争冠优势浮现,梅西有望大赛四连冠

祥谈体育
2024-07-01 10:39:01
真相出炉!印尼主办方负有重大责任,知名医生说出张志杰死亡真因

真相出炉!印尼主办方负有重大责任,知名医生说出张志杰死亡真因

十点街球体育
2024-07-01 15:15:35
特大地铁突发事故!涌水涌沙令整个西安陷入恐慌!

特大地铁突发事故!涌水涌沙令整个西安陷入恐慌!

文雅笔墨
2024-07-02 03:57:07
夏普:勇士不欠克莱的 当初给你4年1.4亿&你缺席了两个赛季

夏普:勇士不欠克莱的 当初给你4年1.4亿&你缺席了两个赛季

直播吧
2024-07-02 01:04:10
女星吴谨言被质疑催吐,脖子凸起疑似催吐包,生图瘦到脸都垮了

女星吴谨言被质疑催吐,脖子凸起疑似催吐包,生图瘦到脸都垮了

萌神木木
2024-07-01 20:31:08
陈慧珊为了梁锦松,和相恋13年的丈夫离婚!对方却转身娶了伏明霞

陈慧珊为了梁锦松,和相恋13年的丈夫离婚!对方却转身娶了伏明霞

瑶卿文史
2024-07-01 23:39:40
2024-07-02 07:08:49
硅星人
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
1355文章数 10260关注度
往期回顾 全部

科技要闻

天兵科技巩义现场工作人员:正寻找黑匣子

头条要闻

欧洲杯-葡萄牙点球3-0斯洛文尼亚 进8强战法国

头条要闻

欧洲杯-葡萄牙点球3-0斯洛文尼亚 进8强战法国

体育要闻

葡萄牙的神!他拯救C罗拯救葡萄牙

娱乐要闻

今年内娱最大的闹剧,该收场了

财经要闻

债牛疯狂不止,引央行“出手”!

汽车要闻

奥迪Q6 e-tron Sportback官图曝光

态度原创

游戏
亲子
艺术
健康
公开课

钢岚:测试服最终版调整汇总分析!这样的艾琳专武满意了么?

亲子要闻

好可爱的小宝贝。

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

人类为何至今无法攻克渐冻症?

公开课

连中三元是哪三元?

无障碍浏览 进入关怀版