网易首页 > 网易号 > 正文 申请入驻

斯坦福团队抄袭清华系大模型实锤,作者深夜道歉,中国大模型已经无法被忽视

0
分享至

前段时间,斯坦福大学人工智能研究院(Stanford HAI)发布了一份报告,表示美国在大模型领域遥遥领先。

报告指出,2023 年 61 个著名的人工智能模型来自美国的机构,远远超过欧盟的 21 个和中国的 15 个。

OpenAI 早期投资人 Vinod Khosla 去年还曾在 X 发文称,美国的开源模型都会被中国抄袭。

然而,一直被认为在「追赶美国」的国产大模型现在却成了被抄袭的对象,而这个抄袭的 AI 团队,正是来自发布上述报告的斯坦福大学。


斯坦福 AI 团队主导的 Llama3-V 开源模型,被揪出涉嫌抄袭国内清华&面壁智能的开源模型「小钢炮」MiniCPM-Llama3-V 2.5,瞬间在 AI 圈里炸开了锅。

在实锤之下,斯坦福团队也不得不紧急道歉。

正如面壁智能 CEO 李大海调侃式的回应,这是一种「受到国际团队认可的方式」。无论我们距离最顶尖的大模型还有多少差距,但国产大模型已经到了不能再被忽视的阶段。

简单梳理一下时间线:

斯坦福 AI 团队发布 Llama3-V,号称 SOTA 多模态大模型

网友质疑该模型抄袭国内面壁智能 MiniCPM-Llama3-V2.5

质疑证据涌现,Llama3-V 作者上演「删库跑路」

面壁智能官方实锤抄袭,深夜给出声明

Llama3-V 作者正式道歉,网友各持己见

抄袭面壁智能「小钢炮」,斯坦福 AI 团队上演「删库跑路」

近日,一个斯坦福 AI 团队宣布,只需 500 美元就可训练出一个超越 GPT-4V 的 SOTA 多模态大模型。

但很快,X 用户 @yangzhizheng1 指出,该项目使用的模型结构和代码与面壁智能不久前发布的 MiniCPM-Llama3-V2.5 惊人地相似。


为此,X 用户 @yangzhizheng1 也放出了相应的质疑证据。

证据一:

Llama3-V 和 MiniCPM-Llama3-V 2.5 的模型结构、代码,简直是复制粘贴级别的相似,区别大概就是换了个马甲——变量名改了改。

就像是同一件衣服,只是换了不同颜色的纽扣,你说巧不巧?


证据二:

Llama3-V 的作者被问到为啥能提前用上还没发布的 MinicPM-Llama3-V2.5 分词器时,他们解释称,用的是面壁智能上一代 MinicPM-V-2 项目。


但有媒体向面壁智能官方求证,在 HuggingFace 中,MiniCPM-V2 与 MiniCPM-Llama3-V 2.5 分词器分别是两个文件,文件大小也完全不同。

更何况,MiniCPM-Llama3-V 2.5 的分词器是用 Llama3 分词器加上 MiniCPM-V 系列模型的特殊 token 组成。

考虑到 MiniCPM-V2 的发布时间早于 Llama3,理论上它不可能包含尚未公开的 Llama3 分词器技术。

证据三:

更离谱的是,llama3-V 项目的作者面对用户的质疑,一看事情不妙,干脆上演了一出「删库跑路」的好戏。

连 GitHub 上的项目页面都撤了,堪称掩耳盗铃 2.0 版本。


Hugging Face 地址如下,目前打开该页面,我们只能看到「404」。

https://huggingface.co/mustafaaljadery/llama3v/commit/3bee89259ecac051d5c3e58ab619e3fafef20ea6

这还没完,更多证据正在不断涌现:

X 用户 @yangzhizheng1 表示如果往 MiniCPM-Llama3-V 2.5 的 checkpoint 添加高斯噪声(由单个标量参数化),出来的模型跟 Llama3-V 就像是一个模子刻出来的。

不仅如此,这模型还能识别「清华简」这种深奥的战国古文字,而且错得都一模一样,用面壁智能官方的话来说:

不仅对得一模一样、连错得都一模一样。


要知道这一古文字数据,是面壁智能和清华大学自然语言处理实验室团队花费数月时间,从清华大学收藏的清华简上逐字扫描并人工标注得来,从未对外公开过。

那斯坦福 AI 团队是如何凭空获得呢?

可以说,面壁智能的连番声明算是彻底实锤了斯坦福 AI 研究团队的抄袭。

直到今天凌晨,斯坦福 Llama3-V 团队的两位作者 Siddharth Sharma 和 Aksh Garg 在社交平台 X 上就这一学术不端行为向面壁 MiniCPM 团队正式道歉, 表示 Llama3-V 模型将悉数撤下。

名校学霸也抄袭?中国开源大模型正迎头赶上

此事之所以在网络上激起千层浪,一个重要的原因在于抄袭作者的背景实在光鲜。

公开信息显示,Siddharth Sharma 与 Aksh Garg 均是斯坦福大学计算机系的本科生,曾发表过机器学习领域的相关论文。

其中,Siddharth Sharma 曾在亚马逊实习过一段时间,目前主要从事于 AI 和数据相关工作。

而 Aksh Garg 的实习履历,那叫一个丰富,涵盖 SpaceX、斯坦福大学和加州理工学校等知名企业机构。

至于被这上述两位作者称为「代码搬运工」的 Mustafa Aljadery,是南加州大学出身,在舆论发酵之后,目前 X 账号已经被设为隐私状态。


对于斯坦福 Llama3-V 团队的道歉声明,眼尖的网友却不吃这套。

例如,X 用户 @xunie 指出,这哥俩将责任归咎给一个人的甩锅行为,莫不是「有福同享,有难你当」?


斯坦福 AI 实验室主任 Christopher David Manning 也站出来谴责这一抄袭行为,并且对 MiniCPM 这一优异的中国开源模型表示赞扬。


不过,也有网友抱着「得饶人处且饶人」的态度,悠悠然地鼓励道:

开放和诚实是科技界非常重要的价值观,期待你的新作品。


Google DeepMind 研究员 Lucas Beyer 表示,中国开源大模型拥有像 MiniCPM 这样好的模型,但国际上却没给够应有的关注……


面壁智能团队也于昨天对此事进行回应。

面壁智能 CEO 李大海表示:「技术创新不易,每一项工作都是团队夜以继日的奋斗结果,也是以有限算力对全世界技术进步与创新发展作出的真诚奉献。

我们希望团队的好工作被更多人关注与认可,但不是以这种方式。」


面壁智能首席科学家刘知远也在知乎上发文表示,表示这次事件从另一个角度证明了中国创新成果的国际影响力,强调了开源共享的重要性,以及对原创精神的尊重。

不得不说,这出 AI 圈的抄袭大戏,教科书般地诠释了叫「创新不易,且行且珍惜,学术诚信,人人有责」。

要知道,模仿了代码的形,却抄不来那份原创的风姿卓绝。

事实上,自去年以来,中国大模型如同雨后春笋般陆续开源,从以往的受益者转变为贡献者,不吝于向世界提供更多开源的优异成果。

上至阿里巴巴、腾讯等巨头,下至面壁智能,智谱 AI 、昆仑天工等 AI 初创,也都是开源社区的积极分子,为中国大模型的发展添砖加瓦。

我们也盼着,这股子开放共享的春风,能吹得更猛烈些。

正如面壁智能 CEO 李大海所呼吁的那样,大家一起共建开放、合作、有信任的社区环境。加油合作,才能让世界因 AGI 的到来变得更好!



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
网友:上海某餐饮品牌老板申请破产?2000多员工7个月工资未发…

网友:上海某餐饮品牌老板申请破产?2000多员工7个月工资未发…

火山诗话
2024-06-29 06:33:35
《星刃》性感女主私密部位细节逼真 让玩家感到惊讶

《星刃》性感女主私密部位细节逼真 让玩家感到惊讶

3DMGAME官方号
2024-06-29 18:22:06
自由身加盟仅1年!法媒:由于高薪,巴黎希望不惜代价卖掉什克

自由身加盟仅1年!法媒:由于高薪,巴黎希望不惜代价卖掉什克

直播吧
2024-06-29 23:40:27
上海一企业发生事故:2名工人死亡!负责人获刑,事发时仍处于缓刑考验期

上海一企业发生事故:2名工人死亡!负责人获刑,事发时仍处于缓刑考验期

上观新闻
2024-06-29 21:17:53
突发!爱达·魔都号一男乘客翻越栏杆后落海,正紧急搜救,已取消停靠济州岛计划

突发!爱达·魔都号一男乘客翻越栏杆后落海,正紧急搜救,已取消停靠济州岛计划

新民晚报
2024-06-29 23:47:27
“买家秀”!塞尔维亚首次公开展示红旗-17防空系统

“买家秀”!塞尔维亚首次公开展示红旗-17防空系统

观察者网
2024-06-29 21:46:53
被打马赛克的杨颖很狼狈,8000万一部戏的风光,估计是很难回去了

被打马赛克的杨颖很狼狈,8000万一部戏的风光,估计是很难回去了

七阿姨爱八卦
2024-06-27 21:58:06
秘不发丧!碧桂园正式清零

秘不发丧!碧桂园正式清零

投行风云
2024-06-29 17:53:11
2万朝军开赴前线,朝鲜对乌军有多大胜算:能打得比俄军更好吗?

2万朝军开赴前线,朝鲜对乌军有多大胜算:能打得比俄军更好吗?

说天说地说实事
2024-06-28 20:08:07
外媒:泽连斯基称将在今年准备好“全面计划”,以说明如何结束俄乌冲突

外媒:泽连斯基称将在今年准备好“全面计划”,以说明如何结束俄乌冲突

环球网资讯
2024-06-29 10:21:37
啪啪多久才能爽到腿软?

啪啪多久才能爽到腿软?

硬派健身
2024-06-29 10:11:04
水花兄弟解体!克莱将与勇士结束13年合作 詹皇愿降薪帮湖人追他

水花兄弟解体!克莱将与勇士结束13年合作 詹皇愿降薪帮湖人追他

罗说NBA
2024-06-30 06:17:17
不和你玩了?网传苏州日商协会决定撤资,已有员工接到赔偿通知

不和你玩了?网传苏州日商协会决定撤资,已有员工接到赔偿通知

西游日记
2024-06-29 17:51:23
独家丨北京一代传奇酒店“落幕” 长城饭店停业

独家丨北京一代传奇酒店“落幕” 长城饭店停业

21世纪经济报道
2024-06-29 22:50:13
好声音学员王韵壹意外离世,年仅38岁,生前最后露面照公开

好声音学员王韵壹意外离世,年仅38岁,生前最后露面照公开

素素娱乐
2024-06-29 10:39:26
保安砍死2名业主后续:女业主先动手辱骂,一句话激怒他起了杀心

保安砍死2名业主后续:女业主先动手辱骂,一句话激怒他起了杀心

180°视角
2024-06-29 16:40:45
太难了!大家今年消费降级到什么程度了?网友:老公都开始碰我了

太难了!大家今年消费降级到什么程度了?网友:老公都开始碰我了

有趣的火烈鸟
2024-06-28 09:36:10
最新!俞莉教授被离职,南方医科大领导官威至上,三问南医大!

最新!俞莉教授被离职,南方医科大领导官威至上,三问南医大!

芒果的爱pMgf
2024-06-29 19:10:16
网传成都一女子与人吵架称“有所长电话”,警方通报:不相识,无私交

网传成都一女子与人吵架称“有所长电话”,警方通报:不相识,无私交

界面新闻
2024-06-30 07:15:45
4大名嘴神评意大利回家!黄健翔当场骂:又丑又菜!詹俊贺炜开喷

4大名嘴神评意大利回家!黄健翔当场骂:又丑又菜!詹俊贺炜开喷

嘴炮体坛
2024-06-30 02:49:25
2024-06-30 07:48:49
AppSo
AppSo
让智能手机更好用的秘密
4550文章数 26425关注度
往期回顾 全部

科技要闻

比亚迪引发了一场"战争"

头条要闻

台高中生离奇坠亡留上亿房产 大陆籍母亲恐难完全继承

头条要闻

台高中生离奇坠亡留上亿房产 大陆籍母亲恐难完全继承

体育要闻

老鹰“贱卖”穆雷,独行侠有意汤神

娱乐要闻

白玉兰明星反应精彩 胡歌获奖唐嫣激动

财经要闻

A股上半年人均亏损1.2万 你亏了多少?

汽车要闻

你没看错!广汽丰田今天秀了一把智电技术

态度原创

时尚
房产
艺术
本地
手机

伊姐周六热推:电影《云边有个小卖部》;电视剧《度华年》......

房产要闻

20亿!又有国企要卖海南资产!

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

本地新闻

冷知识:东北雪糕才是最早的网红雪糕

手机要闻

销量同比暴增四成 苹果手机大促销效果显著

无障碍浏览 进入关怀版