网易首页 > 网易号 > 正文 申请入驻

Qwen2开源,百模大战结束

0
分享至

撰文 |王长胜

6月7日,阿里云的通义千问推出开源模型系列Qwen2,包括5款模型:0.5B、1.5B、7B、72B、MoE。其中,Qwen2-72B整体性能全面超越了美国最强的开源模型Llama3-70B,成为全球最强开源大模型。

去年还在讨论百模大战,万万没想到,仅仅不到一年,大模型格局已经彻底被改写,大部分国产大模型已经可以宣布名存实亡,最终能活下来的恐怕只有个位数。

这基本符合我去年写的文章《决战大模型,九死一生》,在这篇文章的结尾我预测:

“大模型三要素:算力、算法和数据,缺一不可,而背后支持的就是资金和人才。这是一个烧钱大战。当然,烧钱才能把行业烧热,才能诞生新技术、新革命,这也是大模型从业者对于下一个时代的光荣责任。过几年回头再看,就理解了这个标题,决战‘大模型’,可能不止是‘九死’,而是‘百死一生’。”

如果说Qwen2只是改变了中国AI格局,那格局就太小了。事实上,Qwen2在碾压国内所有大模型的基础上,也成为全球最强大的开源大模型。

为什么这么说?我们先来看看Qwen2发布后,全球AI巨头们的惊讶表情。

Qwen2发布后两小时,Hugging Face联合创始人兼首席执行官克莱门特·德朗格(Clément Delangue)发推宣布:“各位,HF开源大模型榜单新的第一出来了,Qwen2-72B。”

曾几何时,美国Meta一度用Llama系列一统开源大模型的天下,而如今,阿里的通义千问Qwen2凭实力坐上第一把交椅,这不仅仅意味着开源大模型阵营诞生了新标杆,同时,也为全球开发者提供了新的选择。

看不清?再上一张高清图。

这绝不仅仅是皇冠的更迭,更是中美两国在AI领域的争夺战,并且战争已经进入到白热化阶段。

美国不仅全面禁止了英伟达GPU对中国的出口,不想让我们用最先进的芯片训练大模型,甚至还要禁止中国人下载和使用开源的Llama3,连现成的大模型都不让我们用。要知道,Llama3可是当今全球最流行、最强大的大模型。这就如同安卓操作系统一样,如果禁止中国人使用会怎样?

Qwen2的发布,打破了僵局。全球各大机构的测评显示,同样是主力的72B参数对标Llama3-70B,Qwen2已经在绝大多数任务中全面超越了Llama3。也就是说,对我们而言,Qwen2已经完全可以替代Llama3了。Qwen2在多项中文能力上已经达到甚至超过了GPT4.0,在英文、数学与人类评估上虽然不如GPT4.0,但也是开源大模型当中最好的了。

“自Llama 3以来,Qwen2是最具影响力的开源LLM,性能超过了Llama 3,在学术和聊天方面达到了最先进的性能。”

一石激起千层浪。

Qwen2的强悍登场,让全球众多开源平台和工具也在第一时间宣布了对Qwen2的支持,包括Tensor-RT、OpenVINO、OpenCompass、XTuner、LLaMA-factory、Firefly、OpenBuddy、vLLM、Ollama等,这样的生态影响力,是此前的国产大模型从来没有享受过的待遇。

在这里,我不得不多说一句。虽然开创性、颠覆式创新,我们确实还比不过美国;虽然引领时代的OpenAI,我们目前还无法比肩;但是,中国AI行业的科研人员的追赶能力还是非常强悍的,只要方向走对了,赶超只是一个时间问题。特别是在美国连开源大模型都不想给我们用的时候,阿里能够做出全球最顶尖的开源大模型,真的是给了我们很大的信心。

世界就是这样,竞争就是这样,有人欢呼,就会有人失意。

现在,国内几家头部的大模型公司一定百感交集,直呼“卷,太卷了”。以目前的大模型训练成本估算,Qwen2至少要投入几个亿才能训练出来,如今就这么白送给大家使用,这让那些试图靠大模型挣钱的闭源厂商还怎么活?

“我走你的路,让你无路可走。”

“阿里不靠大模型赚钱,别人也别想赚钱。”

“阿里是不是傻?把大模型行业卷死了,自己也赚不到钱,何苦呢?”

这也许是很多AI从业者对Qwem2开源的感慨。这么说,也没错,但是,我觉得阿里云应该不是这么想的。我试图帮大家分析一下。

从去年大模型爆发以来,哪家大模型公司挣到钱了?OpenAI?Google?META?百度?腾讯?华为?科大讯飞?百川智能?智谱?抖音?一家都没有赚钱,目前还都在烧钱阶段。

赚钱的只有卖芯片(算力)的英伟达,卖云服务的亚马逊和微软,都赚翻了。中国互联网圈有句名言,羊毛出在猪身上。美国淘金时代有句话,淘金的不如卖铲子的。

现在明白了吧,阿里云可是国内最大的云厂商,通义千问可以不赚钱,但是,最重要的云端算力资源都要跑在阿里云上,阿里云通过云服务把大模型的投入都赚回来,还得翻倍。这笔买卖亏不亏?

当然,有一点需要说明,通义千问开源大模型全球下载了已经超过了1600万,其中很大一部分并不会跑在阿里云上。所以,开源的第一目的并不是圈用户,这只是一个附加结果。从全球范围内来看,任何开源行为,初心大多是普惠,这一点不容诛心之论,其次是构建一个繁荣的生态,把饼做大了才有得分。

阿里的AI战略,或者说AI野心,差不多也是这样,或者说比这个更宏大一些。为什么这么说?要知道,阿里云一家干了美国三家AI领域巨头干的事情。

阿里云开源了通义千问Qwen2大模型对标的是META的开源大模型Llama,你开源,我也开源,你强,我比你更强。阿里云还搞了一个大模型开源社区——魔搭,汇聚了大量开源模型,成为国内开发者最活跃的AI社区,对标的就是美国的开源社区——HuggingFace。阿里云的云服务对标的就是亚马逊的云服务AWS。

作为一家提供基础设施的云厂商,阿里云从底层的算力基座,到大模型应用的构建,再到开放的AI生态,这完全符合当初阿里云的多位高管在多个场合反复说的那句话:“坚持开源和开放,是阿里云的重要策略,我们希望打造一朵AI时代最开放的云,让算力更普惠、让AI更普及。”

阿里集团CEO、阿里云CEO吴永铭在解释为什么暂缓阿里云分拆的时候就说过这句话:“坚决加大对阿里云的持续战略投入强度,让阿里云心无旁骛专注于‘AI+云计算’发展战略。为此阿里云暂缓从阿里集团完全分拆,以便能以更大的研发投入面对不确定的市场环境。”

Qwen2的开源,只是阿里AI战略的一小步,却成为中国AI产业的一大步。它在很大程度上,加速了中国AI的进程,也加速了百模大战提前终结。那些看不到希望的大模型厂家,可以重新做选择了,或者退赛,或者选择一个更适合自己的AI细分赛道,继续在AI产业中贡献力量,不一定非要卷大模型,做服务、做应用落地,都有着光明的前景。

如今,Qwen2利剑出鞘,斩获全球最强开源大模型的桂冠,并在全球范围获得了行业人士的广泛认可,这是“AI+云计算”战略的产物,也是市场竞争的产物。竞争,本身就有资源优化的作用,不要搞重复建设,把最优资源集中到效率最高的地方,AI的时代才刚刚开始,可做的事情还有很多,卷大模型,已经没有未来了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
男友去世,女子想生下遗腹子遭婆家强烈反对,“你再找一家嫁了吧...”

男友去世,女子想生下遗腹子遭婆家强烈反对,“你再找一家嫁了吧...”

环球网资讯
2025-02-26 18:36:08
云南夫妇相约一起跳楼,从31楼一跃而下,独留下10岁儿子目睹一切

云南夫妇相约一起跳楼,从31楼一跃而下,独留下10岁儿子目睹一切

凡知
2025-02-26 17:40:12
女子实名举报山东一大学教师婚内出轨,而校领导包庇不作为!

女子实名举报山东一大学教师婚内出轨,而校领导包庇不作为!

三湘都市报
2025-02-26 21:34:33
51岁金城武有望复出!雪藏7年,挑战《无间道》的港片终于要上了

51岁金城武有望复出!雪藏7年,挑战《无间道》的港片终于要上了

头号电影院
2025-02-26 00:10:26
泽哥大无畏!一天走进2大战斗最残酷的要塞!硬汉,你又在哪里?

泽哥大无畏!一天走进2大战斗最残酷的要塞!硬汉,你又在哪里?

大风文字
2024-11-19 09:19:12
长期静养与每天锻炼的人,谁更长寿?调查89530名老人,给出答案

长期静养与每天锻炼的人,谁更长寿?调查89530名老人,给出答案

奇妙的本草
2025-02-17 18:00:03
山东医科大副教授婚内出轨,妻子产后3月出轨女大学生,学校包庇

山东医科大副教授婚内出轨,妻子产后3月出轨女大学生,学校包庇

180°视角
2025-02-26 18:20:19
发海报狂怼!奔驰打响和华为终极商战!

发海报狂怼!奔驰打响和华为终极商战!

互联网品牌官
2025-02-26 17:14:37
郭富城妻子在米兰被抢包,发文求助:还有机会找到吗

郭富城妻子在米兰被抢包,发文求助:还有机会找到吗

红星新闻
2025-02-26 16:36:17
热搜上细思恐极的“94斤孕妇”事件:新型洗脑,害惨中国女生

热搜上细思恐极的“94斤孕妇”事件:新型洗脑,害惨中国女生

知否大叔
2025-01-25 10:12:34
温州一女老师出轨肌肉男:双方家属捉奸,内衣散落一地,原配崩溃

温州一女老师出轨肌肉男:双方家属捉奸,内衣散落一地,原配崩溃

娜乌和西卡
2025-02-26 17:53:43
装疯卖傻、目不识丁、一肚子草包,是谁捧红了这些跳梁小丑?

装疯卖傻、目不识丁、一肚子草包,是谁捧红了这些跳梁小丑?

肆时说
2025-02-26 15:27:21
一年支出521亿,京东扛不起130万骑手的社保大旗

一年支出521亿,京东扛不起130万骑手的社保大旗

关不羽
2025-02-26 19:45:54
268比0!乌克兰全票通过“战时无法举行选举”,总统选举将在持久和平后举行

268比0!乌克兰全票通过“战时无法举行选举”,总统选举将在持久和平后举行

红星新闻
2025-02-26 18:54:20
39岁凤姐近况曝光!住15刀民宿发福至160斤,知情人曝男友身份!

39岁凤姐近况曝光!住15刀民宿发福至160斤,知情人曝男友身份!

乌娱子酱
2025-02-26 09:45:48
曝多位网友实拍某地街道,沿途大量店铺关门转让,上午十点地铁电梯关了一半

曝多位网友实拍某地街道,沿途大量店铺关门转让,上午十点地铁电梯关了一半

可达鸭面面观
2025-02-26 14:48:27
重磅!美国欲废止中美双边税收协定,两国跨境投资恐掀滔天巨浪

重磅!美国欲废止中美双边税收协定,两国跨境投资恐掀滔天巨浪

魏家东
2025-02-26 15:30:14
弹劾案或将收尾,尹锡悦最后一搏?最新民调出炉,形势再度逆转

弹劾案或将收尾,尹锡悦最后一搏?最新民调出炉,形势再度逆转

历史有些冷
2025-02-26 00:40:03
美俄关系突然缓和,朝鲜发现不对劲,又开始向中国靠拢

美俄关系突然缓和,朝鲜发现不对劲,又开始向中国靠拢

文雅笔墨
2025-02-24 18:38:36
南师大女博士与导师的故事有了更多新内幕了

南师大女博士与导师的故事有了更多新内幕了

清晖有墨
2025-02-26 10:29:08
2025-02-27 02:24:49
王长胜 incentive-icons
王长胜
关注科技公司的一切
757文章数 1719关注度
往期回顾 全部

科技要闻

独家|特斯拉FSD国内训练完全合规 属L2智驾

头条要闻

《乌美矿产协议》全文公布

头条要闻

《乌美矿产协议》全文公布

体育要闻

高端局这一桌,没有尼克斯的位置

娱乐要闻

大S终于能下葬!市值千万墓地曝光

财经要闻

股价暴涨10倍,老铺黄金还能疯多久?

汽车要闻

一口价13.99万起 上汽大众ID.4 X聪明款限时优惠

态度原创

数码
教育
手机
家居
公开课

数码要闻

宏碁暗影骑士・擎 7 Pro 笔记本开启预约

教育要闻

四年级数学题,难住了很多普通考生

手机要闻

vivo X200 Ultra再次被确认:视频拍摄大提升,堪称能通话的相机

家居要闻

云雾缭绕 浪漫空间惬意生活

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版