网易首页 > 网易号 > 正文 申请入驻

太离谱了,国内开源大模型登顶全球榜首

0
分享至



国产大模型赛道的选手有很多,不管是大厂还是小厂,只要与AI沾边,都在探索自己的盈利和发展模式。

特别是在OpenAI说要严格限制接口调用之后,大家又兴奋了起来,纷纷推出各种优惠政策和推出新技术模型等等。

最近看了一圈国内的大模型,发现阿里云的通义千问已经跑到开源赛道第一名去了,Qwen2-72B 在世界开源模型排行榜上荣登榜首!





这是Hugging Face联合创始人兼首席执行 Clem Delangue 发的测试数据,他说本次新的榜单测试用了300张H100显卡,进行了多维度的重新评测。



大家对AI比较熟悉的话,应该见过这个Logo,在Hugging Face上经常能免费体验到各种模型功能。



这也是在新版v2规则测试下的结果,原版的测试太简单导致无法区分模型强度,而且有的模型开始了“刷题模式”,所以它们改进了一下测试规则,大致的基准内容如下。



对于最后的测试结果,自然是有人欢喜有人愁。去原推文下面看了一下,有表示欢迎新的测试方法的,也有开发者意识无法接受说新的方式测试集数据小,无法发挥其他模型实力的。



除了在开源领域,其他很多地方也有通义千问的影子,今天就来好好给大家盘盘,被大家吹爆的通义千问强在哪里。

截至2024年7月3日,通义千问官方最强的公开模型是它们自己在用的v2.5版本,开源最新的为Qwen2系列。





开源版本是榜首就很强了,而闭源的v2.5在5月份发布的时候,就说在权威基准OpenCompass上,性能全面赶超GPT-4了。



相信大家听到各家的模型超越OpenAI的GPT4,就和听到手机厂商的“吊打苹果”环节一样。

其实这个问题还真不好说,因为目前市场上的主流模型发挥都不稳定,面对千奇百怪的问题都有可能翻车。



而超过GPT4的话,从OpenAI的知名代表人物的话里可以看出,这个模型现阶段并不是符合他们预期的,他已经开始在预热GPT5了。



从这个角度看,现阶段各家说的超越也就可以理解了,这并不是说技术到了顶点而无法超越,而是大家都在摸索,比拼的是进度推进得如何。



而普通用户面对大模型,大家都学会了鸡蛋不能放在一个篮子里,都会选几家备用,挑选最好的回答。



所以光是问答还不行,还需要全面,什么写代码绘图做视频等等都要整上,而在这方面通义千问的模型也是“有备而来”。

根据能查到信息来看,在视觉比拼上,Qwen-VL在MME、Seed-Bench和TouchStone三个多模态大语言模型评测中登顶,成为业界SOTA 模型。



代码方面,专门用于编程的CodeQwen1.5也拿到了 Bigcode 模型排行榜第一的位置。



多语言方面还拿了个阿拉伯语的第一。



听起来挺厉害,光是这样说,其实大家也会想,找一些模型优势项目去比就可以了,不会的直接不宣传。对于普通用户来说,来自产品“同行”的评价可能更有参考价值。

像是360的创始人周鸿祎和猎豹移动的CEO,一个发视频表示祝贺,一个表示通义千问的开源模型都比很多闭源模型强了。







这样的国内评价网上有很多,而在国外评价上,通义千问的口碑也挺好,开发者们表示在训练以后,就算不是中文内容,表现也不错。



相较于其他的模型,阿里通义模型其实是属于主动积极那种,之前搞各种智能体,还有用来娱乐的照片跳舞,国内首位AI程序员入职,以及带头给大模型API大幅降价等等。





在模型官网上还有各种专业用途的“子版本”,用于法律的,教育辅助的等等,对比个人用的智能体来说进阶了不少,像是大家更为熟悉的微博、小米、VIVO等厂商也接入了通义千问,个人和企业用户都挺广。



从长远来看,通义千问的模型是在放长线钓大鱼,开源社区、国内外开发者、企业用户、个人用户、机构单位等都有它的身影,这个生态如果变成完全体,再搭配上阿里系原本的云服务体系,在AI相关的比拼中能取得很大的优势。

在其他AI工具还在单独完善某个领域功能的时候,通义千问在悄悄布局全球市场了,官方的博客里说之后的模型也会继续开源。



你可能又想起了那句话,国内的产品从0到1很难,但是从1到100速度是飞快的,在这件事上其实就能看出来一些。



现在来看,通义千问是有产生质变的能力的,希望以后能有颠覆性的功能出现,有了这些铺垫,那时候就能给全球用户整个更大的震撼!

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
韩军方:朝军切断韩朝输电塔电线

韩军方:朝军切断韩朝输电塔电线

上观新闻
2024-11-26 13:35:08
曝新东方美女老师出轨男学生,大尺度照片流出,聊天记录曝光

曝新东方美女老师出轨男学生,大尺度照片流出,聊天记录曝光

娱官儿
2024-11-26 10:51:09
曝大批网友给殴打霸凌学生的王所长送锦旗,市局领导怕影响太大,不让拍视频

曝大批网友给殴打霸凌学生的王所长送锦旗,市局领导怕影响太大,不让拍视频

可达鸭面面观
2024-11-26 08:36:58
亚冠东亚区积分榜:泰山海港赢球进入前八,申花明日战光州

亚冠东亚区积分榜:泰山海港赢球进入前八,申花明日战光州

懂球帝
2024-11-26 22:22:06
华为Mate 70系列正式发布:整机性能暴增40%,搭载原生鸿蒙系统

华为Mate 70系列正式发布:整机性能暴增40%,搭载原生鸿蒙系统

环球网资讯
2024-11-26 16:13:06
网传某知名寺庙的住持带领僧人申请美国签证,仅四五位弟子过关,四十多人被拒

网传某知名寺庙的住持带领僧人申请美国签证,仅四五位弟子过关,四十多人被拒

六子吃凉粉
2024-11-26 21:50:07
国家消防救援局:锂电池热失控不可避免!禁止电车进入地库,无奈之举?

国家消防救援局:锂电池热失控不可避免!禁止电车进入地库,无奈之举?

都市快报橙柿互动
2024-11-26 20:16:48
上饶警员到江苏「远洋捕捞」被浙江抓了,上面支持「东南互联」反击!

上饶警员到江苏「远洋捕捞」被浙江抓了,上面支持「东南互联」反击!

家传编辑部
2024-11-26 18:01:09
baby香港出席活动暴瘦仅80斤,忙完凌晨吃火锅被偶遇,素颜好憔悴

baby香港出席活动暴瘦仅80斤,忙完凌晨吃火锅被偶遇,素颜好憔悴

缘浅娱深
2024-11-26 14:29:19
今起严查!苏州、无锡、常州、南通联合行动

今起严查!苏州、无锡、常州、南通联合行动

城市日历
2024-11-26 19:16:36
吴柳芳的故事,其实得从五年前说起

吴柳芳的故事,其实得从五年前说起

卢诗翰
2024-11-26 15:52:17
“尊界”首次亮相!余承东:首款车型开启预定,售价100万元至150万元!曾称远超迈巴赫、劳斯莱斯

“尊界”首次亮相!余承东:首款车型开启预定,售价100万元至150万元!曾称远超迈巴赫、劳斯莱斯

每日经济新闻
2024-11-26 17:59:15
F-35一架也造不出来,美国间谍跑到中国偷东西,结果被一锅端

F-35一架也造不出来,美国间谍跑到中国偷东西,结果被一锅端

空天力量
2024-11-11 10:19:24
尴尬!一下雪,兰州碧桂园业主下山成大问题,网友:一分钱一分货

尴尬!一下雪,兰州碧桂园业主下山成大问题,网友:一分钱一分货

火山诗话
2024-11-26 08:41:46
红四方上市首日盘中暴涨2200%!“四方”上市公司都跟着“喝汤”

红四方上市首日盘中暴涨2200%!“四方”上市公司都跟着“喝汤”

第一财经资讯
2024-11-26 20:20:01
没让大陆失望!蔡英文返台,下飞机前讲出3个词,民进党底牌打光

没让大陆失望!蔡英文返台,下飞机前讲出3个词,民进党底牌打光

现代小青青慕慕
2024-11-26 07:20:34
网传东莞常平中学门口配有警察执勤!或打响校园安保的第一枪…

网传东莞常平中学门口配有警察执勤!或打响校园安保的第一枪…

火山诗话
2024-11-26 19:16:17
华为“史上最强大Mate”正式发布!首发卫星寻呼功能,余承东:靠抄袭是没有未来的,能超越Mate的只有Mate

华为“史上最强大Mate”正式发布!首发卫星寻呼功能,余承东:靠抄袭是没有未来的,能超越Mate的只有Mate

每日经济新闻
2024-11-26 15:31:11
郑州农民工讨薪未果杀死项目班组长,涉事公司:公安已介入

郑州农民工讨薪未果杀死项目班组长,涉事公司:公安已介入

追月数星的朋友圈
2024-11-26 22:06:35
台当局偷偷改了规矩:若解放军战机飞临台岛,台湾民众只有3分钟

台当局偷偷改了规矩:若解放军战机飞临台岛,台湾民众只有3分钟

猎火照狼山
2024-11-27 00:05:03
2024-11-27 03:59:00
果核剥壳
果核剥壳
分享新奇的黑科技软件资源
368文章数 733关注度
往期回顾 全部

科技要闻

"这是国产化最高,也是史上最强的Mate"

头条要闻

墨西哥总统称墨不是中国产品转口美国的途径 中方回应

头条要闻

墨西哥总统称墨不是中国产品转口美国的途径 中方回应

体育要闻

格列兹曼完成欧冠100次出场,法国球员中第四人

娱乐要闻

权威奖项沦为资本工具?谁来管一管

财经要闻

洪灏刘煜辉对谈实录 涉及A股、债务等!

汽车要闻

解决油车无法处理的难题 仰望U7数字底盘这么强

态度原创

房产
本地
时尚
手机
公开课

房产要闻

大动作!新世界·天馥全线上新,锚定广州置业安全网第一标准!

本地新闻

城市24小时|领跑万亿城市,武汉“开挂”了?

秋冬多穿彩色吧!减龄又好看

手机要闻

iPhone 16摄像头表现远不及16 Pro机型 在DXOMARK的测试中排名第20位

公开课

一块玻璃,如何改变人类世界?

无障碍浏览 进入关怀版