网易首页 > 网易号 > 正文 申请入驻

国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身To

0
分享至

国产大模型首次在公开榜单上超过GPT-4o!



就在刚刚,“大模型六小强”之一的零一万物正式对外发布新旗舰模型——Yi-Lightning(闪电)。

在大模型竞技场(Chatbot Arena)上,Yi-Lightning性能直冲总榜单并列第6,数学分榜并列第3,代码等其它分榜也名列前茅。

总成绩几乎与马斯克最新xAI大模型Grok-2-08-13持平,超越GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonnet等顶流。

同时,国内清华系大模型公司智谱AI的GLM-4-Plus也杀进了总榜,位居第9位。

该榜单结果来自全球累积超千万次的人类用户盲测投票。

前段时间大模型竞技场还刚刚更新了规则,新榜单对AI回答的长度和风格等特征做了降权处理,分数更能反映模型真正解决问题的能力。

这次Yi-Lightning杀出重围,Lmsys团队特意发帖子,称这是竞技场上的大新闻:

细看大模型竞技场分类榜上的“赛况”,Yi-Lightning各项能力都排在前头。

在中文能力上,Yi-Lightning和GLM-4-Plus两个国产大模型都名列前位。

Yi-Lightning跃居并列第二,和o1-mini相差无几。

数学能力,Yi-Lightning和Gemini-1.5-Pro-002并列第3,仅次于o1-preview、o1-mini。

代码能力Yi-Lightning排名并列第4。

另外在Hard Prompts和Longer Query分榜,Yi-Lightning也都排在第4位。

最后同样值得关注的是,竞技场新功能风格控制过滤,确保分数反映模型真正解决问题的能力,而不是用漂亮的格式、增加回答长度。

在对长度和风格等特征做了降权处理后,所有模型分数均有下降,Yi-Lightning排名变化不大,整体还与GPT-4o、Grok-2同一梯队。

发布会上,零一万物创始人兼CEO李开复博士展示了Yi-Lightning在不同场景上的能力。

Yi-Lightning主打一个“推理速度更快,生成质量更好”。

相比上半年Yi-Large,Yi-Lightning首包速度提升1倍,推理速度也提升了4成。

像是翻译下面这种文学作品,Yi-Lightning不仅速度更快:

而且用词更精准,更具文学色彩:

那么Yi-Lightning是如何做到的?

好用还得极速

Yi-Lightning采用MoE混合专家模型架构。

底层技术上,Yi-Lightning在以下方面进行了提升。

首先是优化混合注意力机制(Hybrid Attention),只在模型的部分层次中将传统的全注意力(Full Attention)替换为滑动窗口注意力(Sliding Window Attention)。

由此以来,模型在保证处理长序列数据高性能表现的同时,还能大大降低推理成本。

Yi-Lightning还引入了跨层注意力(Cross-Layer Attention, CLA),允许模型在不同的层次之间共享键(Key)和值(Value)头,减少对存储需求。

这使得Yi-Lightning能在不同层次之间更有效地共享信息。

总的来说,KV cache缩小了2-4倍,同时将计算的复杂度从O(L²)降至O(L)。

其次,Yi-Lightning还采用了动态Top-P路由机制。

也就是说,Yi-Lightning可以根据任务的难度动态自动选择最合适的专家网络组合——

训练过程中会激活所有专家网络,使模型能学习到所有专家知识;而推理阶段,根据任务的难度,模型会选择性激活更匹配的专家网络。

另外,之前有一些传言称国内大模型“六小强”,有一些已经不做预训练了,李开复博士这次在发布会上直接“just.100fyg.com辟谣”:

而且在模型预训练阶段,团队还积累了丰富的多阶段训练方法,将整个训练分为两块,一块做好以后就把它固定起来,然后在这个固定的jazz.english-talk.net模型上再做后段训练。

训练前期,更注重数据多样性,使得Yi-Lightning尽可能学习不同的知识;训练后期更重内容更丰富、知jazz.mileagenote.com识性更强的数据。

同时团队还在不同阶jazz.tranpathz.com段采用不同的batch size和LR schedule保证训练速度和稳定性。

李开复博士还表示,零一万物开发模型讲究“模基共建”,jazz.szttc.net也就是共建模型和基础架构。

模型的训练、服务jazz.lzjtxjc.com、推理设计,与底层的AIInfra架构和模型结构必须高度适配。

这样做的java.uflazshop.com目的,不仅是让模型更好,而且让它在推理的时候能够更便宜。

再加上以上种种抬升“性价比”的技术加持,所以Yijava.dvfile.com-Lightning这次也是打到了白菜价——

在中文等方面,Yi-Lightning比肩OpenAI的o1-mini,o1-mini的定价是每百万输入3美元java.viptmt.com,每百万输出12美元。

Yi-Lightning每百万tokjava.bjbinglun.comen只需0.99RMB也是打到了骨折。

但李开复博java.xiyimedia.com士表示,即便这样也:不亏钱。

除了发布新模型,零just.ispiderman.com一万物这次还首发了AI2.0数字人方案。

目前该数字人已接入Yi-Lightninjust.miaofk.comg,实时互动效果相比以往更强更自然了,belike:

https://www.toutiao.com/article/74262448083242jazz.bbwwives.net84968/

最后谈起和国外头部大模型的差距,李开复博士表示这次Yi-Lightning的排名证明了国产大模型跟硅谷最顶尖模型的差距缩小jazz.gznycs.com到了五个月。

参考链接:[1]https://x.com/lmarena_ai/status/1846245604890116457[2]https://x.comjazz.yzwzw.com/01AI_Yi/status/1845776529185476613

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
台当局偷偷改了规矩:若解放军战机飞临台岛,台湾民众只有3分钟

台当局偷偷改了规矩:若解放军战机飞临台岛,台湾民众只有3分钟

阿纂看事
2024-11-27 15:18:00
大家有没有发现,原本红遍大江南北的演员“黄渤”基本消失了?

大家有没有发现,原本红遍大江南北的演员“黄渤”基本消失了?

人情皆文史
2024-11-22 01:21:52
“一瞬间持仓全红了,发生了什么?”尾盘嗨了!A股突然加速爆发!沪指重回3300点!超百股涨停!

“一瞬间持仓全红了,发生了什么?”尾盘嗨了!A股突然加速爆发!沪指重回3300点!超百股涨停!

雪球
2024-11-27 16:06:28
大杀四方!特朗普全面宣战!!

大杀四方!特朗普全面宣战!!

一个坏土豆
2024-11-26 20:06:08
一晚一万九,中国女网红、女主播被BBC扒光了!

一晚一万九,中国女网红、女主播被BBC扒光了!

书画艺术收藏
2024-11-25 20:00:02
徐根宝谈上海队无缘三大球冠军:不是真实实力的体现,继续好好练

徐根宝谈上海队无缘三大球冠军:不是真实实力的体现,继续好好练

直播吧
2024-11-27 18:13:38
业内人曝娱乐圈潜规则:剧组盒饭仨月赚250万,导演亲戚都抢不到

业内人曝娱乐圈潜规则:剧组盒饭仨月赚250万,导演亲戚都抢不到

小盖纪实
2024-11-26 10:37:18
网传东莞常平中学门口配有警察执勤!或打响校园安保的第一枪…

网传东莞常平中学门口配有警察执勤!或打响校园安保的第一枪…

火山诗话
2024-11-26 19:16:17
一位教授的惊人调查:农村当前最严重的问题,并不是农民收入太低

一位教授的惊人调查:农村当前最严重的问题,并不是农民收入太低

尚曦读史
2024-11-26 21:25:02
体育总局开始调查吴柳芳,工作人员表态,她未来堪忧,已暂停直播

体育总局开始调查吴柳芳,工作人员表态,她未来堪忧,已暂停直播

辣条小剧场
2024-11-26 16:28:53
正式离队!武磊敲定新去向后发声,上港俱乐部批准,穆斯卡特不舍

正式离队!武磊敲定新去向后发声,上港俱乐部批准,穆斯卡特不舍

小海要说球
2024-11-27 17:25:05
女子1个月按摩12回,丈夫尾随妻子去按摩店,拉开门缝呆住

女子1个月按摩12回,丈夫尾随妻子去按摩店,拉开门缝呆住

莉雅细细谈
2024-10-20 21:20:15
司马南大尺度视频很辣眼

司马南大尺度视频很辣眼

代伟看世界
2024-11-26 22:12:26
网友:现在雷克萨斯全系都崩盘,优惠12万,感觉离开中国不远了

网友:现在雷克萨斯全系都崩盘,优惠12万,感觉离开中国不远了

火山诗话
2024-11-26 09:57:32
伊能静22岁儿子首谈父母离婚:分开是好事,爸爸庾澄庆教会我做人

伊能静22岁儿子首谈父母离婚:分开是好事,爸爸庾澄庆教会我做人

阿纂看事
2024-11-27 17:43:50
俄军击毙美军,局势突然恶化,英法德集体失声,美国还想息事宁人

俄军击毙美军,局势突然恶化,英法德集体失声,美国还想息事宁人

东方点兵
2024-11-27 00:33:38
他用2000万将妻宠成宝,结婚14年没有孩子,如今50岁他后悔了吗?

他用2000万将妻宠成宝,结婚14年没有孩子,如今50岁他后悔了吗?

肆时说
2024-11-27 15:56:10
宋朝最牛的阴阳人,假冒尼姑祸害上百寡妇,最后被一条狗识破

宋朝最牛的阴阳人,假冒尼姑祸害上百寡妇,最后被一条狗识破

吴学华看天下
2023-09-08 12:09:39
立白科技集团一经理招女生做情人工资1.3万元?公司回应

立白科技集团一经理招女生做情人工资1.3万元?公司回应

大象新闻
2024-11-27 14:00:16
墨西哥女总统态度如此强硬!特朗普宣称25%关税后极力指责特朗普

墨西哥女总统态度如此强硬!特朗普宣称25%关税后极力指责特朗普

橘色数码
2024-11-27 19:40:54
2024-11-27 23:55:00

科技要闻

利润暴跌40%后,三星芯片部门任命新负责人

头条要闻

前实习生攻击公司模型训练 字节跳动起诉索赔800余万

头条要闻

前实习生攻击公司模型训练 字节跳动起诉索赔800余万

体育要闻

网红主播踢顶级联赛 这是什么奇葩俱乐部

娱乐要闻

天呐鹿晗瘦了这么多,像漫画出来的

财经要闻

马光远:所有的房地产政策基本都到位了

汽车要闻

中国的超豪华车尊界S800 预售百万起/ L3级智驾

态度原创

家居
手机
旅游
公开课
军事航空

家居要闻

简单空间 层次高级感并存

手机要闻

摩托罗拉海外推出Moto AI首次公测,双击手机背部即可随时访问

旅游要闻

张家界新景点“飞拉达”位于5000英尺高空

公开课

一块玻璃,如何改变人类世界?

军事要闻

黎以停火协议生效 以军警告

无障碍浏览 进入关怀版