网易首页 > 网易号 > 正文 申请入驻

李开复率队问鼎全球多项榜单

0
分享至

虽然Yi系列大模型出道时间相对较晚,但从效果上来看,绝对称得上是后发制人

一出手即问鼎多项全球第一

  • Hugging Face英文测试榜单位居第一,以34B的大小碾压Llama-2 70B和Falcon-180B等一众大尺寸大模型;
  • 唯一成功登顶HuggingFace的国产大模型;
  • C-Eval中文能力排行榜位居第一,超越了全球所有开源模型;
  • MMLU、BBH等八大综合能力表现全部胜出;
  • 拿下全球最长上下文窗口宝座,达到200K,可直接处理40万汉字超长文本输入。

值得注意的是,零一万物及其大模型并非是一蹴而就,而是酝酿了足足半年有余。

由此不免让人产生诸多疑问:

例如为什么要憋半年之久的大招,选择在临近岁末之际出手?

再如是如何做到一面世即能拿下如此之多的第一?

带着这些问题,我们与零一万物做了独家交流,现在就来一一揭秘。

击败千亿参数大模型

具体来看,零一万物最新发布开源的Yi系列大模型主要有两大亮点:

  • “以小博大”击败千亿参数模型
  • 全球最长上下文窗口支持40万字

在Hugging Face英文测试公开单 Pretrained 预训练开源模型排名中,Yi-34B以70.72分数位列全球第一,超过了LLaMA-70B和Falcon-180B。

要知道,Yi-34B的参数量仅为后两者的1/2、1/5。不仅“以小博大”问鼎榜单,而且实现了跨数量级的反超,以百亿规模击败千亿级大模型。

其中在MMLU(大规模多任务语言理解)、TruthfulQA(真实性基准)两项指标中,Yi-34B都大幅超越其他大模型。

△Hugging Face Open LLM Leaderboard (pretrained) 大模型排行榜,Yi-34B高居榜首(2023年11月5日)

聚焦到中文能力方面,Yi-34B在C-Eval中文能力能力排行榜上超越所有开源模型。

同样开源的Yi-6B也超过了同规模所有开源模型。

△C-Eval 排行榜:公开访问的模型,Yi-34B 全球第一(2023年11月5日)

在CMMLU、E-Eval、Gaokao三个主要中文指标上,明显领先于GPT-4,彰显强大的中文优势,对咱们更知根知底。

在BooIQ、OBQA两个问答指标上,和GPT-4水平相当。

另外,在大模型最关键评测指标MMLU(Massive Multitask Language Understanding,大规模多任务语言理解)、BBH等反映模型综合能力的评测集上,Yi-34B在通用能力、知识推理、阅读理解等多项指标评比中全面超越,与Hugging Face评测高度一致。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
游客反映“花费1580元报名三亚双飞游未能如期成行”,重庆两江新区通报:对涉事公司立案调查

游客反映“花费1580元报名三亚双飞游未能如期成行”,重庆两江新区通报:对涉事公司立案调查

环球网资讯
2024-12-21 17:39:57
终于封海!“正式交锋”打响?解放军不再废话,南海上演重磅一幕

终于封海!“正式交锋”打响?解放军不再废话,南海上演重磅一幕

视野聚椒
2024-12-21 19:13:29
北京通美注册卡壳超两年背后:核心业务受外贸政策影响,涉嫌侵犯商业秘密遭问询

北京通美注册卡壳超两年背后:核心业务受外贸政策影响,涉嫌侵犯商业秘密遭问询

时代商学院
2024-12-20 19:05:13
字节跳动、腾讯:采购了 460000 块 GPU

字节跳动、腾讯:采购了 460000 块 GPU

云头条
2024-12-20 23:27:11
天差地别啊!解放军澳门驻军25年前后的对比图亮相

天差地别啊!解放军澳门驻军25年前后的对比图亮相

青青子衿
2024-12-20 18:57:16
美防长奥斯汀指出:中美一旦开战,美军杀伤力更强拥有战斗优势!

美防长奥斯汀指出:中美一旦开战,美军杀伤力更强拥有战斗优势!

探秘历史
2024-12-21 18:35:02
五部回忆“特殊时代”的书:是时代的伤痛,更是个人的悲剧

五部回忆“特殊时代”的书:是时代的伤痛,更是个人的悲剧

尚曦读史
2024-12-21 00:51:06
三双了!莫兰德8中6已经拿下12分12板15助3断

三双了!莫兰德8中6已经拿下12分12板15助3断

直播吧
2024-12-21 21:31:31
朋友圈看到的,一位工作20年的老同学被裁员,公积金提取了64万。

朋友圈看到的,一位工作20年的老同学被裁员,公积金提取了64万。

人情皆文史
2024-12-18 22:27:36
外媒评2024年最佳5款手机:iPhone16ProMax仅排第3!

外媒评2024年最佳5款手机:iPhone16ProMax仅排第3!

搞机小帝
2024-12-21 12:39:52
巴特勒的续约要求其实相当明了,基本就是太阳和火箭二选一!

巴特勒的续约要求其实相当明了,基本就是太阳和火箭二选一!

田先生篮球
2024-12-21 16:31:10
射门变传球?格拉利什内切射门直飞边线,哈兰德争顶错过皮球

射门变传球?格拉利什内切射门直飞边线,哈兰德争顶错过皮球

直播吧
2024-12-21 21:10:38
已和邹市明分房睡3年,40岁冉莹颖: 夫妻生活非必需品 不要求他

已和邹市明分房睡3年,40岁冉莹颖: 夫妻生活非必需品 不要求他

风过乡
2024-12-21 12:29:13
失联10年,马航370终于迎来重大利好消息,背后内幕即将曝光?

失联10年,马航370终于迎来重大利好消息,背后内幕即将曝光?

飞花文史
2024-12-21 15:28:48
又是车祸,又是关键人物!中国不得不防!

又是车祸,又是关键人物!中国不得不防!

李荣茂
2024-12-21 07:16:04
中央组织部通知:刘昌松履新

中央组织部通知:刘昌松履新

坠入二次元的海洋
2024-12-20 13:50:27
普京揭发伊朗老底,这就是不抵抗的结果:350人打败30000伊叙大军

普京揭发伊朗老底,这就是不抵抗的结果:350人打败30000伊叙大军

深析古今
2024-12-21 15:29:12
电动车挡风被又上热搜!央视:防寒不防患,保暖重要还是安全重要!

电动车挡风被又上热搜!央视:防寒不防患,保暖重要还是安全重要!

涵豆说历史
2024-12-19 10:04:55
提前重建!曼城回购6000万前锋,搭档哈兰德

提前重建!曼城回购6000万前锋,搭档哈兰德

球文速递
2024-12-21 21:51:29
断裂树枝悬挂马路上方,54岁女子骑车撞上不幸身亡!交警认定死者主责,当地政府次责,双方均有异议

断裂树枝悬挂马路上方,54岁女子骑车撞上不幸身亡!交警认定死者主责,当地政府次责,双方均有异议

鲁中晨报
2024-12-20 23:23:12
2024-12-21 22:56:49
虫书鸟篆
虫书鸟篆
最专业,最健康,最适合的
633文章数 1138关注度
往期回顾 全部

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

头条要闻

美政府逃过"关门" 特朗普希望反对他政策的议员被替代

头条要闻

美政府逃过"关门" 特朗普希望反对他政策的议员被替代

体育要闻

“他不再是那个数据刷子了”

娱乐要闻

叶柯现身酒店被偶遇 心情超好 小腹隆起孕肚明显

财经要闻

国潮褪去,李宁掉队!

科技要闻

OpenAI最强推理模型o3发布!但明年才能用

汽车要闻

预售37.98万 坦克500Hi4-Z将于1月1日上市

态度原创

教育
手机
亲子
数码
时尚

教育要闻

国内中产家庭最爱去的英国大学!

手机要闻

苹果史上变化最大的一代!iPhone 17 Pro系列将迎来6大升级

亲子要闻

熊孩子赖地上怎么办,姑姑来治,网友:妥妥的血脉压制

数码要闻

华硕 ROG 幻 X 2025 预热:1月7日 CES 2025 亮相

“羊羔毛”外套不愧是保暖王者,时髦精都爱,冬季有它美美哒

无障碍浏览 进入关怀版