网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

Reflection 70B AI 模型第三方基准测试结果不佳

2024-09-11 11:59:09　来源: IT之家

山东举报

0

分享至

IT之家 9 月 11 日消息，科技媒体 The Decoder 昨日（9 月 10 日）报道，对比平台 Artificial Analysis 相关数据表明，Reflection 70B AI 模型在基准测试中的表现，实际上不及 Meta 的 LLaMA-3.1-70B。

针对 AI 模型基准测试结果不佳，Reflection 公司首席执行官马特・舒默（Matt Shumer）表示，上传模型权重至 Hugging Face 时遇到问题，所使用的权重是多个不同模型的混合体，而他们内部托管的模型则显示出更佳的结果。

舒默随后向部分用户提供了独家访问内部模型的权限，Artificial Analysis 重做了测试，并报告结果优于公开 API，只是他们无法确认所访问的具体是哪个模型。

Reflection 在 Hugging Face 已上传了新的模型，不过这些模型在测试中的表现明显逊于之前通过私有 API 提供的模型。

IT之家查询公开资料，有用户还发现了证据，表明 Reflection API 有时会调用 Anthropic Claude 3.5 Sonnet以及OpenAI。

舒默旗下公司 OthersideAI 此前已宣布计划于本周发布一款基于 LLaMA 3.1 450B 的更大、更强大的模型。

舒默对这一即将发布的版本做出了大胆声明，称其不仅将成为最佳的开源模型，还将是有史以来最优秀的语言模型。

官方回应：

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

阿里推出AI数据科学家，全流程自动化，科研小白也能用

量子位 2024-08-07 14:04:07
25 跟贴 25
AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

量子位 2024-09-08 13:27:35
79 跟贴 79

国内开店卷不动，换上AI出海试试

量子位 2024-07-17 16:09:25
0 跟贴 0

8岁小孩哥上手用AI制作游戏，全程2小时，引来50多万人围观

机器之心Pro 2024-09-03 14:38:55
49 跟贴 49
两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了

量子位 2024-08-11 12:58:22
0 跟贴 0

不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用

机器之心Pro 2024-11-06 16:33:15
0 跟贴 0

全世界跑得最快的人形机器人，还能跳科目三都知道波士顿动力的机器人会空翻，那你知道中国品牌宇树科技有

爱范儿 2024-07-04 20:41:36
6429 跟贴 6429
让ChatGPT不敢开口的名字！神秘bug引马斯克围观

量子位 2024-12-02 19:33:09
132 跟贴 132

肌肉骨骼居然和人类一样。外网爆火的克隆机器人，灵活性超高，胸腔里还复刻了人类的心脏瓣膜，宛如《西部世

量子位 2024-10-26 12:28:00
0 跟贴 0
搭载ChatGPT的《星际穿越》机器人爆火，马斯克：想要！ ChatGPT复刻版《星际穿越》机器人T

量子位 2024-07-09 12:03:11
0 跟贴 0
全球最远1.4米！国产宇树创人形机器人跳远纪录，外网惊叹碾压特斯拉

量子位 2024-10-19 12:16:06
2962 跟贴 2962
训练18个月GPT-5跳票！AI大模型的泡沫要破裂了？

雷科技 2024-12-24 15:41:41
18 跟贴 18
人形机器人狂奔！山地、草地、公路无障碍，原速演示全程高能

量子位 2024-10-14 13:19:05
1174 跟贴 1174
网友一个定积分的WIFI密码，测出了AI数学之王。Grok超强数学思维碾压ChatGPT，引马斯克点

量子位 2024-10-31 18:55:41
18 跟贴 18
波士顿动力新机器人后空翻视频炸圈！扮作圣诞老人，动作干净丝滑

量子位 2024-12-25 16:00:03
377 跟贴 377
国产机器狗驮成年小伙遛弯视频爆火，新通勤工具有了

量子位 2024-12-24 18:28:22
3 跟贴 3
程序员的AI救赎时刻接入这个数据库业务提问自动解决

量子位 2024-12-20 18:25:44
0 跟贴 0
网友用350美元造出能走能玩的端到端人形机器人

量子位 2024-11-15 17:47:23
3 跟贴 3
告别屈膝小碎步让机器人像人一样走路国产团队造出“钢铁侠”

量子位 2024-10-24 11:42:12
0 跟贴 0
AI指挥机器人拍照，1:1复刻大片构图

量子位 2024-12-18 18:21:56
0 跟贴 0
Ilya播客干货引热议：LLM不仅是统计学

量子位 2024-12-24 11:34:18
0 跟贴 0
Anthropic联创：Scaling Law没崩，但推理成天价！有了TTT，25年AI更加速

新智元 2024-12-26 15:05:56
3 跟贴 3
「数字孪生」东京上线！Jim Fan：具身智能零样本迁移现实世界，共享「蜂群思维」

新智元 2024-12-26 15:11:59
1 跟贴 1
AIGC让电影成本降到几千块，全球创作者规模将急剧扩大

量子位 2024-12-23 11:41:50
0 跟贴 0
大模型可视化工具爆火，GPT推理过程一目了然

量子位 2024-11-18 15:41:30
0 跟贴 0
大模型承重墙，去掉了就开始摆烂！苹果给出了「超级权重」

机器之心Pro 2024-11-19 15:50:17
0 跟贴 0
AI时代下基础设施每个环节将发生怎样的变化？

量子位 2024-12-18 11:08:29
0 跟贴 0
为什么AI可以下围棋、打Dota，却连简单的家务都做不好？

量子位 2024-12-17 18:39:55
0 跟贴 0
国产AI视频神器X-Portrait 2，效果碾压Runway

量子位 2024-11-14 17:24:46
0 跟贴 0
机器人身穿衣服做家务被质疑！来自OpenAI押注的独角兽因过于逼真被怀疑是真人套壳——人形机器人初

量子位 2024-09-04 18:16:57
0 跟贴 0
最有打工天赋的机器人出现了！一镜到底的连续大负载搬运，动态超稳，来自国产的逐际动力

量子位 2024-08-12 10:39:39
0 跟贴 0
AI如何改变社交娱乐新姿势？阿里云专家解读来了

量子位 2024-11-27 20:35:45
0 跟贴 0
AI是怎么认出AI视频的？人类靠寻找“违和感”，AI靠的是

量子位 2024-11-08 18:51:54
0 跟贴 0
特斯拉199元摆件迅速售空二手市场大量上架炒至600元

封面新闻 2024-12-26 17:18:09
4 跟贴 4
豆包电脑版，原地封神了！

雷科技 2024-09-25 18:25:33
12 跟贴 12
有PS5玩家收到索尼警告：再这样操作就封号！

游民星空 2024-12-24 11:07:47
569 跟贴 569
大神Karpathy：我给大模型「SQL注入」攻击，简直不要太轻松

机器之心Pro 2024-08-16 17:22:16
1 跟贴 1
饭店两男子因为互相看了一眼差点起冲突

重庆城市TV 2024-12-26 17:08:20
683 跟贴 683
陆上大疆！国产机器狗成精了！科幻变现实！马斯克惊了！

人猿星球观察 2024-12-26 17:39:02
5 跟贴 5
市场份额50%！ openEuler系装机量过千万国产操作系统借开源突围

量子位 2024-11-19 14:35:43
0 跟贴 0

曝一中国留学生涉倒卖俄军用装备，包括防弹衣装甲板等，已被俄海关拘留

曝一中国留学生涉倒卖俄军用装备，包括防弹衣装甲板等，已被俄海关拘留

西游日记

2024-12-26 07:04:36

中方专机抵达乌克兰，泽连斯基为争取中国，对华许下多个承诺

中方专机抵达乌克兰，泽连斯基为争取中国，对华许下多个承诺

空天力量

2024-12-26 17:35:51

平安夜票房仅3837万元，去年同期是1.7亿，网友：真没人过洋节了

平安夜票房仅3837万元，去年同期是1.7亿，网友：真没人过洋节了

火山诗话

2024-12-26 06:09:31

女人会不会打扮，看她穿的“羽绒服”对比就明白了，区别真的很大

女人会不会打扮，看她穿的“羽绒服”对比就明白了，区别真的很大

何有强

2024-12-26 00:40:30

北京高铁9分钟不雅画面曝光，全网围观：你不要脸的样子，真丑！

北京高铁9分钟不雅画面曝光，全网围观：你不要脸的样子，真丑！

书画艺术收藏

2024-12-26 20:00:03

美方提醒赖清德：大陆一旦决定收台，台当局横竖都只有一种结局

美方提醒赖清德：大陆一旦决定收台，台当局横竖都只有一种结局

曹兴教授TALK

2024-12-26 19:29:40

网红“猴哥说车”夫妻离婚？猴哥妻子：结婚2年1年无性生活…

网红“猴哥说车”夫妻离婚？猴哥妻子：结婚2年1年无性生活…

小人物看尽人间百态

2024-12-24 15:22:56

伊朗这两步，有些出人意料

近距离

2024-12-26 21:20:58

比亚迪巴西员工发声:过得很好，没有被奴役，更不想失去工作！

比亚迪巴西员工发声:过得很好，没有被奴役，更不想失去工作！

阿伧说事

2024-12-26 16:39:08

成飞六代机飞了

三叔的装备空间

2024-12-26 20:26:08

12月26日俄乌最新：黑色幽默

12月26日俄乌最新：黑色幽默

西楼饮月

2024-12-26 19:48:43

突然宣布！降息250个基点！

第一财经资讯

2024-12-26 23:23:01

柯文哲遭起诉求刑28年半中国国民党、民进党表态

柯文哲遭起诉求刑28年半中国国民党、民进党表态

环球网资讯

2024-12-26 19:29:08

很多老板明年不打算继续干了

曹多鱼的财经世界

2024-12-26 12:56:04

不寒而栗！多名中国顶尖科学家意外死亡！

不寒而栗！多名中国顶尖科学家意外死亡！

财经三分钟pro

2024-12-26 18:26:26

创人类壮举！美探测器平安夜“触摸”太阳，火凤凰诞生

创人类壮举！美探测器平安夜“触摸”太阳，火凤凰诞生

华人生活网

2024-12-26 12:14:27

向全球宣布，中国六代机首飞，该由解放军主导未来空战了！

向全球宣布，中国六代机首飞，该由解放军主导未来空战了！

胖福的小木屋

2024-12-27 01:01:59

在美国活过来的TikTok，却把中国卖家薅得只剩下了裤衩

在美国活过来的TikTok，却把中国卖家薅得只剩下了裤衩

派大星纪录片

2024-12-26 15:49:38

京东宣布：2万名客服，涨薪！

每日经济新闻

2024-12-26 00:08:12

坠机事件谜团待解，哈萨克斯坦官员回应“遭袭”说法：仅凭照片便作出结论是炒作

坠机事件谜团待解，哈萨克斯坦官员回应“遭袭”说法：仅凭照片便作出结论是炒作

红星新闻

2024-12-26 19:20:48

爱科技，爱这里 - 前沿科技人气平台

263694文章数 605702关注度

往期回顾全部

科技要闻

小米正搭建GPU万卡集群，大力投入AI大模型

头条要闻

阿航客机失事现场找到第二个黑匣子

头条要闻

阿航客机失事现场找到第二个黑匣子

体育要闻

再见，中超最后的超级巨星

娱乐要闻

57岁王祖贤分享近照，状态太好又被质疑整容

财经要闻

69亿订单"消失"，卓然股份隐藏了什么?

汽车要闻

新物种iCAR V23的“尤里卡时刻”

态度原创

教育

游戏

时尚

房产

军事航空

教育要闻

真心建议文科生都去做这三件事别卷学历了

外媒评选有史以来最令人惊叹的30款佳作《悟空》入选

今年最好看的搭配竟然是基础款？这样穿高级又时髦

房产要闻

富力地产子公司欠薪风波：年关将至！员工深陷困境，呼吁尽快解决

军事要闻

中方批菲防长涉华言论出格荒唐

© 1997-2024 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版