网易首页 > 网易号 > 正文 申请入驻

英伟达打脸AMD:H100在软件加持下,AI性能比MI300X快47%!

0
分享至

12月14日消息,AMD于本月初推出了其最强的AI芯片Instinct MI300X,其8-GPU服务器的AI性能比英伟达H100 8-GPU高出了60%。对此,英伟达于近日发布了一组最新的H100与MI300X的性能对比数据,展示了H100如何使用正确的软件提供比MI300X更快的AI性能。

根据AMD此前公布的数据显示,MI300X的FP8/FP16性能都达到了英伟达(NVIDIA)H100的1.3倍,运行Llama 2 70B和FlashAttention 2 模型的速度比H100均快了20%。在8v8 服务器中,运行Llama 2 70B模型,MI300X比H100快了40%;运行Bloom 176B模型,MI300X比H100快了60%。

但是,需要指出的是,AMD在将MI300X 与 英伟达H100 进行比较时,AMD使用了最新的 ROCm 6.0 套件中的优化库(可支持最新的计算格式,例如 FP16、Bf16 和 FP8,包括 Sparsity等),才得到了这些数字。相比之下,对于英伟达H100则并未没有使用英伟达的 TensorRT-LLM 等优化软件加持情况下进行测试。

AMD对于英伟达H100测试的隐含声明显示,使用vLLM v.02.2.2推理软件和英伟达DGX H100系统,Llama 2 70B查询的输入序列长度为2048,输出序列长度为128。

而英伟达最新公布的对于DGX H100(带有8个NVIDIA H100 Tensor Core GPU,带有80 GB HBM3)测试,带有公开的NVIDIA TensorRT LLM软件,v0.5.0用于Batch-1,v0.6.1用于延迟阈值测量。工作量详细信息与脚注与AMD之前的测试相同。

结果显示,与 AMD展示的MI300X 8-GPU服务器性能相比,英伟达DGX H100 服务器在使用优化的软件加持后,速度提高了 2 倍多,相比 AMD MI300X 8-GPU 服务器快了47%。

DGX H100 可以在1.7 秒内处理单个推理任务。为了优化响应时间和数据中心吞吐量,云服务为特定服务设置了固定的响应时间。这使他们能够将多个推理请求组合成更大的“Batch”,并增加服务器每秒的总体推理次数。MLPerf 等行业标准基准测试也使用此固定响应时间指标来衡量性能。

响应时间的微小权衡可能会导致服务器可以实时处理的推理请求数量产生不确定因素。使用固定的 2.5 秒响应时间预算,英伟达DGX H100 服务器每秒可以处理超过 5 个 Llama 2 70B 推理,而Batch-1每秒处理不到一个。

显然,英伟达使用这些新的基准测试是相对公平的,毕竟AMD也使用其优化的软件来评估其GPU的性能,所以为什么不在测试英伟达H100时也这样做呢?

要知道英伟达的软件堆栈围绕CUDA生态系统,经过多年的努力和开发,在人工智能市场拥有非常强大的地位,而AMD的ROCm 6.0是新的,尚未在现实场景中进行测试。

根据AMD之前透露的信息显示,其已经与微软、Meta等大公司达成了很大一部分交易,这些公司将其MI300X GPU视为英伟达H100解决方案的替代品。

AMD最新的Instinct MI300X预计将在2024年上半年大量出货,但是,届时英伟达更强的H200 GPU也将出货,2024下半年英伟达还将推出新一代的Blackwell B100。另外,英特尔也将会推出其新一代的AI芯片Gaudi 3。接下来,人工智能领域的竞争似乎会变得更加激烈。

编辑:芯智讯-浪客剑

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
公司空降总经理,身为销冠的我被开离职,三个月后总经理慌了神

公司空降总经理,身为销冠的我被开离职,三个月后总经理慌了神

二十一号故事铺
2024-09-19 18:30:10
全新国产宝马X3实车现身,外观确实更有看头,空间很大

全新国产宝马X3实车现身,外观确实更有看头,空间很大

沙雕小琳琳
2024-10-06 02:41:35
郭艾伦融入感好强!开法拉利,街边穿拖鞋吃饭,退休生活既视感!

郭艾伦融入感好强!开法拉利,街边穿拖鞋吃饭,退休生活既视感!

篮球资讯达人
2024-10-05 18:06:26
这是汪小菲为纪念结婚十周年的聚会,也是和大S最后一次合体庆祝

这是汪小菲为纪念结婚十周年的聚会,也是和大S最后一次合体庆祝

圈里的甜橙子
2024-10-05 19:33:59
李纯马頔逛街被偶遇,两人颜值差距大,网友好奇李纯看上马頔啥了

李纯马頔逛街被偶遇,两人颜值差距大,网友好奇李纯看上马頔啥了

娱乐的小灶
2024-10-05 14:44:18
金正恩回应尹锡悦:若遭韩美攻击,朝将动用一切攻击力量

金正恩回应尹锡悦:若遭韩美攻击,朝将动用一切攻击力量

参考消息
2024-10-04 14:26:09
谷歌工程师杀妻案再次开庭,律师称收到来自中国的嫌疑人“行为健康”医疗记录

谷歌工程师杀妻案再次开庭,律师称收到来自中国的嫌疑人“行为健康”医疗记录

红星新闻
2024-10-05 12:56:26
沈阳跌幅最大的小区房价揭晓!医疗配套对于购房者来说有多重要?

沈阳跌幅最大的小区房价揭晓!医疗配套对于购房者来说有多重要?

科学发掘
2024-10-05 23:18:05
哪个瞬间让你觉得女朋友不简单?网友:被警察带走的那天 我惊呆了

哪个瞬间让你觉得女朋友不简单?网友:被警察带走的那天 我惊呆了

滑稽斑马呀
2024-09-25 13:50:01
剧组声明:与该演员暂停合作!

剧组声明:与该演员暂停合作!

930老友记
2024-10-05 18:12:48
出生于1988年,王可履新

出生于1988年,王可履新

鲁中晨报
2024-10-05 13:37:06
毁三观!脱口秀演员何广智被曝知三当三,聊天记录曝出, 尺度大!

毁三观!脱口秀演员何广智被曝知三当三,聊天记录曝出, 尺度大!

娱乐的小灶
2024-10-03 11:33:53
犹太人好像对中国抱有很大希望,觉得中国将能成为他们的安全港湾

犹太人好像对中国抱有很大希望,觉得中国将能成为他们的安全港湾

日风的故事屋
2024-10-03 13:45:21
央视前主持人林海,走红后与妻子离婚,在节目上发飙之后事业坎坷

央视前主持人林海,走红后与妻子离婚,在节目上发飙之后事业坎坷

小盖纪实
2024-10-05 17:37:37
北京36岁女教授,妥协下嫁26岁农村小伙,8年过去如今怎么样了?

北京36岁女教授,妥协下嫁26岁农村小伙,8年过去如今怎么样了?

科学发掘
2024-10-05 17:41:03
国安部首任部长回忆:康生临终前经常强调一件事

国安部首任部长回忆:康生临终前经常强调一件事

旧时楼台月
2024-10-05 19:20:44
美联社公布以色列 Nevatim 空军基地的卫星图像,以色列损失惨重

美联社公布以色列 Nevatim 空军基地的卫星图像,以色列损失惨重

低调看天下
2024-10-04 09:46:43
2-0,中国留洋球员闪耀欧洲:攻入赛季第2球,帮助球队取赛季首胜

2-0,中国留洋球员闪耀欧洲:攻入赛季第2球,帮助球队取赛季首胜

侧身凌空斩
2024-10-06 00:58:06
退路没了!97个人口小县完成机构改革,加速砸掉“铁饭碗”!

退路没了!97个人口小县完成机构改革,加速砸掉“铁饭碗”!

财话连篇
2024-10-05 11:32:27
俄外长:对抗和霸权主义不能解决任何全球问题

俄外长:对抗和霸权主义不能解决任何全球问题

新华社
2024-10-05 22:40:06
2024-10-06 07:28:49
芯智讯
芯智讯
聚焦科技万象,报道前沿资讯。
5639文章数 31787关注度
往期回顾 全部

数码要闻

机械师K600T机械键盘上新:白紫配色 Gasket结构首发199元

头条要闻

以色列3个月后才通报穆什塔哈之死 其去年曾躲过轰炸

头条要闻

以色列3个月后才通报穆什塔哈之死 其去年曾躲过轰炸

体育要闻

郑钦文摔倒受伤 0-2告负无缘中网决战

娱乐要闻

肖战晒照庆33岁生日,阳光帅气有活力

财经要闻

“抢筹”中国资产!外资巨头发声!

科技要闻

十一直击:鸿蒙智行、小米汽车人气高涨

汽车要闻

售17.78万元 蒙迪欧1.5T混动舒雅型上市

态度原创

教育
艺术
数码
房产
公开课

教育要闻

为何“爱偷懒”的家长,养出了“最优秀”的孩子?

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

数码要闻

美的小魔方 pro 电热水瓶上市:0 塑料水路,预售 799 元

房产要闻

国庆到啦!快来查收你的买楼大礼包

公开课

眼花失眠抽筋,你的肝该调调了

无障碍浏览 进入关怀版