网易首页 > 网易号 > 正文 申请入驻

英特尔详细介绍Ponte Vecchio 性能可达英伟达A100平台的2.5倍

0
分享至

在 Hot Chips 34 大会期间,英特尔再次详细介绍了 Sapphire Rapids HBM 处理器 + Ponte Vecchio(2-Stack)GPU 平台的潜力,称该服务器平台的性能可达英伟达 A100 竞品的 2.5 倍。英特尔首席 GPU 计算架构师 Hong Jiang 在演讲中指出,Ponte Vecchio 具有三种配置。

(via WCCFTech)

从单一 OAM、到配备 Xe Links 的 x4 子系统,Ponte Vecchio GPU 不仅能够单独运行、也可部署于 Sapphire Rapids 双路服务器平台之上。

其中 OAM 支持 4 GPU 和 8 GPU 平台的 all-to-all 拓扑,辅以英特尔 oneAPI 软件堆栈。

作为一个零级(Level Zero)API,其为跨架构编程支持提供了低层级的硬件接口。

oneAPI 主要特性如下:

● 提供面向其它工具和加速器设备的接口; ● 支持精细的增益控制、以及低延迟的加速器特性; ● 具有多线程设计; ● 将 GPU 作为驱动程序的一部分而提供。

性能指标方面,2-Stack Ponte Vecchio GPU 配置(如单一 OAM 上的配置),可提供高达 52 TFLOP 的 FP64 / FP32 算力。

另有 419 TFLOP 的 TF32(XMX Float 32)、839 TFLOP 的 BF16 / FP16,以及 1678 TFLOPs 的 INT8 算力。

英特尔还详细说明了 Ponte Vecchio 的缓存大小 / 峰值带宽 —— 比如 GPU 上的寄存器为 64 MB,提供 419 TB/s 的带宽。

L1 缓存也为 64 MB,带宽 105 TB/s(4:1)。L2 缓存为 408 MB,带宽 13 TB/s(8:1)。HBM 内存池高达 128 GB,辅以 4.2 TB/s(4:1)的带宽。

以下是英特尔为 Ponte Vecchio 配备的系列计算效率(compute efficiency)技术。

Register File(寄存器文件):

● Register Caching(寄存器缓存) ● Accumulators(累加器)

L1 / L2 Cache:

● Write Through(直写) ● Write Back(回写) ● Write Streaming(流式写入) ● Uncached(不缓存)

Prefetch(预取):

● 支持 L1 和(或)L2 缓存的软件(指令)预取; ● 支持到 L2 获取指令和数据的 Command Streamer 预取。

英特尔解释称,更大的 L2 缓存,可为 2D-FFT 和 DNN 等工作负载带来巨大的效益,并且分享了完整 Ponte Vecchio GPU 和 80 / 32 MB 模块之间的一些性能比较。

此外英特尔搬出了运行 CUDA 和 SYCL 的英伟达 Ampere A100,与使用 SYCL 的 Ponte Vecchio GPU 平台展开了性能横比。

在 miniBUDE(一种可预测配体与目标结合能的计算工作负载)中,Ponte Vecchio GPU 模拟测试结果的速度,更是 Ampere A100 的 2 倍。

另外在 ExaSMR 核反应堆设计仿真设计中,英特尔 Ponte Vecchio GPU 也以 1.5 倍领先于英伟达竞品方案。

不过需要指出的是,英伟达早已向市场投放了性能更加强悍的 Hopper H100,所以英特尔这里拿 Ampere A100 进行比较还是相当投机取巧的。

言归正传,英特尔概述了 Ponte Vecchio 旗舰数据中心 GPU 的一些关键特性,例如 128 个 Xe 内核、128 个光追(RT)单元、HBM2e 显存、以及连接到一起的 8 个 Xe-HPC GPU 。

该芯片在两个独立的堆栈中提供了高达 408 MB 的 L2 缓存、之间通过 EMIB 互连,且各部分芯片混用了 Intel 7 和台积电 N7 / N5 等多个工艺节点。

由两块(2 Tiles)组成的每个堆栈有 16 裸片,最大的 active die 尺寸为 41 m㎡、Compute Tile 则是 650 m㎡ 。

以下是 Ponte Vecchio GPU 的完整小芯片 / 工艺节点描述:

● 英特尔 7nm ● 台积电 7nm ● Foveros 3D 封装 ● EMIB 互连 ● 10nm 增强型 Super Fin ● Rambo Cache ● HBM2 高带宽显存

以下是英特尔 Ponte Vecchio 芯片的 47 块(Tiles)组成:

● 16 个 Xe HPC(内/外部) ● 8 个 Rambo Cache(内部) ● 2 个 Xe Base(内部) ● 11 个 EMIB(内部) ● 2 个 Xe Link(外部) ● 8 个 HBM(外部)

Ponte Vecchio GPU 使用了 8 个 HBM 8-Hi 堆栈,总共包含 11 个 EMIB 互连,完整封装尺寸为 4843.75 m㎡ 。

设计中还提到了高密度 3D Forveos 封装的 Meteor Lake CPU,可知其 bump pitch 的间距为 36u 。

【总结】Ponte Vecchio GPU 不是一个单独的芯片,而是由 47 个不同工艺制程的小芯片“组合”得来。

遗憾的是,受英特尔多次跳票的影响,使用 Ponte Vecchio GPU 和 Sapphire Rapids CPU 的 Aurora 超级计算机项目也被迫推迟。

即便如此,英特尔还是透露了下一代 Rialto Bridge GPU 。可知作为 Ponte Vecchio GPU 的继任者,其有望于 2023 年开始提供样品。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一百多元“流浪”上海八天,一名贵州高考生的考前“游戏”

一百多元“流浪”上海八天,一名贵州高考生的考前“游戏”

澎湃新闻
2024-06-28 06:42:35
觉醒吧!中国需要真实声音,拒绝盲目歌颂!

觉醒吧!中国需要真实声音,拒绝盲目歌颂!

雪莉故事汇
2024-06-24 07:27:47
河北男子被逼下跪爬行后续:4名霸凌者身份曝光,教育局急于甩锅

河北男子被逼下跪爬行后续:4名霸凌者身份曝光,教育局急于甩锅

六毛朵朵
2024-06-27 16:58:25
因葡萄牙爆冷输球出局!匈牙利主帅:不知道该说什么,很不幸...

因葡萄牙爆冷输球出局!匈牙利主帅:不知道该说什么,很不幸...

直播吧
2024-06-27 21:37:54
李尚福、魏凤和被开除党籍、军籍,取消上将军衔

李尚福、魏凤和被开除党籍、军籍,取消上将军衔

政知新媒体
2024-06-27 18:45:25
美股三大股指小幅收高,美国续请失业金升至2021年底以来新高

美股三大股指小幅收高,美国续请失业金升至2021年底以来新高

第一财经资讯
2024-06-28 07:34:08
秦城监狱:两种监区,两种不同的待遇,204监区,部长级待遇

秦城监狱:两种监区,两种不同的待遇,204监区,部长级待遇

贱议你读史
2024-06-27 07:40:02
楼市,最荒唐的政策终于出现了

楼市,最荒唐的政策终于出现了

山丘楼评
2024-06-26 23:05:37
四胞胎考上清华!家庭黑历史被扒,装穷骗补,其父狂删6万条精日言论

四胞胎考上清华!家庭黑历史被扒,装穷骗补,其父狂删6万条精日言论

趣笔谈
2024-06-27 11:42:23
崔永熙次轮也落选!中国球员连续8年0人被NBA选中 专家一语成谶

崔永熙次轮也落选!中国球员连续8年0人被NBA选中 专家一语成谶

颜小白的篮球梦
2024-06-28 06:27:30
骂受伤女子的人,想想歹徒冲上满载孩童的校车,国际上有什么影响

骂受伤女子的人,想想歹徒冲上满载孩童的校车,国际上有什么影响

走读新生
2024-06-26 11:16:08
仅播1集,收视率破2,不愧是你们苦苦盼了两年的都市黑马剧

仅播1集,收视率破2,不愧是你们苦苦盼了两年的都市黑马剧

娱乐圈笔娱君
2024-06-27 10:56:07
官方:姜萍月考83分成绩截图属实,其参赛电脑是借的

官方:姜萍月考83分成绩截图属实,其参赛电脑是借的

鲁中晨报
2024-06-27 21:15:05
国足18强抽签出炉!孙继海和多位媒体人士也表达了自己的看法!

国足18强抽签出炉!孙继海和多位媒体人士也表达了自己的看法!

人生趣事悟语
2024-06-28 03:32:48
北大数学教授袁老师证明姜萍100%造假,愿出钱邀请姜萍来北大面谈

北大数学教授袁老师证明姜萍100%造假,愿出钱邀请姜萍来北大面谈

學人Scholar
2024-06-27 13:45:38
最年长的现任中央政治局委员,从团长到军委副主席,他用了34年

最年长的现任中央政治局委员,从团长到军委副主席,他用了34年

李昕言温度空间
2024-05-15 17:17:55
0比3拉开差距!南美双雄时代结束,网友:巴西队被阿根廷甩远了

0比3拉开差距!南美双雄时代结束,网友:巴西队被阿根廷甩远了

体坛知识分子
2024-06-28 06:20:02
风流成性?这一次,再多的名利都救不了43岁的“海王”马苏

风流成性?这一次,再多的名利都救不了43岁的“海王”马苏

蜉蝣说
2024-06-27 17:47:20
B站网红奈妮直播大瓜,直播“喷泉”遭封,录屏视频曝光

B站网红奈妮直播大瓜,直播“喷泉”遭封,录屏视频曝光

新动察plus
2024-06-27 11:36:50
剧情拉满!美国1-2巴拿马 维阿拳击对手染红巴洛贡爆杆世界波

剧情拉满!美国1-2巴拿马 维阿拳击对手染红巴洛贡爆杆世界波

直播吧
2024-06-28 08:04:59
2024-06-28 08:36:49
cnBeta.COM
cnBeta.COM
提供IT行业即时资讯
51672文章数 68758关注度
往期回顾 全部

数码要闻

MediaGone 500:把固态硬盘、闪存盘和智能手机当做午餐

头条要闻

驻法大使卢沙野:目前在台湾的政权是一个叛乱政权

头条要闻

驻法大使卢沙野:目前在台湾的政权是一个叛乱政权

体育要闻

排名只比国足高14位 他们打进欧洲杯16强

娱乐要闻

李雪琴北大学历情况被扒,牵扯多人

财经要闻

欧洲,准备对阳光电源逆变器动手了?

科技要闻

再不上市,哪吒快活不下去了

汽车要闻

32万公里实车直播拆解 极氪凭事实证明实力!

态度原创

本地
时尚
教育
手机
军事航空

本地新闻

冷知识:东北雪糕才是最早的网红雪糕

四十岁的女人穿衬衫,美得不只是岁月

教育要闻

安徽中考题,分式方程的化简求值问题,数字大

手机要闻

曝iPhone 16电池更容易更换:苹果引入新技术

军事要闻

“环太平洋2024”多国联合演习开幕 中国专家解读

无障碍浏览 进入关怀版