网易首页 > 网易号 > 正文 申请入驻

Nature:探秘世界最快超算的一天

0
分享至


新智元报道

编辑:乔杨

【新智元导读】在美国田纳西州东部的山区,一台名为Frontier的破纪录超算为科学家提供了前所未有的机会,让他们得以研究从原子到星系的一切。

超算建设如火如荼,无论是主权AI还是科技巨头,都在源源不断地给英伟达输血、建数据中心。

而在这之前,截止到2023年12月,世界上运算速度最快的超算,是位于美国田纳西州橡树岭的Frontier,也被称为OLCF-5。

Frontier配备的是AMD的CPU和GPU,有5万个处理器(其中包含3.8万个GPU),运算速度为1.102 exaFLOPS,即每秒1.102百亿亿(1018)次浮点运算。

这个速度甚至比10万台笔记本同时工作还要更快,而且在2022年首次亮相时,Frontier还破了一个纪录——第一次突破了百亿亿次运算速度的门槛。


Frontier超算的覆盖面积比两个篮球场还要大

之所以要追求如此卓越的速度和规模,是为了满足各领域前沿科学研究中模拟计算的需要。

Frontier十分擅长创建模拟,并能同时捕捉到大尺度的模式和小尺度的细节,比如微小的云滴如何影响气候变暖的速度。

如今,研究人员们从世界各地登录Frontier,创建从亚原子粒子到星系的一切尖端模型,包括模拟蛋白质进行药物发现和涉及、模拟湍流以改进飞机发动机,以及训练能和谷歌、OpenAI竞争的开源LLM。

但是,就在今年四月的一天,Frontier的运作出现了一点意外。

Frontier所在的田纳西州橡树岭国家实验室科学主任Bronson Messer表示,为了为了跟上世界各地科学家们的要求,Frontier的功耗急剧上升,峰值达到了约27兆瓦,足以为大约1万个家庭供电。


这也为超算的冷却系统带来了挑战,用Messer的话说,「机器像一条被烫伤的狗一样在运行」。

根据2023年的统计,Frontier共有1744个用户,遍布18个国家,贡献的计算和数据支撑了至少500篇已经公开发表的论文。

探秘Frontier「大脑」内部

和我们想象的场景类似,Frontier所在的机房类似于一个仓库,运转时发出的电子嗡嗡声稳定而轻柔。

机房中共有74个机架,每个节点分别包含4个GPU和1个CPU。之所以有如此快的运算速度,就是得益于庞大的GPU数量。

实验室主任Messer形容道,「这些GPU运行得非常快,但也愚蠢至极,它们可以一遍又一遍地做同一件事。」

这种同时处理多项运算的功能对超算的快速工作非常有用,但除此之外,也没什么其他任务了。

这种「愚蠢至极」的背后,是一种通用性,各领域的科学家都可以通过定制代码来运行GPU。

Frontier的运转日夜不停,同样连轴转的还有负责运营、维护的工程团队。

负责建造这台超算的工程师团队来自惠普公司,其中一位技术人员Corey Edmonds表示,他们有一个工程团队会对Frontier进行持续监控,判断是否存在故障迹象。

比如其中一位夜班人员Conner Cunningham的工作时间就是晚7点到早7点,负责用十多个监视器关注网络和建筑物的安全,并监控当地天气,确保Frontier正常运转。

实际上,大多数夜晚都是「平安夜」,Cunningham一般只需要巡查几次,其余时间都可以在工位上学习。

「这项工作有点像消防员,如果发生任何事,需要有人在岗监控。」

助力大科学

虽然Frontier日夜不停地运转,但研究人员想要申请到使用机会,也并不是一件容易的事。

科学主任Messer和其他3位同事负责使用提案的评估和批准,他们去年共批准了131个项目,通过率约为1/4,

申请人需要表明其项目需要利用整个超算系统才能获批,一般用于对各种时间和空间尺度进行建模。

Frontier每年共有约6500万个节点时(node-hour)可用,研究人员得到的最常见的分配额度为50万个节点时,相当于全系统连续运行三天。

Messer表示,相比其他数据中心,研究人员在Frontier上获得的计算资源大约多出十倍。


Frontier拥有超过5万个处理器,并采用液冷

有了更快的运算速度、更多的计算资源,研究人员们就能做出更加雄心勃勃的「大科学」。

比如,在原子级精度精确地模拟生物过程,像是溶液中的蛋白质或核酸如何与细胞其他部分发生相互作用。

今年5月,有学者用Frontier模拟了含有超过1550亿个水分子的立方体形状的水滴,大小约为人类头发宽度的十分之一,是有史以来规模最大的原子级模拟之一。

短期内,研究人员希望模拟细胞器来为实验室提供信息;此外他们还希望将这些高分辨率的模拟结果,与X射线自由电子激光器的超快成像相结合,以加速发现。

这些工作都是为今后更大的目标做铺垫——从原子开始对整个细胞进行建模。

有了Frontier,气候模型也变得更加精确。


去年,气候科学家Matt Norman和其他研究人员使用Frontier运行了分辨率为3.25公里的全球气候模型,其中还结合了分辨率更加精细的复杂的云层运动。

为了创建长达数十年的预测模型,Frontier的计算能力是十分必要的,而且需要用上整个系统的算力才能做到。

对于一个适用于天气和气候预测的模型,至少需要每天进行一年的模拟运行。

Frontier每天可以模拟1.26年,这个速度可以使研究人员能够创建比以前更准确的50年预测。

如果换到其他计算机上运行,要达到相同的分辨率,同时考虑云的影响,计算速度则会慢得多。

在更大的宇宙级尺度上,Frontier也能带来更高的分辨率。

匹兹堡大学的天体物理学家Evan Schneider也在使用Frontier,研究银河系大小的星系如何随着年龄的增长而演化。

他们创建的星系模型跨越四个数量级,最大规模可达约10万光年。而在Frontier之前,以类似的分辨率模拟的最大结构是矮星系,质量约为五十分之一。

Frontier对AI意味着什么

作为曾经的世界第一,Frontier的地位显得更加独特,因为这台超算是为数不多的属于公共部门的设备,而非由工业界主导。

由于AI领域的研究往往需要吞噬庞大的算力,学术界和工业界的成果存在巨大的鸿沟。

有学者统计过, 2021 年,96%的最大的AI模型来自工业界。平均而言,工业界模型的规模是学术模型的近30倍。

这种差异在投资金额方面也很明显。美国的非国防公共机构在2021年提供了15亿美元支持AI研究。同年,全球工业界支出超过3400亿美元。

而自从GPT-4、Gemini Ultra等商业LLM发布以来,两者之前的差距又被进一步扩大,这种投资鸿沟导致工业界和学术界可用的计算资源明显不对称。

由于工业界的模型开发以盈利为目的,往往会忽视很多技术发展中必须要面对的重要问题,比如基础研究、低收入群体的需求、评估模型风险、纠正模型偏见等等。

如果学术界要承担起这些责任,就需要能和行业规模匹配的算力,这就是Frontier的用武之地。

一个最典型的例子,科技公司训练出的LLM往往保留不同程度的专有性,但研究者们往往会奖自己开发的模型免费提供给任何人使用。

马里兰大学帕克分校的计算机科学家Abhinav Bhatele表示,这将有助于大学研究人员与公司竞争,「学术界人士训练类似规模模型的唯一方法是获得像Frontier这样的资源。」

Bhatele认为,Frontier等设施在AI领域就是发挥着这种至关重要的作用,让更多的人参与到技术开发中,共享成果。

但值得注意的是,这场国家之间、科技公司和非营利机构间的算力基础设施竞赛,依旧在持续,能力强大如Frontier也终会有跌落的一天。

橡树岭实验室已经在规划Frontier的继任者,名为Discovery,计算速度将提升3~5倍。

作为参考,Frontier相比2014年的最快的超算天河二号A快了35倍,比2004年最快的超算Earth Simulator快3.3万倍。


研究人员仍然渴望更快的速度,但工程师们面临着持续的挑战,其中一方面就是能源。

Frontier的能源效率相比Summit就提升了4倍多,很大程度上是源于不同的冷却方案。

Frontier使用室温水进行冷却,与Summit使用冷水不同。Frontier总能耗的大约3%~4%用于冷却,而Summit 的这一比例为10%。

与 Summit 使用冷冻水不同。Frontier 总能耗的大约 3-4% 用于冷却,而 Summit 的这一比例为 10%。

多年来,能源效率一直是构建更先进超算的关键瓶颈,而在可预见的将来,这个瓶颈估计会持续存在。

实验室主任Messer表示, 「我们本可以在2012年建造一台百亿亿次级别的超算,但提供动力的成本太高了,需要多一两个数量级的电力。」

参考资料:

https://www.nature.com/articles/d41586-024-02832-5


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日本新首相浮出,对华立场曝光,比岸田都难缠!

日本新首相浮出,对华立场曝光,比岸田都难缠!

日风的故事屋
2024-09-18 19:11:13
汤普森打了13年,还没突破3000三分大关,他还有机会吗?

汤普森打了13年,还没突破3000三分大关,他还有机会吗?

大西体育
2024-09-09 09:39:44
中秋最大爆款,不是12万的天籁,证明只卷价格没用了?

中秋最大爆款,不是12万的天籁,证明只卷价格没用了?

路咖汽车
2024-09-18 15:53:03
证券时报头版:外资机构齐发声,看好人民币资产全球吸引力

证券时报头版:外资机构齐发声,看好人民币资产全球吸引力

澎湃新闻
2024-09-18 07:40:18
雪梨发文悼念徐少强!曾未婚为他生下一对龙凤胎,怨了36年终原谅

雪梨发文悼念徐少强!曾未婚为他生下一对龙凤胎,怨了36年终原谅

小seven的囧囧啊
2024-09-17 09:52:24
金喜善这女人颜值真的是绝了!

金喜善这女人颜值真的是绝了!

娱乐的小灶
2024-09-17 10:23:34
华为大战苹果!iPhone16反响平平,华为预定超500万

华为大战苹果!iPhone16反响平平,华为预定超500万

路平说
2024-09-16 14:03:19
张含韵的奶欲更勾人,36岁依旧童颜,身材却饱满成熟韵味满满

张含韵的奶欲更勾人,36岁依旧童颜,身材却饱满成熟韵味满满

打麻将的仔
2024-09-15 16:16:32
海港外战外行!亚冠首轮就“拉胯”,媒体人开炮:不恐怖没自信

海港外战外行!亚冠首轮就“拉胯”,媒体人开炮:不恐怖没自信

奥拜尔
2024-09-18 22:13:24
万元机皇:三星Galaxy S25 Ultra 国内已入网

万元机皇:三星Galaxy S25 Ultra 国内已入网

MR说书先生
2024-09-16 15:44:01
A股:大家做好心理准备,股市,或将重演16年的历史

A股:大家做好心理准备,股市,或将重演16年的历史

生活中的栗子
2024-07-30 16:14:33
吴谨言洪尧婚后首次同框,亲密搂肩女方孕味十足,婚戒设计图抢镜

吴谨言洪尧婚后首次同框,亲密搂肩女方孕味十足,婚戒设计图抢镜

萌神木木
2024-09-18 15:19:20
安徽肥东发生4.7级地震 当地应急局:震中在梁园镇,受损情况仍在排查

安徽肥东发生4.7级地震 当地应急局:震中在梁园镇,受损情况仍在排查

红星新闻
2024-09-18 22:12:08
厂商推出《街霸6》蛛俐手办:化身兔女郎装踹人更刺激

厂商推出《街霸6》蛛俐手办:化身兔女郎装踹人更刺激

游民星空
2024-09-18 17:08:39
改变自己的最快方式:多巴胺戒断

改变自己的最快方式:多巴胺戒断

洞见
2024-09-17 21:33:59
特斯拉表示Model Y用60度电跑出100度效果

特斯拉表示Model Y用60度电跑出100度效果

ZAEKE知客
2024-09-18 18:12:09
今天才知道!电动车“充满不拔”和“没充满拔”,到底哪个更伤车

今天才知道!电动车“充满不拔”和“没充满拔”,到底哪个更伤车

沙雕小琳琳
2024-09-18 17:30:06
姚明一家近照,43岁叶莉依旧漂亮,女儿身高超1米9,大姚发福

姚明一家近照,43岁叶莉依旧漂亮,女儿身高超1米9,大姚发福

大西体育
2024-09-15 17:29:21
徐嘉余说王路飞应该喜欢吃月饼,王楚钦来互动,评论区里笑不活了

徐嘉余说王路飞应该喜欢吃月饼,王楚钦来互动,评论区里笑不活了

阿柒体讯
2024-09-18 09:53:15
超2200万!墨西哥城进入NBA扩军城市候选 其为北美洲人口最多城市

超2200万!墨西哥城进入NBA扩军城市候选 其为北美洲人口最多城市

直播吧
2024-09-18 09:15:11
2024-09-19 00:20:49
新智元
新智元
AI产业主平台领航智能+时代
11545文章数 65593关注度
往期回顾 全部

科技要闻

抖音变长,长过B站

头条要闻

北约称乌使用远程导弹打击俄不会使局势升级 俄方回应

头条要闻

北约称乌使用远程导弹打击俄不会使局势升级 俄方回应

体育要闻

78天5连胜!欧冠疯狂9-2 刷爆69年纪录

娱乐要闻

中秋晚会删于适节目,吴京新片受影响

财经要闻

面对市场逼宫,美联储今晚如何降?

汽车要闻

功能多动力强 长安启源E07也太全面了!

态度原创

健康
教育
家居
手机
艺术

炉甘石洗剂,凭啥成了止痒全能王?

教育要闻

中国体育“两个博览会”将打造成全国赛事IP集散地

家居要闻

自在此间 一刻悠然

手机要闻

iPhone17 Pro系列或搭载台积电2nm工艺处理器 能效大提升

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

无障碍浏览 进入关怀版