网易首页 > 网易号 > 正文 申请入驻

Nvidia 发布最强 AI 芯片架构 Blackwell 和推理微服务 NIM

0
分享至

原文[1]:Kif Leswing[2]- 2024.03.18

(Nvidia CEO 黄仁勋在 2024 年 3 月 18 日,于加利福尼亚州圣何塞的 Nvidia GTC 人工智能大会上发表了主题演讲。)

周一,Nvidia 推出了新一代的人工智能芯片以及运行人工智能模型的软件。这一消息是在 Nvidia 在圣何塞举办的开发者大会上宣布的,此举是芯片制造商希望巩固其作为 AI 公司首选供应商的地位。

自从 OpenAI 的 ChatGPT 在 2022 年底引发了 AI 热潮以来,Nvidia 的股价已经翻了五倍,而总销售额也增长了三倍以上。Nvidia 的高端服务器 GPU 对于训练和部署大型 AI 模型至关重要。像微软和 Meta 这样的公司已经花费了数十亿美元购买这些芯片。

这一代新的 AI 图形处理器被命名为 Blackwell。首款 Blackwell 芯片被称为 GB200,将在今年晚些时候开始发货。Nvidia 正以更强大的芯片吸引其客户以刺激新订单。例如,公司和软件制造商仍在争先恐后地抢购当前一代的 "Hopper" H100s 和类似的芯片。

Nvidia CEO 黄仁勋周一在加州举行的公司开发者大会上表示:“Hopper 很出色,但我们需要更大的 GPU。”

公司还推出了一个名为 NIM 的创收软件,它将使部署 AI 变得更容易,给客户另一个坚持使用 Nvidia 芯片而不是选择日益增多的竞争者[3]的理由。

Nvidia 的高管表示,公司正在从一个主要以销售芯片为主的供应商,转变为更像微软或苹果那样的平台提供商,其他公司可以在其平台上构建软件。

“Blackwell 不是一个芯片,它是一个平台的名称,”黄仁勋说。

Nvidia 企业副总裁 Manuvir Das 在一次采访中说:“可销售的商业产品是 GPU,而软件是为了帮助人们以不同的方式使用 GPU。当然,我们仍在做这个。但真正改变的是,我们现在真正拥有了一个商业软件业务。”

Das 表示,Nvidia 的新软件将使在 Nvidia 的任意 GPU 上运行程序变得更容易,即使是那些可能更适合部署执行而不是构建 AI 的旧款 GPU。

Das 说:“如果你是开发者,有一个有趣的模型希望人们采用,如果你把它放在 NIM 中,我们会确保它可以在我们所有的 GPU 上运行,这样你就能接触到更多的用户。”

来认识一下,Hopper 的继任者 Blackwell

(Nvidia 的 GB200 Grace Blackwell 超级芯片,配有两个 B200 图形处理器和一个基于 Arm 的中央处理器。)

每两年,Nvidia 都会更新其 GPU 架构,解锁大幅度的性能提升。过去一年发布的许多 AI 模型都是在公司的 Hopper 架构上训练的——这种架构被 H100 等芯片使用,该架构于 2022 年发布。

Nvidia 表示,基于 Blackwell 的处理器,如 GB200,为 AI 公司提供了巨大的性能升级,AI 性能达到 20 万亿次浮点运算,而 H100 的性能为 4 万亿次浮点运算。额外的处理能力将使 AI 公司能够训练更大、更复杂的模型。

该芯片包括 Nvidia 称之为“专门用于运行基于 transformer 的 AI 的 transformer 引擎”,这是支撑 ChatGPT 的核心技术之一。

Blackwell GPU 很大,将两个单独制造的芯片合并成一个由台积电制造的芯片。它也将作为一个名为 GB200 NVLink 2 的整体服务器提供,该服务器结合了 72 个 Blackwell GPU 和其他用于训练 AI 模型的 Nvidia 部件。

(在加利福尼亚州圣何塞的开发者大会上,Nvidia 的 CEO 黄仁勋比较了新的 “Blackwell” 芯片和当前的 “Hopper” H100 芯片的大小。)

亚马逊、谷歌、微软和甲骨文将通过云服务销售 GB200 的使用权限。GB200 将两个 B200 Blackwell GPU 与一个基于 Arm 的 Grace CPU 配对。Nvidia 表示,亚马逊网络服务将用 20,000 个 GB200 芯片构建一个服务器集群。

Nvidia 表示,该系统可以部署一个拥有 27 万亿参数的模型。这甚至比最大的模型,如据报道拥有 1.7 万亿参数的 GPT-4,都要大得多。许多人工智能研究人员认为,拥有更多参数和数据的更大模型可能会解锁新的能力。

Nvidia 并未提供新的 GB200 或其使用系统的成本。根据分析师的估计,Nvidia 基于 Hopper 的 H100,每个芯片的成本在 25,000 至 40,000 美元之间,整个系统的成本高达 200,000 美元。

(Nvidia 还将销售 B200 图形处理器,作为占据整个服务器机架的完整系统的一部分。)

Nvidia 推理微服务

Nvidia 还宣布将新增一款名为 NIM 的产品,即 Nvidia 推理微服务,加入其 Nvidia 企业软件订阅服务。

NIM 使得使用较旧的 Nvidia GPU 进行推理(即运行 AI 软件的过程)变得更容易,并将允许公司继续使用他们已经拥有的数亿 Nvidia GPU。与新 AI 模型的初始训练相比,推理所需的计算能力更少。NIM 使得公司能够运行自己的 AI 模型,而不必向 OpenAI 这样的公司购买 AI 服务。

该策略是让购买基于 Nvidia 的服务器的客户注册 Nvidia 企业版,每个 GPU 每年的许可费用为 4500 美元。

Nvidia 将与 Microsoft 或 Hugging Face 等 AI 公司合作,确保他们的 AI 模型能够在所有兼容的 Nvidia 芯片上运行。然后,开发人员可以使用 NIM 在自己的服务器或基于云的 Nvidia 服务器上高效运行模型,无需进行冗长的配置过程。

Das 说:“在我的代码中,原本是调用 OpenAI 的服务,现在我将改变一行代码,使其指向从 Nvidia 获得的 NIM 服务”

Nvidia 表示,该软件还将帮助 AI 在配备 GPU 的笔记本电脑上运行,而不是在云服务器上运行。

参考资料

[1] 原文: https://www.cnbc.com/2024/03/18/nvidia-announces-gb200-blackwell-ai-chip-launching-later-this-year.html

[2] Kif Leswing: https://www.cnbc.com/kif-leswing/

[3] 日益增多的竞争者: https://www.cnbc.com/2023/12/07/amd-stock-spikes-after-company-launches-ai-chip-to-rival-nvidia.html

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
深圳男子买彩票中2亿,6天后去兑奖,却被工作人员赶了出去

深圳男子买彩票中2亿,6天后去兑奖,却被工作人员赶了出去

今天说故事
2025-05-28 14:49:59
600726,3连板!新股,盘中大涨1500%!电力板块,爆发!

600726,3连板!新股,盘中大涨1500%!电力板块,爆发!

证券时报e公司
2026-05-27 10:34:57
国际空间站里的生活并不美好:臭气熏天、嘈杂脏乱、充斥死皮细胞

国际空间站里的生活并不美好:臭气熏天、嘈杂脏乱、充斥死皮细胞

混沌录
2026-05-26 20:59:18
成都“十五五”规划纲要:为何只字未提“地铁第五期”

成都“十五五”规划纲要:为何只字未提“地铁第五期”

原广工业
2026-05-27 08:47:42
买彩票别再瞎买了?数据公开:换个新方法,下个中奖的可能就是你

买彩票别再瞎买了?数据公开:换个新方法,下个中奖的可能就是你

复转这些年
2026-05-26 18:36:30
苏超口碑大反转!球员因为“淫乱”行为被内部处理,已经不是秘密

苏超口碑大反转!球员因为“淫乱”行为被内部处理,已经不是秘密

酷侃体坛
2026-05-26 18:11:31
住院新规来了!白天治疗、晚上回家,陪护不再全家熬(政策解读)

住院新规来了!白天治疗、晚上回家,陪护不再全家熬(政策解读)

李博世财经
2026-05-26 10:01:57
“再跳,就真长不高了!”家长晒小学生运动视频,网友看不下去了

“再跳,就真长不高了!”家长晒小学生运动视频,网友看不下去了

妍妍教育日记
2026-05-25 19:06:47
多名院士调查发现:吃一口久冻猪肉,就等于服一次毒?真假

多名院士调查发现:吃一口久冻猪肉,就等于服一次毒?真假

叙说医疗健康
2026-05-27 08:00:20
最高法:文某某犯罪情节特别恶劣,手段特别残忍,罪行极其严重,已被执行死刑

最高法:文某某犯罪情节特别恶劣,手段特别残忍,罪行极其严重,已被执行死刑

新京报政事儿
2026-05-26 16:48:03
板桥水库溃坝:24万人一夜消逝,尘封28年,真相远比天灾残酷

板桥水库溃坝:24万人一夜消逝,尘封28年,真相远比天灾残酷

小玡说故事
2026-05-15 20:07:35
谁骂我谁倒霉!透过泽连斯基,看懂什么叫顶级因果律武器

谁骂我谁倒霉!透过泽连斯基,看懂什么叫顶级因果律武器

大又元
2026-05-12 16:13:52
中国五千年最绝妙的4副对联,写尽人生百态,读一遍就懂了半个人生

中国五千年最绝妙的4副对联,写尽人生百态,读一遍就懂了半个人生

诗词天地
2026-05-14 05:59:32
窦唯早期的这身打扮,至今看也很时尚,才华帅气集于一身

窦唯早期的这身打扮,至今看也很时尚,才华帅气集于一身

大江
2026-05-26 11:50:46
美国下狠手!赶人“新规”,百万华人一旦回国,十年都没法再入境

美国下狠手!赶人“新规”,百万华人一旦回国,十年都没法再入境

好贤观史记
2026-05-26 16:53:23
“国家队”宣布收购二手房!不限楼龄,300万70平以下,评论炸锅

“国家队”宣布收购二手房!不限楼龄,300万70平以下,评论炸锅

火山詩话
2026-05-27 10:14:17
吉利正式官宣:5月28日,新车上市

吉利正式官宣:5月28日,新车上市

科技堡垒
2026-05-25 12:25:51
曝台湾省歌手费玉清现状曝光!无儿无女,和女闺蜜互相解决需求

曝台湾省歌手费玉清现状曝光!无儿无女,和女闺蜜互相解决需求

小徐讲八卦
2026-04-02 07:51:08
万万没想到,我国在喜马拉雅山脉南侧还有4座城市,直抵印度腹地

万万没想到,我国在喜马拉雅山脉南侧还有4座城市,直抵印度腹地

抽象派大师
2026-05-27 00:12:32
南京一男子晚上看急诊排队超2小时才看上病 从挂号到输完液折腾近6小时

南京一男子晚上看急诊排队超2小时才看上病 从挂号到输完液折腾近6小时

闪电新闻
2026-05-26 21:14:52
2026-05-27 11:08:49
科技荐文
科技荐文
分享科技相关好文。
35文章数 3关注度
往期回顾 全部

科技要闻

美光股价大涨超19% 市值破万亿美元

头条要闻

媒体:鲁比奥访印 美印之间"蜜里藏刀"三大痛点很微妙

头条要闻

媒体:鲁比奥访印 美印之间"蜜里藏刀"三大痛点很微妙

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

小S晒归宁宴旧照,大S穿吊带裙扎丸子头

财经要闻

ST岩石退市背后:A股“炒壳”时代终结

汽车要闻

试驾新红旗HQ9 2.0T混动+双电机四驱

态度原创

艺术
家居
房产
健康
手机

艺术要闻

这个夏天去苏州过几天清闲安逸的日子

家居要闻

古老而持久 石影扶手椅

房产要闻

招商地产接盘碧桂园!海口这个烂尾豪宅,要彻底改命?

外泌体抗衰,什么时候能用上?

手机要闻

小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度

无障碍浏览 进入关怀版