黄仁勋发布全新GPU，专为大模型打造，微软谷歌Meta排队预定

GGV有话说：

近期，黄仁勋在台北大学毕业典礼上的演讲在圈内刷屏。这是一年一度的台北 Computex 大会，计算的世界，黄仁勋的主场。

他发布了全新的 GPU，瞄准下一代 AI 产品。外媒的评价是「强到荒谬」（ridiculous supercomputer）。

今天的GGView，就带大家一起了解了解这款专为大模型打造的全新GPU。

来源：Founder Park

小甜点这就是游戏的未来

发布会一开始，黄仁勋就发布了用于游戏的 AI 模型渲染工具 ACE（Avatar Cloud Engine）。

「这就是游戏的未来！」黄仁勋激动地说。

他展示了一段 demo，在一个 Cyberpunk 风格的酒馆里，玩家可以与 AI NPC 自由对话。

玩家说话时会有录音提示，NPC 可以很快地作出回应。据黄仁勋表示，只需要为 NPC 写好设定，不需要写脚本，就可以建立一个性格鲜明的 AI NPC。

ACE 是一个自定义 AI 模型的工坊服务（foundry service）。NPC 通过自然语言交互，具有「智能化表现」，这能大大改善玩家的游戏体验。开发者可以使用 ACE for Games 来搭建、部署定制的语音、对话和动画 AI 模型，进行中间件、工具和游戏的开发。

ACE 整个套件包括三部分：

Omniverse Audio2Face，用于将语音转换为匹配的角色表情。

ACE 来源于英伟达和创业公司 Convai 的合作。

这是 Convai 公司的产品演示视频。

新超算主打一个大模型的「大」

黄仁勋带来了今天最重磅的发布，新款超级 GPU DGX GH200。

这款超算针对 LLM、推荐系统和数据分析工作复杂的大模型开发，通过 NVLink 互连技术和 NVLink Switch System，让 256 个 GH200 超级芯片相连，作为一整个 GPU 运行。英伟达上一代系统通过 NVLink 只能连接 8 块芯片。

「这是一个 GPU，」黄仁勋说。

DGX GH200 架构相比上一代将 NVLink 带宽提升了 48 倍以上，在单个 GPU 上通过简单编程，就能够提供大型 AI 超级计算机的能力。

它提供了 1 exaFLOP 的性能，所有芯片共享 144TB 内存。对比 2020 年发布的 DGX A100，内存扩大近 500 倍。

黄仁勋透露，目前 Google Cloud、Meta 和微软已经排队预定了 DGX GH200，用于生成式 AI 相关业务。英伟达还计划将新品设计作为蓝图提供给云服务和其他大企业。

据英伟达官方透露，DGX GH200 将于今年年底上市。Grace Hopper 超级芯片已经全线投入生产。

同时，英伟达还在使用 DGX GH200 打造一台更大的超级计算机，NVIDIA Helios，将搭配 4 个 DGX GH200 系统，通过 NV 自家的 Quantum-2 InfiniBand 网络互连，就是说 1024 个 Grace Hopper 超级芯片，小学乘法。今年年底发售。

干销售还是那句老话：越买越赚

黄仁勋一如既往，现场干起了销售。他至少重复了 5 遍：「The more you buy, the more you save.」

对比 CPU。

1000 万美元的成本，960 个 CPU 的数据中心，11GWh 功率，能处理 1x LLM 的数据量。

用他们的 GPU 呢，还是 1000 万美金，48 个 GPU 的数据中心，3.2GWh 功耗，44x LLM 的处理效率。

如果你就要达到 11GWh 的功耗，那么花 3400 万美金，172 个 GPU 的服务器，可以处理 150x LLM。

或者你只需要处理 1x LLM 的数据量，那么 40 万美金，2 块 GPU，0.13GWh。

几张 PPT 他切过来切过去，反复对比。

「That"s right, the more you buy, the more you save. That"s NVIDIA.」

黄氏销售的秘诀：小学乘法。

H100 也在台上。老黄摆出来一台 H100，说这是现在世界上最贵的计算机，20 万美元，第一个搭载 Transformer Engine 的计算机。

60 磅重（约 54 斤），他说他举得动，但考虑还要继续演讲，算了。