同城58网 软件 黄仁勋发布全新GPU,专为大模型打造,微软谷歌Meta排队预定|GGView

黄仁勋发布全新GPU,专为大模型打造,微软谷歌Meta排队预定|GGView

GGV有话说:

近期,黄仁勋在台北大学毕业典礼上的演讲在圈内刷屏。这是一年一度的台北 Computex 大会,计算的世界,黄仁勋的主场。

他发布了全新的 GPU,瞄准下一代 AI 产品。外媒的评价是「强到荒谬」(ridiculous supercomputer)。

今天的GGView,就带大家一起了解了解这款 专为大模型打造的全新GPU。

来源:Founder Park

小甜点这就是游戏的未来

发布会一开始,黄仁勋就发布了用于游戏的 AI 模型渲染工具 ACE(Avatar Cloud Engine)。

这就是游戏的未来!」黄仁勋激动地说。

他展示了一段 demo,在一个 Cyberpunk 风格的酒馆里,玩家可以与 AI NPC 自由对话。

玩家说话时会有录音提示,NPC 可以很快地作出回应。据黄仁勋表示,只需要为 NPC 写好设定,不需要写脚本,就可以建立一个性格鲜明的 AI NPC。

ACE 是一个自定义 AI 模型的工坊服务(foundry service)。NPC 通过自然语言交互,具有「智能化表现」,这能大大改善玩家的游戏体验。开发者可以使用 ACE for Games 来搭建、部署定制的语音、对话和动画 AI 模型,进行中间件、工具和游戏的开发。

ACE 整个套件包括三部分:

Omniverse Audio2Face,用于将语音转换为匹配的角色表情。

ACE 来源于英伟达和创业公司 Convai 的合作。

这是 Convai 公司的产品演示视频。

新超算主打一个大模型的「大」

黄仁勋带来了今天最重磅的发布,新款超级 GPU DGX GH200

这款超算针对 LLM、推荐系统和数据分析工作复杂的大模型开发,通过 NVLink 互连技术和 NVLink Switch System,让 256 个 GH200 超级芯片相连,作为一整个 GPU 运行。英伟达上一代系统通过 NVLink 只能连接 8 块芯片。

「这是一个 GPU,」黄仁勋说。

DGX GH200 架构相比上一代将 NVLink 带宽提升了 48 倍以上,在单个 GPU 上通过简单编程,就能够提供大型 AI 超级计算机的能力。

它提供了 1 exaFLOP 的性能,所有芯片共享 144TB 内存。对比 2020 年发布的 DGX A100,内存扩大近 500 倍。

黄仁勋透露,目前 Google Cloud、Meta 和微软已经排队预定了 DGX GH200,用于生成式 AI 相关业务。英伟达还计划将新品设计作为蓝图提供给云服务和其他大企业。

据英伟达官方透露,DGX GH200 将于今年年底上市Grace Hopper 超级芯片已经全线投入生产。

同时,英伟达还在使用 DGX GH200 打造一台更大的超级计算机,NVIDIA Helios,将搭配 4 个 DGX GH200 系统,通过 NV 自家的 Quantum-2 InfiniBand 网络互连,就是说 1024 个 Grace Hopper 超级芯片,小学乘法。今年年底发售。

干销售还是那句老话:越买越赚

黄仁勋一如既往,现场干起了销售。他至少重复了 5 遍:「The more you buy, the more you save.

对比 CPU。

1000 万美元的成本,960 个 CPU 的数据中心,11GWh 功率,能处理 1x LLM 的数据量。

用他们的 GPU 呢,还是 1000 万美金,48 个 GPU 的数据中心,3.2GWh 功耗,44x LLM 的处理效率。

如果你就要达到 11GWh 的功耗,那么花 3400 万美金,172 个 GPU 的服务器,可以处理 150x LLM。

或者你只需要处理 1x LLM 的数据量,那么 40 万美金,2 块 GPU,0.13GWh。

几张 PPT 他切过来切过去,反复对比。

「That"s right, the more you buy, the more you save. That"s NVIDIA.」

黄氏销售的秘诀:小学乘法。

H100 也在台上。老黄摆出来一台 H100,说这是现在世界上最贵的计算机,20 万美元,第一个搭载 Transformer Engine 的计算机。

60 磅重(约 54 斤),他说他举得动,但考虑还要继续演讲,算了。

软硬一体服务到位

据黄仁勋透露,全球有 4 万家大公司和 15000 家初创公司使用 NV 的技术,仅去年一年,CUDA 软件的下载量就达到 2500 万次,有的选的都选了 NV。

除了游戏产品和超算,黄仁勋还发布了一系列 AI 相关的产品和服务。

他展示了一系列生成式 AI 的应用,包括一首音乐,输入文本(歌词)就能生成一段曲子。他还兴奋地在现场玩起卡拉 OK。

一个用于创建加速服务器的模块化参考架构 NVIDIA MGX,制造商可以用它快速、经济地打造 100 多种不同的服务器配置,满足各种需求。

Grace Hopper 利用 GenAI,可以将 2D 视频通话转换为 3D 视频,次时代视频通话体验。

英伟达与软银合作,在日本建立分布式数据中心网络。

专用于提高以太网 AI 云性能和效率的网络平台 NVIDIA Spectrum-X,相比传统以太网结构,AI 性能和电源效率提高 1.7 倍。

英伟达还与微软 Windows合作,在 PC 上开发适配 AI 的工具、框架和驱动程序,简化开发者开发和部署 AI 产品。当然是针对 RTX GPU 的 PC。

这是黄仁勋和英伟达的,不知道第多少次高光时刻,但它肯定不是最后一次。

此时此刻的英伟达,市值接近 1 万亿美元,过去五个月增长近 3 倍。

沃顿商学院教授 Jeremy Siegel 接受《财富》采访称,英伟达匹配它过去几天夸张的股价飙涨,它是一家「真正的好公司」,「没人能预测它可能涨到多高」。

「太多了,」黄仁勋在发布会最后说,「我知道太多了。」

(It"s too much, I know it"s too much.)

*本文首发于公众号:Founder Park,如需转载请联系微信:geekparker

温馨提示:虽然我们每天都有推送,但最近有读者表示因平台推送规则调整,有时候看不到我们的文章~

欢迎大家进入公众号页面,右上角点击“设为星标”点亮⭐️,收藏我们的公众号,新鲜内容第一时间奉上!

*文章观点仅供参考,不代表本机构立场。

本文来自网络,不代表本站立场,转载请注明出处:https://www.tcw58.com/n/a78193.html

The,预定,more,模型,芯片,处理,游戏,GGView,you,黄仁,黄仁勋,英伟达,模型,Hopper,微软

同城58网后续将为您提供丰富、全面的关于The,预定,more,模型,芯片,处理,游戏,GGView,you,黄仁,黄仁勋,英伟达,模型,Hopper,微软内容,让您第一时间了解到关于The,预定,more,模型,芯片,处理,游戏,GGView,you,黄仁,黄仁勋,英伟达,模型,Hopper,微软的热门信息。小编将持续从百度新闻、搜狗百科、微博热搜、知乎热门问答以及部分合作站点渠道收集和补充完善信息。