同城58网 软件 AMD RDNA3显卡架构深度解析:这一次的秘密不再是硬堆核心数量

AMD RDNA3显卡架构深度解析:这一次的秘密不再是硬堆核心数量

“2020年,基于RDNA 2架构的AMD Radeon RX 6000系列显卡一经亮相便艳惊四座,为PC游戏体验树立行业新标杆。再加上锐龙处理器的助阵,和更多前沿技术和功能的支持,又一次为玩家提供了整体台式平台的巨大升级。”

“AMD一直致力于将优异的AMD Radeon显卡带给发烧友和游戏市场,用不断精进的图形能力令用户收获极致体验,用一款又一款的优秀产品引领行业进入一个全新高性能时代。”

“相信在此之前,大家已经对即将上市的全新一代AMD Radeon RX 7000系列台式显卡和RDNA 3架构有些了解,今天,我们将与大家进一步分享关于这一全新系列的更多细节。”

——AMD高级副总裁、大中华区总裁潘晓明

2022年11月初,AMD方面召开新品发布会,正式推出了最新一代的RDNA3显卡架构,以及首批采用该架构的旗舰显卡产品Radeon RX 7900 XTX与Radeon RX 7900 XT。

AMD Radeon 技术事业部工程研发高级副总裁王启尚手捧Radeon RX 7900 XTX显卡

对于这两款显卡,不知道大家的期待值有多高呢?老实说,因为它们毕竟要等到12月才能正式开售,所以目前还没有太多的性能实测数据。在这样的情况下,绝大多数朋友对于AMD这两款新显卡当前最深的印象,可能就是它们仅需7399/7999元的官方定价了。

是的,我们三易生活并不否认,AMD这一代的旗舰显卡很可能是极富诚意的,但理由却并不仅在于它们的官方定价。事实上,在我们看来,比起“性价比”,AMD此次新品更有诚意的部分,可能更多地反而体现在了RDNA3、或者说Navi31内核的设计方面。

接下来我们就一点点地来抽丝剥茧,为大家分析RDNA3架构此次的几大亮点。

业界首款小芯片设计,成本与良率是极大优势

为什么AMD本世代的旗舰显卡敢于定到比竞争对手低得多的价格?除了市场策略外,一个很重要的因素,就在于它采用了“小芯片(Chiplet)设计”。

简单来说,在Radeon RX 7900 XTX与Radeon RX 7900 XT里的 Navi31核心,本质上其实是由一个“GCD”小核心和多个“MCD”小核心所组成的片上互联阵列。

其中,“GCD”采用的是5nm制程,负责Navi31核心里的所有图形、计算相关的任务。具体来说,它又包含了三个主要组成部分,既统一计算单元、显示引擎,以及双媒体引擎。

相比之下,“MCD”采用的则是更成熟、成本相对较低的6nm制程。这是因为它每一个其实都只包含了64bit的显存控制单元,以及16MB的Infinity Cache缓存。再加上运行频率要远低于计算部分,所以自然也就不需要最新的架构了。

那么问题就来了,这样混合制程的“小芯片”设计,到底会带来怎样的好处呢?用AMD方面的话来说,“小芯片”的设计“充分利用了宝贵的5nm制程”。这也就意味着,通过将不需要高频运行的组件“剔除”出计算核心、改用成本更低的制程来制造,Navi31降低了整体的成本。

为什么我们会这样说?其实证据就在核心面积上。

众所周知,在Radeon RX 6000系列中,首发的RX 6900 XT和RX 6800 XT都是基于Navi21内核,它们虽然实际流处理器规格有着较大的差异(5120SP vs 4608SP),但核心面积都是519平方毫米,官方公布的TDP也都是300W。也就是说在RX 6800 XT里,存在着一部分并未发挥作用的晶体管、实际上还是在耗电的情况。

然而在目前的Radeon RX 7000系列中,6144SP的RX 7900 XTX和5376SP的RX 7900 XT核心面积,却分别为522平方毫米以及485平方毫米,很明显有着一定的差异。同时RX 7900 XT的TDP也从RX 7900 XTX的355W下降到了300W,同样有所不同。

为什么RX 7900 XT的核心面积会比RX 7900 XTX要小一些,功耗也明显更低呢?对比两者的规格不难发现,RX 7900 XT“恰好”少了64bit的显存位宽以及16MB的Infinity Cache缓存,“恰好”是一个MCD小核心的规格。

是的,这也就意味着RX 7000系列不再需要靠“物理屏蔽”大核心里的部分故障单元来制造次旗舰产品,而是直接减少“ 小芯片”的数量,来进行不同档位间产品规格的区分。而这实际上就从一个侧面证明了,新架构里单个小芯片的良品率很可能是非常高的。

当然,既然用了多个小芯片互联的方式来组成最终的“大GPU”,那么核间互联的效率自然也就会成为制约性能发挥的重要因素。好在,AMD早在此前的EPYC、Zen系列CPU中,就已将小芯片互联进行了大量实践。

所以,Navi31也直接采用了源自CPU上的Infinity Fabric互联技术。用AMD Radeon 技术事业部工程研发高级副总裁王启尚的话来说,Navi31的峰值浮点性能达到了Navi21的2.7倍,所以他们也刻意将新核心的Infinity Fabric互联带宽设定为前代的2.7倍,以满足新GPU的峰值运算数据传输需求。

底层架构大改,全新计算单元很有诚意

讲完了此次的整体芯片设计,接下来让我们更深入一点,来看看AMD是如何实现RDNA3性能提升的。

如果此前关注过我们三易生活的相关内容可能还记得,我们曾在批判过另一家厂商的GPU设计思路。当时通过“简单的算术”,我们计算出了这些年来从GTX680到RTX3090Ti历代核心里、每MHz频率/每单核心所对应的单精度浮点算力水平。结果发现,对于N卡来说,至少到RTX3090Ti为止,在长达至少7代的产品序列里,单个SP的单时钟周期性能,其实是完全没有进步的。也就是说,一切的性能进步,都是堆流处理器数量、拉高主频,再用制程压制功耗的结果。

明白了这一点,再来看AMD这边的情况。别的不说,就拿官方承认“对位”的RX 6950 XT和RX 7900 XTX相比,新旗舰的最高主频从2310MHz增长到2500MHz、SP数量从5120增加到6144,倘使AMD方面不改进基础核心架构,那么新旗舰的浮点性能应该大致为前代的(2500/2310)*(6144/5120)*100%=129.6%。

但实际上RX 7900 XTX的浮点性能高达61.44TFlops,达到了前代(23.65TFlops)的2.59倍之多。于是这也就意味着,AMD必然大改了RDNA3的底层SP架构。而且新的单个SP的性能相比老架构,更是直接翻番了的(准确来说,是200.45%)。

那么问题来了,AMD是如何做到这一点的呢?

首先,AMD大幅修改了SP的底层架构,采用了双路的Dual Issue指令分发单元。也就是说现在在一个时钟周期里,RDNA 3的每一个SP能够发出双倍的指令量,它既可以是两路不同的指令,也能够是两个相同的并行计算指令。这样一来,RDNA 3的单核心指令吞吐量,直接就相当于翻倍了。

其次,AMD还显著增加了新架构的近存规模。与前代的Navi21相比,Navi31核心的L1缓存从128KB per Array翻倍到了256KB per Array,同时L2缓存从4MB增加到了6MB。

不得不说,两倍的L1大小、再加上两倍的指令发射设计,这不禁令我们联想到一个十分有趣的可能性。那就是对于Navi31这颗核心来说,你甚至可以认为,它其实是将每个SP做成了原来的差不多“两倍大”,同时“表面上的”SP数量却并没有大幅增长。很显然,比起竞争对手无脑堆SP数量和主频,AMD这样的设计至少是要更“底层”、也显得更有诚意一些的。

显示与媒体设计进化,为8K时代做足准备

最后,在算力、渲染能力大升级的基础上,RDNA3也终于迎来了显示输出设计以及媒体解码性能的“与时俱进”。

一方面,RDNA3内置了新的Radiance Display Engine。作为业界首个搭载于高性能游戏显卡上的、支持DP2.1接口的显示输出引擎,它不仅支持高达54Gbps的带宽(顺带一提,此前Intel Xe架构GPU的“DP2.1”带宽只有40Gbps),而且可以完美兼容4K 480Hz、或是8K 160Hz的视频输出能力,同时具备12bit(680亿色)的专业级色深。

另一方面,作为最新一代的游戏显卡,AMD当然也给RDNA3引入了符合当前玩家需求的“双媒体引擎Dual Media Engine”。它可以同时解码/编码一个AVC以及一个HEVC视频流,也可以支持最新的AV1编解码。

也就是说。理论上它完全可以支持同时录制/直播一个游戏画面,再加上一个摄像头捕捉画面,同时还不会对游戏帧率造成什么影响(因为此时它不额外占用SP的算力)。很显然,这就是专为游戏直播等行业设计的新功能。

当然,为了能够更好地应对“8K”时代的游戏需求,AMD也正在准备全新的FSR3技术。有趣的是,根据官方公布的相关技术信息显示,FSR3相比FSR2会多调用一个被称为“AMD Fluid Motion Frames”的补帧技术,为游戏生成新的画面帧。

对,AMD版本的显卡硬件补帧不久后也会随着RDNA3架构的正式上市面世。大家到时候可以期待一下它的效果,以及其是否能够兼容以往架构的老显卡。

本文来自网络,不代表本站立场,转载请注明出处:https://www.tcw58.com/n/a3799.html

秘密,Navi,架构,系列,旗舰,核心,深度,芯片,的设计,Radeon,架构,王启尚,Navi31,Radeon,显卡

同城58网后续将为您提供丰富、全面的关于秘密,Navi,架构,系列,旗舰,核心,深度,芯片,的设计,Radeon,架构,王启尚,Navi31,Radeon,显卡内容,让您第一时间了解到关于秘密,Navi,架构,系列,旗舰,核心,深度,芯片,的设计,Radeon,架构,王启尚,Navi31,Radeon,显卡的热门信息。小编将持续从百度新闻、搜狗百科、微博热搜、知乎热门问答以及部分合作站点渠道收集和补充完善信息。