小芯片构架的RDNA 3主打差异化竞争
解读AMD次世代GPU的战略底气
2022年,PC显示领域的竞争更加激烈,AMD也选在2022年底,正式发布了RDNA 3架构与支持该构架的全新一代AMD Radeon RX 7000系列台式显卡,希望以整体台式平台的巨大升级和前沿技术,在竞争中脱颖而出。
增强阵列优势、扩展产品外沿
大家应该还记得,AMD上一次更新RDNA 2架构的AMD Radeon RX 6000系列显卡,还是在2020年,RDNA 2构架一经发布,便取得了相当不错的业内评价和消费者口碑,而且采用RDNA 2构架的移动端显示核心也在今年的笔记本市场中大放异彩,赢得了市场与口碑的双丰收,这也让大家对AMD发布RDNA 3架构充满期待。
AMD高级副总裁,大中华区总裁潘晓明先生为Navi 31发布会致发言词
在此次发布会上,AMD高级副总裁,大中华区总裁潘晓明先生对RDNA 3架构可谓寄予厚望,并在开场致辞中说道:“我同大家一样,对于全新一代AMD Radeon RX 7000系列台式显卡与RDNA 3架构,充满了期待与憧憬……正如全新AMD Radeon RX 7000系列台式显卡一样,AMD将一如既往的为广大玩家和行业带来优秀的产品。”
了解AMD的朋友都知道,AMD一直都在努力推动3A平台战略,即在PC行业同时推动AMD的CPU、GPU和Chipset(芯片组)的应用,并形成相互加成、相互助力的产品组合,基于硬件向游戏、行业应用、数据中心提供阵列化的服务,尤其是游戏,一直是AMD获得巨大消费者拥趸的品牌入口。事实上,今天AMD的愿景早已超出了即有领域,AMD的锐龙处理器、Radeon显卡、云游戏服务早已向新一代的游戏机,包括PS5、Xbox跟Valve Steam Deck,以及汽车市场(最新的特斯拉电动车)中提供出色的游戏体验,这一切,正是建立在AMD多年的技术积淀之上。
在未来一段时间中,RDNA 3构架正是提供这些服务的基础,在此次的Navi 31(RDNA 3架构GPU核心的研发代号)线上发布会上,AMD首先展示的便是首先采用RDNA 3架构的两款产品——RX 7900 XTX跟RX 7900 XT,借助这两款显卡的解读,让我带大家一起了解RDNA 3构架的特点,并深入剖析AMD在GPU领域上的布局。
具有前瞻性的设计目标
AMD Radeon技术事业部工程研发高级副总裁王启尚先生展示全新一代AMD Radeon RX 7000系列台式显卡
在此次发布会中,我们的老朋友——AMD Radeon技术事业部工程研发高级副总裁王启尚先生作为主讲人,重点解决了新发布的产品特点。志不强者智不达!作为AMD树立次世代显示核心标杆的RDNA 3构架,在设计之初便设定了三个前瞻性目标:
追求在每瓦性能方面的领先地位,使游戏玩家能够合理地提升它们的性能;
支持更快、更高分辨率的新一代的显示器;
通过AMD全新的软件功能和解决方案,来提供新一代的游戏体验
可以看到,AMD的新一代GPU产品不再以纯粹堆砌晶体管数量,或者说单一的性能指标作为衡量GPU进步的指标,这也是充分发发挥构架优势和工艺制程带来的产品目标改变——体现在RNDA 3上,新构架实现了54%的每瓦性能(能耗比)的提升。而且这一理念并非是RNDA 3就做出的改变,其实在AMD的前三代产品:从Vega到RDNA,从RDNA到RDNA 2,均非常看重每瓦性能指标的提升——从Vega到RDNA 3,三代产品总共实现了超过350%的累计的提升。
除了每瓦性能指标外,另两在提升表现在GPU输出的显示能力、软件功能和整体解决方案之上:近年来显示设备的的硬件也处于高速增长中,GPU必须拥有超前的输出能力的匹配能力;不仅如此,在GPU的市场竞争中,单一的硬件性能已经不再是决定成败的惟一因素,软硬结合才是提供出色用户体验的关键。在过去数年中,AMD不断推出并更新软件和整体方案层面的软实力,诸如AMD超威卓越平台、AMD FSR 2.0等新技术纷纷加入到GPU平台之中,提供了优秀的整体用户体验。
首次将小芯片架构引入到GPU之中
聊完RDNA 3构架的设计目标,我们再来看看该构架的具体创新。
RDNA 3构架最为重要的创新便是采用了Chiplet(以下简称“小芯片”)的架构,这个构架其实我们并不陌生,此前在锐龙跟EPYC(霄龙)产品线上均采用了同类技术,只不过RDNA 3是首次采用该构架的GPU。小芯片架构的原理说来并不复杂,它是将不同的制程工艺应用在GPU的不同功能区间上:针对核心运算的引擎采用的是5nm制程工艺,被称为GCD,可实现更为出色的每瓦性能;GDDR 6显存接口则采用相对成熟的6nm的制程工艺打造,被称为MCD,值得注意的是,MCD中加入了第二代的高速缓存Infinity Cache技术。
进一步打开RDNA 3构架,可以看到GPU共拥有一个GCD和6个MCD组成,在DIE上,GCD的面积为300mm²,而单个MCD的面积为37mm²,这样的设计不仅能够降低成本,也能提升DIE上的利用率。正是通过小芯片架构,RDNA 3构架GPU可拥有高达580亿个晶体管。
GCD核心进步1:统一的计算单元
作为显示核心的GCD,由三个全新的单元组成:统一的计算单元、新的显示引擎和新的双媒体引擎(Dual Media Engine)。可以留意到,AMD这次定义RDNA 3构架的计算单元前加上了一个定语——“统一”,什么叫统计的计算呢?可以理解为一个高度紧密集成的单元,也就是在图形渲染时,在人工智能和光线追踪之间共享计算资源,以提升更高的DIE上单位面积性能比。实现资源共享的关键在于通用的寄存器,AMD称之为VGPR。RDNA 3构架的VGPR比RDNA 2构架多50%,能充分利用5nm制程带来的优势,进一步封装出更多的晶体管,使得晶体管密度增加了165%。这样的芯片设计也带来了体积更小、速度更快、更节能的新构架。
在RDNA 3构架的GCD中,采用了全新的Stream Processor流处理器,这也是GPU显示核心中最基础的运算单元。新构架的流处理器采用了双路的Dual Issue指令分发单元,可以向Wave 32的 SIMD Unit发出两路不同的指令,这意味着,除了数据可以并行使用(RDNA 2功能),指令传达也可以双路并行,这大大提升了计算单元中的运行效率,也更加节省能耗。
正是通过统一计算单元,将运算指令紧密地结合到统一的计算单元当中,使得新构架的AI加速能力提升了多达2.7倍,可以让RDNA 3构架显卡能够满足未来应用需求对AI能力的高需求;
另一方面,统一的计算单元也能进一步优化光线追踪,它主要通过新的着色器指令集、针对ray box sorting(Ray Box排序)和traversal(遍历)多项的优化,实现光线追踪性能的提升,而这一能力的提升也高达50%,这使得AMD显卡在光线追踪上与对手差距大大缩短。
AMD还发现,很多游戏和工作负载的瓶颈更容易卡在前端工作分配和命令处理的效率上,一味提升后端着色器性能是解决不了这方面问题的。所以在RDNA 3构架上,便采用了全新的Decoupled Clocks(解耦时钟)。Decoupled Clocks的机制可以理解为一个独立电源管理器,也就是让前端和后端着色器分别跑在合适的频率之上,主要是提高了前端频率,达到2.5GHz,而让后端跑在较低的2.3GHz上,仅这一项,便节省25%的用电量,也解决了前端的性能瓶径。
GCD核心进步2:新的显示引擎(Radiance Display Engine)
在GCD中,新的Radiance Display Engine也是相当明显的进步。它拥有业界首个能够搭载在高性能显卡游戏上的DisplayPort 2.1的接口,大为提升相对未来显示设备的匹配能力,也是为未来以4K作为游戏主流分辨率而生的。这个接口拥有前所未有的54Gbps Display Link的带宽,可以支持4K@480Hz或者8K@165Hz的高分(分辨率)高刷(刷新率)能力,每通道12位色深可以渲染出让人惊艳的最高可达680亿种颜色。通过全新显示引擎,实现了RDNA 3构架的第二项设计目标。
GCD核心进步3:全新的双媒体引擎(Dual Media Engine)
GCD中引入的全新的双媒体引擎Dual Media Engine,是为了满足最新媒体标准与相应格式的支持。多媒体性能一直是AMD的优势项目,可以看到新的双媒体引擎支持AVC跟HEVC2个同步解码或者同步编码的直播,也支持8K@60Hz的AV1编码跟解码能力,尤其值得注意的是,新引擎支持AI提升视频编码质量。比起RDNA 2,双媒体引擎通过提升内部频率,性能比前者提升了1.8倍,在实际编解码操作中,基本能够节省一半的时间。
正是通过这些改进,使RDNA 3的计算性能要比RDNA 2的计算性能高了2.7倍,浮点运算性能达到61 TFLOPS。且通过小芯片设计的RDNA 3构架实现了对5nm工艺制程的更优化利用,总体提升了15%的频率和54%的能效。
汇总RDNA3 GPU特点:
-
首次在GPU中引入小芯片设计,对5nm工艺进行优化,频率提升15%,能效提升54%;
-
统一的高密度集成计算单元,提升DIE上晶体管密度165%,AI加速能力提升了多达2.7倍,光追性能提升1.5倍;
-
峰值带宽提升2.7倍,浮点性能高达61TFlops;
-
每时钟周期双路指令发射,提长前端频率,效率更高、能耗更低;
-
全新显示、媒体引擎,原生支持DP 2.1、支持8K@60Hz的AV1编解码;
AMD Radeon RX 7900 XT & AMD Radeon RX 7900 XTX性能解读
从参数上来看,此次全新发布的RDNA 3架构台式平台旗舰级独立显卡都拥有相当不错的素质,以AMD Radeon RX 7900 XTX为例,它拥有96个RDNA 3的统一计算单元、2.3赫兹的游戏频率,并配有24GB,384bit位宽的GDDR6显存。此外它支持最新的DisplayPort 2.1跟AV1编码解码,整个卡只有355W的功耗,作为旗舰级产品,这是相当不错的表现;比之略低的AMD Radeon RX 7900 XT,则拥有84个同样的计算单元、2 GHz的游戏频率、20GB、320bit位宽的GDDR6的显存,同样也支持DisplayPort 2.1以及AV1,全卡为300W的功耗。
可以看到,这两块显卡均是基于4K游戏为基础的高性能显卡,AMD Radeon RX 7900 XTX的性能更是达到AMD前代旗舰的1.7倍,光线追踪性能提升1.6倍。
而它的性能,也是面向4K游戏推出的,可以看到4K分辨率下,各种游戏均有相当不俗的表现。值得一提的是,AMD Radeon RX 7900 XT和AMD Radeon RX 7900 XTX的整体能耗控制得相当低(相对竞品旗舰产品),用户完全不需要升级机箱电源便能适配。正因其出色的能耗比,我们也会RDNA 3的移动端GPU抱有相当大的期望,对于向轻薄发展的笔记本等产品而言,能耗比指标比单纯的性能指标更为关键,我们完全可以期待AMD明年凭借RDNA 3的移动端独立显卡打个翻身仗。
进一步完善AMD GPU的软件护城河
同样在此发布会上,AMD提供了FSR 3.0的前瞻预览,并公布了全新的AMD Smart Access Memory(AMD显存智取技术)的技术。AMD Smart Access Memory可大为提升RDNA3构架GPU的潜力,大幅提高系统性能。
FSR技术上的推进不可谓不迅速,截至10月底,该技术已经拥有216款的游戏支持,其中85款支持最新的FSR 2.X版本,在最新版的FSR 2.2上,包括《极限竞速:地平线5》等一大批游戏大作均会得到支持,该游戏在4K的分辨率下,RX 7900 XTX独显开启FSR可实现三位数的fps。AMD还提到,预计在2023年发布FSR 3.0中会加入全新的补帧技术——AMD Fluid Motion Frames,它能生成额外的帧以实现最多两倍的fps。
在RDNA3 Navi 31 GPU的发布会上,我们通过下一代显卡的关键指标可以看出很多趋势:首先,RDNA 3是一个比RDNA 2在基础构架上拥有更大创新,这也让AMD在未来的GPU市场策略拥有了更大发挥空间;其次,RDNA 3构架是AMD在GPU上首次打出差异化竞争的第一张牌,不再采用跟随战术也意味着AMD有了反超的底气和决心;最后,AMD扩展了自己的战术外沿,以自己一向所长的游戏口碑为基石,向PC以外的领域扩张,在GPU上,后期的想象空间无比巨大。
加载更多