您現在的位置是:首頁 > 遊戲

AMD RDNA3顯示卡架構深度解析:這一次的秘密不再是硬堆核心數量

由 三易線上 發表于 遊戲2023-01-27
簡介別的不說,就拿官方承認“對位”的RX 6950 XT和RX 7900 XTX相比,新旗艦的最高主頻從2310MHz增長到2500MHz、SP數量從5120增加到6144,倘使AMD方面不改進基礎核心架構,那麼新旗艦的浮點效能應該大致為前代的

顯示卡核心脫焊還有救嗎

2020

年,基於RDNA 2架構的AMD Radeon RX 6000系列顯示卡一經亮相便豔驚四座,為PC遊戲體驗樹立行業新標杆。再加上銳龍處理器的助陣,和更多前沿技術和功能的支援,又一次為玩家提供了整體臺式平臺的巨大升級。”

“AMD一直致力於將優異的AMD Radeon顯示卡帶給發燒友和遊戲市場,用不斷精進的圖形能力令使用者收穫極致體驗,用一款又一款的優秀產品引領行業進入一個全新高效能時代。”

AMD RDNA3顯示卡架構深度解析:這一次的秘密不再是硬堆核心數量

相信在此之前,大家已經對即將上市的全新一代AMD Radeon RX 7000系列臺式顯示卡和RDNA 3架構有些瞭解,今天,我們將與大家進一步分享關於這一全新系列的更多細節。”

——

AMD

高階副總裁、大中華區總裁潘曉明

2022年11月初,AMD方面召開新品釋出會,正式推出了最新一代的RDNA3顯示卡架構,以及首批採用該架構的旗艦顯示卡產品Radeon RX 7900 XTX與Radeon RX 7900 XT。

AMD RDNA3顯示卡架構深度解析:這一次的秘密不再是硬堆核心數量

AMD Radeon 技術事業部工程研發高階副總裁王啟尚手捧Radeon RX 7900 XTX顯示卡

對於這兩款顯示卡,不知道大家的期待值有多高呢?老實說,因為它們畢竟要等到12月才能正式開售,所以目前還沒有太多的效能實測資料。在這樣的情況下,絕大多數朋友對於AMD這兩款新顯示卡當前最深的印象,可能就是它們僅需7399/7999元的官方定價了。

AMD RDNA3顯示卡架構深度解析:這一次的秘密不再是硬堆核心數量

是的,我們三易生活並不否認,AMD這一代的旗艦顯示卡很可能是極富誠意的,但理由卻並不僅在於它們的官方定價。事實上,在我們看來,比起“價效比”,AMD此次新品更有誠意的部分,可能更多地反而體現在了RDNA3、或者說Navi31核心的設計方面。

接下來我們就一點點地來抽絲剝繭,為大家分析RDNA3架構此次的幾大亮點。

業界首款小晶片設計,成本與良率是極大優勢

為什麼AMD本世代的旗艦顯示卡敢於定到比競爭對手低得多的價格?除了市場策略外,一個很重要的因素,就在於它採用了“小晶片(Chiplet)設計”。

AMD RDNA3顯示卡架構深度解析:這一次的秘密不再是硬堆核心數量

簡單來說,在Radeon RX 7900 XTX與Radeon RX 7900 XT裡的 Navi31核心,本質上其實是由一個“GCD”小核心和多個“MCD”小核心所組成的片上互聯陣列。

AMD RDNA3顯示卡架構深度解析:這一次的秘密不再是硬堆核心數量

其中,“GCD”採用的是5nm製程,負責Navi31核心裡的所有圖形、計算相關的任務。具體來說,它又包含了三個主要組成部分,既統一計算單元、顯示引擎,以及雙媒體引擎。

AMD RDNA3顯示卡架構深度解析:這一次的秘密不再是硬堆核心數量

相比之下,“MCD”採用的則是更成熟、成本相對較低的6nm製程。這是因為它每一個其實都只包含了64bit的視訊記憶體控制單元,以及16MB的Infinity Cache快取。再加上執行頻率要遠低於計算部分,所以自然也就不需要最新的架構了。

那麼問題就來了,這樣混合製程的“小晶片”設計,到底會帶來怎樣的好處呢?用AMD方面的話來說,“小晶片”的設計“充分利用了寶貴的5nm製程”。這也就意味著,透過將不需要高頻執行的元件“剔除”出計算核心、改用成本更低的製程來製造,Navi31降低了整體的成本。

為什麼我們會這樣說?其實證據就在核心面積上。

眾所周知,在Radeon RX 6000系列中,首發的RX 6900 XT和RX 6800 XT都是基於Navi21核心,它們雖然實際流處理器規格有著較大的差異(5120SP vs 4608SP),但核心面積都是519平方毫米,官方公佈的TDP也都是300W。也就是說在RX 6800 XT裡,存在著一部分並未發揮作用的電晶體、實際上還是在耗電的情況。

AMD RDNA3顯示卡架構深度解析:這一次的秘密不再是硬堆核心數量

然而在目前的Radeon RX 7000系列中,6144SP的RX 7900 XTX和5376SP的RX 7900 XT核心面積,卻分別為522平方毫米以及485平方毫米,很明顯有著一定的差異。同時RX 7900 XT的TDP也從RX 7900 XTX的355W下降到了300W,同樣有所不同。

AMD RDNA3顯示卡架構深度解析:這一次的秘密不再是硬堆核心數量

為什麼RX 7900 XT的核心面積會比RX 7900 XTX要小一些,功耗也明顯更低呢?對比兩者的規格不難發現,RX 7900 XT“恰好”少了64bit的視訊記憶體位寬以及16MB的Infinity Cache快取,“恰好”是一個MCD小核心的規格。

是的,這也就意味著RX 7000系列不再需要靠“物理遮蔽”大核心裡的部分故障單元來製造次旗艦產品,而是直接減少“ 小晶片”的數量,來進行不同檔位間產品規格的區分。而這實際上就從一個側面證明了,新架構裡單個小晶片的良品率很可能是非常高的。

當然,既然用了多個小晶片互聯的方式來組成最終的“大GPU”,那麼核間互聯的效率自然也就會成為制約效能發揮的重要因素。好在,AMD早在此前的EPYC、Zen系列CPU中,就已將小晶片互聯進行了大量實踐。

所以,Navi31也直接採用了源自CPU上的Infinity Fabric互聯技術。用AMD Radeon 技術事業部工程研發高階副總裁王啟尚的話來說,Navi31的峰值浮點效能達到了Navi21的2。7倍,所以他們也刻意將新核心的Infinity Fabric互聯頻寬設定為前代的2。7倍,以滿足新GPU的峰值運算資料傳輸需求。

底層架構大改,全新計算單元很有誠意

講完了此次的整體晶片設計,接下來讓我們更深入一點,來看看AMD是如何實現RDNA3效能提升的。

AMD RDNA3顯示卡架構深度解析:這一次的秘密不再是硬堆核心數量

如果此前關注過我們三易生活的相關內容可能還記得,我們曾在批判過另一家廠商的GPU設計思路。當時透過“簡單的算術”,我們計算出了這些年來從GTX680到RTX3090Ti歷代核心裡、每MHz頻率/每單核心所對應的單精度浮點算力水平。結果發現,對於N卡來說,至少到RTX3090Ti為止,在長達至少7代的產品序列裡,單個SP的單時鐘週期性能,其實是完全沒有進步的。也就是說,一切的效能進步,都是堆流處理器數量、拉高主頻,再用製程壓制功耗的結果。

明白了這一點,再來看AMD這邊的情況。別的不說,就拿官方承認“對位”的RX 6950 XT和RX 7900 XTX相比,新旗艦的最高主頻從2310MHz增長到2500MHz、SP數量從5120增加到6144,倘使AMD方面不改進基礎核心架構,那麼新旗艦的浮點效能應該大致為前代的(2500/2310)*(6144/5120)*100%=129。6%。

AMD RDNA3顯示卡架構深度解析:這一次的秘密不再是硬堆核心數量

但實際上RX 7900 XTX的浮點效能高達61。44TFlops,達到了前代(23。65TFlops)的2。59倍之多。於是這也就意味著,AMD必然大改了RDNA3的底層SP架構。而且新的單個SP的效能相比老架構,更是直接翻番了的(準確來說,是200。45%)。

AMD RDNA3顯示卡架構深度解析:這一次的秘密不再是硬堆核心數量

那麼問題來了,AMD是如何做到這一點的呢?

首先,AMD大幅修改了SP的底層架構,採用了雙路的Dual Issue指令分發單元。也就是說現在在一個時鐘週期裡,RDNA 3的每一個SP能夠發出雙倍的指令量,它既可以是兩路不同的指令,也能夠是兩個相同的平行計算指令。這樣一來,RDNA 3的單核心指令吞吐量,直接就相當於翻倍了。

其次,AMD還顯著增加了新架構的近存規模。與前代的Navi21相比,Navi31核心的L1快取從128KB per Array翻倍到了256KB per Array,同時L2快取從4MB增加到了6MB。

不得不說,兩倍的L1大小、再加上兩倍的指令發射設計,這不禁令我們聯想到一個十分有趣的可能性。那就是對於Navi31這顆核心來說,你甚至可以認為,它其實是將每個SP做成了原來的差不多“兩倍大”,同時“表面上的”SP數量卻並沒有大幅增長。很顯然,比起競爭對手無腦堆SP數量和主頻,AMD這樣的設計至少是要更“底層”、也顯得更有誠意一些的。

顯示與媒體設計進化,為8K時代做足準備

最後,在算力、渲染能力大升級的基礎上,RDNA3也終於迎來了顯示輸出設計以及媒體解碼效能的“與時俱進”。

AMD RDNA3顯示卡架構深度解析:這一次的秘密不再是硬堆核心數量

一方面,RDNA3內建了新的Radiance Display Engine。作為業界首個搭載於高效能遊戲顯示卡上的、支援DP2。1介面的顯示輸出引擎,它不僅支援高達54Gbps的頻寬(順帶一提,此前Intel Xe架構GPU的“DP2。1”頻寬只有40Gbps),而且可以完美相容4K 480Hz、或是8K 160Hz的影片輸出能力,同時具備12bit(680億色)的專業級色深。

AMD RDNA3顯示卡架構深度解析:這一次的秘密不再是硬堆核心數量

另一方面,作為最新一代的遊戲顯示卡,AMD當然也給RDNA3引入了符合當前玩家需求的“雙媒體引擎Dual Media Engine”。它可以同時解碼/編碼一個AVC以及一個HEVC影片流,也可以支援最新的AV1編解碼。

也就是說。理論上它完全可以支援同時錄製/直播一個遊戲畫面,再加上一個攝像頭捕捉畫面,同時還不會對遊戲幀率造成什麼影響(因為此時它不額外佔用SP的算力)。很顯然,這就是專為遊戲直播等行業設計的新功能。

AMD RDNA3顯示卡架構深度解析:這一次的秘密不再是硬堆核心數量

當然,為了能夠更好地應對“8K”時代的遊戲需求,AMD也正在準備全新的FSR3技術。有趣的是,根據官方公佈的相關技術資訊顯示,FSR3相比FSR2會多呼叫一個被稱為“AMD Fluid Motion Frames”的補幀技術,為遊戲生成新的畫面幀。

對,AMD版本的顯示卡硬體補幀不久後也會隨著RDNA3架構的正式上市面世。大家到時候可以期待一下它的效果,以及其是否能夠相容以往架構的老顯示卡。

推薦文章