您現在的位置是:首頁 > 遊戲
AMD RDNA3顯示卡架構深度解析:這一次的秘密不再是硬堆核心數量
顯示卡核心脫焊還有救嗎
“
2020
年,基於RDNA 2架構的AMD Radeon RX 6000系列顯示卡一經亮相便豔驚四座,為PC遊戲體驗樹立行業新標杆。再加上銳龍處理器的助陣,和更多前沿技術和功能的支援,又一次為玩家提供了整體臺式平臺的巨大升級。”
“AMD一直致力於將優異的AMD Radeon顯示卡帶給發燒友和遊戲市場,用不斷精進的圖形能力令使用者收穫極致體驗,用一款又一款的優秀產品引領行業進入一個全新高效能時代。”
“
相信在此之前,大家已經對即將上市的全新一代AMD Radeon RX 7000系列臺式顯示卡和RDNA 3架構有些瞭解,今天,我們將與大家進一步分享關於這一全新系列的更多細節。”
——
AMD
高階副總裁、大中華區總裁潘曉明
2022年11月初,AMD方面召開新品釋出會,正式推出了最新一代的RDNA3顯示卡架構,以及首批採用該架構的旗艦顯示卡產品Radeon RX 7900 XTX與Radeon RX 7900 XT。
AMD Radeon 技術事業部工程研發高階副總裁王啟尚手捧Radeon RX 7900 XTX顯示卡
對於這兩款顯示卡,不知道大家的期待值有多高呢?老實說,因為它們畢竟要等到12月才能正式開售,所以目前還沒有太多的效能實測資料。在這樣的情況下,絕大多數朋友對於AMD這兩款新顯示卡當前最深的印象,可能就是它們僅需7399/7999元的官方定價了。
是的,我們三易生活並不否認,AMD這一代的旗艦顯示卡很可能是極富誠意的,但理由卻並不僅在於它們的官方定價。事實上,在我們看來,比起“價效比”,AMD此次新品更有誠意的部分,可能更多地反而體現在了RDNA3、或者說Navi31核心的設計方面。
接下來我們就一點點地來抽絲剝繭,為大家分析RDNA3架構此次的幾大亮點。
業界首款小晶片設計,成本與良率是極大優勢
為什麼AMD本世代的旗艦顯示卡敢於定到比競爭對手低得多的價格?除了市場策略外,一個很重要的因素,就在於它採用了“小晶片(Chiplet)設計”。
簡單來說,在Radeon RX 7900 XTX與Radeon RX 7900 XT裡的 Navi31核心,本質上其實是由一個“GCD”小核心和多個“MCD”小核心所組成的片上互聯陣列。
其中,“GCD”採用的是5nm製程,負責Navi31核心裡的所有圖形、計算相關的任務。具體來說,它又包含了三個主要組成部分,既統一計算單元、顯示引擎,以及雙媒體引擎。
相比之下,“MCD”採用的則是更成熟、成本相對較低的6nm製程。這是因為它每一個其實都只包含了64bit的視訊記憶體控制單元,以及16MB的Infinity Cache快取。再加上執行頻率要遠低於計算部分,所以自然也就不需要最新的架構了。
那麼問題就來了,這樣混合製程的“小晶片”設計,到底會帶來怎樣的好處呢?用AMD方面的話來說,“小晶片”的設計“充分利用了寶貴的5nm製程”。這也就意味著,透過將不需要高頻執行的元件“剔除”出計算核心、改用成本更低的製程來製造,Navi31降低了整體的成本。
為什麼我們會這樣說?其實證據就在核心面積上。
眾所周知,在Radeon RX 6000系列中,首發的RX 6900 XT和RX 6800 XT都是基於Navi21核心,它們雖然實際流處理器規格有著較大的差異(5120SP vs 4608SP),但核心面積都是519平方毫米,官方公佈的TDP也都是300W。也就是說在RX 6800 XT裡,存在著一部分並未發揮作用的電晶體、實際上還是在耗電的情況。
然而在目前的Radeon RX 7000系列中,6144SP的RX 7900 XTX和5376SP的RX 7900 XT核心面積,卻分別為522平方毫米以及485平方毫米,很明顯有著一定的差異。同時RX 7900 XT的TDP也從RX 7900 XTX的355W下降到了300W,同樣有所不同。
為什麼RX 7900 XT的核心面積會比RX 7900 XTX要小一些,功耗也明顯更低呢?對比兩者的規格不難發現,RX 7900 XT“恰好”少了64bit的視訊記憶體位寬以及16MB的Infinity Cache快取,“恰好”是一個MCD小核心的規格。
是的,這也就意味著RX 7000系列不再需要靠“物理遮蔽”大核心裡的部分故障單元來製造次旗艦產品,而是直接減少“ 小晶片”的數量,來進行不同檔位間產品規格的區分。而這實際上就從一個側面證明了,新架構裡單個小晶片的良品率很可能是非常高的。
當然,既然用了多個小晶片互聯的方式來組成最終的“大GPU”,那麼核間互聯的效率自然也就會成為制約效能發揮的重要因素。好在,AMD早在此前的EPYC、Zen系列CPU中,就已將小晶片互聯進行了大量實踐。
所以,Navi31也直接採用了源自CPU上的Infinity Fabric互聯技術。用AMD Radeon 技術事業部工程研發高階副總裁王啟尚的話來說,Navi31的峰值浮點效能達到了Navi21的2。7倍,所以他們也刻意將新核心的Infinity Fabric互聯頻寬設定為前代的2。7倍,以滿足新GPU的峰值運算資料傳輸需求。
底層架構大改,全新計算單元很有誠意
講完了此次的整體晶片設計,接下來讓我們更深入一點,來看看AMD是如何實現RDNA3效能提升的。
如果此前關注過我們三易生活的相關內容可能還記得,我們曾在批判過另一家廠商的GPU設計思路。當時透過“簡單的算術”,我們計算出了這些年來從GTX680到RTX3090Ti歷代核心裡、每MHz頻率/每單核心所對應的單精度浮點算力水平。結果發現,對於N卡來說,至少到RTX3090Ti為止,在長達至少7代的產品序列裡,單個SP的單時鐘週期性能,其實是完全沒有進步的。也就是說,一切的效能進步,都是堆流處理器數量、拉高主頻,再用製程壓制功耗的結果。
明白了這一點,再來看AMD這邊的情況。別的不說,就拿官方承認“對位”的RX 6950 XT和RX 7900 XTX相比,新旗艦的最高主頻從2310MHz增長到2500MHz、SP數量從5120增加到6144,倘使AMD方面不改進基礎核心架構,那麼新旗艦的浮點效能應該大致為前代的(2500/2310)*(6144/5120)*100%=129。6%。
但實際上RX 7900 XTX的浮點效能高達61。44TFlops,達到了前代(23。65TFlops)的2。59倍之多。於是這也就意味著,AMD必然大改了RDNA3的底層SP架構。而且新的單個SP的效能相比老架構,更是直接翻番了的(準確來說,是200。45%)。
那麼問題來了,AMD是如何做到這一點的呢?
首先,AMD大幅修改了SP的底層架構,採用了雙路的Dual Issue指令分發單元。也就是說現在在一個時鐘週期裡,RDNA 3的每一個SP能夠發出雙倍的指令量,它既可以是兩路不同的指令,也能夠是兩個相同的平行計算指令。這樣一來,RDNA 3的單核心指令吞吐量,直接就相當於翻倍了。
其次,AMD還顯著增加了新架構的近存規模。與前代的Navi21相比,Navi31核心的L1快取從128KB per Array翻倍到了256KB per Array,同時L2快取從4MB增加到了6MB。
不得不說,兩倍的L1大小、再加上兩倍的指令發射設計,這不禁令我們聯想到一個十分有趣的可能性。那就是對於Navi31這顆核心來說,你甚至可以認為,它其實是將每個SP做成了原來的差不多“兩倍大”,同時“表面上的”SP數量卻並沒有大幅增長。很顯然,比起競爭對手無腦堆SP數量和主頻,AMD這樣的設計至少是要更“底層”、也顯得更有誠意一些的。
顯示與媒體設計進化,為8K時代做足準備
最後,在算力、渲染能力大升級的基礎上,RDNA3也終於迎來了顯示輸出設計以及媒體解碼效能的“與時俱進”。
一方面,RDNA3內建了新的Radiance Display Engine。作為業界首個搭載於高效能遊戲顯示卡上的、支援DP2。1介面的顯示輸出引擎,它不僅支援高達54Gbps的頻寬(順帶一提,此前Intel Xe架構GPU的“DP2。1”頻寬只有40Gbps),而且可以完美相容4K 480Hz、或是8K 160Hz的影片輸出能力,同時具備12bit(680億色)的專業級色深。
另一方面,作為最新一代的遊戲顯示卡,AMD當然也給RDNA3引入了符合當前玩家需求的“雙媒體引擎Dual Media Engine”。它可以同時解碼/編碼一個AVC以及一個HEVC影片流,也可以支援最新的AV1編解碼。
也就是說。理論上它完全可以支援同時錄製/直播一個遊戲畫面,再加上一個攝像頭捕捉畫面,同時還不會對遊戲幀率造成什麼影響(因為此時它不額外佔用SP的算力)。很顯然,這就是專為遊戲直播等行業設計的新功能。
當然,為了能夠更好地應對“8K”時代的遊戲需求,AMD也正在準備全新的FSR3技術。有趣的是,根據官方公佈的相關技術資訊顯示,FSR3相比FSR2會多呼叫一個被稱為“AMD Fluid Motion Frames”的補幀技術,為遊戲生成新的畫面幀。
對,AMD版本的顯示卡硬體補幀不久後也會隨著RDNA3架構的正式上市面世。大家到時候可以期待一下它的效果,以及其是否能夠相容以往架構的老顯示卡。
推薦文章
- 女子打車被婆家罰跪,有無精神病都不該如此“嚇唬” | 新京報快評
正如事發後,當地婦聯工作人員所說,無論出於何種目的,婆家對女子進行罰跪罰跑肯定是不對的,是否涉嫌違法,應由警方調查認定...
- 狗狗在什麼條件下會對你不忠?又為什麼那麼忠誠呢?
最後,總之狗狗對人的忠誠是其他動物所無法比擬的,這除了來自於狼的遺傳外,與人類的關係其實是最大的,因為生存能力的逐漸降低,它們對人的依賴性越來越強,再加上人類會刻意的選擇那些“忠誠”的個體,最終讓狗離不開了人...
- 錘子教練預判錯誤,可能到手的勝利,換來一場慘敗
蒙蒂一看你施羅德這麼強,那好我就讓球員去包夾了,隨即施羅德就送出了兩個失誤,而湖人的哈姆教練,不管是臨場的這種應對以及經驗就顯得差了很多,這也是大家非常疑惑為什麼一個沒有主教練經驗的球員,湖人會選擇他來背沃格爾的鍋,不過哈姆這場比賽用的雙高...