一、前言:全新的RDAN3構架浮點性能暴漲2.7倍
在RTX 30系列、RX 6000系列顯卡上市整整2年之後,獨顯市場終於迎來了升級換代。
首先登場的NVIDIA的RTX 4090/4080,如今採用全新RDNA3構架的AMD RX 7900 XT/XTX也來了。
以下是RDNA3構架新技術解析:
1、全新的MCD
AMD新顯卡借鑒了銳龍處理器Chiplets的設計理念,採用了全新的MCM設計。Navi 31擁有6個MCD和1個GCD。
MCD的意思是Memory Cache Die,也就是Infinity Cache緩存和顯存控制器所在的地方,採用的是相對成熟的6nm製程工藝。
單個MCD面積為37mm2,包含16MB Infinity Cache和1個64Bit GDDR6顯存控制器。6個MCD總面積220mm2,組成了384Bit顯存位寬和96MB Infinity Cache無限緩存。
GCD則是Graphics Compute Die,包括流處理器計算單元、VGPR媒體單元、AI加速器和RT光追加速器等。GDC採用的是先進的5nm製程工藝,面積約306 mm2。
如此設計最直接的好處就是可以大幅度降低晶片成本!
一般來說晶片面積越大、良率越低,MCM不僅可以大幅度提升良率,相對不吃性能的部分採用成熟的6nm製程工藝也能有效降低成本。
2、雙發射設計的流處理器單元
很多人可能對於RX 7900 XTX電晶體數量倍增,而流處理器數量卻只增加了20%感到疑惑!
RDNA3採用了全新的流處理器設計方案,每組CU單元中包含64個FP32單元和64個INT32單元。每個FP32與INT32單元可以根據需求進行整數或者浮點運算。
在極限狀態下,所有的FP/INT32單元都進行浮點運算時,一組CU單元相當於擁有12個流處理器。擁有96組CU的RX 7900 XTX理論上最多可以等效於12488個流處理器,浮點能力則高達61TFLOPS,要知道上代RX 6950 XT的浮點運算性能只有23TFLOPS,直接暴漲2.7倍。
這種設計理念與NVIDIA的Ada Lovelace構架異曲同工,不同的是,NV將INT32單元也算作了流處理器,因此RTX 4090的流處理器數量看上去很恐怖。
此外,RDAN3還加入了全新的AI運算單元(AI Accelerator),作用類似於N卡的Tensor Core。每組CU中擁有2個AI Accelerator,可以提升2.7倍的相關運算效率,如果有涉及到深度學習的運算,GPU的運行效率會得到很大的提升。
3、其他
在RDNA3 GPU中,AMD首次引入了DP2.1接口,傳輸帶寬從DP1.4的32Gbps提升蛋到了54Gbps,可以輸出8K165Hz或4K480Hz的畫面,並且支持12 bit色深,能顯示680億種色彩。
由於RX 7900 XTX擁有384Bit位寬,配合20GHz的GDDR6顯存,在顯存帶寬上不像前代那麼吃緊。
因此RDNA3縮減了Infinity Cache容量,但同時將緩存運行頻率提升到了2.3GHz,使得Infinity Cache擁有5.3TB/的恐怖帶寬,相當於前代的2.7倍。
在FSR方面,目前主推的是FSR 2.0,目前已有85款主流遊戲提供支持,隨後會推出FSR 2.2進一步改善畫質。
對於NVIDIA重點宣傳單 DLSS 3,AMD也有應對計劃,預計將於明年第一季度推出FSR 3.0,支持全新的AMD Fluid Motion Frame補幀技術,相比FSR 2.0最多可以帶來2被的幀率提升。
RX 7900 XTX首發售價7999元,與上代RX 6900 XT相同,比競品RTX 4080便宜了1500元。而RX 7900 XT的售價則是7499元,看上去性價比反而還比不上貴了500元的RX 7900 XTX。
此次我們將會使用撼訊RX 7900 XTXX紅魔來進行測試。
來源:快科技