AMD RDNA架構技術傳奇王啟尚專訪：專注每瓦性能小晶片有大優勢

隨著NVIDIA RTX 40系列、AMD RX 7000系列的陸續登場，新一輪顯卡大戰漸入高潮。那麼，“後發制人”的AMD RX 7900系列有什麼特異之處呢？

近日，被業界譽為“RDNA架構技術傳奇的”AMD Radeon技術事業部工程研發高級副總裁王啟尚(David Wang)先生，接受了快科技的專訪，暢聊了多個有關AMD RX 7900系列顯卡的前沿技術話題。

王啟尚在美國華盛頓大學獲得電子工程碩士學位，曾先後就職於LSI Logic、Axil、SGI、ArtX等半導體晶片企業，2000年加入ATI，2006年隨著ATI被收購而進入AMD。

王啟尚具備極其豐富的圖形晶片設計、開發與管理經驗，在AMD(ATI)眾多GPU產品的研發中起到了不可替代的領導作用，尤其是RDNA系列GPU架構，以超高能效而聞名。

↑↑↑王啟尚

——HYPR-RX：一鍵開啟大禮包

AMD Adrenalin驅動軟體中提供了豐富、強大的功能，但事實上，很多遊戲玩家拿到卡之後直接就開始玩了，很少會去仔細研究一些特別的功能會帶來什麼樣的好處，造成浪費，也不利於發揮顯卡的全部實力和潛力。

為此，AMD開發了HYPR-RX，將Adrenalin驅動內的多個功能與技術整合在一起，包括Radeon Boost性能加速、Radeon Anti-Lag抗延遲、RSR超解析度等，可以一鍵開啟。

這樣，它們就能協同，由此能夠降低延遲也能提供相比原來設置最高達85%的更強性能。

該功能預計2023年上半年正式上線，目前僅支持RX 7000系列顯卡，暫時不會支持RX 6000系列或更老的型號。

——FSR：從超解析度到補幀

截止10月底，AMD FSR超解析度技術已經獲得超過216款遊戲的支持，其中85款已支持FSR 2。

FRS技術的下一個版本是FSR 2.2，重點進一步改善了畫質，比如減少快速移動物體的重影。

它和FSR 2.1/2.0同樣基於時域放大算法，不需要依靠AI或者專用的AI硬體，就可以實現出色的畫質和性能。

據介紹，AMD和3DMark所屬公司UL Solutions也有很好的合作。目前，3DMark有針對NVIDIA DLSS和Intel XeSS的功能進行測試，正在擴展功能測試項目，其中就會包括一項專門針對AMD FSR的測試，它將使用FSR 2.2幫助用戶在他們的硬體上進行FSR的性能和圖像質量的對比。

王啟尚透露，在縮放技術上，AMD的下一個重大版本將是FSR 3，支持AMD Fluid Motion Frame補幀技術，預計可帶來比FRS 2最多2倍的幀率，技術上會有很大的優勢。

FSR 3技術預計將在2023年推出，更多細節會在後續出。

從目前的情況看，筆者認為AMD FSR 3不再是傳統的超解析度縮放技術，而是全新的幀生成技術，通過AI計算、匹配直接在渲染幀之間插入新的幀，從而大幅提升幀率，並保持同樣甚至更好的畫質。

這樣一來，FSR 3同樣也不會取代 FRS 2.x，而是並行發展，遊戲也可以同時支持，讓玩家根據自己的需求和喜好來使用。

——多媒體：支持AV1、賽靈思AI助陣

多媒體一直是AMD GPU的強項，視頻編解碼、媒體串流等方面每一代都有創新技術和應用。

RDNA3架構集成了全新的媒體引擎，支持AV1視頻編解碼，其內部的頻率也增加了1.8倍，所以基本上能夠將一些編碼和解碼的時間相比上代節省一半。

AMD還在其中集成了賽靈思開發出的內容自適應機器學習技術，能夠提升文本內容在編碼解碼時的質量，目前只適用Windows 11上的DX應用程式，且目前它的解析度只支持1080p解析度及以下。不過王啟尚表示，未來將繼續加強該技術並擴展至比較高的解析度。

該技術是AMD高級媒體框架(AMF)的一部分，基於著色器，改進編碼時文本的質量，不過僅支持Windows 11 DX應用，且最高支持解析度為1080p。

王啟尚還詳細介紹了AMD的兩種串流新技術，都集成在AMD錄制與直播中。

一是“串流預分析”(Pre-Analysis)，可以分析視頻幀中每個區塊(block)的時間活動和空間復雜性，並提取其他視頻屬性，比如場景變化、靜態場景、運動強度等。

根據所使用的前向緩沖區的深度，該技術可以在實際編碼之前，分析最多達40幀畫面，讓編碼器提前得知未來幀的特徵，從而採取主動行動，提升視頻畫面質量。

此外，它還可以提高編碼效率，為視頻流中與其他塊有著更高相關性的塊提供更多的碼率。

還有“串流預濾波”(Pre-Filtering)，一個低通感知保邊濾波器，可以去除幀畫面中視覺上不重要的細節，而過濾強度可以根據視頻內容、目標碼率自適應，最終能在同等碼率下實現更高質量的編碼。

——功耗：專注每瓦性能、小晶片設計有個最大優勢

性能之外，用戶對於CPU處理器、GPU顯卡的功耗問題越來越重視，畢竟，節能減排是社會大趨勢，是綠色可持續發展的根本。在這方面，高能效的RDNA架構正好契合。

王啟尚表示，提高性能以滿足不斷增長的現代遊戲需求是當下、未來的重點，需要不斷改進晶片的設計和架構，但是提高性能的時候，一定又會產生更多的功耗，所以必須思考如何改變核心架構。

RDNA3就充分體現了AMD在能效即每瓦性能上所花費的大量心思，在RDNA2 提高54％的基礎上，再一次提高了54％，顯示了AMD有能力、有決心繼續打造更節能、更安靜、更低溫的顯卡。

比如RX 7900 XTX，對比上代RX 6950 XT，提供了大幅提高的性能和大量的新體驗，但功耗只增加了25W。

更進一步，AMD在設計RX 7900系列顯卡時，選擇了性能、功耗的更佳平衡點，希望帶來更有能效的顯卡，不需要額外的轉接頭，兩個標準的8針電源接口即可供電。

而說到功耗控制，就繞不開製造工藝，其越先進，就可以帶來越好的能效。

RX 7900系列使用的是台積電5nm製造工藝，而競品RTX 40系列使用的是所謂台積電4N。

對此，王啟尚表示，AMD和台積電在製造工藝優化方面有著很深的合作關系，RX 7900系列基於AMD與台積電合作開發且調優的5nm工藝，具有更高的功率、性能和更小面積。

對其他廠商可能使用市場叫法來命名其5nm製程工藝，王啟尚表示不發表任何評論。

此外，RX 7900系列第一次引入了chiplet小晶片設計，就像AMD銳龍、霄龍處理器做的那樣。

王啟尚提出，chiplet設計的最大優勢，就是便於選擇使用最合適的製造工藝完成適當的工作，比如計算核心使用比較昂貴的5nm工藝，實現出色的每瓦性能，I/O核心、Infinity Cache高速緩存則使用成熟的6nm工藝，最終在每個價位上實現更強的性能。

——競爭：RX 7900 XTX的真正對手是它！

有趣的是，我們的第一反應是RX 7900 XTX要競爭RX 4090，不過王啟尚表示，從市場定價來講，RX 7900 XTX對標RTX 4080是更合適的，有著額外的8GB GDDR6顯存、更寬的384-bit位寬、領先的DisplayPort 2.1技術等。

順帶一提，王啟尚還確認，RX 7900系列顯卡沒有著色器執行重排序(SER)。

在他看來，在光線追蹤的實現中，將光線遍歷和光線著色混合在一起是沒有必要的。他表示：“你可以看到從RDNA 2到RDNA 3，在光追上面的比較，在性能上面其實有很大的進步，所以我們覺得這樣混在一起對我們架構來說是沒有必要的。”

如果遍歷的速度很快，而著色成本又很高，那麼這種做法顯然是十分有效的，可以提高著色的利用率，並分別處理遍歷與著色的需求。

可以說，RDNA3是王啟尚帶領團隊親手培育養大的又一個好孩子，從種種設計和特性來看已經展現出了不俗的實力，更加讓我們期待它解禁上市後秀出真正的實力。

尤其是在各種高端晶片產品功耗不斷膨脹的情況下，RDNA3依然有著如此出色的能效，以更小的代價實現更好的性能，帶來更好的體驗，值得整個行業思考和借鑒。

↑↑↑王啟尚手持RX 7900 XTX

來源：快科技