AMD RDNA架構技術傳奇王啟尚專訪:專注每瓦性能 小晶片有大優勢

隨著NVIDIA RTX 40系列、AMD RX 7000系列的陸續登場,新一輪顯卡大戰漸入高潮。那麼,“後發制人”的AMD RX 7900系列有什麼特異之處呢?

近日,被業界譽為“RDNA架構技術傳奇的”AMD Radeon技術事業部工程研發高級副總裁王啟尚(David Wang)先生,接受了快科技的專訪,暢聊了多個有關AMD RX 7900系列顯卡的前沿技術話題。

王啟尚在美國華盛頓大學獲得電子工程碩士學位,曾先後就職於LSI Logic、Axil、SGI、ArtX等半導體晶片企業,2000年加入ATI,2006年隨著ATI被收購而進入AMD。

王啟尚具備極其豐富的圖形晶片設計、開發與管理經驗,在AMD(ATI)眾多GPU產品的研發中起到了不可替代的領導作用,尤其是RDNA系列GPU架構,以超高能效而聞名。

AMD RDNA架構技術傳奇王啟尚專訪:專注每瓦性能 小晶片有大優勢 ↑↑↑王啟尚

——HYPR-RX:一鍵開啟大禮包

AMD Adrenalin驅動軟體中提供了豐富、強大的功能,但事實上,很多遊戲玩家拿到卡之後直接就開始玩了,很少會去仔細研究一些特別的功能會帶來什麼樣的好處,造成浪費,也不利於發揮顯卡的全部實力和潛力。

為此,AMD開發了HYPR-RX,將Adrenalin驅動內的多個功能與技術整合在一起,包括Radeon Boost性能加速、Radeon Anti-Lag抗延遲、RSR超解析度等,可以一鍵開啟。

這樣,它們就能協同,由此能夠降低延遲也能提供相比原來設置最高達85%的更強性能。

該功能預計2023年上半年正式上線,目前僅支持RX 7000系列顯卡,暫時不會支持RX 6000系列或更老的型號。

——FSR:從超解析度到補幀

截止10月底,AMD FSR超解析度技術已經獲得超過216款遊戲的支持,其中85款已支持FSR 2。

FRS技術的下一個版本是FSR 2.2,重點進一步改善了畫質,比如減少快速移動物體的重影。

它和FSR 2.1/2.0同樣基於時域放大算法,不需要依靠AI或者專用的AI硬體,就可以實現出色的畫質和性能。

據介紹,AMD和3DMark所屬公司UL Solutions也有很好的合作。目前,3DMark有針對NVIDIA DLSS和Intel XeSS的功能進行測試,正在擴展功能測試項目,其中就會包括一項專門針對AMD FSR的測試,它將使用FSR 2.2幫助用戶在他們的硬體上進行FSR的性能和圖像質量的對比。

王啟尚透露,在縮放技術上,AMD的下一個重大版本將是FSR 3,支持AMD Fluid Motion Frame補幀技術,預計可帶來比FRS 2最多2倍的幀率,技術上會有很大的優勢。

FSR 3技術預計將在2023年推出,更多細節會在後續出。

從目前的情況看,筆者認為AMD FSR 3不再是傳統的超解析度縮放技術,而是全新的幀生成技術,通過AI計算、匹配直接在渲染幀之間插入新的幀,從而大幅提升幀率,並保持同樣甚至更好的畫質。

這樣一來,FSR 3同樣也不會取代 FRS 2.x,而是並行發展,遊戲也可以同時支持,讓玩家根據自己的需求和喜好來使用。

AMD RDNA架構技術傳奇王啟尚專訪:專注每瓦性能 小晶片有大優勢

——多媒體:支持AV1、賽靈思AI助陣

多媒體一直是AMD GPU的強項,視頻編解碼、媒體串流等方面每一代都有創新技術和應用。

RDNA3架構集成了全新的媒體引擎,支持AV1視頻編解碼,其內部的頻率也增加了1.8倍,所以基本上能夠將一些編碼和解碼的時間相比上代節省一半。

AMD還在其中集成了賽靈思開發出的內容自適應機器學習技術,能夠提升文本內容在編碼解碼時的質量,目前只適用Windows 11上的DX應用程式,且目前它的解析度只支持1080p解析度及以下。不過王啟尚表示,未來將繼續加強該技術並擴展至比較高的解析度。

該技術是AMD高級媒體框架(AMF)的一部分,基於著色器,改進編碼時文本的質量,不過僅支持Windows 11 DX應用,且最高支持解析度為1080p。

王啟尚還詳細介紹了AMD的兩種串流新技術,都集成在AMD錄制與直播中。

一是“串流預分析”(Pre-Analysis),可以分析視頻幀中每個區塊(block)的時間活動和空間復雜性,並提取其他視頻屬性,比如場景變化、靜態場景、運動強度等。

根據所使用的前向緩沖區的深度,該技術可以在實際編碼之前,分析最多達40幀畫面,讓編碼器提前得知未來幀的特徵,從而採取主動行動,提升視頻畫面質量。

此外,它還可以提高編碼效率,為視頻流中與其他塊有著更高相關性的塊提供更多的碼率。

還有“串流預濾波”(Pre-Filtering),一個低通感知保邊濾波器,可以去除幀畫面中視覺上不重要的細節,而過濾強度可以根據視頻內容、目標碼率自適應,最終能在同等碼率下實現更高質量的編碼。

——功耗:專注每瓦性能、小晶片設計有個最大優勢

性能之外,用戶對於CPU處理器、GPU顯卡的功耗問題越來越重視,畢竟,節能減排是社會大趨勢,是綠色可持續發展的根本。在這方面,高能效的RDNA架構正好契合。

王啟尚表示,提高性能以滿足不斷增長的現代遊戲需求是當下、未來的重點,需要不斷改進晶片的設計和架構,但是提高性能的時候,一定又會產生更多的功耗,所以必須思考如何改變核心架構。

RDNA3就充分體現了AMD在能效即每瓦性能上所花費的大量心思,在RDNA2 提高54%的基礎上,再一次提高了54%,顯示了AMD有能力、有決心繼續打造更節能、更安靜、更低溫的顯卡。

AMD RDNA架構技術傳奇王啟尚專訪:專注每瓦性能 小晶片有大優勢

比如RX 7900 XTX,對比上代RX 6950 XT,提供了大幅提高的性能和大量的新體驗,但功耗只增加了25W。

更進一步,AMD在設計RX 7900系列顯卡時,選擇了性能、功耗的更佳平衡點,希望帶來更有能效的顯卡,不需要額外的轉接頭,兩個標準的8針電源接口即可供電。

而說到功耗控制,就繞不開製造工藝,其越先進,就可以帶來越好的能效。

RX 7900系列使用的是台積電5nm製造工藝,而競品RTX 40系列使用的是所謂台積電4N。

對此,王啟尚表示,AMD和台積電在製造工藝優化方面有著很深的合作關系,RX 7900系列基於AMD與台積電合作開發且調優的5nm工藝,具有更高的功率、性能和更小面積。

對其他廠商可能使用市場叫法來命名其5nm製程工藝,王啟尚表示不發表任何評論。

此外,RX 7900系列第一次引入了chiplet小晶片設計,就像AMD銳龍、霄龍處理器做的那樣。

王啟尚提出,chiplet設計的最大優勢,就是便於選擇使用最合適的製造工藝完成適當的工作,比如計算核心使用比較昂貴的5nm工藝,實現出色的每瓦性能,I/O核心、Infinity Cache高速緩存則使用成熟的6nm工藝,最終在每個價位上實現更強的性能。

——競爭:RX 7900 XTX的真正對手是它!

有趣的是,我們的第一反應是RX 7900 XTX要競爭RX 4090,不過王啟尚表示,從市場定價來講,RX 7900 XTX對標RTX 4080是更合適的,有著額外的8GB GDDR6顯存、更寬的384-bit位寬、領先的DisplayPort 2.1技術等。

順帶一提,王啟尚還確認,RX 7900系列顯卡沒有著色器執行重排序(SER)。

在他看來,在光線追蹤的實現中,將光線遍歷和光線著色混合在一起是沒有必要的。他表示:“你可以看到從RDNA 2到RDNA 3,在光追上面的比較,在性能上面其實有很大的進步,所以我們覺得這樣混在一起對我們架構來說是沒有必要的。”

如果遍歷的速度很快,而著色成本又很高,那麼這種做法顯然是十分有效的,可以提高著色的利用率,並分別處理遍歷與著色的需求。

可以說,RDNA3是王啟尚帶領團隊親手培育養大的又一個好孩子,從種種設計和特性來看已經展現出了不俗的實力,更加讓我們期待它解禁上市後秀出真正的實力。

尤其是在各種高端晶片產品功耗不斷膨脹的情況下,RDNA3依然有著如此出色的能效,以更小的代價實現更好的性能,帶來更好的體驗,值得整個行業思考和借鑒。

AMD RDNA架構技術傳奇王啟尚專訪:專注每瓦性能 小晶片有大優勢 ↑↑↑王啟尚手持RX 7900 XTX

來源:快科技