買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090

從NVIDIA的第一款RTX 30系列顯卡發布至今已經過去3個多月了,各種性能測試我們也是做了一大堆。相信大家對RTX 3090至RTX 3060 Ti在內的4款NVIDIA GeForce RTX 30系列顯卡(還有RTX 3080以及RTX 3070)已經有一個比較全面的了解了吧。

由於增加了許多的「黑科技」,這代的NVIDIA GeForce RTX 30系列顯卡無論是在本身遊戲性能還是光追的表現方面都比NVIDIA GeForce RTX 20系列顯卡強悍了許多。

不過強歸強,到底強多少,還得有實際的數據才行,而作為一名遊戲玩家,我們最希望知道的還是——這塊RTX 30系顯卡在我要玩的遊戲中表現如何?

雖然在原本的顯卡測試中,我們已經包含了10來款熱門遊戲的表現。但是,這怎麼能夠呢?畢竟每個玩家喜歡的遊戲都不盡相同,只是10來款遊戲肯定不夠全面。既然這樣,那就直接上50款吧!

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090

因此,為了讓大家對於整個NVIDIA GeForce RTX 30系列顯卡有一個更加直觀的認識,我們決定做成一個系列的評測選題,在這一系列選題中,我們將使用不同的顯卡分別對10款熱門光追遊戲及40款近兩年的頂級3A大作,進行實際的遊戲性能測試,方便大家能夠根據自己喜歡的遊戲,找出適合自己的、對應的顯卡。

本篇為該系列選題的第一期,我們將為大家帶來RTX 30系列的核彈顯卡——RTX 3090的性能評測,看看作為NVIDIA目前最頂級的顯卡,在這50款遊戲中,會有怎樣的性能發揮。

RTX 30系列顯卡的新特性:

在RTX 30系列顯卡中,最強的顯卡無疑就是RTX 3090顯卡了。這款NVIDIA Ampere的核彈產品相比20系又有哪些新特性?讓我們一起來看一下!

8K分辨率的支持:

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
RTX 3090宣傳圖

首先需要提一句的是,HDMI 2.1接口已經添加了對8K@60Hz的支持,也就是說只要是顯卡有這個接口,都能輸出8K分辨率。

但是能輸出不代表能夠暢玩遊戲,為了讓玩家在8K分辨率上更加流暢的體驗3A大作,NVIDIA配套推出了DLSS 2.1版本,相比DLSS 2.0版本,2.1的改進就是增加了一個「超高性能模式」,它使用了9倍采樣,以達到更低的渲染分辨率,加上RTX 3090強悍的24GB顯存,讓「暢玩3A大作」變成了現實。

新一代Shader、RT Core以及Tensor Core:

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
全新的Shader、RT Core以及Tensor Core

在全新的着色器中,NVIDIA Ampere架構每個時鍾周期可以進行2次着色器計算,使得NVIDIA Ampere架構達到了30 Shader-TFOPS,是Turing架構11 Shader-TFOPS的2.7倍。

在第二代RT Core中,NVIDIA Ampere架構翻倍了光追中的光線以及三角形計算吞吐量,使其可以達到58的RT-TFOPS,是Turing架構34RT-TFOPS的1.7倍。

在第三代Tensor Core中,NVIDIA Ampere架構的Tensor核心可以自動識別消除不太重要的神經網絡中的權重。因此,新的Tensor核心達到了238 Tensor-TFLOPS,是Turing架構89 Tensor-TFLOPS的2.7倍。

ANNOUNCING RTX IO技術:

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
傳統工作模式中不同讀寫速度所需要的工作核心數量(每個藍框代表一個核心)

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
基於AO API工作模式時 不同讀寫速度與所需核心數量(每個藍框代表一個核心)

正常的遊戲工作流程是CPU復制硬盤中的文件並解壓縮遊戲圖像,然後再交給顯卡進行渲染。

但是由於PCIE 4.0的推出,使得PC的傳輸速率由傳統機械硬盤的100MB/s直接提升到了7GB/s。這時再將硬盤中的文件交給CPU,然後經過一系列的運算處理再經過顯卡渲染,這樣的工作流程顯然過於繁瑣,且由於CPU的限制無法發揮PCIE 4.0高速通道的性能。

而NVIDIA Ampere架構的另一項功能——新IO API則是可以直接從固態硬盤快速加載數據,然後傳輸到GPU顯存,用GPU來進行無損解壓縮。以此,遊戲中即使遇到宏觀的巨大世界和場景,也可以被更加快速的加載出來,更好的發揮了PCIE 4.0的優勢。

GDDR6X顯存技術:

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
PAM4信令功能的GDDR6X顯存

全新NVIDIA Ampere架構部分顯卡採用了與美光合作的GDDR6X顯存,這是首個具有PAM4信令功能的顯存,它採用了以250mV為步進的4個級別電壓分別對2位數據進行編碼。

特點是能夠在相同的時間內,達到傳統GDDR6兩倍的數據傳輸速度(等效顯存頻率翻倍)。

所以,採用了GDDR6X顯存的顯卡,在相同物理顯存頻率的情況下(就是GPU-Z顯示的顯存頻率),等效顯存頻率是GDDR6的2倍。

GDDR6X的等效顯存速率計算公式為:物理頻率(MHz)*8=等效頻率(MHz),等效頻率*2=等效速率(Gbps)即1188MHz*8*2=19Gbps。

而GDDR6的等效速率計算公式為:物理頻率(MHz)*4=等效頻率(MHz),等效頻率*2=等效速率(Gbps)即1750MHz*4*2=14Gbps。

在物理頻率相同的情況下,他們倆的等效顯存速率分別是16倍和8倍的區別。

NVIDIA Broadcast技術:

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
NVIDIA Broadcast直播程序界面

NVIDIA的Broadcast技術是一種直播技術,它是作用於直播行業里邊的,包括但不僅限於虛擬背景(計算主播背景來進行替換)、人像跟蹤(可將主播的背景去掉,僅保留主播本身,適用於在遊戲中展示)和噪聲消除(清楚麥克風的環境噪音以及回聲)。

由於Broadcast技術是使用的NVIDIA顯卡中的Tensor核心來進行計算處理的,所以在直播時對CPU和對顯卡標準場景的負載會大幅度下降。

目前包括鬥魚直播伴侶、嗶哩嗶哩直播姬、甚至是OBS Studio、OBS Studio等直播推流軟件都已經添加對該技術的支持,所以該技術主要應用於使用電腦來進行直播的主播們。

NVIDIA Reflex技術:

如果NVIDIA Broadcast技術僅對直播行業有用,那麼NVIDIA Reflex技術就是為遊戲玩家而生的福利了。

這項技術的作用旨在盡可能的降低用戶操作鼠標、鍵盤時的延遲。

傳統的用戶對鼠標進行操作然後得到反饋的工作流程是:用戶操控鼠標——鼠標產生信號傳遞給CPU——CPU進行操作處理——CPU運算好的資料傳給顯卡——顯卡進行渲染——顯卡傳遞給顯示器。

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
NVIDIA Reflex的工作簡化流程

NVIDIA Reflex主要就是優化了CPU到GPU之間的工作流程,它允許CPU可以將運算好的資料提前丟給顯卡做渲染。省去了用戶操作鼠標後給CPU,然後CPU走排隊流程,等待整個處理序列完事後一起丟給顯卡的時間,(相當於是走了一個插隊流程)。

這樣的好處可以大大降低CPU到顯卡之間的延遲,以便讓顯卡更快速的進行渲染後將圖像丟給顯示器,這項技術尤其是在FPS類遊戲中的表現會更加明顯。

光線追蹤和DLSS技術:

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
傳統的光柵化處理示意圖

光柵化的過程簡單地描述就是光柵引擎根據頂點渲染生成的三角形以人眼所接收到的二維畫面來創建需要渲染的圖像,接着將紋理數據按坐標鋪入該圖像中的三角形,得到完整的畫面數據,再由ROPs將完整的畫面數據填充到屏幕所看到的像素。

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
光線追蹤處理示意圖

而光線追蹤就是通過模擬光的物理行為來提供逼真的光照。光線追蹤通過跟蹤光從觀看者的眼睛穿過虛擬3D場景時將採取的路徑來計算像素的顏色。當它穿越場景時,光可以從一個物體反射到另一個物體(引起反射),被物體阻擋(引起陰影),或者穿過透明或半透明物體(引起折射)。所有這些相互作用被組合以產生然後在屏幕上顯示的像素的最終顏色。

其實這項技術在之前就已經有了,不過那是設計領域,不同於遊戲,設計領域是允許長時間進行渲染從而展現給用戶一副圖像或是一部視頻的。而遊戲是實時變化的,所以這次應用到遊戲領域中的光線追蹤技術又叫「實時光線追蹤」。

和傳統的「工程師預先填充式」的光柵化處理不同,光線追蹤有了「實時演算」的特性,所以它在光影的表現方面會更加的真實——這不僅是玩家們的用戶體驗得到了加強,遊戲設計師們運用該技術也可以更快的完成一幅場景的構建(包括玻璃門、鏡子,光影的安排),省去更多的時間可以讓設計師們有更多的時間去打磨遊戲的場景,劇情,以便提升整體遊戲的質量。

DLSS技術:

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
DLSS及DLSS 2.0效果對比

DLSS又叫「深度學習超級采樣抗鋸齒」。它的特點則是就是直接進行較低分辨率的渲染,然後再對周圍的像素點進行填充,使得畫面的表現更加完整。

由於渲染分辨率的降低,使得顯卡的渲染速度變得更加高效,以此來提升遊戲的流暢度。

不過DLSS是有學習功能的,所以在像素填充時它會去學習更高分辨率下的渲染結果,以達到更好的最終表現,而這就是依賴於NVIDIA的Tensor核心進行計算了。

上圖中我們僅列了DLSS和DLSS 2.0的表現,因為2.1隻是增加了一個超級性能模式(即以更低的分辨率來進行渲染)。

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
《控制》中關閉DLSS(左)和開啟DLSS(右)對比圖

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
《控制》中關閉DLSS(左)和開啟DLSS(右)對比細節圖

通過將上邊的對比圖進行放大,我們可以發現牆上表格的細節在開啟DLSS(右)後表現的更加完整。這是得益於DLSS在之前學習中記錄了高分辨率下的細節,然後在填充時進行了補全。

所以整體而言,DLSS帶來的遊戲表現不僅僅是流暢度提升,畫質反而會有可能得到增強。

測試顯卡技嘉RTX 3090魔鷹介紹:

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090

本次測試使用的顯卡是來自技嘉的GeForce RTX 3090 GAMING OC 24G(下簡稱技嘉RTX 3090魔鷹),該顯卡的定位是高於獵鷹的存在,屬於超頻版,其核心Boost頻率達到了1755MHz(公版RTX 3090頻率為1700MHz)。

該卡採用了3風扇設計,最左邊的為8cm直徑,中間和右邊的風扇則是9cm直徑。

三個風扇均採用了刀刃式扇葉,在每個扇葉的邊緣都設有一個凸起的三角立體造型,再搭配葉面上的導流槽可以為風扇增加更多的進風量。

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090

背面使用了覆蓋式的金屬背板,不過在顯卡的右側部分仍然留有吹透式設計的出風口,可以讓冷風直接通過右邊的風扇吹透顯卡。如果顯卡溫度較低的話,此處的風不僅能夠起到輔助顯卡散熱的作用,還能夠優化機箱內部的風道設計。

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090

顯卡採用了雙BIOS的設計,默認為OC(高頻率)模式,用戶可通過撥動BIOS開關來進入靜音模式,在靜音模式下顯卡的核心Boost頻率則是1725MHz,屆時顯卡的發熱控制會更加出色,風扇旋轉時的噪音也會進一步減少。

即使在OC模式下,顯卡在GPU負載較低時風扇仍會停轉,以達到0噪音的目的。

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090

在外接輔助供電方面,該卡為雙8Pin設計。

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090

該顯卡的供電應為16+3相設計。核心供電為16相,由2顆uPI uP9512R PWM芯片控制,顯存供電為3相,由1顆uPI uP9511R PWM控制。

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090

該顯卡採用了鎂光的D8BGX顯存顆粒,GPU(正反面)左右各4顆,頂部3顆底部1顆共計12*2(正反面)構成了384bit的位寬以及24GB GDDR6X的顯存容量。

測試平台其它硬件介紹:

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090

為了保證顯卡的性能發揮不會因為其它硬件產生瓶頸,這次我們使用了Intel Core i9-10900K處理器以及32GB*2記憶體的硬件配置。

本次測試涉及10款帶光追的遊戲以及40款近兩年的3A級大作,在測試時如果有預設畫質則我們選擇預設畫質的最高檔,如果沒有預設則我們選擇手動將全部選項設置為最高。

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
整體測試硬件平台

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090

本次測試使用的主板為技嘉的Z490 AORUS MASTER,又叫超級雕,是定位屬於次旗艦的主板,該主板支持PCI-E 4.0通道(需搭載11代酷睿處理器),其CPU輔助供電為雙8Pin,是一款及超頻、遊戲性能為一體的高端ATX架構主板。

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090

測試使用的記憶體為芝奇的F4-3600C16D-32GTRG,2條DDR4-3600MHz 16GB容量的記憶體共計組成了雙通道32GB的容量。該記憶體套裝時序為16-16-16-36,電壓為1.35V。其超高的容量可以更好的發揮出技嘉RTX 3090魔鷹這塊目前30系列頂級顯卡的性能。

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090

由於測試項目比較多,所以我們使用了西數的WD_BLACK D10 8TB移動硬盤來作為數據存儲盤,該硬盤轉速為7200RPM,可提供高達250MB/s的讀取速度,作為移動硬盤來說,非常的方便。

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090

由於測試使用的Intel 10核心20線程的頂級處理器i9-10900K,該處理器發熱量比較大,所以我們選擇了安耐美的冰凌360一體式水冷散熱器,該水冷採用了3個風壓可達6.28i毫米水柱的磁懸浮軸承散熱風扇。並使用了一顆支持TDP500W的450L/H強力EF1水泵,在全部360一體式水冷中可以算是頂尖水平了。

4K分辨率下遊戲性能測試:

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
4K分辨率下支持光追的10款遊戲性能表現

註:上圖中,《決勝時刻現代戰爭》不支持DLSS功能,所以僅開啟「光追」特效。

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
4K分辨率下40款3A大作遊戲性能表現

測試小結:

在10款支持光追的遊戲中,我們分別測試了開啟光追及DLSS和關閉光追及DLSS的成績。

可以發現如果同時開啟光追及質量檔的DLSS,只有《決勝時刻17》以及《德軍總部:新血脈》可以達到90幀以上的平均幀。

在40款3A大作中,則只有《全面戰爭:三國》未能達到60幀平均幀的流暢表現。

2K分辨率下遊戲性能測試:

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
2K分辨率下支持光追的10款遊戲性能表現

註:上圖中,《決勝時刻現代戰爭》不支持DLSS功能,黃色條形圖表示遊戲在該分辨率下不支持DLSS功能,所以在測試該項遊戲性能時,僅開啟「光追」特效。

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
2K分辨率下40款3A大作遊戲性能表現

測試小結:

在10款支持光追的遊戲中,只有《賽博朋克2077》以及《看門狗:軍團》和《戰慄深隧:離去》在開啟光追及DLSS後無法達到平均幀90幀以上暢爽遊戲的表現。但均超過了60幀以上平均幀的流暢表現。

而在40款3A大作中,除了《刺客信條:英靈殿》之外,其它遊戲均達到了90幀以上平均幀的暢爽表現。

1080P分辨率下遊戲性能測試:

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
1080P分辨率下支持光追的10款遊戲性能表現

註:上圖中,《決勝時刻現代戰爭》不支持DLSS功能,黃色條形圖表示遊戲在該分辨率下不支持DLSS功能,所以在測試該項遊戲性能時,僅開啟「光追」特效。

買前必看 30系顯卡50款遊戲幀率測試合集:RTX3090
1080P分辨率下40款3A大作遊戲性能表現

測試小結:

在10款支持光追的遊戲中,只有《戰慄深隧:離去》這款遊戲在開啟光追(該遊戲1080P分辨率不支持DLSS)後無法達到平均幀90幀以上暢爽遊戲的表現。其它遊戲均超過了90幀以上平均幀的暢爽表現。

而在40款3A大作中,所有遊戲均達到了平均幀90幀以上的暢爽表現。

來源:遊民星空