老黃擠爆牙膏 Ada Lovelace顯卡性能值得期待

在時隔兩年之後,NVIDIA終於推出Ada Lovelace架構顯卡,首款產品GeForce RTX 4090將於10月12日正式上市。RTX 4080 16GB/12GB也將於11月上市。

與Ampere使用三興8nm工藝相比,Ada Lovelace架構的製造工藝終於不再“拖後腿”,台積電工藝帶來巨大的能效提升,同時也讓顯卡頻率更高。

憑借更多的CUDA和更高的頻率,GeForce RTX 4090(82.6TFlops)理論傳統性能(FP32)是RTX 3090 Ti(約40 TFlops)的兩倍。

就算16GB版RTX 4080(48.7 TFlops)還是比RTX 3090 Ti高23.5%左右,對比RTX 3080 Ti(34 TFlops)高40%。

有趣的是,12GB版RTX 4080(40 TFlops)的理論傳統性能與RTX 3090 Ti相同,意味著Ada Lovelace首發的三款產品,理論性能至少達到上一代旗艦產品的水平,旗艦產品的對比甚至實現翻番。

雖然FP32無法直接提現到遊戲、專業加速軟體中,但NVIDIA至少實現了在發布會上性能翻番的目標。

在Ada Lovelace的緩存系統存在極大的差異。老黃在發布會上隻字未提3D封裝的緩存,意味著這一代GPU以然是傳統設計方案。

不過沒有3D緩存系統並非不可理解,隔壁AMD在銳龍7 5800X3D(105W熱設計功耗)上的選擇就可以看到,3D封裝必然要犧牲一定的散熱性能。考慮到首款三款顯卡(285W-450W)都是發熱大戶,使用3D封裝帶來的性能提升,或許不遠不如提升散熱性能重要。

在顯存上,三款顯卡更是體現出巨大的差異,這些差異未來將會體現到全系列的產品線上。

不同核心將會直接決定GPU的顯存位寬,AD102最高384-bit位寬,未來不排除RTX 3080 Ti/uper會使用AD102核心。

同時將顯存位寬削減至320-bit。AD103核心最高顯存位寬定在256-bit,除了某些缺陷特別嚴重的核心需要屏蔽更多單元外。

至於AD104核心,它的最高顯存位寬為192-bit,對應RTX 4070系列顯卡(12GB版RTX 4080大機率是原RTX 4070)。

老黃擠爆牙膏 Ada Lovelace顯卡性能值得期待

在具體的顯存上,採用AD102核心的GeForce RTX 4090使用與上一代相同的384-bit位寬和21Gbps的GDDR6x顯存,顯存帶寬與RTX 3090 Ti相同的1008GB/,但至少沒有開“倒車”。

至於為何沒有使用RTX 4080 16GB的23Gbps顯存,筆者猜測有兩種可能,第一是顯存產能較低,無法滿足NVIDIA的需求。第二就是考慮到顯卡的供電和散熱需求,無法搭載發熱更高的23Gbps顯存。

與AD102核心不同,使用AD103核心的GeForce RTX 4080 16GB在顯存帶寬上就開了“倒車”,主要原因還是顯存位寬從上一代RTX 3080的320-bit看到256-bit。

雖然顯存頻率從19Gbps提升到23Gbps,但帶寬依然從760GB/降低至736GB/。只是,未來不排除NVIDIA會推出256-bit位寬的RTX 4070 Ti/uper。

最後是使用AD104核心的RTX 4080 12GB,在192-bit位寬和21Gbps顯存下,其顯存帶寬僅有504GB/,比RTX 3070高12.5%,大幅落後RTX 3070 Ti的604GB/。

如果說RTX 4080 16GB保住80級別定位的話,那RTX 4080 12GB就是拿來湊數的,更准確的命名應該是RTX 4070。

老黃擠爆牙膏 Ada Lovelace顯卡性能值得期待

老黃擠爆牙膏 Ada Lovelace顯卡性能值得期待

用戶最關心的性能方面,NVIDIA官方提供部分遊戲的性能預覽。從給出的數據來看,RTX 4090相對於RTX 3090 Ti,微軟的飛行模擬提升將近一倍。

賽博朋克更是超過4倍。至於為何提升幅度如此之大,應該是NVIDIA精選遊戲有關。兩款RTX 4080對比的是RTX 3080 Ti,提升幅度在1.5倍到3倍之間。

事實上,NVIDIA在Ada Lovelace上堆料,Tensor Core從上一代的320個提升至1400個,並加入從Hopper上下放的各種Transformer Engine引擎,能夠帶來更好的加速訓練效果。最重要的DLSS 3,基於光流的補幀設計可以帶來更高的理論幀率。

在功耗不變的情況下,NVIDIA採用比8nm先進兩代的4nm工藝,能耗比的提升應該會遠超想像。

最直觀的對比,就是從Maxwell(GTX 980 Ti)到Pascal(GTX 1080 Ti),兩者的熱設計功耗都是250W,但實際遊戲性能提升超過60%,這就是Ada Lovelace的遊戲表現值得期待的原因。

寫在最後:

從目前公開的數據來看,NVIDIA Ada Lovelace的性能提升是非常值得期待。NVIDIA精選了部分對自家顯卡優化更到位的遊戲來展示性能提升,雖然實際遊戲提升不如宣傳,是同樣值得期待。

另外,NVIDIA兩款RTX 4080顯卡更像為清空RTX 30系列顯卡做出來的產品,兩款顯卡明顯有“智商稅”的嫌疑。筆者認為NVIDIA不會大量出貨這兩款RTX 4080,在完成30系顯卡清倉後更新產品線,帶來更具性價比的產品,以滿足用戶的使用需求。

老黃擠爆牙膏 Ada Lovelace顯卡性能值得期待

來源:快科技