它很接近完美了,AMD R9 7950X 全面評測

的 8 月 29 日,時隔將近兩年後,超威半導體(下稱 AMD)發布了他們的新一代的桌面消費級 CPU Zen 4 產品,Ryzen 7000 系列。作為 Zen 3 系列的繼任者,Zen 3 系列產品的優秀性能與能效自然不由分說,其一掃Zen 1 & Zen 2 單線程與 Gaming 相較於對手產品的陰霾,不僅獲得了長足的 IPC 與單線程性能進步,還在 Gaming 上大放異彩。以至於刪除我們上一份稿件的藍色黑惡勢力的 11 代桌面酷睿產品出師未捷直接身先死,直到 12 代酷睿產品的發布才在這些方面扭轉了頹勢。

作為優秀的 Zen 3 產品繼承人,Zen 4 系列的產品自然備受矚目,其不僅對微架構進行了改動,還進行了製程大節點的更新,從 TSMC N7 製程切換到了 TSMC N5 製程,至使其同時獲得了 IPC 與頻率的雙重提升,格外的引人矚目。

在這里,OneRaichu 跟 ECSM_Official 共同合作,我們對 Zen 4 的旗艦產品,AMD Ryzen R9 7950X 進行了相應的測評。

下面,我們將從微架構、互聯、延遲與帶寬、理論性能、遊戲、IPC、功耗與能效幾個方面進行相應的測評。

測試平台:

CPU1: AMD Ryzen R9 7950X

CPU2: Intel Core i9 12900KF

DRAM: DDR5-6000 CL30-38-38-76 AMD=1T,intel: Trefi=262143

其他小參=Auto。

主板:某 Z690 與某 X670E(均為旗艦 or 次旗艦型號)

(由於 AMD 這次採用了各路媒體分批解禁的政策,9/26,9/27 分兩天解禁,這種迷惑操作讓我們暫時不能直接展示借用主板的詳細信息。盡管我們不受 AMD NDA 的拘束,但為了避免連累到板廠,所以這里暫不展示板廠信息)

BIOS 版本:截止 9/24,均為目前最新版本。

GPU:AMD Radeon RX 6900 XTXH @2700MHz 400W VBIOS

散熱:DEEPCOOL 冰堡壘 360 AIO。 規格簡介它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

其中 AMD Ryzen R9 7950X 的睿頻為:

Max=57x, Fmax=58.5x 低於 55℃ 時可見,多線程睿頻視不同壓力變化而變化。

記憶體默認支持到 JEDEC 5200MHz(即默認記憶體不超頻下能支持的最高頻率記憶體,僅限於 1DPC+2CH 或 2DPC+1CH 時)

Intel Core i9 12900K 的核心睿頻為

P:1C 52x,2C 51x,8C 49x

E:1-4E 39x,5-8E 37x

記憶體默認支持到 JEDEC 4800MHz(即默認記憶體不超頻下能支持的最高頻率記憶體,僅限於 1DPC+2CH 或 2DPC+1CH 時) 微架構

1.前端:

相較於 Zen 3 來說,Zen 4 在前端做了一些相應的調整,首先是分支預測器的部分,按照 AMD 的說法,他們調整了分支預測的每周期執行執行能力,致使其達到了每周期兩個指令的分支預測,與之配套的,他們同時調整了 BTB(branch target buffer)的大小,均為增加 50%(L1 BTB 1536 entries,L2 7168 entries)。

除了調整分支預測器之外,為了增強前端的指令解碼能力,更多的調整在微指令緩存上,其從 4k 條目調整為 6.75k,這意味著其可以緩存更多的解碼後指令,降低 Decoder 的解碼壓力。與此同時,AMD 還調整了 ops cache 的輸出能力,其由最多 8 mop/cycle 的輸出能力增加到了 9 mop/cycle。

前端的其他部分則沒有大的改動,其他的改動主要集中在後端部分。

2.後端:

盡管 disptach 部分沒有大的改動,但由於前端的微指令輸出峰值有些許的增加,AMD 選擇了對重排緩沖區(ROB)進行調整,其由 256 entries 增加至 320 entries,大小增加了 25%。

更多的變動出現在 EU 和寄存器部分,首先是指令 Retire 的隊列部分,由於 ROB 部分的增大,微指令在後端的 Retire 過程自然會遭受到相對比上代大一些的壓力,因此在這里 AMD 選擇增加了增加 25% 的指令 retire queue,並且同時還調整了 int 跟 fp 執行單元的可用寄存器數量(int 192 to 224/ fp 160 to 192),以避免整體運行時可能的指令堵塞,以調整 IPC 情況。

另一個顯著的變化是 LD/ST 部分,也就是我們俗稱的訪存部分,雖然 Zen 4 並沒有進一步加寬 LD/ST 的寬度,但是他們對 LD 的隊列情況做了一些調整,按照官方的說法,load queue 增加了22%,由 72 entries 調整為 88 entries,並基於此調整了 DTLB 的尺寸,L1 DTLB 應該是由 64 entries 調整至 96 entries。

3.緩存

L2 由 512 kb 12cycle 調整為 1024kb 14cycle。

4.指令

本代微架構搭配支持 AVX512 指令集,支持的情況與藍色廠商這邊 11th 的情況類似,使用 fusion 的情況完成 AVX512 的實現,但由於僅有 2*256bit 的 ALU,因此 Zen4 上的 AVX512 支持為半吞吐。

5.總結

總的來說,這已經不算是小修小改的微架構級別改進,如果說非要找一個類比的話,我覺得這一次的改進類似藍色廠家從 Skylake 到 Willow cove 的調整,只是幅度沒有對方的這麼大,譬如 ROB size 上 SKL 到 WLC 提升了約 71%,而 Z3 到 Z4 只提升 25%。因此,同頻下獲得的 ipc AMD 官方宣傳在 8-10% 左右,相較於 SKL 到 WLC 的將近 20% 來說略低一些。但,我想紅色廠家的適可而止也僅僅只是為了下一次更好提升做下的鋪墊。 互聯部分它很接近完美了,AMD R9 7950X 全面評測

按照國際慣例,首先進行的是核心互聯部分的測試。

它很接近完美了,AMD R9 7950X 全面評測

使用 microbench CTC 工具,這里不使用求秒工具的原因是因為該工具在跨 CCD 延遲測試 Zen 4 時結果中含有雙倍跨 CCD 延遲,但同 CCD 內延遲測試基本一致。從結果中看,可以看見延遲結果是跟上代差不多,8C 一個 CCX,每一個 CCX 單獨一個 CCD,跨 CCD 需要增加大約 60-62ns 的延遲。看起來還是原先的設計,並沒有做太多的調整。

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

相較於 intel 這邊 12900K 的結果來說,CCX 內延遲好於 intel,CCX/CCD 外延遲較 intel 差一些,總得來說有利有弊。 延遲與帶寬部分

首先是快餐 AIDA64 的延遲帶寬測試,由於這塊板子還沒有國內解禁,在這里我們對該主板進行打碼處理。 它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測它很接近完美了,AMD R9 7950X 全面評測

可以看見 AMD 這邊的確是 CR1 的設置,其延遲為 61.7 ns 比 AMD 官方參考文件里的 64 ns更低,而 intel 這邊對應的延遲為 55.7 ns。

比較明顯的問題出現在 AMD 這邊的帶寬上,盡管這個版本的 AIDA64 已經可以正確識別 7950X,但是帶寬測試相較於 6000 MHz 的理論帶寬值 96 GB/s 來說還是略低了一些,此結果與後面測試的結果相互印證,確認 AIDA64 的帶寬測試並非出現 BUG。

比較有趣的改進出現在了 L2 跟 L3 的帶寬上,可以看見 L2 L3 的 bandwidth 有了明顯的提升。

另外,本代關閉 CCD2,僅剩 CCD1 時仍舊會出現帶寬下降的問題,不過主要出現 read/copy 上。

具體的延遲/帶寬測試見下

1.延遲部分

我們進行了兩個產品(對比 12900K)的內緩存延遲測試(使用 Clamchowder 的測試工具)。

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

可以看見 7950X 在除記憶體之外的其他部分延遲上均實現了對 12900K 的戰勝,除了 intel 這邊 L2 有一段因為 Golden cove 更大的 cover 范圍外。

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

在這里,我們還進行了兩個產品同頻下的內緩存延遲對比,使用 Cycle(周期)表示延遲情況。

可以看見,不同核心在相同頻率下的設計差別,其中:

Intel 這邊是 5 cycle 48kb 1,1.25M 15 cycle L2 以及 63 cycle 30M L3。

AMD 這邊是 4 cycle 32kb L1,1M 14 cycle L2 以及 50 cycle 32M(2CCD*2) L3

考慮到不同 cache 的 way 情況不同,這個 cache 的配置我個人認為在 L1 L3 上AMD 略勝一籌,L2 上兩者基本持平。

2.帶寬部分

完成了延遲部分的測試之後,我們還針對緩存/記憶體的帶寬進行了相應的測試。

首先是單線程讀取/寫入部分。

這里我們直接對單線程帶寬進行了頻率歸一化處理,可以看見實際上同頻的 12 代 P core 的 L1 L2-Read 帶寬相較於 7950X 帶寬略高一些,L3 的帶寬則低一些。 Write 部分帶寬則有些變化,其中 12 代 P core 的 L1 write 部分高於 7950X,而從 L2 開始則低於 7950X。

與上代有些不同,到了 DRAM 部分開始,不論是 read/write,均為 AMD 小有優勢,其中單線程 read 帶寬相較於上代 Zen 3 來說有較大的提升,會為浮點性能帶來比較好的進步,這與 IMC 的改進是密切相關的。

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

我們還測試了指令帶寬,可以看見 7950X 的指令帶寬在 L1 的部分略優於 12 代 P core 這邊,盡管這里擺出沒有 Zen 3 的數據,但實際較於上代 Zen 3 產品來說還是有這明顯的改進。到了 L2 L3 部分,則 NOP8/4 的帶寬兩者持平,到了接近記憶體部分開始,則 12 代 P core 逐漸占據優勢。 它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

類似的,我們還測試了多線程 read 帶寬。 它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

可以看見,AMD 的確在 L2 L3 上做了提速處理,這也因此增加了 L3 的延遲,從上代的 46 cycle 到 50 cycle,從記憶體帶寬的情況上看,似乎的確與 AIDA64 測試的接近(測試位置不同),AMD 的多線程記憶體帶寬確實受到了較大的限制。

由於在 Ryzen 7000 系列的產品中,記憶體控制器頻率 UCLK 以及 IF 總線頻率 FCLK 不再繼續維持 1:1 的情形,其中 UCLK 頻率繼續與記憶體頻率 MCLK 維持在 1:1 的情形,而 FCLK 與二者之比則通常維持在 2:3:3,這里我們使用的是 6000 MHz 的 DDR5 記憶體。

此時的三者頻率為 2000:3000:3000,我們猜測此時的多線程帶寬受限的主要原因是 IF 總線頻率不足,2000  MHz IF總線搭配 Zen 4 IOD 可獲得的最大 read 帶寬可能為 64 GB/s,而這個值遠小於 DDR5 6000 所能提供的 96 GB/s,也因此我們在 2GB size 測試的帶寬為 65 GB/s 附近。

而由於 UCLK 頻率的大幅度提升,其能夠供給給核心的單線程帶寬大幅度提升,去年的 Zen 3 在浮點項目上受限的一個重要原因是盡管每周期能執行的 LD 指令數跟 Golden cove 相同,但其 IMC 能夠供給的最大帶寬僅有 20+ GB/s,今年 Zen 4 上的 IMC 實現了頻率的重要提升,也因此提供了足夠的帶寬,其單線程 read 帶寬甚至來到了 35 GB/s 以上,比競爭對手的 Golden cove 還要多 10% 以上,然而這也來到 3 路 LD 單元的極限吞吐上。

換句話說,也就是記憶體頻率的提升對 Zen 4 這邊的單線程/多線程帶寬提升都不會很大,因為單線程帶寬已經接近極限,而多線程被 IF 總線限制也無法提升,可能記憶體對於 Zen 4 來說提升的只有延遲與部分 Gaming 了。

這種帶寬限制的設計,如果不是當前版本的 BIOS BUG 的話,那麼我想會部分帶寬需求較大的多線程應用造成明顯的瓶頸,譬如部分科學計算,如果您的日常使用中可能偏重這些場景的話,在選擇前請謹慎考慮。 理論性能

由於藍色勢力的阻撓刪帖,再加上認識的朋友以一頓大餐作為抵償,致使 10/20 之前我們無法再一次發布某不知名 24C 32T 產品的測試數據,不過也給了我們更多的時間去測試在新 BIOS 下的表現,所以這里只有 12900K 跟 7950x 的相關數據,敬請各位讀者見諒。

1.Cinebench 部分

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

2.3DMark 物理分 它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測可能是由於帶寬的影響,在 TS 的物理分中,出現了 12900K>7950X 的情況。

3.SuperPi 部分 它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

4.CPU-Z 部分

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

5.解壓縮部分 它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

我們使用了 7Z 的總結果替代了子項。

6.AIDA64 部分

由於部分項目在多次測試時結果不正常,這里我們選擇的項目如下,並且以後的流程都是這些:FP32、FP64、SHA3、Zlib、AES、Queen、SHA1-hash、Photoworxx、FP32-RT、FP64-RT。關於 FPU 部分項目項目,可能是因為適配的原因,我們在測試時會有藍屏 watch dog 的情況,故沒有計入其中。

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

AIDA64 的 FP32/64 支持 AVX512 輸出,從 FP32/64 的表現中也不難看出 Zen 4 的 AVX512 與 11 th/12 th P core 半吞吐 AVX512 接近。如果是全吞吐的 AVX512 的話,在此項目中得益於頻率相較於 12900k 來的更高,實際成績應當接近 intel 這邊的 3x。

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

關於 Photoworxx 項目,由於出現嚴重的帶寬問題,致使 Zen 4 在這個項目中不如 12900K。 測試項目總結:

單線程部分:

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

多線程部分:

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測SPEC 與 Geekbench

在性能測試的基礎上,我們分別使用了 SPEC CPU 2017 1.1.8 以及 Geekbench 5.4.4 進行了對應的 IPC 測試,同時測試了默認頻率的情況以及 3.6GHz 時的情況,僅供參考。

1.SPEC CPU 2017 部分

OS:WSL2-Ubuntu20.04

編譯器:GCC/Gfortran/G++ 10.3.0

測試參數:-O3

無任何第三方記憶體庫(No jemalloc/mimalloc)

對應測試 cfg 附於網盤之中

連結:https://pan.baidu.com/s/1G0yD_FC3yXOJl3tkkyzjSg

提取碼:pa37

歡迎各位取用測試

首先是單線程部分:

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

我們首先測試了默認頻率下單線程性能,在默頻情形下,得益於頻率與 IPC 雙重提升的因素,7950X 的 ST 與 FP 均雙雙領先於 12900K 部分,領先幅度在 7-9% 左右。

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

隨後我們測試了 3.6GHz 下的 IPC 情況,可以看見 Zen 4 在這個環境下實現了對 GLC 的 int 部分 IPC 反超,而 FP 部分則仍舊略輸於 GLC。值得注意的是,如果使用第三方記憶體庫如 jemalloc/mimalloc/qcmalloc 等,測試的結果則會略有不同,主要在 523 等幾個子項上。

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

我們還測試了一下 IPC 損失的情況,可以看見由於 Zen 4 的 private cache 略少,再加上考慮到頻率更高的細節問題,5.7GHz 的 Zen 4 似乎 IPC 損失比 12900K 的 GLC 核心更大一些,當然也跟 Linux 下 intel 這邊的 ST 睿頻能更好的發揮出來有關系。

我們還測試了 LLVM 下的單線程情況,可以看見在 Clang10 下單純的 C/C++ int 項目里,Zen 4 的領先會比在 GCC 中更大一些。

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

除了單線程之外,我們還使用 GCC 編譯器測試了多線程部分。

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

從結果中可以看見,在 int 中,16 個大核心的 Zen 4 領先的幅度較大,實現了大約 28% 的性能領先。而在 fp 中,情況則有所變化,由於受限於記憶體帶寬的重要 bound,其大量項目出現嚴重倒車,甚至出現大幅不如 12900K 的情況下,好在有不少不吃帶寬的項目拉高性能,最終還是相較於 12900K 實現了大約 8.4% 的性能領先。

2.Geekbench 5.4.4

首先是 ST 部分

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

可以看見 ST 部分的性能領先大約在 8-12% 之間。

它很接近完美了,AMD R9 7950X 全面評測

隨後我們使用 Geekbench 5.4.4 進行 3.6 GHz 的 IPC 測試 它很接近完美了,AMD R9 7950X 全面評測

可以看見兩者的 IPC 基本相同,其中 GLC 在 int 上略勝一點。

緊接著,我們測試了 IPC 損失的情況。

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

可以看見在 Win 下的睿頻機制下,與 SPEC 情況不同,Zen 4 的損失要相較於 GLC 更小一些。

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

最後我們還測試了多線程的情況,可以看見 GB 對帶寬的渴求相對還是弱一些,由於數據碎片更小,這個時候測出來的結果也相對於產生嚴重 memory bound 的 SPEC mt 好一些,僅有 Navigation 與 Machine Learning 兩個項目出現了比較嚴重的記憶體瓶頸問題,致使 16 個大核心反而不如頻率更低的 8 大 8 小。 遊戲部分

由於 ADL/RPL 平台依舊兼容 DDR4,所以這里額外安排了 DDR4 3600 C17-19-19-39 Trefi 262143 的平台測試。

為了確保測試公平統一,所以均採用遊戲內自帶的 Demo 和幀數統計,並且每款遊戲均運行 5 次 Demo,取平均值,如成績出現與其他四次較大的差距,那麼本次成績無效,補測一次,若遊戲本身幀數統計包含小數,則會保留相應位數的小數,否則一律四捨五入。 它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測

關注我們時間較長的朋友可能發現了,這次的評測和之前某次評測時的成績似乎些許的變化,這主要是由於 7950X+6900XT 在使用 WQHL 5.1 版本顯卡驅動時在部分遊戲中會出現成績大幅度下降的問題所致。在 WQHL 5.1 驅動、看門狗:軍團項目中,相較於新版本 8.2 的驅動 Benchmark 成績大約會低 15%,然而 12900K 平台則無此問題,這主要是由於 CPU 適配所致,為了公平起見,我們對 Gaming 部分進行了重新測試。

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

在遊戲測試中,由於普遍無法使用所有 CPU 核心,遊戲幀數的提升自然就沒有理論性能提升這麼大,不過高頻帶來的提升就是實打實的了。

在幾乎所有測試遊戲中,5.5G+ 的 8 核心基本是經常看見,甚至偶爾可以看到 5.7G+ 的超高頻率。因此對於頻率依賴較大的遊戲中,例如 CSGO、古墓麗影均展現了較大的超越,CSGO 超越 12900K 7.3%,古墓麗影超越 5.7%。

不過古爾丹,代價是什麼呢?後果是此時的 CPU 功耗明顯較高,部分場景甚至超過 140w,甚至比上代 5950X 的功耗來的還要高了一些,不過此功耗下溫度卻並不高。

產生這些問題的主要原因是我們認為在遊戲這些中低負載的運行環境中,AMD 的電壓似乎有些過於激進。盡管 AMD 使用了 N5 HP 工藝進行 Zen 4 核心的重構,然而 N5 畢竟本質是更多面向移動端產品的高能效工藝,在跑這種超高頻率上仍然還是需要加壓處理的,所以這個問題也能理解。

不過我們認為電壓仍有一定的優化空間,但就目前來看,你至少需要一個雙塔風冷或者水冷搭配它使用來達到最大運行頻率。

在偏向 GPU 更多的遊戲(優化較差),例如地平線 5、看門狗、大表哥 2 中,AMD 也展現出和 12900K 幾乎無差別的幀數,個位數的差距基本處於誤差范圍內。

但是偏向記憶體的遊戲就明顯疲軟,例如需要大量記憶體帶寬的遊戲,如奇點灰燼、文明 6 等,7950X 受限於 IF 總線頻率不足的問題導致無法提供更大的帶寬,所以即使使用了速度更快的 DDR5 也無法全面超越 12900K。

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

值得注意的是,孤島驚魂 6 這個不太吃記憶體的遊戲居然也出現了大幅度落後,經過簡單的驗證我們發現,在運行基準測試的時候,顯卡在部分場景的使用率會大幅度下降,有時甚至無法維持在 70% 以上,也就是顯卡並沒有全力渲染。

12900K 雖然在這款遊戲中也會有占用不滿的情況,但是並沒有 AMD 如此嚴重,並且在這款遊戲中關閉 Resizable Bar 在 AMD 平台反而可以獲得 2~4% 左右的性能提升。

Resizable Bar 可以讓 CPU 直接訪問顯卡的全部顯存,當然,這需要占用一定量的 IF 帶寬,這不由的讓我們懷疑是否是由於 IOD 內部交換帶寬不足導致的 DRAM 和 PCIe 互相影響,不過這僅為我們的猜測,具體的答案就需要 AMD 給我們了。

我們對 AMD 的遊戲表現的概括非常簡單,7950X 與 12900K 之間有來有回。單論 CPU 部分來說,他的遊戲性能可以說是非常強勁,遊戲運行時可以非常輕松的看到 5.5G 甚至以上的頻率,並且是多顆核心一同達到如此的高頻,這是我們前所未聞的,這也是目前為止 x86 平台在遊戲中 Auto 頻率最高的處理器,甚至媲美某顆即將上市的 24C 的處理器。

令人扼腕的是 IF 的帶寬始終還是影響了部分遊戲性能,超大 64MB 的 L3 也無法發揮全力,這實在是令人惋惜,如果 AMD 有幸看到了這段總結,我們希望在下一代產品中 AMD 能夠盡可能避免這個問題。

由於我們本職工作的原因,所有測試幾乎都是在晚上完成的,為了防止垮起個批臉第二天去上班,再加上無法長時間借用 CPU 和主板,所以這次還是無法安排 1% Low 的測試,還請各位諒解。 功耗與能效

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

在我們使用的 DEEPCOOL 冰堡壘 360mm 體式水冷下,初始的功耗約為 230w,隨後在一秒內撞上了 95 度的 Tjmax 溫度牆,頻率下降,功耗下滑至 210w 附近,溫度繼續維持 95度。

對比之下,同散熱器壓制功耗在 230w 附近的 12900k,溫度大約在 88 度左右,可以看見積熱問題仍舊存在,並且由於功耗更高,似乎更加嚴重了一點。

註:此測試均為開放式平台測試結果

由於當前的 BIOS 不支持功耗細微調節,僅有 65/105/170w 三檔選擇,這里我們使用頻率控制的方式測試功耗。

註:紅色的點為 Auto 頻率下初始測試時 16C 的綜合頻率。

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測

可以看見,從 45x 到 51x 左右,大約提升 13% 性能,功耗接近翻倍,為了些許的極限頻率大幅度提升功耗還是有些得不償失。這個測試證明,N5 製程的 Zen 4 在中高頻率下擁有極好的能效比,對比 Zen 3 產 品,其 230W 時才可以達到大約 16C 4.4-4.5 Ghz 的情況,而 Zen 4 在 Auto 電壓下只需要 130w 即可實現,這證明 AMD 在發布會所說的低功耗能效表現基本屬實。

另:在 FPU 測試中,使用 AVX2 與 512 的測試功耗幾乎完全一致。 總結

時隔兩年之後,AMD 推出了他們的全新產品 Zen 4,作為相對來說保守改進&更換製程的產品,Zen 4 的表現已然相當優異,已然將對手的旗艦產品 12900K 從單/多線程均甩於馬後,就連 Gaming 也做到了互有勝負的地步。

如果說,讓我們給 Zen 4 產品一個評價,我想用幾近完美這個詞來形容再合適不過,雖然他仍舊有著些許的小問題,但在怪獸級的性能以及不錯的能效面前,仍舊無傷大雅。

隨著 AMD 新品的推出,雙方在桌面級 CPU 市場的競爭也趨近於白熱化的階段,9 月 28 日的 00:20 分,也就是後天,刪了我們上一份測評的藍色巨人也將推出他們的 13 代新品,用於與 Ryzen 7000 系列競爭,不論本世代最終鹿死誰手,誰又將成為本世代的單線程/多線程性能之王,我想這都應當都是近十年來半導體發展最好的時代,當然也是對於我們消費者來說最有利的時代。(當然關注我們比較長時間的朋友心里大概已經有答案了)

只有激烈的競爭才能避免擠牙膏式提升再度出現,也才會有不斷的進步,也才能避免廠商弱智定價的出現,不論什麼領域均不外如是。

讓我們暫時拋卻礦潮的陰霾,迎接馬上到來的 CPU 與 GPU 的新品大戰,未來,很快就來了。(不過皮衣刀客黃奸商的 GPU,我想我們就不一定能提前弄到為大家帶來測評了。) 測試後的一些碎碎念:

由於給我們的 7950X 測試時間只有不到一周,因此測試的流程趕的非常緊,也沒有更多的時間深入架構內部使用各種工具來進行測試,不得不說有些遺憾。

在測完了 Ryzen R9 7950X 之後,其實還是有蠻多感慨想發的,作為一匹好馬,Zen 4 最終還是沒有匹配上它的好鞍,IOD+IF 的帶寬限制讓這個產品在全能性上頓時打了折扣,我不知道這是不是有意為之,因為在 Zen4 對應的 Server 平台 Genoa 上我們並沒有見到這種問題。這個問題對於一些要做蛋白模擬等科學計算方向的用戶來說就會面臨著抉擇問題。

第二個問題是多線程的頻率/功耗限制設置的過於激進了一些,很多時候為了那最後的 5-10% 頻率,功耗大幅暴增上去之後,對於 TSMC N5 製程的產品來說還是太熱了一些。可以說 Auto 狀態下的風冷已經幾乎沒有用武之地可言,當然可能還是為了跟對方的新品競爭吧,不過個人感覺還是有些考量上的問題存在。如果功耗限制在 170-180w 這個水平我覺得會比現在來的更好,因為這個功耗下,水冷可以不撞溫度牆,但多線程性能只會損失 3-5% 設置更小。

第三個問題其實宣發與市場的問題,實際上,在我們私下的測試里,AMD 這個平台記憶體頻率越低,在部分場景的領先優勢反而相對看起來會好看(對比 12900K),我們不知道為什麼 AMD 的 Marketing 選擇了 6000 CL30-38 作為 ref 平台測試數據,並且讓媒體們參考。要知道這個頻率也不是每個 Ryzen 7000 CPU+ 平台都能穩定跑上的,所以這個表現讓我感覺就是,市場部實際上是不清楚自家產品性質的,這種割裂感讓我有些不知道該怎麼吐槽,跟隔壁藍廠五五開吧。另一個問題就是評測發布時間的問題,只有部分「值得信賴」的媒體被允許在 9/26 發布,其他媒體則在 9/27 晚上 21:00 後才能發布  review,這種中國區區別對待的方式我覺得也太蠢了一點,至於為什麼 AMD 會如此安排,這里不做更多評價,你們自己理解吧。

(當然,我們例外~~~)

碎碎念的最後,獻給說我是 A 黑、無實物評測、雲評測的 A 炮:

它很接近完美了,AMD R9 7950X 全面評測

它很接近完美了,AMD R9 7950X 全面評測 它很接近完美了,AMD R9 7950X 全面評測它很接近完美了,AMD R9 7950X 全面評測

我自費購買的 AMD CPU 從 Trinity 開始到 Raphael 不等,已經有很多顆並用作收藏用途,圖中部分的 CPU 均在發售前通過特殊渠道購入,價格自然也比零售要高得多,至於我秀這些意義是什麼,你們可以好好消化一下。

吹一個廠商並不會讓你手中購買的 CPU 性能提升 50%,如果你是真的喜歡 AMD,那你應當理性的面對它產品的優缺點,理性購買,而不是不帶腦子的去吹並試圖用某些素質低下的方式來證明你是對的。錯誤的市場反饋只會讓廠商下達錯誤的方向,企業只會慢慢走向低谷,因為這事吃過虧的企業已經不在少數,只有銷量的下降,才會讓廠商意識到問題,從而改進這些問題,作為消費者的我們才能用上更優秀、更便宜的產品。

最後我想借用其他 up 的一句話送給這些「精神股東」和「職業 I/A/NV 炮」:一個垃圾,是沒有辦法靠著市場宣發的文案來改變它的本質,譬如 Rocket lake。(並非指 Zen4,而是單純的闡述觀點,請勿對號入座,想多了就是你自己的問題)

(我針對是那些完全不講道理,還有喜歡扭曲他人意思的那幾位,理智粉絲切勿對號入座)

(其中 CPU 均來自海外資源,也有不少中國未上市的產品,所以就不秀完整的啦)

本文的最後,也感謝每一位讀者對本評測的閱讀,如有不對,勞煩指正,如有不足,敬請諒解。

(所有測試數據均由 OneRaichu 與 ECSM_Official 測試,僅基於測試平台以及對應條件,如有不同,敬請指正,數據均有多次重復測試,我們非常歡迎和諧的討論,如果你對我們的數據有質疑,還請提供相同平台的數據,以便我們更快的查找問題。)

來源:Chiphell