當64核遇上PCIe 4.0 超級算力是這樣建成的

我們現在的時代正處於一場算力革命中,大數據、5G、AI人工智能、雲計算等領域都對高性能提出了更高的要求,基於所有數據的分析和最終決策都需要高性能計算,這是未來的一片藍海。

今天AMD這樣的公司已經可以從多個方面來提高算力,其中最關鍵的部分依然是高性能CPU。AMD CEU蘇姿豐此前在接受采訪時表示,AMD的使命是提供解決方案,讓所有用戶都能利用高性能計算來解決世界上一些最有趣和最棘手的挑戰。​​​​

針對高性能計算,AMD自從推出Zen架構以來的三年里,最重要的動作就是新一代EPYC 7002系列處理器,它不僅從上代的14nm工藝升級到了7nm工藝,同時還從32核升級到了64核,並帶來了PCIe 4.0總線,使得高性能計算算力大漲的同時,還解決了I/O的瓶頸,可以靈活搭配新一代GPU、網絡等,系統性地提升了算力。

當64核遇上PCIe 4.0 超級算力是這樣建成的

EPYC 7002系列處理器使用了Zen2架構,這一代最重要的三個特點就是繼續提升性能、工藝升級改善能效,同時提高CPU並行能力——更多核心、更多IO等。

Zen2架構升級:IPC性能大漲、浮點運算能力翻倍

自從2017年推出第一代Zen架構以來,AMD在處理器性能上已經魚躍龍門,Zen相比之前的CPU就提升了52%的IPC性能提升,遠超業界水平。

此後AMD的路線圖中,Zen架構持續不斷優化,不論單核還是多核,性能一直在穩步增長,在Zen2上,AMD依然提升了15%的單核IPC性能,同時優化了多核並行能力,更容易擴展。

當64核遇上PCIe 4.0 超級算力是這樣建成的

在具體架構上,Zen2上繼承了Zen架構的CCX+IF總線+SMT多線程技術,同時在分支預測、緩存系統、整數、浮點等單元上做了改進,並加入了新的指令,提升了安全性。

最終的結果達到或者說超過了AMD的預期,IPC性能提升15%,浮點運算能力翻倍,頻率達提升到4.7GHz+。

當64核遇上PCIe 4.0 超級算力是這樣建成的

最終在性能上,多核性能更因為翻倍的核心數而大幅領先,性能最多可以翻倍。

當64核遇上PCIe 4.0 超級算力是這樣建成的

7nm工藝+chiplets小芯片設計:首發64核128線程、算力翻倍不是夢

在第二代EPYC處理器上,除了Zen2架構在性能上的大量改進,AMD還在業界首發了7nm CPU,先進工藝的加入也讓EPYC 7002系列處理器脫胎換骨,核心面積更小,同樣的功耗下性能提升25%,或者同樣的性能下功耗降低了50%。

當64核遇上PCIe 4.0 超級算力是這樣建成的

光有這些還不夠,EPYC 7002最終能夠實現64核的奇跡還離不開另外一項技術的運用——Chiplets混合小芯片設計,簡單來說就是將多個芯片集成到一顆處理器里。

當64核遇上PCIe 4.0 超級算力是這樣建成的

具體到EPYC 7002處理器中,它實際上就是由8組CCD核心、1組IOD核心組成,前者就是CPU核心,每個CCD內有8個CPU內核+32MB L3緩存,7nm工藝製造,總核心面積74mm2,集成38億晶體管。

IOD就是專用的IO核心,集成了DDR、PCIe等子單元,有桌面版及服務器版兩種,搭配的PCIe 4.0通道、記憶體主控是不同的,服務器版IOD核心面積高達416mm2,更為龐大。

當64核遇上PCIe 4.0 超級算力是這樣建成的

採用Chiplets小芯片設計,一方面是可以將CPU、IO核心分離,分別使用不同的工藝,然後靈活搭配,避免單一大核心的製造難題,因為目前的工藝水平下,製造單一核心的64核處理器面臨着很多困難,成本、良率很難控制。

當64核遇上PCIe 4.0 超級算力是這樣建成的

根據AMD之前的數據,如果將16核32線程的銳龍3代作為100%基準,那麼採用原生核心的16核處理器成本將超過2,至少是兩倍的成本。

如果是EPYC霄龍處理器,那麼核心數越多,成本優勢就越明顯,64核7nm銳龍作為基準的話,那麼48核的成本就是0.9,而原生48核設計的成本至少是1.9,依然是兩倍水平,而64核設計幾乎就是傳統CPU工藝的死穴了,幾乎沒法製造。

最終,第二代AMDEPYC 7002系列處理器,通過採用革命性的Chiplets小芯片設計,克服了製造工藝和成本的挑戰,為x86服務器帶來了高達64核心128線程的超強算力!

One More Thing:128條PCIe 4.0通道給高性能計算插上翅膀

全新的Zen2架構、7nm工藝、64核128線程幾乎就是整個EPYC 7002系列處理器的超高起點了,上面每一點都是領先業界的,對手在短時間內都沒做到,但它還不是EPYC 7002處理器的全部。

在EPYC 7002處理器上,AMD還重點提升了IO設計。在當前的高性能計算中,IO瓶頸實際上要比CPU性能瓶頸更為嚴重,提升整體的算力不能忽視IO部分,否認很難發揮出64核128線程的強大性能。

當64核遇上PCIe 4.0 超級算力是這樣建成的

在EPYC 7002處理器上,AMD提供了128條PCIe 4.0通道,數量及技術雙雙創造了記錄,這是目前已商用的處理器中最為強大的,因為PCIe 4.0能夠提供2倍的PCIe 3.0性能,總帶寬高達128GB/,雙向可達256GB/。

128PCIe 4.0可以讓EPYC 7002系列的服務器連接更多更強的GPU加速卡或者NVMe設備。從實際測試來看,在3DMark的PCIe功能測試中,PCIe4.0比上代性能提升了70%,CDM硬盤性能也提升了35%到50%,優勢明顯。

當64核遇上PCIe 4.0 超級算力是這樣建成的

在64核及PCIe 4.0的兩大獨有優勢下,AMD的EPYC 7002處理器已經獲得新一代小型超算DGX-A100的認可——這是老對手NVIDIA的產品,但在選擇芯片時,也只有EPYC 7002中的旗艦EPYC 7742才符合選擇,因為它可以支持雙路128核256線程、PCIe 4.0加持的15.36TB NVMe硬盤。

當64核遇上PCIe 4.0 超級算力是這樣建成的

除了新一代服務器、工作站之外,AMD的EPYC 7002處理器這一年來收獲不菲,在多個高性能計算系統中已經大顯身手,包括全球超快的兩台百億億次級超級計算機Frontier、EI Captian,都有EPYC霄龍的身影,以及AMD Radeon Instinct加速卡,都是受益於64核128線程及PCIe 4.0的強大。

當64核遇上PCIe 4.0 超級算力是這樣建成的

總之,在高性能計算這個方向上,AMD的EPYC 7002系列處理器正在創造奇跡,從發布到現在以來,憑借64核128線程、PCIe 4.0的專屬優勢,它在各大性能測試中已經斬獲了超過170項世界記錄,目前還在持續增長中。

憑借這些優勢,AMD的EPYC已經從高性能計算的起跑點領先。正如AMD CEO蘇姿豐之前在采訪中說的那樣,2020年將是高性能計算的一年。

無論你是企業客戶還是還是個人用戶,從更高核心到更寬IO全方位系統性提升的高性能計算都將改變未來的工作和生活。

當64核遇上PCIe 4.0 超級算力是這樣建成的

作者:憲瑞
來源:快科技