AI時代算力為王 AMD 64核EPYC重新定義高性能計算

AI時代的算力、算法和數據處在一種螺旋式的提升關系中,雖然芯片製程和計算性能的提升,使得對算力的渴求不像以前那樣迫切,但當算法普及和數據累積達到一個新的程度時,原來的算力又不夠了,成為AI性能提升的硬指標。

2019年5月初,AMD度過了自己的50歲生日。創辦50年來,它已經成長全球唯一一個擁有高性能CPU和GPU芯片的半導體公司。也是在2019年,AMD推出了7nm Zen2架構的新一代霄龍/銳龍處理器,這是21世紀以來繼64位K8之後AMD最重要的CPU升級之一。        

在7nm Zen2架構處理器上,AMD再次將CPU性能和核心數量提升到了一個新紀錄上。相比上一代Zen架構,單核心IPC性能提升15%,相當可觀;核心數量更是直接翻番,第二代EPYC處理器以8的倍數從8核、16核……到48核,以及最高的64核128線程,可謂豪華。得益於EPYC的設計下放到消費級產品,主流桌面銳龍也做到了16核32線程,HEDT發燒平台做到了24核、32核乃至64核128線程。

AI時代算力為王 AMD 64核EPYC重新定義高性能計算

在7nm Zen2發布之後,有分析師評價說,這是AMD 50年來首次在架構及工藝上同時領先對手,這在以前是沒有過的。

AI時代算力為王 AMD 64核EPYC重新定義高性能計算

AMD CEO蘇姿豐在去年的發布會上表態,AMD已經變了,得益於一系列技術及產品突破,AMD從大家印象中的市場導向型企業變成了技術導向型企業,並且是「技術領導「型企業。

從2017年正式重返高性能計算領域,在2年時間里AMD經過三代銳龍、兩代霄龍處理器的發展,就站上了高性能計算領域的制高點,他們是怎麼做到的呢?

7nm Zen2創新制勝:x86首發小芯片設計 64核128線程破紀錄

在AMD推出Zen架構處理器之前,x86 CPU行業的發展已經停滯多年了。單核性能多年沒有明顯提升,多核也沒有明顯變化,桌面市場10年間都是最多4核8線程,服務器市場還停留在20+核心時代,業界無奈稱之為「擠牙膏」,這嚴重阻礙了x86行業的發展。

AMD在第一代Zen上取得了突破,IPC性能大漲52%不說,還順手將CPU核心數量提升了一倍,桌面普及8核16線程,EPYC霄龍處理器也做到了32核64線程,多任務性能輕松碾壓對手的CPU。

在7nm Zen2處理器上,AMD又實現了一次性能突破,大膽放棄了傳統設計思路,首次在x86行業使用了chiplets小芯片設計,CPU計算核心與IO核心分離,核心數翻倍,最多64核128線程,再一次將CPU計算性能推向了新高潮。

AI時代算力為王 AMD 64核EPYC重新定義高性能計算

以第二代EPYC為例,它的64核架構實際上就是1+8模塊組成的。中間最大的那個是IO核心,稱為IOD(IO Die),使用了12nm工藝製造,根據需要集成了不同數量的DDR主控、PCIe主控、IF總線等IO單元,EPYC版的IOD核心面積416mm2,集成340億晶體管。

IO核心周圍的8個模塊則是CPU核心,7nm工藝製造,成為CCD(Core Chiplet Die),每個CCD中有8核16線程CPU,面積74mm2,集成38億晶體管。

這樣一來,AMD在設計EPYC處理器的時候就有足夠的靈活性,好像搭積木那樣堆出不同核心的EPYC處理器,以8的倍數,從8核到64核CPU只需考慮不同的IO核心及CCD核心搭配即可。

這種巧妙的設計不僅賦予了第二代AMD EPYC處理器靈活性,還大幅降低了成本。根據AMD的測算,核心數越多,成本優勢就越明顯,64核7nm銳龍作為100%基準的話,那麼48核的成本就是0.9,而原生48核設計的成本至少是1.9,比小芯片設計高太多了,幾乎翻倍。

AI時代算力為王 AMD 64核EPYC重新定義高性能計算

當然,最重要的一點還有,在第二代EPYC處理器多核性能再次翻倍的同時,單核性能並沒有止步,通過7nm工藝及架構改進,AMD在Zen2上實現了15%的IPC性能提升,Cinebench基準測試中實際提升20%以上。

總之,AMD的64核EPYC處理器憑借7nm Zen2巧妙、靈活的架構設計,再次將高性能計算能力翻倍,從發布到現在已經打破了至少140項世界計算紀錄,並且還在持續不斷地提升中。

EPYC高性能計算成功之道:把握技術趨勢、敢於創新

為何EPYC處理器能夠取得這樣的成功,2011年進入AMD公司、2014年擔任CEO的蘇姿豐(Lisa Su)是最有發言權的。此前,對半導體行業另一個巨頭英特爾來說,發展是遵循其著名的Tick-Tock戰略的,要麼提升芯片製造工藝,要麼更新設計架構。

對AMD來說,他們急需一次爆發,因此公司決定雙管齊下,創造一個全新的產品組合。

蘇姿豐說服了客戶,花費數年時間打造出了這一代7nm Zen2架構的處理器。在友商仍然使用14nm工藝的情況下,AMD在升級架構的同時,上馬最先進的7nm工藝無疑是有極大風險的,但最後事實證明AMD「賭對了「。

AI時代算力為王 AMD 64核EPYC重新定義高性能計算

對AMD來說,過去幾年最大的收獲就是他們成功制定並實施了新一代路線圖,從2017年的14nm Zen架構開始,AMD在工藝、架構上就保持着同步升級的節奏,改變了業界Tick-Tock兩年升級一次的慣例。

按照路線圖發展下去,2020年AMD還會推出7nm工藝的Zen3架構的處理器,首發於第三代EPYC處理器 「Milan」 (米蘭)中,今年底應該就會上市了。

再往後,AMD也正式宣布了5nm工藝的Zen4架構,同樣會首先應用於第四代EPYC處理器「Genoa「(熱那亞)中。

AI時代來臨 高性能計算新篇章開啟

憑借7nm Zen2強勁的性能表現,AMD贏得了頂級超算的青睞。AMD先後宣布了新一代E級超級計算機 Frontier和El Capitan,預期峰值處理能力分別為150億億次FLOPS和200億億次FLOPS以上,計劃分別於2021年和2023年交付,後者有望在交付後成為世界上速度最快的超級計算機。

Frontier將採用下一代EPYC,建成後,通過大幅提升大規模人工智能、數據分析和模擬的性能來實現科學突破,幫助科學家開展更多計算。

在Frontier創新成果的基礎上,El Capitan採用代號為「Genoa」(熱那亞)的下一代 AMD EPYC處理器以及針對高性能計算和AI工作負載而優化的新型架構的下一代 Radeon Instinct GPU。前者將基於「Zen 4」處理器核心來支持下一代記憶體和 I/O 子系統,從而更好地服務於 AI 和高性能計算工作負載,後者將採用下一代高帶寬記憶體以實現出色的深度學習性能。El Capitan這樣的設計將在 AI 和機器學習數據分析方面實現飛躍。

接下來的高性能計算該如何發展?從Zen2來看,人們對CPU單核及多核心的性能要求已經達到一個比較滿意的地步,現在更關鍵的是如何利用好這些多核CPU的性能。最有希望的領域應該是AI人工智能了,AI時代的算力、算法和數據交替上升,對更高算力的需求永不停歇,成為AI性能提升的硬指標。

上面提到的Frontier超算性能輕易就達到了目前排名第一的超算系統Summit的7倍水平,而El Capitan的計算能力則更高。

AI時代算力為王 AMD 64核EPYC重新定義高性能計算

AMD CEO蘇姿豐前不久接受采訪時就透露了這方面的信息,她舉了一個前景很誘人的例子,那就是AI人工智能相關的語音識別,目前處理器文本信息不需要多強的CPU性能,但語音識別這樣的應用場景現在多是靠後台的數據中心運算的。

如果超算技術下放到消費級產品上,那麼語音識別等應用就可以利用本地的處理器來計算,這樣速度、效率就會好很多。

根據蘇姿豐的預測,EPYC處理器所代表的高性能計算會在未來5到10年里深刻影響我們的生活,不僅僅是推動數據中心領域的高性能計算發展,還會進一步促進與消費級產品的融合,特別是在AI技術飛速發展的過程中,無處不在的澎湃算力都是最關鍵的。

作者:憲瑞
來源:快科技