NVIDIA Grace | 搜資訊

NVIDIA Grace處理器露出獠牙：AMD、Intel都看不到尾燈

NVIDIA雖然做不了x86架構處理器，但一直在Arm架構上耕耘，如今更是有了面向數據中心和高性能計算的“Grace”，可以雙芯並聯，還能和Hopper GPU聯手組成超級晶片。 NVIDIA Grace處理器基於Arm Neoverse N2架構，最多144個核心、117MB三級緩存，全球首個支持LPDDR5X ECC內存(總帶寬1TB/)，支持58條PCIe 5.0通道，還有帶寬900GB/的一致性互連接口(七倍於PCIe 5.0)，可運行NVIDIA所有的軟體堆棧與平台，包括RTX、HPC、AI、Omnivers。 NVIDIA此前就宣稱，Grace的能效是當今領先處理器的2倍。 Hot Chips 2023大會上，NVIDIA首席科學家Bill Dally展示了Grace的強悍性能，來自雙路超級晶片，共有288個核心。對比的競品方案都是頂級的，一個是AMD霄龍9654，雙路192核心384線程，另一個是Intel至強鉑金8480+，雙路112核心224線程。按照NVIDIA給出的數據，Grace處理器在Weather WRF、MD CP2K、Climate NEMO、CFD OpenFOAM、Graph Analytics GapBS BFS等一系列伺服器負載中，相比AMD整體基本持平，部分優勢項目領先最多達40％，同時遙遙領先Intel，幅度普遍超過50％。但是別忘了功耗，兩顆Grace 500W，兩顆霄龍9654 640W，兩顆至強鉑金8480+ 700W。在一個5兆瓦的數據中心中，Grace的性能領先AMD普遍在70-90％，最多竟然達到2.5倍，對比Intel就更是完全碾壓級別的存在了。來源：快科技

NVIDIA GH200 CPU+GPU超級晶片大升級史無前例282GB HBM3e記憶體

快科技8月9日消息，NVIDIA官方宣布了新一代GH200 Grace Hopper超級晶片平台，全球首發採用HBM3e高帶寬內存，可滿足世界上最復雜的生成式AI負載需求。 NVIDIA 2022年3月推出了，首次將CPU、GPU融合在一塊主板上，不過直到今年5月份才量產。其中，Grace CPU擁有72個Armv9 CPU核心、198MB緩存，支持1TB/高帶寬的LPDDR5X ECC內存，還支持PCIe 5.0。 Hopper GPU則採用台積電4nm定製工藝，800億電晶體，集成18432個CUDA核心、576個Tenor核心、60MB二級緩存，支持6144-bit HBM高帶寬內存，此前版本配備的是96GB HBM3。雙路配置的系統中，兩顆新一代GH200超級晶片可帶來144個CPU核心、8PFlops(8千萬億次浮點計算每秒) AI性能、282GB HBM3e內存，容量是現在的3.5倍，而高達10TB/的帶寬也是現在的3倍。基於NVLink高速總線，GH200超級晶片還可以繼續拓展互連，GPU可以訪問全部的CPU內存，雙路配置下總容量可達1.2TB。 NVIDIA沒有透露採用的HBM3e來自哪家供應商，很可能是SK海力士。首批基於GH100超級晶片的系統將在2024年第二季度出貨。順帶一提，AMD Instinct MI300A、MI300X AI加速器分別配備128GB、192GB HBM3，後者帶寬超過5TB/。來源：快科技

黃仁勛：NVIDIA只用兩年就研製出比x86快1.3倍的CPU處理器

在本周的GTC 2023春季技術大會上，黃仁勛展示了自研數據中心CPU Grace+高性能計算GPU Hopper的合體產品Grace Hopper全貌。對於推遲交付（從上半年推到下半年）的情況，黃仁勛在會後媒體環節交流時表示，Grace CPU和Grace Hopper超級晶片系統都在製造中，“矽片正在工廠里飛舞”。他坦言，相對於友商需要花費很多年，NVIDIA只用兩年時間就研製出Grace CPU，這的確是相對短的時間。據悉，Grace CPU基於ARM v9指令集打造，144核設計，緩存容量396MB，支持LPDDR5X ECC記憶體，帶寬高達1TB/，還支持PCIe 5.0、NVLink-C2C互連等。號稱比競品x86處理器（AMD Zen4 Genoa）快了1.3倍，節省60%的能耗。連同GPU，一塊20.3 x 12.7厘米就能放下，兩個一組可以放入1U風冷伺服器機架。來源：快科技

黃仁勛親手拿出CPU+GPU超級晶片發布一年了還是個PPT

整整一年前的GTC 2022圖形技術大會上，NVIDIA發布了、，同時利用它們打造了，一是Grace CPU二合一，二是Grace CPU＋Hopper GPU二合一。一年時間過去了，新一屆GTC 2023大會上，黃仁勛親手拿出了超級CPU＋GPU，這也是我們第一次看到它的實物。和渲染圖的精美不同，實物顯得有點朴實無華。小小的PCB電路板上安排了兩顆晶片與大量供電元件，異常緊湊，其中基板較大、晶片較小的是Grace CPU，基板較小、晶片較大的則是Hopper GPU，後者整合封裝了六顆HBM記憶體。同時，黃仁勛還放出了配備超級CPU＋GPU的伺服器節點效果圖，但沒有做進一步解釋，也沒有透露更多規格、性能，只是提了一句CPU、GPU之間的通信帶寬是傳統PCIe總線的多達10倍。黃仁勛也沒有說這種產品到底什麼時候出貨。同時，黃仁勛也拿出了超級CPU二合一，基板加晶片占據了PCB的大部分面積。封裝好的計算模組也第一次亮相，長寬尺寸為8x5英寸(20.3×12.7厘米)，兩個一組可以放入1U風冷伺服器機架。黃仁勛稱，Grace相比傳統x86 CPU，性能可領先30％，能效可領先70％，數據中心吞吐能力可領先1倍。 Grace CPU目前已經出樣，合作夥伴正在設計系統方案，但何時出貨上市暫無時間表。根據此前公布的資料，Hopper GPU採用定製版台積電4nm工藝、全新架構，集成多達800億個電晶體、18432個CUDA核心、576個Tensor核心，支持6144-bit位寬的80GB HBM3/HBM2e高帶寬記憶體，並支持PCIe 5.0、第四代NVLIink，性能號稱四倍於上代A100，功耗最高700W。 Grace CPU採用雙芯合體設計，共計144個Arm架構核心，集成396MB緩存，支持LPDDR5X ECC記憶體，同樣支持PCIe 5.0，內部帶寬3.2TB/，晶片間帶寬1TB/，功耗500W。來源：快科技

NVIDIA 144核心超級CPU揭秘：3.5倍能效碾壓AMD 128核心

2022年3月的GTC技術大會上，NVIDIA正式發布了，同時打造了兩顆超級晶片，一是Grace CPU二合一，二是Grace CPU＋Hopper GPU二合一。 Grace CPU二合一 Grace CPU＋Hopper GPU二合一現在，NVIDIA官方詳細揭示了Grace Superchip超級晶片的設計與性能、能效。它通過NVLink-C2C晶片間互連總線，將兩顆Grace CPU整合在一塊基板上，彼此之間的雙向帶寬多達900GB/。 Grace CPU基於Armv9-A 9.0架構、Neoverse V2 64位內核，以4個128-bit功能單元的方式配置了兩組SIMD矢量指令集，一是SVE 2(縮放矢量擴展第二版)，二是NEON(高級SIMD)。它還支持LSE(大型系統擴展)，可提供低成本的原子操作，改進CPU通信吞吐。 NVIDIA聲稱，這種核心的能效，是如今伺服器常見x86核心的2倍。 Grace CPU單顆集成72個核心，互相通過3.2TB/超高帶寬的NVIDIA縮放一致性Fabric總線互連，而二合一的超級晶片上就是144個核心。每核心64KB一級指令緩存、64KB一級數據緩存、1MB二級緩存，一顆超級晶片的所有核心共享234MB三級緩存。記憶體整合封裝了LPDDR5X，最大容量960GB，最高帶寬1TB/(每一顆500GB/)，還支持ECC。對比傳統的八通道DDR5，這種設計不但帶寬高出53％，單位功耗也只有1/8。對比海量帶寬的HBM2e，單位成本只有1/3，容量則可達8倍。擴展支持八組PCIe 5.0 x16，總帶寬1TB/，還有用於管理的低速PCIe通道。性能方面，一顆超級晶片的FP64雙精度峰值浮點性能可達7.1TFlops(每秒7.1萬億次計算)，熱設計功耗500W。 NVIDIA對比了AMD Zen3架構的霄龍7763 64核心，雙路組成128核心，號稱性能可領先1.5-2.5倍，能效可領先2.0-3.5倍！當然，AMD已經有了Zen4架構、最多96核心的霄龍9004系列，NVIDIA Grace依然還沒有商用。來源：快科技

NVIDIA自研Grace處理器詳情公布：功耗500W、性能不及Zen2

NVIDIA設計CPU產品已經有段時間了，不過Tegra從手機、平板到盒子折騰一番後，最終發現自己的歸宿在汽車自動駕駛以及任天堂Switch遊戲機上。拋開Tegra，NVIDIA在今年的GTC 2022上還公布了名為Grace的處理器，主要用於伺服器、高性能計算等領域。在本次HotChips 34大會上，NV公布了Grace的更多詳情，感興趣的不妨了解下。據悉，Grace處理器採用台積電4nm工藝製造，72核ARM v9指令集架構。注意，NV不是直接套用的ARM Cortex公版（比如X1/X2、A710等），而是和蘋果一樣，純自行研製CPU核。因為NVIDIA只賣兩種Grace處理器集成方案，一是兩顆CPU的雙芯平台，一是Grace CPU+Hopper GPU的聯合平台，所以一套系統就能做到144核規模。此外，處理器還支持最大512GB的LPDDR5X記憶體（ECC），提供68條PCIe 5.0通道，三級緩存多達117MB。性能方面，72核在Spec_Int中可拿到370分，大約是AMD EPYC 7742的一半水平（128核Zen2）。來源：快科技

1.8萬核心GPU、144核心CPU NVIDIA大殺器將揭開面紗

Hot Chips年度晶片行業盛會將在本月底舉行，Intel、AMD、NVIDIA和眾多業內晶片巨頭都將拿出各家的拳頭產品，秀秀肌肉。 NVIDIA這次會有多場分享，重點覆蓋Hopper GPU計算加速器、Grace CPU伺服器處理器、NVLink高速總線，屆時會有多位高級工程師分享內部架構設計、性能數據。採用定製版台積電4nm工藝、全新架構，集成多達800億個電晶體、18432個CUDA核心、576個Tensor核心，支持6144-bit位寬的80GB HBM3/HBM2e高帶寬記憶體，並支持PCIe 5.0、第四代NVLIink，性能號稱四倍於上代A100，功耗最高700W。採用雙芯合體設計，共計144個Arm架構核心，集成396MB緩存，支持LPDDR5X ECC記憶體，帶寬達1TB/，同樣支持PCIe 5.0，功耗500W。 NVIDIA還打造了一顆超級晶片，，通過NVLink-C2C高速總線互連，帶寬達900GB/。來源：快科技

NVIDIA 144核心超級CPU逆天性能2倍於Intel、能效2.3倍

3月底的GTC大會上，NVIDIA不但發布了新一代Hopper H100 GPU，兩顆晶片合體，官方稱之為「SuperChip」，總計144個核心、396MB緩存、1TB/ LPDDR5X ECC記憶體，功耗500W。它的性能怎麼樣呢？NVIDIA之前的說法是，SPECrate_2017理論測試中，對比兩顆AMD 64核心的霄龍7742，性能領先1.5倍，但那畢竟是AMD的上一代產品了，架構還是Zen2。現在，NVIDIA加速計算業務業務副總裁Ian Buck的一次演講中，明確對比了Grace SuperChip的性能。 PPT顯示，在高性能計算領域常見的天氣研究與預報中，NVIDIA Grace對比兩顆Intel至強鉑金8360Y，性能達到了2倍，能效更是達到了2.3倍！ Intel至強鉑金8360Y基於10nm工藝、Ice Lake架構，具備36核心72線程，主頻2.4-3.5GHz，熱設計功耗250W，雙路就是72核心144線程、500W。 144個物理核心對比144個邏輯核心，類似的功耗，如此對比倒是比較公平，不過Intel很快就會發布Intel 7新工藝、新架構的Sapphire Rapids，最多56核心。 AMD也即將推出5nm新工藝、Zen4新架構的霄龍7004系列，最多96核心。來源：快科技

Tag: NVIDIA Grace