超算 | 搜資訊

英偉達首次公開目前最快AI超算：搭載4608個H100 GPU

快科技2月18日消息，近日，英偉達首次向外界公布了其最新的面向企業的AI超級計算機Eos，同時也是英偉達目前速度最快的AI超級計算機。據介紹，Eos共配備了4608個英偉達H100 GPU，同時還配備了1152個英特爾Xeon Platinum 8480C處理器（每個CPU有56個內核）。 Eos還採用了英偉達Mellanox Quantum-2 InfiniBand技術，數據傳輸速度高達400 Gb/，對訓練大型AI模型和系統擴展至關重要。英偉達公布數據顯示，在最新的全球Top500超級計算機當中，Eos位居全球第九，其峰值性能更是達到了188.65 Peta FLOPS。而且Eos不僅供英偉達自身使用，其構架也為其他想打造面向企業的超級計算機的公司提供樣本。英偉達表示，Eos整合了其在AI領域的專業技術和經驗，是先前DGX超級計算機知識的結晶，可以幫助企業處理最具挑戰性的項目，並實現AI目標。來源：快科技

歐盟敲定其首個ExaFLOP級超算：採用Arm處理器和英偉達計算卡

多年來，超級計算機一直在突破各種運算上限，包括了MegaFLOP、GigaFLOP、TeraFLOP、PetaFLOP、以及現在的ExaFLOP。美國橡樹嶺國家實驗室的Frontier成為首台真正意義上達到ExaFLOP級別（百億億次）的超級計算機，在高性能Linpack（HPL）基準里，顯示其運算性能達到了1.194 Exaflop/s。據HPCWire報導，歐盟已敲定其首個ExaFLOP級超算系統，代號為「Jupiter」，將採用Arm架構的CPU以及英偉達的GPU，以提供出色的計算能力。該項目總預算為2.73億歐元，由歐洲高效能計算聯合協會（EuroHPC JU）及Eviden和ParTec組成的技術公司負責，大概三個月後開始進行安裝。雖然近年來基於Arm架構的CPU發展迅猛，但在超級計算機領域仍不多見，目前排名前十的超算系統里僅有一款選擇了Arm架構。傳聞Jupiter將採用SiPearl的Rhea CPU，這是一家位於法國的晶片設計公司，主要針對超級計算機設計基於Arm架構的晶片。Rhea採用的是ArmNeoverse V1平台，暫時還不清楚具體的性能。與Rhea搭配的是英偉達的H100計算卡，這款火熱的產品在性能方面自然不需要過多介紹。歐盟的Jupiter超算系統表明了，歐洲地區正努力成為全球科技行業的參與者，選擇Rhea可以說是邁出自力更生的一步。除了Jupiter以外，歐盟還在研究其位於法國的第二台ExaFLOP級超算系統，預計2025年投入使用。 ...

每秒150億億次中國頂級超算入圍美國戈登·貝爾大獎

據媒體The next platform報導，美國計算機協會（Associationfor Computing Machinery; ACM）近期公布了戈登·貝爾獎（被譽為“超級計算應用領域的諾貝爾獎”）的入圍名單。基於中國1.5 EXAFLOPS（百億億次）超級計算機的一篇研究論文再次入圍，該獎項將在今年11月在美國丹佛舉行的SC23超級計算大會上頒發。中國超級計算機再度入圍 ACM表示，雖然最終的系統規模以及模擬和模型運行的結果尚未完成，但基於新一代的 1.5 exaflops中國神威超級計算機（oceanlite，太湖之光升級版）完成的一篇題為《渦輪機械流動的精確計算》論文（將在11月SC23會議之前正式發布）已經入圍。早在2021年11月，中國的超級計算機就曾以4190萬個核心的量子模擬而獲得了戈登貝爾獎。當時阿里巴巴集團、清華大學、DAMO學院，浙江實驗室和北京人工智慧研究院在Oceanlite機器中運行了一個名為“八卦路”的預訓練機器學習模型，該模型涉及3700多萬個核心和14.5萬億個參數。此次《渦輪機械流動的精確計算》論文，則是由Weiqi Shen， Jiahuan Cui， Yao Zheng等（共 19 位作者），來自浙江大學、清華大學、國家超級計算無錫中心、劍橋大學、佛羅里達大學團隊共同完成。該團隊開發了一種新的大渦流模擬代碼，用於解決渦輪機械中的可壓縮流。他們將該代碼應用於美國國家航空航天局（NASA）的重大挑戰問題，使用高階非結構化求解器求解高壓渦輪級聯的 16.9 億個網格元素和 8650 億個自由度。根據該論文的作者顯示，Oceanlite系統擁有超過100000個由中國國家並行計算機工程與技術研究中心（NRCPC）設計的定製SW26010 Pro處理器。 2022年4月，中國科學技術大學、國家海洋科學與技術試點實驗室（青島）、北京大學數學科學學院、無錫國家超級計算中心和中國海洋大學組成的聯合團隊，公布了一篇超級計算機模擬復雜量子多體的文章介紹，SW26010 pro是sw26010改進型，擁有6個核心模塊，每個模塊有1個管理Linux線程的核心（MPE）和64個計算核心。而組成太湖之光的SW26010處理器，只有4個核心模塊，說明SW26010 pro單片應該有50%的性能提升。 The next...

每秒40億億次俄羅斯最強AI超算上線：中國GPU？

俄羅斯雖然遭到了前所未有的封鎖和限制，但從未放棄。莫斯科國立大學(MSU)就上線了最新的超級計算機“MSU-270”，AI計算性能高達400PFlops(40億億次浮點計算每秒)。關於這台超算的配置，MSU披露的很少，只說配備了大約100塊“最新的圖形加速器”，並在供電、散熱、通信方面採用了全新的設計。俄羅斯並沒有自己的高端計算GPU，大機率來自外部供應，但是NVIDIA、AMD、Intel都不能向俄羅斯出口此類產品，媒體就想到了中國廠商，比如一度號稱比肩NVIDIA的壁仞科技。在此之前，MSU使用的GPU加速器都來自NVIDIA。 MSU-270 40億億次計算的性能單指AI方向，也就是FP16半精度浮點格式。目前，俄羅斯最強的通用計算超算最大性能只有21.5PFlops，也就是2.15億億次FP64雙精度浮點計算每秒。除了AI，MSU-270還可廣泛用於各種科學領域的研究，包括物理學、化學、生物學、心理學、社會學、地質學、醫學等等。來源：快科技

中國罕見披露百億億次超算：1920萬核心 2.2倍於美國第一

美國已經或正在打造多台百億億次級別的超級計算機，而由於眾所周知的原因，中國這幾年在頂級超算方面非常低調，不公開，不參與排名，搞得老美也很好奇。 Tom's Haredware報導稱，無錫國家超算中心、開發了申威處理器的江南計算技術研究所，最近向美國計算機協會(ACM)戈登·貝爾獎提交了一台新超算的部分數據，披露其具有49230個計算節點、大約1920萬個CPU核心。工程師開發了一種新的大型旋渦模擬算法，配合這台超算，可處理渦輪機械中的可壓縮流體，並解決了NASA提出的一個難題：使用高級非結構化求解器，處理一個具備16.9億網格組件、8650億自由度(變量)的高壓渦輪機序列。相比之下，現在公開排名世界第一的超算Frontier，使用的是AMD EPYC 64核心處理器，總計8699904個CPU核心，中國這台超算是它的2.2倍。目前尚不清楚這台超算的具體身份，不知道是不是2021年完成的神威·海洋之光(Oceanlite)，它的性能就高達每秒150億億次浮點計算(1.5EFlops)，事實上已經超過了Frontier，後者升級後為每秒119.4億億次。媒體猜測，這台新超算的處理器，很可能是2016年面世的前輩神威·太湖之光里那顆申威26010的升級版本，單顆核心數量更多。值得一提的是，神威·太湖之光曾多次在世界超算TOP500榜單上蟬聯冠軍，還在2016年、2017年連續拿下過戈登·貝爾獎。神威·海洋之光原型機神威·太湖之光神威·太湖之光里的申威處理器雙路節點神威·太湖之光里的申威26010處理器來源：快科技

6 秒內完成 47 年運算， Google 量子計算機輕松碾壓世界第一超算

摩爾定律已逼近極限，量子計算將帶領人類進入一個全新的領域。近日， Google 在 arxiv 上發表了一篇關於量子計算機的論文，並宣稱他們的量子計算機在短短 6 秒內就完成了世界上最先進計算機 47 年的計算量。研究論文顯示， Google 最新 Sycamore 量子處理器從 2019 年的 53 個量子比特飛躍到了現如今的 70 個量子比特。需要說明的是，作為量子計算機的基本信息單元，量子比特數（英語：quantum bit）是評估量子計算機運算能力的一個重要參數。量子比特數越大，計算機中的組件就越多，能夠以指數方式執行的計算就越多。因此，新處理器量子比特數量的增加意味著其性能得到了成倍的提高，與此同時，論文也顯示，新處理器的穩健性也大約是以前的 2.41 億倍。事實上，無論是「口頭」，還是「實際」，Google 從未放棄對量子計算機的研發。早在...

微軟公布量子超級計算機路線圖：十年內完成第一台量子超算系統的建造

近日，微軟公布了其量子超級計算機的路線圖。其高級量子計算開發副總裁Krysta Svore表示，開發團隊預計在十年內建造並完成第一台量子超級計算機，目標是每秒執行100萬次量子運算。目前微軟已實現了第一個里程碑，生產出一個拓撲超導相及其伴隨的Majorana零模態。微軟表示，獨立專家已經驗證了其提供的數據，並開始設計世界上第一個拓撲量子比特，這是唯一已知的具有潛力滿足量子計算規模化所需標準的設計，比迄今為止任何其他工程化量子比特更加穩定。此前微軟執行長Satya Nadella在相關活動中就曾表示，微軟會用Azure Quantum，將人工智慧和量子計算結合起來，開創科學發現的新時代，目標是將未來250年的化學和材料科學進展壓縮到25年。為了實現這一目標，微軟發布了三項重要公告： Azure Quantum Elements通過整合高性能計算（HPC）、人工智慧和量子計算的最新突破，使得研究人員能夠在化學和材料科學方面取得規模、速度和准確性的進展，加速科學發現。 Azure Quantum中的Copilot可幫助科學家使用自然語言來推理復雜的化學和材料科學問題，可以完成復雜的任務，比如生成基礎計算和模擬，查詢和可視化數據，以及獲得復雜概念的指導答案。微軟通往量子超級計算機的路線圖：一級 - 基礎，運行在噪聲物理量子位上的量子系統；二級 - 彈性，在可靠的邏輯量子位上運行的量子系統；三級 - 規模，量子超級計算機可以解決最強大的經典超級計算機無法解決的重要問題。 Krysta Svore稱，微軟認為其路線圖和通往量子超級計算機的時間是幾年而不是幾十年。 ...

Frontier蟬聯全球超算Top500榜首：仍是唯一ExaFLOP級超算系統

今天第61期全球超算Top500榜單公布，美國橡樹嶺國家實驗室的全球首台達到ExaFLOP級別（百億億次）的超級計算機Frontier蟬聯了榜首。在高性能Linpack（HPL）基準里，顯示其運算性能已從去年11月的1.102 Exaflop/s增長至現在的1.194 Exaflop/s，有了進一步的提升。 Frontier也是至今唯一一台達到ExaFLOP級別的超級計算機系統，這很大程度上是由於美國能源部阿貢國家實驗室的超級計算機Aurora出現延誤所致，後者基於英特爾Sapphire Rapids和Ponte Vecchio構建，經過多年努力仍未提交基準測試結果。雖然之前有報導稱，Frontier的運轉情況並不好，平均故障間隔時間僅為數個小時，不過現在似乎已經解決了，已全面投入使用，被研究人員用於眾多科學工作負載。安裝在日本神戶的RIKEN計算科學中心（R-CCS）的Fugaku位於第二，運算性能為0.442 Exaflop/s；來自芬蘭CSC–IT科學中心的LUMI排在第三，運算性能為0.3091Exaflop/s；位於義大利博洛尼亞非盈利計算聯盟CINECA的Leonardo排在第四，運算性能為0.239Exaflop/s；第五是美國橡樹嶺國家實驗室的Summit，運算性能為148.8 Petaflop/s；第六是美國國家能源研究科學計算中心（NERSC）勞倫斯利弗莫爾國家實驗室的Sierra，運算性能為94.6Petaflop/s；第七是中國國家並行計算機工程與技術研究中心（NRCPC）開發並安裝在無錫國家超級計算中心的神威太湖之光，運算性能為93Petaflop/s；第八同樣來自勞倫斯利弗莫爾國家實驗室，基於HPE Cray Shasta平台構建的Perlmutter，運算性能為64.6 Petaflop/s；第九是英偉達內部的NVIDIA DGX A100 SuperPOD，運算性能為63.4 Petaflop/s；第十位是天河二號甲，由中國國防科技大學（NUDT）開發並部署在中國廣州國家超級計算機中心，運算性能為61.4 Petaflop/s。 ...

Google發布了為AI打造的A3超算，基於NVIDIA H100 GPU

今天凌晨，Google舉辦了GoogleI/O2023大會。在會上，Google不僅發布了最新的Pixel系列硬體產品，還宣布了自家的AI服務GoogleBard將會擁有更多功能，且將在更多的國家和地區開放使用。與此同時，Google還揭秘了在GoogleBard背後提供強大算力的機器，A3超級計算機。 Google表示A3是專為訓練和運行現時的生成式AI和大語言模型而打造的，可提供26exaFlops的AI性能。每台A3均由第四代英特爾至強可擴展處理器、2TBDDR5-4800記憶體、8塊NVIDIAH100GPU組成。這8塊H100GPU通過NVSwitch和NVLink4.0互連，對分帶寬能夠達到3.6TB/s。 NVIDIA H100 NVL NVIDIA的超大規模和高性能計算副總裁IanBuck表示，「由NVIDIAH100GPU驅動的Google雲A3將會加速生成式AI應用的訓練和運行。繼Google雲最近推出的G2之後，我們很自豪可以繼續和Google雲合作，通過AI基礎設施幫助世界各地的企業轉型。」此外，除了英特爾和NVIDIA提供的硬體之外，A3還搭載了Google自家定製的200GbpsIPU，它可以讓GPU和GPU之間的數據繞過CPU，並可在其他虛擬機網絡和數據流的接口上傳輸。相較A2，A3擁有10倍的網絡帶寬，且尾延遲更低，穩定性更高。同時，Google的Jupiter數據中心網絡結構能讓數以萬計的GPU高度互連，而且能夠按需調整網絡拓撲，這有利於成本的降低。現時GoogleA3尚未正式推出，如果想要使用的話，目前的唯一方法就是填寫Google的預覽意向表。而且它是一個面向企業的服務，跟個人用戶關系並不大。不過說起來，如果能用上GoogleBard的話，某種意義上也算是體驗過A3了。 ...

ChatGPT背後的第一台AI超算：出自NVIDIA黃仁勛之手

OpenAI旗下的生成式AI工具ChatGPT可謂火遍全球，微軟創始人比爾蓋茨甚至不吝讚美，這是他自1980年首次看到現代圖形桌面環境(GUI)以來，最具革命性的技術進步。同時，ChatGPT或者說OpenAI的大火，也讓在背後提供算力晶片A100的NVIDIA受益頗多，有估算需要3萬塊才能滿足ChatGPT當前的訪問量。A100計算卡單塊售價8-9萬元左右，3萬塊就是大約25個億。日前與CNBC交流時，NVIDIA CEO黃仁勛回憶起當年，我親手給OpenAI交付了當時世界上第一台人工智慧超級計算機。在此次GTC上，NVIDIA又發布了頂級的H100 NVL，專為大型語言模型(LLM)進行優化，是部署ChatGPT等應用的理想平台。在數據中心規模，H100 NVL與上一代A100相比，GPT-3上的推理性能提高了多達12倍。來源：快科技

電費飆升日本最強超算用不上起了：臨時關閉30%節點

在超算領域，雖然中國及美國主導了最近10多年來的性能排名，然而日本也在TOP500超算榜單中有過輝煌，之前靠著K京超算拿到了第一，2020到2021年中新一代超算Fugaku富岳四次蟬聯TOP500冠軍。現在依然能排到全球第二，峰值性能依然是537PFLOPS，持續性能442PFLOPS。 Fugaku超算的處理器也是日本自研的，使用的是48核ARM處理器A64FX，浮點部分是與ARM合作的SVE指令擴展，使用了512bit浮點運算單元，每個節點使用48核+4輔助核，IO及計算節點則是48核+4輔助核結構。雖然富岳超算的性能很好很強大，但是運營方日本理化研究所也面臨著一個難題，那就是超算的電費，尤其是今年日本電費也大漲，富岳總計功耗達到了30MW，在當前的超算中功耗可不低，比排第一的美國E級超算要高出50%。據富岳的運營方所說，由於電費飆升，富岳過去幾個月的運營情況不太好，不得不臨時關閉了30%的節點，不然他們就要面臨財務危機了。富岳超算是日本花費了10年時間開發出來的，造價高達1300億日元，當年的匯率超過12億美元，每年光是能源費用就要4000萬美元，也就是將近3億。來源：快科技

2022年戈登貝爾獎公布日、美四台超算技術突破

2022 年 11 月 17 日，高性能計算領域的最高榮譽之一“戈登貝爾獎”公布，來自法國、日本和美國的16人國際團隊獲獎。獲獎原因是：在超算上實現突破性的網格細化粒子細胞模擬，推動雷射電子加速器設計的發展。相關工作成果介紹體現在論文“Pushing the Frontier in the Design of Laser-Based Electron Accelerators with Groundbreaking Mesh-Refined Particle-In-Cell Simulations on Exascale-Class Supercomputers”中。獲勝團隊將獲得由 HPC...

聯想第8次登頂中國高性能計算機TOP 100榜單獨占42席

11月15日，第四屆中國超級算力大會暨中國智能計算產業聯盟理事會在北京正式召開。 2022中國高性能計算機（HPC）性能TOP100排行榜正式揭曉。其中，聯想集團以42套的成績名列榜首，這是聯想集團第八次位列中國HPC TOP 100第一。此外，憑借在高性能計算領域的突出貢獻和創新實踐，聯想集團還獲得“中國智能計算領軍企業”稱號。聯想集團不僅八次登頂中國高性能計算機TOP 100年度數量總份額榜首，還連續9次蟬聯全球高性能計算機TOP500榜單製造商份額第一。據不完全統計，截至2022年1月，聯想高性能計算已在全球范圍內部署超過5萬個溫水水冷節點，在高性能計算機系統技術方面已申請國家發明專利85項，46項已獲授權。在本次公布的中國高性能計算機TOP100中，聯想集團董事長兼CEO楊元慶為母校上海交通大學捐建，用於教育科研的高性能計算設備“思源一號”也上榜了。其總計算力達6千萬億次/秒，算力在中國高校中排名第一，甚至超過了哈佛、劍橋等國際名校。來源：快科技

A卡+AU打造的全球首台E級超算被指故障太多運營方回應：問題不大

在全球新一代E級（百億億次）超算競賽中，位於美國橡樹嶺國家實驗室的“Frontier”超算最終勝出，它也是AMD的一大驕傲，因為“Frontier”的CPU及加速卡都使用了AMD的產品，讓AMD在TOP500超算中重回第一。然而“Frontier”超算問世之後，似乎麻煩一直不斷，最近多家美國網站爆料稱Frontier超算規劃的FP64雙精度浮點性能為1.685EFlops(168.5億億次計算每秒)，但目前只能勉強跑到1EFlops，也就是只能達到設計目標的60％。不僅性能沒有達到目標，穩定性等其他方面也有問題，讓人對這台超算明星產生了懷疑。不過超算的擁有者一直在淡化問題，負責橡樹嶺國家實驗室計算設施項目的主管賈斯汀·惠特證實了超算有些問題，但他強調這些問題都是十多年來處理過的典型問題，主要是計算規模及應用程式的廣度問題，畢竟E級計算性能比以往的超算性能強大了10多倍甚至數十倍。賈斯汀·惠特拒絕提供超算的詳細問題所在，但他表示他和團隊正在努力提高“Frontier”超算的可靠性。來源：快科技

雙A打造全球第一台百億億次超算陷入麻煩：效率只有60％

今年6月，公開亮相，採用AMD Trento EPYC 7A53處理器、AMD Instinct MI250X GPU加速卡的組合，這也是AMD時隔十年重返超算之巔，性能相當於其後第二到第七名的總和。 Frontier超算部署在美國能源部橡樹嶺國家實驗室，最初計劃2022年內全面投入運行，後推遲到2023年1月1日，但現在卻被曝出自上線之初就存在嚴重的問題，每天都故障不斷。據稱，Frontier超算規劃的FP64雙精度浮點性能為1.685EFlops(168.5億億次計算每秒)，但目前只能勉強跑到1EFlops，也就是只能達到設計目標的60％。具體原因不詳，有一種說法是HPE Cray機櫃使用的Slingshot網絡互連系統與HPE集群存在衝突，另一種說法是Slingshot互連系統與AMD計算平台存在衝突，但究竟怎麼回事不得而知。美國能源部百億億次計算項目的一位對外聯絡發負責人Mike Bernhardt發布了一則簡單聲明，稱感謝HPE、AMD的努力，Frontier系統今年秋天提前交付，目前正在進行安裝和集成，這是一項繁重、復雜的任務，但目前進展順利，將在明年按期想科學界開放。為了沖擊百億億次超算，美國規劃了三條路線。 Intel Sapphire Rapids四代可擴展至強、Ponte Vecchio加速卡打造的“Aurora”進展也很不順，一直在推遲，主要是Intel的兩個新品遲遲無法規模交付。 AMD處理器、NVIDIA加速卡組成的“Polaris”消息非常少，不清楚目前具體進展如何。來源：快科技

首台ExaFLOP級超算Frontier幾乎每天都有故障，問題或出自GPU及互聯系統

美國橡樹嶺國家實驗室的Frontier是全球首台真正意義上達到ExaFLOP級別（百億億次）的超級計算機，在高性能Linpack（HPL）基準里，顯示其運算性能達到了1.102 Exaflop/s，峰值性能達到了1.685 Exaflop/s。打造一台超級計算機並不是一件容易的事情，需要面對大量的硬體和軟體工作，而且有可能遇到意料之外的狀況，特別是Frontier這種採用新架構、性能有跨越式提升的超算。據TomsHardware報導，目前Frontier的運轉情況並不好，幾乎沒有一天是完全正常運轉，平均故障間隔時間僅為數個小時。有關Frontier存在硬體問題的消息已經流傳有一段時間了，有消息稱可能與該系統採用的HPESlingshot互連系統有關，也有傳聞指Instinct MI250X計算卡並不是那麼可靠。 Frontier基於HPE Cray EX235a架構，採用了AMD第三代EPYC處理器，頻率為2GHz，整個系統共有8730112個內核。每個HPE Cray EX節點包括了一塊AMD的64核EPYC「Trento」7A53處理器（代號Milan的Zen 3架構衍生產品），512GB的DDR4記憶體，以及四塊Instinct MI250X計算卡，通過四個HPE Slingshot 200Gbps乙太網NIC（25GB/s）連接，提供800Gbps（100 GB/s）的節點帶寬。 Frontier並不是唯一一款採用HPE Cray EX架構及HPESlingshot互連系統的超級計算機，芬蘭名為Lumi的超算幾乎採用了相同的架構，峰值性能達到了0.55 ExaFLOPS，似乎並沒有出現類似的問題。 Frontier原計劃在2022年上線，不過至今仍未正式部署，不知道2023年是否可以向研究人員開放。 ...

騰訊最強超算中心誕生：算力是目前世界第一的10倍

9月27日，騰訊長三角人工智慧先進計算中心及生態產業園項目北區8棟樓基本完工。目前，7號、8號樓已投入使用，1萬余台伺服器正常運行。據介紹，該計算中心建成後，伺服器數量將達到80萬台，算力是目前世界排名第一的超算中心的10倍，屆時將成為全國單體規模最大、達到世界領先水平的數據中心。將承擔各類人工智慧、即時通信、圖像處理、科學計算等任務，以強大的數據處理能力為全社會提供雲計算服務。騰訊長三角人工智慧先進計算中心及生態產業園項目是上海市重大建設項目，將引入騰訊的科恩、優圖、微翎三大實驗室。除了騰訊三大實驗室外，還有常山北明、東華軟體、T3出行、靈雀雲等50餘家騰訊生態鏈企業將入駐生態產業園項目。來源：快科技

x86/ARM勁敵第三大CPU架構RISC-V進入超算：表現驚人

一個歐洲大學生團隊組裝出第一台能夠平衡功耗和性能的 RISC-V 超級計算機。更重要的是，它展示了 RISC-V 在高性能計算方面的巨大潛力，為歐洲擺脫對美國晶片技術的依賴提供了機會。「Monte Cimone」集群不會很快用於處理大規模的天氣模擬等，因為它只是一台實驗機器。這台設備由博洛尼亞大學和義大利最大的超級計算中心 CINECA 的人員構建，六節點集群設計，旨在展示除浮點能力之外的各種 HPC 性能元素。它使用 SiFive 的 Freedom U740 片上系統RISC-V 的電源模塊，這個2020 年推出的 SoC 有五個 64 位 RISC-V CPU 內核——四個...

10倍AMD超算性能 NVIDIA開建AI超算：CPU、顯卡都自己的

前兩天的TOP500超算排行榜中，AMD這次大獲全勝，，而且是首個性能百億億次的超算，性能達到了1.102 Exaflop/。在AMD之外，基於Intel處理器及加速卡的Aurora超算也快要問世了，預計在2023年安裝，性能可達200億億次。這兩家的超算都上路了，NVIDIA也不會閒著，他們也同樣得到了美國能源部的資金，為後者的洛斯阿拉莫斯國家實驗室LANL開發新一代超算，使用的則是NVIDIA自己的CPU及加速卡。 CPU是NVIDIA自研的5nm Grace系列，有兩種版本，CPU+GPU版的是整合了72核CPU及Gopper GPU，純CPU版的是整合了2路Grace，總計144個CPU核心，1TB LPDDR5記憶體。 GPU無疑會是NVIDIA的4nm Hopper架構H100，集成800億電晶體，總計1.8萬個CUDA核心，有著高達80GB的HBM2e顯存，擁有2TB/的帶寬，並是第一款採用PCIe Express 5.0的NVIDIA卡。這套超算的性能將首次達到1000億億次，也就是10個E級，是AMD現在最強超算的10倍性能。不過這個性能不是傳統意義上的FP浮點性能，而是AI性能，是面向AI加速的超算。來源：快科技

全球超算TOP500：美國突破百億億次、中國笑而不語

2022年5月30日，在德國漢堡舉行的 ISC 2022公布了第59屆的全球超算TOP500榜單，位於美國橡樹嶺國家實驗室 (ORNL) 的新型超級計算機Frontier以絕對優勢，成功超越日本的Fugaku，成為了全球最強超級計算機，同時也是全球首個真正的百億億次超級計算機。中國的神威·太湖之光和天河二號排名下滑至第六和第九。百億億次超級計算機Frontier：性能最強，能效最高據介紹，Frontier 在美國橡樹嶺國家實驗室的計算設施 (OLCF) 占地 372 平方米，由 74 個 Cray EX 機櫃組成，擁有 9，408 個節點，每個節點配備一個 AMD Milan 「Trento」 7A53 Epyc CPU 和四個AMD...

AMD世界最強超算揭秘：64核CPU僅2GHz頻率、100%液冷

今天公布的TOP500超算中，基於AMD處理器和加密卡的超算Frontier拿下了冠軍，這也是美國及全球首個公開確認的百億億次超算，峰值性能超過110億億次。 AMD上一次拿到TOP500第一還是2012年泰坦超算，當時使用的是16核皓龍處理器，不過加速卡是NVIDIA的K20X，現在的Frontier是AMD處理器及MI250X加速卡的高光時刻，10年沒有白費。 Frontier使用了AMD的第三代EPYC處理器，但不是常見的milan系列，而是代號「Trento」的7A53，也是64核128線程，但支持XGMI總線，是為超算定製的產品。 1路64核處理器搭配4路MI250X加速卡，通過Infinity Fabric連接，還有4路NIC高速網絡及4路PCIe 4.0 NVMe SSD硬碟，這些共同組成一個節點。最終的Frontier超算由74個機櫃組成，總計9408個節點，總計擁有873萬個核心（CPU+GPU），9.2PB DDR4記憶體及37PB本地存儲、716PB中心級存儲。雖然規模龐大，但是Frontier的能效非常高，只用了40MW的功耗就實現了百億億次超算，為了節能AMD及HPE也是廢了不少心思，64核的EPYC處理器允許頻率只有2GHz，不需要高頻率。同時傳統的風冷散熱也不夠了，Frontier這次使用了100%的液冷散熱，這也是能效更高的關鍵因素之一。來源：快科技

Frontier成為首台ExaFLOP級超算，以AMD EPYC與Instinct MI250X構建

多年來，超級計算機一直在突破各種運算上限，包括了MegaFLOP、GigaFLOP、TeraFLOP、PetaFLOP、以及現在的ExaFLOP。近日，TOP500官方公布了第59期榜單，美國橡樹嶺國家實驗室的Frontier成為首台真正意義上達到ExaFLOP級別（百億億次）的超級計算機，在高性能Linpack（HPL）基準里，顯示其運算性能達到了1.102 Exaflop/s，峰值性能達到了1.685 Exaflop/s。 Frontier基於HPE Cray EX235a架構，採用了AMD第三代EPYC處理器，頻率為2GHz，整個系統共有8730112個內核。根據過往的信息，每個HPE Cray EX節點包括了一塊AMD的64核EPYC「Trento」7A53處理器，512GB的DDR4記憶體，以及四塊Instinct MI250X計算卡，通過四個HPE Slingshot 200GBps乙太網NIC（25GB/s）連接，提供800Gbps（100 GB/s）的節點帶寬。 EPYC「Trento」7A53處理器為代號Milan的Zen 3架構的衍生產品，傳聞其I/O 晶片採用了Infinity Fabric 3.0來實現與GPU一致的記憶體接口。每塊EPYC「Trento」7A53處理器會被劃分為四個NUMA區域，每個NUMA區域與一塊Instinct MI250X計算卡（每塊兩個GCD）相連。CPU到GPU之間通過Infinity Fabric以36+36GB/s的接口帶寬連接，CPU到GPU之間288GB/s的總帶寬分布在節點中的八個GCD里。在過去多期榜單里，頭名一直由富士通建造、安裝在日本神戶的RIKEN計算科學中心（R-CCS）的Fugaku超級計算機把持，採用了 A64FX處理器。此次Fugaku滑落到第二名，其HPL性能為442 Petaflop/s，峰值性能理論上也能達到1 Exaflop/s。芬蘭CSC的EuroHPC中心的LUMI位列第三，這也是新上榜的超級計算機，HPL性能為151.9 Petaflop/s。 ...

AMD Yes 10年後重奪全球超算第一 CPU顯卡雙喜臨門

在日前ISC國際超算會議上，第59界TOP500超算名單也出爐了，美國橡樹嶺國家實驗室 (ORNL)的超算系統Frontier超越日本的富岳成為全球超算冠軍，而且是首個性能百億億次的超算，性能達到了1.102 Exaflop/。當然，對AMD來說，這次的排名更有意義，因為Frontier超算使用的是AMD的第三代EPYC 64核處理器及Instinct MI250X加速卡，最強超算同時用了AMD的CPU及顯卡，意味著AMD在高性能計算上終於拔得頭籌。在超算領域，AMD上一次拿到TOP500第一還是2012年的泰坦超算，處理器是AMD的皓龍6274 16核，加速卡是NVIDIA的Tesla K20X，峰值浮點性能最終達到了27PFLOPS，也就是2.7億億次。泰坦超算在2019年就退役了，這兩年來由於EPYC處理器性能優勢，AMD在超算上也開始收復失地，現在隨著Frontier超算的到來終於拿到了久違的第一。 AMD在這次的TOP500超算中可謂大獲全勝，不僅僅Frontier超算拿到第一，實際上TOP10中有5個都基於AMD處理器的，包括第三名的Lumi、第七名的Perlmutter、第八名的Selene及第十名的Adasdtra。此外，中國在TOP500中最強的超算還是神威·太湖之光，93.1PFLOPS的性能也沒有變化，目前全球排名第六。目前TOP500超算中美國的總數從150個減少到了126個，中國依然有173套。最最後，實際上AMD的Frontier也不是真正意義上的全球首個百億億次超算，只不過在未來一段時間內，TOP500超算中很可能不會再有中國超算的排名了。來源：快科技

Crusher超算系統上線：AMD定製版EPYC搭配Instinct MI250X

美國能源部（DOE）橡樹嶺國家實驗室（ORNL）正打造一台ExaFLOP級的超級計算機Frontier，這是價值6億美元的項目。在Frontier正式運行之前，將由Crusher暫時代替，作為測試平台。據TomsHardware報導，近日Crusher超級計算機已上線。 Crusher與Frontier採用了相同的架構和組件，每個HPE Cray EX節點包括了一個AMD的64核EPYC「Trento」7A53處理器，512GB的DDR4記憶體，以及四塊Instinct MI250X計算卡。Crusher共有192個節點，分別裝入到兩個機櫃中，其中一個有128個節點，另外一個有64個節點，不過總的占用空間僅為以往Cray XK7 Titan超級計算機的十分之一，但提供了更高的運算性能。Cray XK7 Titan曾是世界上最快的超級計算機之一，搭載了AMD Opteron處理器和英偉達Tesla計算卡，在2012年到2019年之間為數百項科學研究服務。 Crusher和Frontier搭載的EPYC「Trento」7A53處理器是一款定製晶片，AMD沒有透露太多的細節，只知道是代號Milan的Zen 3架構的衍生產品，傳聞其I/O 晶片採用了Infinity Fabric 3.0來實現與GPU一致的記憶體接口。每塊EPYC「Trento」7A53處理器會被劃分為四個NUMA區域，每個NUMA區域與一塊Instinct MI250X計算卡（每塊兩個GCD）相連。 CPU到GPU之間通過Infinity Fabric以36+36GB/s的接口帶寬連接，CPU到GPU之間288GB/s的總帶寬分布在節點中的八個GCD里。Crusher的每個節點通過四個HPE Slingshot 200GBps乙太網NIC（25GB/s）連接，提供800Gbps（100 GB/s）的節點帶寬。 Frontier超算系統在2021年已經交付，不過仍在進行集成和測試，具體運行的時間表仍未確定。Frontier超算系統是美國第一台ExaFLOP級的超級計算機，美國能源部預計會在2023年1月向研究人員開放。 ...

Intel公開頂級超算卡Ponte Vecchio性能：比安培卡皇高出160%

在今天的投資者會議上，Intel公布了一系列猛料，除了CPU、GPU、工藝路線圖之外，還首次公開了自研的超算卡Ponte Vecchio的性能，對比NVIDIA的7nm安培卡皇A100也非常有優勢，性能領先多達160%。自從推出Xe架構GPU之後，Intel以此為基礎打造了一系列顯卡，筆記本上用到是Xe LP架構，ARC遊戲卡用的是Xe HPG架構，而計算卡用的是Xe HPC架構，專門為高性能運算及AI加速而生的。 Ponte Vecchio就是Intel為超算研發的頂級加速卡，它實際上不是一個GPU核心，而是Intel多個晶片通過3D封裝才弄出來的晶片怪獸，成電晶體數量突破1000億個，使用5種不同的製造工藝，在內部封裝了多達47個不同的單元(Tile)，包括計算單元、Rambo緩存單元、Foveros封裝單元、基礎單元、HBM單元、Xe鏈路單元、EMIB單元，等等。根據Intel去年公布的數據，它在初步階段中，實測FP32吞吐性能超過45TFlops，Memory Fabric緩存帶寬超過5TB/，互連帶寬超過2TB/。在這次投資者會議上，Intel還拿出了Ponte Vecchio顯卡跟NVIDIA最頂級的A100加速卡做了對比，後者使用的是7nm Ampere安培架構，以後者的性能作為1.0基準，Ponte Vecchio在不同運算中性能是1.7x、1.9x到最高2.6x。也就是說，Intel的加速卡Ponte Vecchio性能最高可以比NVIDIA的卡皇高出160%，優勢非常明顯。來源：快科技

Meta豪購25億元NV安培GPU 打造世界級AI超算：性能怪獸來了

日前，Meta（Facebook母公司）宣布建造全球最強大的AI超算，名為AI Research SuperCluster（RSC）。其目標是最終運算速度（Linpack）達到220 petaflops（每秒22億億次），實際上，RSC已經投入運行，但後續還會追加運算節點。圖為DGX A100 當前，RSC的配置是760套NVIDIA DGX A100 AI系統，也就是1520顆AMD 64核EPYC處理器（第二代，代號Rome）、6080顆NVIDIA A100 GPU，未來會再追加1240套DGX A100系統，單GPU規模就多達16000顆（單顆顯存40GB）。 I/O方面，網絡帶寬200Gbps、175PB FlashArray、10PB FlashBlade以及46PB緩存。經查，DGX A100發布於2020年，單套系統售價高達19.9萬美元。也就是說，RSC最終完工時，單采購DGX A100就需要花費3.98億美元（約合人民幣25億）。來源：快科技

美國公布新超算：採用NV下一代GPU

NVIDIA的下一代GPU，終於含蓄地揭開了神秘面紗。本周三，美國可再生能源實驗室（NREL）宣布將建造新超算Kestrel，合作方是HPE（惠與）。配置上，這套超算的CPU選用Intel Xeon Scalable Sapphire Rapids，也就是預計明年上半年發布的新一代至強可擴展處理器，GPU則是NVIDIA A100Next，掛載75PB容量的硬碟。性能指標是雙精度44 PetaFLOPS（億億次），大約能在目前超算TOP500中排進前七，2023年投入使用。仔細觀察可發現，這個A100Next很有說法，實際就是NV下一代GPU，因為保密的緣故還不能公開。就爆料來看，Turing的下一代產品分為伺服器/企業級和遊戲級，前者是Hopper，後者是Ada Lovelace，雖然都是5nm，但架構截然不同，Hopper據說是MCM多晶片設計，暴力堆核心，這對伺服器產品來說倒是也順理成章。至於下一代至強Sapphire Rapids，最大56核，支持8通道DDR5-4400記憶體，112條PCIe 5.0，熱設計功耗350W。來源：快科技

清華大學用超算模擬量子計算機：4200萬核CPU、性能可達440億億次

量子計算機是未來新型計算系統的重點之一，如何實現量子霸權——性能超過經典計算機是這個領域的重要目標。在日前SC超算大會上，清華大學教授付昊桓使用中國的神威超算模擬了量子計算機，最多可擴展到4200萬CPU核心，性能可達440億億次。根據付昊桓教授提交的論文，他們在最新的神威超算上開發了用於RQC（隨機量子電路）的高性能矢量模擬器，可擴展到4200萬個核心，FP32單精度性能可達120億億次，混合精度性能可達440億億次。在這台模擬量子計算機上，他們也實現了量子霸權，傳統計算機需要運算1萬年的現在這台量子計算機上只要304秒。作為對比的話，這台模擬的量子計算機比起Google之前的Sycamore量子計算機還要慢一些，後者只需要200秒就可以完成傳統計算1萬年的性能，不過Google的Sycamore也多次被其他公司質疑。據清華大學資料，付昊桓，男，1982年8月生。2003年7月，獲清華大學計算機系學士學位。2005年7月，獲香港城市大學計算機系碩士學位。2009年1月，獲英國倫敦帝國理工學院計算機系博士學位。 2009年3月至2010年11月，在美國史丹福大學地球物理系從事博士後研究。2010年12月至2018年7月，任清華大學地球系統科學系副教授。2018年7月起任清華大學地球系統科學系長聘教授。 2016年、2017年連續兩年獲得高性能計算應用領域最高獎「戈登？貝爾」獎。2017年獲評世界網際網路大會烏鎮峰會世界網際網路領先科技成果。 2017年獲評清華大學十大亮點成果。2018年獲江蘇省五四青年獎章榮譽。2020年獲中國青年五四獎章榮譽。來源：快科技

2021中國超算TOP100揭曉：神威太湖之光5年霸榜被匿名選手終結

11月12日消息，第三屆中國超級算力大會（ChinaSC 2021）上午在京召開。會上發布了，這也是自2002年以來第二十次發榜。結果顯示，匿名廠商的一台主機系統最終排名第一，終結了神威太湖之光連續5年的霸榜。參數顯示，這台高性能計算機採用CPU+GPU異構眾核處理器，Linpack值達到了125040Tflops，也就是每秒超12億億次，比神威太湖之光高出34%，而其CPU核心數則比神威太湖之光少了97%。經查，在全球超算TOP500榜單中，這套匿名系統的成績也能進入前三。據悉，榜單前100台超算系統的平均性能相比2020年提升達79%。廠商方面，TOP100中，聯想有40套系統、浪潮有28套，中科曙光有12套。來源：快科技

英偉達將向英國醫療初創公司開放Cambridge-1超算，以加速人工智慧戰略

目前英國最強大超級計算機是Cambridge-1（劍橋1號），這是英偉達投資1億美元的項目，將致力於推動醫療行業發展，研究人員和科學家可以利用人工智慧加速生物學方面的研究。英偉達已經與阿斯利康、葛蘭素史克、蓋伊和聖托馬斯NHS基金會、倫敦大學國王學院以及Oxford Nanopore Technologies展開合作，首批項目包括深入了解痴呆症等腦部疾病，運用人工智慧協助新藥研發，以及提高尋找人類基因組致病變異研究的准確性。近日，隨著英國在推動人工智慧技術研究和實施的十年計劃，英偉達宣布將向英國醫療方面的初創公司開放Cambridge-1超級計算機。英偉達企業EMEA副總裁David Hogan表示，該計劃是提升英國作為人工智慧全球領導者戰略優勢的重要一步，通過Cambridge-1和NVIDIA Inception計劃支持英國的AI生態系統，其中包括500多家英國最具活力的AI初創公司。 Peptone是英國的一家生物技術公司，也是NVIDIA Inception的成員，將獲得Cambridge-1超級計算機的幫助。Peptone正計劃使用超級計算機應對其在數字生物學領域的挑戰，目前正在創建一種「蛋白質工程系統」，將融合生成式人工智慧模型和計算分子物理學，以發現治療慢性阻塞性肺病、銀屑病和哮喘等炎症性疾病的療法。 Peptone執行長兼創始人Kamil Tamiola表示，Cambridge-1的計算能力將改變遊戲規則，可以將計算與實驗室實驗相結合，以改變蛋白質藥物的設計方式。Cambridge-1能極大地改進抗體的設計，以幫助治療多種炎症疾病。每個使用NVIDIA Inception的初創公司都在其公司生命周期中得到支持，將允許他們的平台上市和開發。目前這些初創公司可以在年底前提交申請，入選後英偉達將會公告，預計最早在2022年初公布名單。 ...

3.6萬CPU核心、1550萬GPU核心：AMD＋NVIDIA打造世界第一AI超算

為了沖擊百億億次計算，美國官方准備了三套不同系統，分別由Intel、AMD、AMD+NVIDIA聯合打造。現在看起來，AMD+NVIDIA的聯合方案進展最快。這套名為「Polaris」(北極星)的超算，隸屬於美國能源部阿貢國家實驗室ALCF(阿貢領先計算設施)，主要為用戶的算法和科學領域的超級規模的研究和探索提供支持，並對學術界、政府機構、行業研究人員開放使用。它基於Cray Slingshot 10高性能可擴展互連架構，惠與(HPE)負責建造，共有560個節點，每個節點配備兩顆AMD EPYC 7532處理器、四塊NVIDIA A100計算卡，合計1120顆處理器、2240塊計算卡。 EPYC 7532擁有32核心64線程(Zen2機構)，A100計算卡則有6912個CUDA核心(Ampere架構)，因此這套超算總共有多達35840個CPU核心、15482880個GPU核心，只是不知道A100這里的顯存是40GB還是80GB。整套系統的FP64雙精度浮點峰值性能將達44PFlops(44千萬億次每秒)，在當今全球超算TOP500榜單上可以排在第十位。不過，它的理論AI性能可以高達驚人的1.4EFlops(140億億次每秒)，通過處理數據密集型和AI高性能計算工作負載，將模擬和機器學習相結合。 Polaris超算將在今年年內上線，明年3月份升級為Slingshot 11架構，處理器更換為Zen3架構的EPYC 7543，仍是32核心，但性能將再上一個台階。 AMD為美國能源部橡樹嶺國家實驗室(ORNL)打造的百億億次超算名為「Frontier」，配備Zen4架構下代EPYC處理器、Instinct計算卡，合同價值6億美元。 Intel中標的超算名為「Aurora」，基於其下代Sapphire Rapids至強處理器、Xe HPC Ponte Vecchio計算卡。不過，AMD、Intel的新平台都尚未發布，大部分都要到明年才會完成，超算系統也順應延期，預計會在2022-2023年才會陸續上線。來源：快科技

AMD超算領域終逆襲 7nm Zen2遙遙領先友商14nm

6月底的ISC21超算大會上，TOP5000新一輪名單出爐，使用ARM晶片架構的日本富岳超算依然第一，但AMD才是這次的大贏家，7nm Zen2架構的霄龍處理器全面殺進超算市場。本次超算排名中TOP10變化不大，最顯著的就是新成員Perlmutter，排名第六，，使用的是AMD Milan CPU 和 Nvidia A100 40GB GPU，峰值性能89.8TFLOPS，持續性能64.6TFLOPS，而且功耗只有2528KW。快科技全球超算TOP500排行榜單基於AMD處理器的超算雖然現在還沒沖擊到前三，但是在這次的TOP500名單中，AMD收獲是最大的，新入的58套系統中AMD份額最多，假以時日AMD在TOP500超算中會占據更多的份額。 ServerTheHome網站分析了新進入的58套TOP500超算系統，得出了一些很有意思的結果。首先是份額，使用AMD處理器的數量超過了Intel、NEC及富士通，雖然AMD領先Intel的數量優勢不算大，但對AMD來說這已經是大翻身了，以前Intel在超算CPU上是壟斷性優勢。具體到CPU架構上，使用AMD的Zen2架構羅馬處理器的是最多的，這是AMD首次使用7nm工藝，最多64核128線程，非常適合超算中使用。 Intel這邊新進入榜單的則是Cascade Lake處理器，14nm工藝，最高28核56線程。再往下還有Intel的10nm工藝IceLake處理器、AMD的7nm Zen3處理器，往後看的話他們潛力更大，會取代前面的Zen2、Cascade Lake處理器。來源：遊民星空

超算TOP500榜單公布英偉達AI優勢前所未有？

本周，一年一度的高性能計算大會ISC如期而至，世界TOP 500超級計算機排名也隨之更新公布，對比去年的榜單，今年TOP 10的榜單中，來自美國新能源部勞倫斯伯克利國家實驗室的Perlmutter系統新晉入圍。在TOP500的榜單中，中國超級計算機的數量雖然下降至186台，但對比位居第二的美國的123台，依然遙遙領先。一個值得注意的事實是，此次榜單中有342套系統採用了英偉達技術提供加速，對比去年的333套提升2%，榜單上使用InfiniBand的系統數量也比去年增加了20%。另外，名單上更新的兩個新系統「超級雲」，能夠同時滿足AI、高性能計算（HPC）和雲端需求。這意味著，高性能計算正在同AI加速融合，而在這一融合趨勢下，英偉達在超算領域的優勢前所未有。不止是TOP10中的8台，新晉系統也選英偉達雷鋒網(公眾號：雷鋒網)此前在《全球TOP10超級計算機8台都選英偉達的三大原因》一文中分析過，由於高速數據互連技術的普及，以及英偉達GPU系統能夠提高將超算的能效提升2.8倍，全球TOP10超級計算機中的8台都採用了英偉達GPU或InfiniBand網絡技術。在最新公布的榜單中，不少新晉系統也都選擇英偉達提供支持，其中包括雲端的兩個新系統。 Microsoft Azure是其中之一，在TOP 500榜單上連續占據第26位到第29位，利用集群將公有雲服務提升到新的水平。作為新興的共享超級計算機，地球上的任何用戶都可以按需使用。在Azure系統的背後，有8個NVIDIA A100 Tensor Core GPU為其各個虛擬實例提供動力支持，每個晶片都有自己的HDR 200G InfiniBand 通信接口，可以與Azure雲中的數千個GPU建立高速連接。劍橋大學的新系統Wilkes-3是另一個超級雲系統，也是世界上第一台雲原生超級計算機。該系統使用了320個連接在HDR 200G Infiniband 網絡上的 A100 GPU，且有經過優化的NVIDIA BlueField DPU提供安全、虛擬化的數據處理，保證虛擬資源的隱私性和安全性。此外，本次進入TOP10的新系統Perlmutter，以 64.59 Linpack petaflops 在 TOP500...

TOP500超算名額一年增長5倍 AMD高性能處理器成了

在最新的ISC 21超算大會上，TOP500上半年的名單更新了，雖然排名靠前的超算變化不大，但是AMD可以說是今年超算市場上的大贏家，使用AMD EPYC處理器的TOP500超算一年增長5倍。 AMD在TOP500超算中最輝煌的時候還是2012年拿下第一的Titan泰坦超算，使用的是AMD的的皓龍6274 16核處理器，加速卡是NVIDIA的Tesla K20X，峰值浮點性能最終達到了27PFLOPS，也就是2.7億億次。在Zen架構問世之前，AMD在超算市場上差不多有五六年的空白，2019年才靠著EPYC處理器才重返TOP500前列，現在入圍的型號及超算性能也不斷提升，本次最強的就是位列第五的Perlmutter超算了，使用的是EPYC 7763 64核處理器，7nm Zen3架構的。根據AMD所說，從2020年6月到現在的一年里，基於AMD處理器的TOP500超算增長了近5倍，也比去年底的時候翻倍，今年6月榜單上的新增58台超算中有一半都使用了AMD的EPYC處理器。對AMD來說，位列第五隻是暫時的，基於新一代EPYC處理器的超算有望沖擊第一，美國已經出資建設了至少兩套百億億次超算，其中與HPE、美國橡樹嶺國家公園合作的超算Frontier是百億億次級別的，還有更強大的El Capitan超算，性能是2百億億次級別的，前者預計在2021年問世，後者預計在2023年問世。來源：快科技

TOP500公布57期Top10超算名單：Fugaku以442Pflop/s傲視群雄

基於超算性能，TOP500 今天公布了第 57 期 Top10 超級計算機名單。從榜單來看，自 2020 年 11 月以來就幾乎沒有變化，日本超級計算機 Fugaku 成功地守住了榜首位置。Fugaku 由 Riken 和富士通開發，其 HPL 基準得分為 442 Pflop/s，是排在第 2 位的 IBM Summit 的...

美國最新超算投入使用：算力世界第二採用AMD＋英偉達方案

近日，美國國家能源研究科學計算中心（NERSC）的勞倫斯·伯克利國家實驗室（Berkeley Lab）宣布，由HPE打造的新型超級計算機Perlmutter已正式投入使用，它也是目前世界上AI性能最強的超算之一。 Perlmutter採用了HPE的HPE Cray EX伺服器，搭載了AMD最新的第三代霄龍EPYC處理器和英偉達A100計算加速卡。它將幫助科學家們建立可見宇宙中有史以來規模最大的3D地圖來研究暗能量如何加速宇宙擴張。Perlmutter基於HPE Cray Shasta平台構建，是一個異構系統，包含有CPU和GPU加速節點，其性能是美國國家能源研究科學計算中心目前使用的超算Cori的三到四倍，該系統按計劃將分兩期交付。目前，第一期交付的系統包括1,536個節點，每個節點都有一顆64核EPYC 7763處理器和四個NVIDIA A100計算加速卡，可以提供60 PetaFLOPS的FP64性能，或3.823 ExaFLOPS的FP16性能。第二期系統將於今年晚些時候交付。部署完成後，Perlmutter的FP64性能綜合能達到180 PetaFLOPS，將超過世界超算排行榜上排名第二的Summit。不過性能仍然較大幅度的落後於日本富士通基於ARM的超算--富岳，據稱富岳的理論性能達到513PetaFlops。這台超算的名字Perlmutter，是為了紀念實驗室的天體物理學家Saul Perlmutter(薩爾·波爾馬特)，他因「透過觀測遙遠超新星而發現宇宙加速膨脹」而獲得了2011年諾貝爾物理學獎。來源：cnBeta

AMD百億億次超算用上「超級SSD」：700PB容量、10TB/s速度

隨著64核霄龍處理器的走紅，AMD近年來拿下了多個超算訂單，其中與HPE、美國橡樹嶺國家公園合作的超算Frontier將是百億億次級別的，用上新一代霄龍及Raden加速卡，今年底問世。除了計算能力超級強大之外，Frontier超算的存儲系統也是頂級水平的，容量、速度都會創造超算紀錄。橡樹嶺國家實驗室日前公布了Frontier超算的IO系統配置，主要由存儲級別的記憶體、中心級別的文件存儲系統構成，其中後者名為Orion，將使用開源的Lustre及ZFS文件系統。 Orion的存儲系統又分為三個層次，首先是5400個NVMe SSD硬碟組成的性能層，容量11.5PB，讀寫速度是10TB/級別的，隨機IOPS超過200萬。第二層是容量層，由47700個HDD硬碟組成，總容量679PB，峰值讀取可達5.5TB/，寫入可達4.6TB/，隨機IOPS也有200萬。第三層是元數據層，也是NVMe SSD硬碟，只有480個，容量10PB。三級存儲系統下來，總容量將達到700PB，速度少則5TB/，多則10TB/，相當於一個超級大容量的混合硬碟了。至於記憶體存儲，則使用PCIe 4.0連接，容量沒公布，但讀取速度可達75TB./，寫入速度35TB/，隨機性能可達150億次IOPS。來源：快科技

新加坡10 PFLOP超算將採用AMD霄龍Milan CPU和英偉達A100 GPU

新加坡國家超級計算機中心（NSCC）宣布：定於 2022 年初投入使用的 10 PFLOP 新超算，將採用 10 萬核心的 AMD EPYC Milan 處理器、以及 352 顆英偉達 A100 Tensor Core GPU 。The Register 報導稱，這台面向政府、企業和研究機構的 10 PFLOP 超算，已於...

威馬W6正式上市：稱達到L4級別無人駕駛最低17萬

雷帝網樂天 4月16日報導威馬W6今天正式上市，新車共推出5款車型，售價區間為16.98-25.98萬元，並正式開啟交付。官方稱，威馬W6搭載高通8155晶片，達到L4級別無人駕駛、可實現SOA技術應用。威馬還邀請90後青年演員董子健、鍾楚曦擔任威馬汽車最新代言人。據威馬稱，威馬W6全車尺寸為4620/1847/1730mm，軸距達到2715mm，搭載160kW永磁同步電機，NEDC續航里程最高可達620km。「威馬W6定位「超算力可進化智能SUV」，是造車新勢力上半年唯一交付的全新車型。」威馬W6搭載AVP無人自主泊車系統，可實現L4級別無人駕駛。威馬W6具備的HAVP（自主學習泊車）適用於住宅、公司等固定車位場景，車輛僅需學習一次即可自主尋徑泊車，用戶通過威馬智行APP即可一鍵「召之即來，呼之即去」。 PAVP（高精地圖泊車）則適用於大型商場、寫字樓等非固定車位場景，依託高精地圖，藉助雲端百萬級算力，車輛可自動規劃泊車路線，通過跨層巡航的全無人自主泊車、取車。 PAVP功能將在年內通過OTA升級推送給用戶。HAVP+PAVP組合能夠解決各類泊車痛點，為用戶打造無人駕駛技術應用。威馬W6還對針對中國路況開發的全功能L2級智能輔助系統進行升級，搭載新的Living Pilot 3.0智行輔助系統，提供20項駕駛輔助配置。新增撥杆變道（ALC）、交通擁堵引導（TJP）、自動導航輔助駕駛（NLP）、前方穿行預警（FCTA）、後方穿行預警（RCTA）、後部穿行制動（RCTB）、開門碰撞預警（DOW）、遙控泊車（RPA）等實用功能，讓車輛成為安全、自由的出行空間。無論是特定場景的無人駕駛系統，還是實用的高級輔助駕駛系統，均離不開威馬硬體帶來的支持。威馬W6搭載高通SA8155晶片，威馬稱，其算力提升8.5倍、圖像處理能力提升20倍，在3D圖像和特效處理等方面獲長足進步。在傳感器方面，5個77GHz毫米波雷達、2個高清前視攝像頭、4個高清環視攝像頭、12個超聲波雷達高效協同，確保各項駕駛輔助配置流暢運行。伴隨威馬W6正式發售，威馬汽車啟用全新產品命名體系，發布W——「世界系列」和M——「大師系列」。「大師系列」，取自威馬英文「WM」中的「M」，以威馬汽車企業使命為源點，旨在通過前瞻技術和匠心美學顛覆用戶對傳統汽車認知。大師系列代表的威馬轎車產品，在追求極致細節的同時，為用戶提供更精緻、更全面、更具個性化的卓越體驗。威馬汽車稱首台純電轎車量產概念版基於「大師系列」理念而生，量產版計劃於2021年末發布。 2021年是威馬汽車戰略全面提速的一年。威馬汽車創始人、董事長兼CEO沈暉表示，威馬汽車將在產品、智能化、渠道、研發技術等方面同步發力，加速奔跑。基於轎車戰略的布局，威馬汽車將會推出兩款主流產品。此外，威馬汽車將穩步推進國際化戰略，加速開拓歐洲、東亞以及東南亞等海外市場。 ——————————————— 雷帝觸網由資深媒體人雷建平創辦，為頭條簽約作者，若轉載請寫明來源。來源：kknews威馬W6正式上市：稱達到L4級別無人駕駛最低17萬

英偉達發布自主CPUARM架構、打造2千億億次超算

NVIDIA是一家GPU公司，但也一直在嘗試各種CPU，包括自動駕駛、移動計算等，早些年還試圖通過Tegra系列染指智慧型手機。 GTC 2021開發者大會上，黃仁勛親自宣布了NVIDIA的全新處理器，代號「Grace」，取自Grace Hopper——格蕾絲·霍珀女士，計算機史上最早的程式設計師之一，也是編譯語言之母，領導開發了程式語言Cobol。有趣的是，此前傳聞稱Ampere GPU架構的繼任者代號是Grace Hopper，看來搞錯了方向。 NVIDIA Grace處理器主要面向超大規模AI人工智慧、HPC高性能計算，最大特點就是海量的帶寬。它基於ARM Neoverse架構，但具體核心數量、頻率、緩存、功耗等暫未公布，今天說的主要是連接，搭配LPDDR5X記憶體可提供超過500GB/s的帶寬，而且支持ECC錯誤校驗，通過緩存一致性NVLink總線連接自家GPU，帶寬可超過900GB/s，同時兩顆CPU之間的帶寬超過600GB/s。瑞士國家超級計算中心(CSCS)、慧與(HPE)、NVIDIA聯合使用Grace CPU、下一代NVIDIA GPU，正在共同打造號稱世界最快AI超算的「ALPS」(阿爾卑斯山)，算力高達20ExaFlops(每秒2千億億次計算)，主要用於天氣研究與預報、材料科學等。 NVIDIA Grace處理器計劃2023年正式推出，2025年還會有下一代。 NVIDIA還同時強調，會繼續支持x86架構，未來將堅持x86、ARM兩條路線並行。來源：遊民星空

12 Page 1 of 2

Tag: 超算