Home Tags 超算

Tag: 超算

Crusher超算系統上線:AMD定製版EPYC搭配Instinct MI250X

美國能源部(DOE)橡樹嶺國家實驗室(ORNL)正打造一台ExaFLOP級的超級計算機Frontier,這是價值6億美元的項目。在Frontier正式運行之前,將由Crusher暫時代替,作為測試平台。 據TomsHardware報導,近日Crusher超級計算機已上線。 Crusher與Frontier採用了相同的架構和組件,每個HPE Cray EX節點包括了一個AMD的64核EPYC「Trento」7A53處理器,512GB的DDR4內存,以及四塊Instinct MI250X計算卡。Crusher共有192個節點,分別裝入到兩個機櫃中,其中一個有128個節點,另外一個有64個節點,不過總的占用空間僅為以往Cray XK7 Titan超級計算機的十分之一,但提供了更高的運算性能。Cray XK7 Titan曾是世界上最快的超級計算機之一,搭載了AMD Opteron處理器和英偉達Tesla計算卡,在2012年到2019年之間為數百項科學研究服務。 Crusher和Frontier搭載的EPYC「Trento」7A53處理器是一款定製晶片,AMD沒有透露太多的細節,只知道是代號Milan的Zen 3架構的衍生產品,傳聞其I/O 晶片採用了Infinity Fabric 3.0來實現與GPU一致的內存接口。每塊EPYC「Trento」7A53處理器會被劃分為四個NUMA區域,每個NUMA區域與一塊Instinct MI250X計算卡(每塊兩個GCD)相連。 CPU到GPU之間通過Infinity Fabric以36+36GB/s的接口帶寬連接,CPU到GPU之間288GB/s的總帶寬分布在節點中的八個GCD里。Crusher的每個節點通過四個HPE Slingshot 200GBps乙太網NIC(25GB/s)連接,提供800Gbps(100 GB/s)的節點帶寬。 Frontier超算系統在2021年已經交付,不過仍在進行集成和測試,具體運行的時間表仍未確定。Frontier超算系統是美國第一台ExaFLOP級的超級計算機,美國能源部預計會在2023年1月向研究人員開放。 ...

Intel公開頂級超算卡Ponte Vecchio性能:比安培卡皇高出160%

在今天的投資者會議上,Intel公布了一系列猛料,除了CPU、GPU、工藝路線圖之外,還首次公開了自研的超算卡Ponte Vecchio的性能,對比NVIDIA的7nm安培卡皇A100也非常有優勢,性能領先多達160%。 自從推出Xe架構GPU之後,Intel以此為基礎打造了一系列顯卡,筆記本上用到是Xe LP架構,ARC遊戲卡用的是Xe HPG架構,而計算卡用的是Xe HPC架構,專門為高性能運算及AI加速而生的。 Ponte Vecchio就是Intel為超算研發的頂級加速卡,它實際上不是一個GPU核心,而是Intel多個晶片通過3D封裝才弄出來的晶片怪獸,成電晶體數量突破1000億個,使用5種不同的製造工藝,在內部封裝了多達47個不同的單元(Tile),包括計算單元、Rambo緩存單元、Foveros封裝單元、基礎單元、HBM單元、Xe鏈路單元、EMIB單元,等等。 根據Intel去年公布的數據,它在初步階段中,實測FP32吞吐性能超過45TFlops,Memory Fabric緩存帶寬超過5TB/,互連帶寬超過2TB/。 在這次投資者會議上,Intel還拿出了Ponte Vecchio顯卡跟NVIDIA最頂級的A100加速卡做了對比,後者使用的是7nm Ampere安培架構,以後者的性能作為1.0基準,Ponte Vecchio在不同運算中性能是1.7x、1.9x到最高2.6x。 也就是說,Intel的加速卡Ponte Vecchio性能最高可以比NVIDIA的卡皇高出160%,優勢非常明顯。 來源:快科技

Meta豪購25億元NV安培GPU 打造世界級AI超算:性能怪獸來了

日前,Meta(Facebook母公司)宣布建造全球最強大的AI超算,名為AI Research SuperCluster(RSC)。 其目標是最終運算速度(Linpack)達到220 petaflops(每秒22億億次),實際上,RSC已經投入運行,但後續還會追加運算節點。 圖為DGX A100 當前,RSC的配置是760套NVIDIA DGX A100 AI系統,也就是1520顆AMD 64核EPYC處理器(第二代,代號Rome)、6080顆NVIDIA A100 GPU,未來會再追加1240套DGX A100系統,單GPU規模就多達16000顆(單顆顯存40GB)。 I/O方面,網絡帶寬200Gbps、175PB FlashArray、10PB FlashBlade以及46PB緩存。 經查,DGX A100發布於2020年,單套系統售價高達19.9萬美元。也就是說,RSC最終完工時,單采購DGX A100就需要花費3.98億美元(約合人民幣25億)。 來源:快科技

美國公布新超算:採用NV下一代GPU

NVIDIA的下一代GPU,終於含蓄地揭開了神秘面紗。 本周三,美國可再生能源實驗室(NREL)宣布將建造新超算Kestrel,合作方是HPE(惠與)。 配置上,這套超算的CPU選用Intel Xeon Scalable Sapphire Rapids,也就是預計明年上半年發布的新一代至強可擴展處理器,GPU則是NVIDIA A100Next,掛載75PB容量的硬碟。 性能指標是雙精度44 PetaFLOPS(億億次),大約能在目前超算TOP500中排進前七,2023年投入使用。 仔細觀察可發現,這個A100Next很有說法,實際就是NV下一代GPU,因為保密的緣故還不能公開。 就爆料來看,Turing的下一代產品分為伺服器/企業級和遊戲級,前者是Hopper,後者是Ada Lovelace,雖然都是5nm,但架構截然不同,Hopper據說是MCM多晶片設計,暴力堆核心,這對伺服器產品來說倒是也順理成章。 至於下一代至強Sapphire Rapids,最大56核,支持8通道DDR5-4400內存,112條PCIe 5.0,熱設計功耗350W。 來源:快科技

清華大學用超算模擬量子計算機:4200萬核CPU、性能可達440億億次

量子計算機是未來新型計算系統的重點之一,如何實現量子霸權——性能超過經典計算機是這個領域的重要目標。在日前SC超算大會上,清華大學教授付昊桓使用中國的神威超算模擬了量子計算機,最多可擴展到4200萬CPU核心,性能可達440億億次。 根據付昊桓教授提交的論文,他們在最新的神威超算上開發了用於RQC(隨機量子電路)的高性能矢量模擬器,可擴展到4200萬個核心,FP32單精度性能可達120億億次,混合精度性能可達440億億次。 在這台模擬量子計算機上,他們也實現了量子霸權,傳統計算機需要運算1萬年的現在這台量子計算機上只要304秒。 作為對比的話,這台模擬的量子計算機比起谷歌之前的Sycamore量子計算機還要慢一些,後者只需要200秒就可以完成傳統計算1萬年的性能,不過谷歌的Sycamore也多次被其他公司質疑。 據清華大學資料,付昊桓,男,1982年8月生。2003年7月,獲清華大學計算機系學士學位。2005年7月,獲香港城市大學計算機系碩士學位。2009年1月,獲英國倫敦帝國理工學院計算機系博士學位。 2009年3月至2010年11月,在美國史丹福大學地球物理系從事博士後研究。2010年12月至2018年7月,任清華大學地球系統科學系副教授。2018年7月起任清華大學地球系統科學系長聘教授。 2016年、2017年連續兩年獲得高性能計算應用領域最高獎「戈登?貝爾」獎。2017年獲評世界網際網路大會烏鎮峰會世界網際網路領先科技成果。 2017年獲評清華大學十大亮點成果。2018年獲江蘇省五四青年獎章榮譽。2020年獲中國青年五四獎章榮譽。 來源:快科技
服務器市場衰退前的最後一次歡呼

2021中國超算TOP100揭曉:神威太湖之光5年霸榜被匿名選手終結

11月12日消息,第三屆中國超級算力大會(ChinaSC 2021)上午在京召開。 會上發布了,這也是自2002年以來第二十次發榜。 結果顯示,匿名廠商的一台主機系統最終排名第一,終結了神威太湖之光連續5年的霸榜。 參數顯示,這台高性能計算機採用CPU+GPU異構眾核處理器,Linpack值達到了125040Tflops,也就是每秒超12億億次,比神威太湖之光高出34%,而其CPU核心數則比神威太湖之光少了97%。 經查,在全球超算TOP500榜單中,這套匿名系統的成績也能進入前三。 據悉,榜單前100台超算系統的平均性能相比2020年提升達79%。 廠商方面,TOP100中,聯想有40套系統、浪潮有28套,中科曙光有12套。 來源:快科技

英偉達將向英國醫療初創公司開放Cambridge-1超算,以加速人工智慧戰略

目前英國最強大超級計算機是Cambridge-1(劍橋1號),這是英偉達投資1億美元的項目,將致力於推動醫療行業發展,研究人員和科學家可以利用人工智慧加速生物學方面的研究。英偉達已經與阿斯利康、葛蘭素史克、蓋伊和聖托馬斯NHS基金會、倫敦大學國王學院以及Oxford Nanopore Technologies展開合作,首批項目包括深入了解痴呆症等腦部疾病,運用人工智慧協助新藥研發,以及提高尋找人類基因組致病變異研究的准確性。 近日,隨著英國在推動人工智慧技術研究和實施的十年計劃,英偉達宣布將向英國醫療方面的初創公司開放Cambridge-1超級計算機。英偉達企業EMEA副總裁David Hogan表示,該計劃是提升英國作為人工智慧全球領導者戰略優勢的重要一步,通過Cambridge-1和NVIDIA Inception計劃支持英國的AI生態系統,其中包括500多家英國最具活力的AI初創公司。 Peptone是英國的一家生物技術公司,也是NVIDIA Inception的成員,將獲得Cambridge-1超級計算機的幫助。Peptone正計劃使用超級計算機應對其在數字生物學領域的挑戰,目前正在創建一種「蛋白質工程系統」,將融合生成式人工智慧模型和計算分子物理學,以發現治療慢性阻塞性肺病、銀屑病和哮喘等炎症性疾病的療法。 Peptone執行長兼創始人Kamil Tamiola表示,Cambridge-1的計算能力將改變遊戲規則,可以將計算與實驗室實驗相結合,以改變蛋白質藥物的設計方式。Cambridge-1能極大地改進抗體的設計,以幫助治療多種炎症疾病。 每個使用NVIDIA Inception的初創公司都在其公司生命周期中得到支持,將允許他們的平台上市和開發。目前這些初創公司可以在年底前提交申請,入選後英偉達將會公告,預計最早在2022年初公布名單。 ...

3.6萬CPU核心、1550萬GPU核心:AMD+NVIDIA打造世界第一AI超算

為了沖擊百億億次計算,美國官方准備了三套不同系統,分別由Intel、AMD、AMD+NVIDIA聯合打造。現在看起來,AMD+NVIDIA的聯合方案進展最快。 這套名為「Polaris」(北極星)的超算,隸屬於美國能源部阿貢國家實驗室ALCF(阿貢領先計算設施),主要為用戶的算法和科學領域的超級規模的研究和探索提供支持,並對學術界、政府機構、行業研究人員開放使用。 它基於Cray Slingshot 10高性能可擴展互連架構,惠與(HPE)負責建造,共有560個節點,每個節點配備兩顆AMD EPYC 7532處理器、四塊NVIDIA A100計算卡,合計1120顆處理器、2240塊計算卡。 EPYC 7532擁有32核心64線程(Zen2機構),A100計算卡則有6912個CUDA核心(Ampere架構),因此這套超算總共有多達35840個CPU核心、15482880個GPU核心,只是不知道A100這里的顯存是40GB還是80GB。 整套系統的FP64雙精度浮點峰值性能將達44PFlops(44千萬億次每秒),在當今全球超算TOP500榜單上可以排在第十位。 不過,它的理論AI性能可以高達驚人的1.4EFlops(140億億次每秒),通過處理數據密集型和AI高性能計算工作負載,將模擬和機器學習相結合。 Polaris超算將在今年年內上線,明年3月份升級為Slingshot 11架構,處理器更換為Zen3架構的EPYC 7543,仍是32核心,但性能將再上一個台階。 AMD為美國能源部橡樹嶺國家實驗室(ORNL)打造的百億億次超算名為「Frontier」,配備Zen4架構下代EPYC處理器、Instinct計算卡,合同價值6億美元。 Intel中標的超算名為「Aurora」,基於其下代Sapphire Rapids至強處理器、Xe HPC Ponte Vecchio計算卡。 不過,AMD、Intel的新平台都尚未發布,大部分都要到明年才會完成,超算系統也順應延期,預計會在2022-2023年才會陸續上線。 來源:快科技

AMD超算領域終逆襲 7nm Zen2遙遙領先友商14nm

6月底的ISC21超算大會上,TOP5000新一輪名單出爐,使用ARM晶片架構的日本富岳超算依然第一,但AMD才是這次的大贏家,7nm Zen2架構的霄龍處理器全面殺進超算市場。 本次超算排名中TOP10變化不大,最顯著的就是新成員Perlmutter,排名第六,,使用的是AMD Milan CPU 和 Nvidia A100 40GB GPU,峰值性能89.8TFLOPS,持續性能64.6TFLOPS,而且功耗只有2528KW。 快科技全球超算TOP500排行榜單 基於AMD處理器的超算雖然現在還沒沖擊到前三,但是在這次的TOP500名單中,AMD收獲是最大的,新入的58套系統中AMD份額最多,假以時日AMD在TOP500超算中會占據更多的份額。 ServerTheHome網站分析了新進入的58套TOP500超算系統,得出了一些很有意思的結果。 首先是份額,使用AMD處理器的數量超過了Intel、NEC及富士通,雖然AMD領先Intel的數量優勢不算大,但對AMD來說這已經是大翻身了,以前Intel在超算CPU上是壟斷性優勢。 具體到CPU架構上,使用AMD的Zen2架構羅馬處理器的是最多的,這是AMD首次使用7nm工藝,最多64核128線程,非常適合超算中使用。 Intel這邊新進入榜單的則是Cascade Lake處理器,14nm工藝,最高28核56線程。 再往下還有Intel的10nm工藝IceLake處理器、AMD的7nm Zen3處理器,往後看的話他們潛力更大,會取代前面的Zen2、Cascade Lake處理器。 來源:遊民星空

超算TOP500榜單公布 英偉達AI優勢前所未有?

本周,一年一度的高性能計算大會ISC如期而至,世界TOP 500超級計算機排名也隨之更新公布,對比去年的榜單,今年TOP 10的榜單中,來自美國新能源部勞倫斯伯克利國家實驗室的Perlmutter系統新晉入圍。 在TOP500的榜單中,中國超級計算機的數量雖然下降至186台,但對比位居第二的美國的123台,依然遙遙領先。 一個值得注意的事實是,此次榜單中有342套系統採用了英偉達技術提供加速,對比去年的333套提升2%,榜單上使用InfiniBand的系統數量也比去年增加了20%。另外,名單上更新的兩個新系統「超級雲」,能夠同時滿足AI、高性能計算(HPC)和雲端需求。 這意味著,高性能計算正在同AI加速融合,而在這一融合趨勢下,英偉達在超算領域的優勢前所未有。 不止是TOP10中的8台,新晉系統也選英偉達 雷鋒網(公眾號:雷鋒網)此前在《全球TOP10超級計算機8台都選英偉達的三大原因》一文中分析過,由於高速數據互連技術的普及,以及英偉達GPU系統能夠提高將超算的能效提升2.8倍,全球TOP10超級計算機中的8台都採用了英偉達GPU或InfiniBand網絡技術。 在最新公布的榜單中,不少新晉系統也都選擇英偉達提供支持,其中包括雲端的兩個新系統。 Microsoft Azure是其中之一,在TOP 500榜單上連續占據第26位到第29位,利用集群將公有雲服務提升到新的水平。作為新興的共享超級計算機,地球上的任何用戶都可以按需使用。 在Azure系統的背後,有8個NVIDIA A100 Tensor Core GPU為其各個虛擬實例提供動力支持,每個晶片都有自己的HDR 200G InfiniBand 通信接口,可以與Azure雲中的數千個GPU建立高速連接。 劍橋大學的新系統Wilkes-3是另一個超級雲系統,也是世界上第一台雲原生超級計算機。該系統使用了320個連接在HDR 200G Infiniband 網絡上的 A100 GPU,且有經過優化的NVIDIA BlueField DPU提供安全、虛擬化的數據處理,保證虛擬資源的隱私性和安全性。 此外,本次進入TOP10的新系統Perlmutter,以 64.59 Linpack petaflops 在 TOP500...

TOP500超算名額一年增長5倍 AMD高性能處理器成了

在最新的ISC 21超算大會上,TOP500上半年的名單更新了,雖然排名靠前的超算變化不大,但是AMD可以說是今年超算市場上的大贏家,使用AMD EPYC處理器的TOP500超算一年增長5倍。 AMD在TOP500超算中最輝煌的時候還是2012年拿下第一的Titan泰坦超算,使用的是AMD的的皓龍6274 16核處理器,加速卡是NVIDIA的Tesla K20X,峰值浮點性能最終達到了27PFLOPS,也就是2.7億億次。 在Zen架構問世之前,AMD在超算市場上差不多有五六年的空白,2019年才靠著EPYC處理器才重返TOP500前列,現在入圍的型號及超算性能也不斷提升,本次最強的就是位列第五的Perlmutter超算了,使用的是EPYC 7763 64核處理器,7nm Zen3架構的。 根據AMD所說,從2020年6月到現在的一年裡,基於AMD處理器的TOP500超算增長了近5倍,也比去年底的時候翻倍,今年6月榜單上的新增58台超算中有一半都使用了AMD的EPYC處理器。 對AMD來說,位列第五隻是暫時的,基於新一代EPYC處理器的超算有望沖擊第一,美國已經出資建設了至少兩套百億億次超算,其中與HPE、美國橡樹嶺國家公園合作的超算Frontier是百億億次級別的,還有更強大的El Capitan超算,性能是2百億億次級別的,前者預計在2021年問世,後者預計在2023年問世。 來源:快科技

TOP500公布57期Top10超算名單:Fugaku以442Pflop/s傲視群雄

基於超算性能,TOP500 今天公布了第 57 期 Top10 超級計算機名單。從榜單來看,自 2020 年 11 月以來就幾乎沒有變化,日本超級計算機 Fugaku 成功地守住了榜首位置。Fugaku 由 Riken 和富士通開發,其 HPL 基準得分為 442 Pflop/s,是排在第 2 位的 IBM Summit 的...

美國最新超算投入使用:算力世界第二 採用AMD+英偉達方案

近日,美國國家能源研究科學計算中心(NERSC)的勞倫斯·伯克利國家實驗室(Berkeley Lab)宣布,由HPE打造的新型超級計算機Perlmutter已正式投入使用,它也是目前世界上AI性能最強的超算之一。 Perlmutter採用了HPE的HPE Cray EX伺服器,搭載了AMD最新的第三代霄龍EPYC處理器和英偉達A100計算加速卡。它將幫助科學家們建立可見宇宙中有史以來規模最大的3D地圖來研究暗能量如何加速宇宙擴張。Perlmutter基於HPE Cray Shasta平台構建,是一個異構系統,包含有CPU和GPU加速節點,其性能是美國國家能源研究科學計算中心目前使用的超算Cori的三到四倍,該系統按計劃將分兩期交付。目前,第一期交付的系統包括1,536個節點,每個節點都有一顆64核EPYC 7763處理器和四個NVIDIA A100計算加速卡,可以提供60 PetaFLOPS的FP64性能,或3.823 ExaFLOPS的FP16性能。第二期系統將於今年晚些時候交付。部署完成後,Perlmutter的FP64性能綜合能達到180 PetaFLOPS,將超過世界超算排行榜上排名第二的Summit。不過性能仍然較大幅度的落後於日本富士通基於ARM的超算--富岳,據稱富岳的理論性能達到513PetaFlops。 這台超算的名字Perlmutter,是為了紀念實驗室的天體物理學家Saul Perlmutter(薩爾·波爾馬特),他因「透過觀測遙遠超新星而發現宇宙加速膨脹」而獲得了2011年諾貝爾物理學獎。來源:cnBeta

AMD百億億次超算用上「超級SSD」:700PB容量、10TB/s速度

隨著64核霄龍處理器的走紅,AMD近年來拿下了多個超算訂單,其中與HPE、美國橡樹嶺國家公園合作的超算Frontier將是百億億次級別的,用上新一代霄龍及Raden加速卡,今年底問世。 除了計算能力超級強大之外,Frontier超算的存儲系統也是頂級水平的,容量、速度都會創造超算紀錄。 橡樹嶺國家實驗室日前公布了Frontier超算的IO系統配置,主要由存儲級別的內存、中心級別的文件存儲系統構成,其中後者名為Orion,將使用開源的Lustre及ZFS文件系統。 Orion的存儲系統又分為三個層次,首先是5400個NVMe SSD硬碟組成的性能層,容量11.5PB,讀寫速度是10TB/級別的,隨機IOPS超過200萬。 第二層是容量層,由47700個HDD硬碟組成,總容量679PB,峰值讀取可達5.5TB/,寫入可達4.6TB/,隨機IOPS也有200萬。 第三層是元數據層,也是NVMe SSD硬碟,只有480個,容量10PB。 三級存儲系統下來,總容量將達到700PB,速度少則5TB/,多則10TB/,相當於一個超級大容量的混合硬碟了。 至於內存存儲,則使用PCIe 4.0連接,容量沒公布,但讀取速度可達75TB./,寫入速度35TB/,隨機性能可達150億次IOPS。 來源:快科技

新加坡10 PFLOP超算將採用AMD霄龍Milan CPU和英偉達A100 GPU

新加坡國家超級計算機中心(NSCC)宣布:定於 2022 年初投入使用的 10 PFLOP 新超算,將採用 10 萬核心的 AMD EPYC Milan 處理器、以及 352 顆英偉達 A100 Tensor Core GPU 。The Register 報導稱,這台面向政府、企業和研究機構的 10 PFLOP 超算,已於...

威馬W6正式上市:稱達到L4級別無人駕駛 最低17萬

雷帝網 樂天 4月16日報導 威馬W6今天正式上市,新車共推出5款車型,售價區間為16.98-25.98萬元,並正式開啟交付。官方稱,威馬W6搭載高通8155晶片,達到L4級別無人駕駛、可實現SOA技術應用。 威馬還邀請90後青年演員董子健、鍾楚曦擔任威馬汽車最新代言人。 據威馬稱,威馬W6全車尺寸為4620/1847/1730mm,軸距達到2715mm,搭載160kW永磁同步電機,NEDC續航里程最高可達620km。 「威馬W6定位「超算力可進化智能SUV」,是造車新勢力上半年唯一交付的全新車型。」 威馬W6搭載AVP無人自主泊車系統,可實現L4級別無人駕駛。 威馬W6具備的HAVP(自主學習泊車)適用於住宅、公司等固定車位場景,車輛僅需學習一次即可自主尋徑泊車,用戶通過威馬智行APP即可一鍵「召之即來,呼之即去」。 PAVP(高精地圖泊車)則適用於大型商場、寫字樓等非固定車位場景,依託高精地圖,藉助雲端百萬級算力,車輛可自動規劃泊車路線,通過跨層巡航的全無人自主泊車、取車。 PAVP功能將在年內通過OTA升級推送給用戶。HAVP+PAVP組合能夠解決各類泊車痛點,為用戶打造無人駕駛技術應用。 威馬W6還對針對中國路況開發的全功能L2級智能輔助系統進行升級,搭載新的Living Pilot 3.0智行輔助系統,提供20項駕駛輔助配置。新增撥杆變道(ALC)、交通擁堵引導(TJP)、自動導航輔助駕駛(NLP)、前方穿行預警(FCTA)、後方穿行預警(RCTA)、後部穿行制動(RCTB)、開門碰撞預警(DOW)、遙控泊車(RPA)等實用功能,讓車輛成為安全、自由的出行空間。 無論是特定場景的無人駕駛系統,還是實用的高級輔助駕駛系統,均離不開威馬硬體帶來的支持。 威馬W6搭載高通SA8155晶片,威馬稱,其算力提升8.5倍、圖像處理能力提升20倍,在3D圖像和特效處理等方面獲長足進步。在傳感器方面,5個77GHz毫米波雷達、2個高清前視攝像頭、4個高清環視攝像頭、12個超聲波雷達高效協同,確保各項駕駛輔助配置流暢運行。 伴隨威馬W6正式發售,威馬汽車啟用全新產品命名體系,發布W——「世界系列」和M——「大師系列」。 「大師系列」,取自威馬英文「WM」中的「M」,以威馬汽車企業使命為源點,旨在通過前瞻技術和匠心美學顛覆用戶對傳統汽車認知。大師系列代表的威馬轎車產品,在追求極致細節的同時,為用戶提供更精緻、更全面、更具個性化的卓越體驗。 威馬汽車稱首台純電轎車量產概念版基於「大師系列」理念而生,量產版計劃於2021年末發布。 2021年是威馬汽車戰略全面提速的一年。威馬汽車創始人、董事長兼CEO沈暉表示,威馬汽車將在產品、智能化、渠道、研發技術等方面同步發力,加速奔跑。 基於轎車戰略的布局,威馬汽車將會推出兩款主流產品。此外,威馬汽車將穩步推進國際化戰略,加速開拓歐洲、東亞以及東南亞等海外市場。 ——————————————— 雷帝觸網由資深媒體人雷建平創辦,為頭條簽約作者,若轉載請寫明來源。來源:kknews威馬W6正式上市:稱達到L4級別無人駕駛 最低17萬

英偉達發布自主CPUARM架構、打造2千億億次超算

NVIDIA是一家GPU公司,但也一直在嘗試各種CPU,包括自動駕駛、移動計算等,早些年還試圖通過Tegra系列染指智慧型手機。 GTC 2021開發者大會上,黃仁勛親自宣布了NVIDIA的全新處理器,代號「Grace」,取自Grace Hopper——格蕾絲·霍珀女士,計算機史上最早的程式設計師之一,也是編譯語言之母,領導開發了程式語言Cobol。 有趣的是,此前傳聞稱Ampere GPU架構的繼任者代號是Grace Hopper,看來搞錯了方向。 NVIDIA Grace處理器主要面向超大規模AI人工智慧、HPC高性能計算,最大特點就是海量的帶寬。 它基於ARM Neoverse架構,但具體核心數量、頻率、緩存、功耗等暫未公布,今天說的主要是連接,搭配LPDDR5X內存可提供超過500GB/s的帶寬,而且支持ECC錯誤校驗,通過緩存一致性NVLink總線連接自家GPU,帶寬可超過900GB/s,同時兩顆CPU之間的帶寬超過600GB/s。 瑞士國家超級計算中心(CSCS)、慧與(HPE)、NVIDIA聯合使用Grace CPU、下一代NVIDIA GPU,正在共同打造號稱世界最快AI超算的「ALPS」(阿爾卑斯山),算力高達20ExaFlops(每秒2千億億次計算),主要用於天氣研究與預報、材料科學等。 NVIDIA Grace處理器計劃2023年正式推出,2025年還會有下一代。 NVIDIA還同時強調,會繼續支持x86架構,未來將堅持x86、ARM兩條路線並行。 來源:遊民星空
曝NVIDIA要拿超算芯片做礦卡能夠挽救缺卡的現狀嗎

曝NVIDIA要拿超算芯片做礦卡能夠挽救缺卡的現狀嗎

  NVIDIA產品知名爆料人士 @kopite7kimi 透露,NVIDIA正在開發一款基於7nm GA100 GPU的挖礦專用卡,它擁有怪獸級恐怖性能,這個GA100大概率就是以前A100頂級加速卡魔改而來的,光想想就覺得很厲害的樣子。   NVIDAI A100加速卡這個東西就厲害了,完全是超級計算機和數據中心以及AI雲計算上的頂級裝備,它擁有恐怖的算力和數據帶寬,擁有40GB和80GB兩個版本。   作為比較,A100的以太坊挖礦速度至少是RTX 3090的兩倍,超過200mh/s算力。   分析認為NVIDIA有可能會放棄A100的Tensor核心和高精度 (FP64)內核,並更換為 FP32 單元以提高 GPU 的算力,盡管這將對SM進行重大修改。   但如果成真,我們可能會看到一款超過300MH/s哈希率的GA100礦卡。   這東西自然價格不菲了,按照以前A100 Tensor核心GPU的定價是11000美元,挖礦型GA100的定價預計不會低於這個價格。   不過貴不怕貴,關鍵是要看每單位算力的價格,以及投入產出比。如果這種礦卡挖礦效率超過遊戲顯卡,顯卡有望回歸正常。   推出挖礦效率比顯卡更強的專業礦卡,而且把兩者之間的價格差距極大區隔開,看來顯卡缺貨漲價難題終於有希望解決了。   就好像以前NVIDAI也有專業顯卡,各有各的市場,各有各的用途,各有各的受眾,各有各的定價,這才是解決問題之道! 來源:遊俠網
曝NVIDIA要拿超算芯片挖礦 看來顯卡缺貨有救了

曝NVIDIA要拿超算芯片挖礦 看來顯卡缺貨有救了

為了能夠讓玩家們買到顯卡,NVIDIA對RTX 3060以太坊挖礦效率進行減半設定。如此「軟限制「不僅很快就被礦老闆們破解,而且礦圈曝出一些小幣種挖礦根本不受影響。或許NVIDIA現在終於明白一個道理,封堵是堵不住的,唯有因勢利導。 所謂因勢利導,就是製造出來一個挖礦效率比遊戲顯卡還厲害的GPU。 NVIDIA A100加速卡 NVIDIA產品知名爆料人士 @kopite7kimi 透露,NVIDIA正在開發一款基於7nm GA100 GPU的挖礦專用卡,它擁有怪獸級恐怖性能,這個GA100大概率就是以前A100頂級加速卡魔改而來的,光想想就覺得很厲害的樣子。 NVIDAI A100加速卡這個東西就厲害了,完全是超級計算機和數據中心以及AI雲計算上的頂級裝備,它擁有恐怖的算力和數據帶寬,擁有40GB和80GB兩個版本。 作為比較,A100的以太坊挖礦速度至少是RTX 3090的兩倍,超過200mh/算力。 分析認為NVIDIA有可能會放棄A100的Tensor核心和高精度 (FP64)內核,並更換為 FP32 單元以提高 GPU 的算力,盡管這將對SM進行重大修改。 但如果成真,我們可能會看到一款超過300MH/哈希率的GA100礦卡。 這東西自然價格不菲了,按照以前A100 Tensor核心GPU的定價是11000美元,挖礦型GA100的定價預計不會低於這個價格。 不過貴不怕貴,關鍵是要看每單位算力的價格,以及投入產出比。如果這種礦卡挖礦效率超過遊戲顯卡,顯卡有望回歸正常。 推出挖礦效率比顯卡更強的專業礦卡,而且把兩者之間的價格差距極大區隔開,看來顯卡缺貨漲價難題終於有希望解決了。 就好像以前NVIDAI也有專業顯卡,各有各的市場,各有各的用途,各有各的受眾,各有各的定價,這才是解決問題之道!來源:快科技
首台ARM架構超算「富岳」正式啟用曾蟬聯全球超算第一

首台ARM架構超算「富岳」正式啟用曾蟬聯全球超算第一

2021 年 3 月 9 日,日本理化學研究所正式啟用了超級計算機「富岳「(Fugaku,ふがく)。 以日本精神文化象徵之一、日本第一高峰「富士山」的別稱為名的 Fugaku 來頭不小,在 2020 年度的全球高性能計算機 TOP500 榜單上兩次位居第一,截至目前它還是全球最強超算。 正因為 Fugaku,日本時隔 9 年後重登全球超算寶座,2020 年日本超算迎來了高光時刻。 全球最強超算正式啟用 昨日,Fugaku 主要研製單位、日本最大綜合性科研機構日本理化學研究所(RIKEN)於官網宣布: 超級計算機 Fugaku 的開發全部完成,進入共享使用階段。 對於 Fugaku 的正式啟用,RIKEN 所長 Hiroshi Matsumoto(松本浩)教授表示: 這只是 Fugaku...

7.1萬核CPU+244TB記憶體 非洲最強超算殺進全球百強

在全球TOP500超算中,近年來中美兩國的數量是最多的,其次是歐盟、日本,非洲地區入圍的超算很少。現在摩洛哥建成了非洲最強超算Toubkal可以爭一下了,能進入全球百強。 ...
歐盟投641億研發百億億次超算 自研7nm處理器

歐盟投641億研發百億億次超算 自研7nm處理器

在新一代高性能計算領域,歐盟也不甘心落後美國、中國等國家了,現在聯合起來要開發自己的超算和處理器。日前歐盟通過了EuroHPC聯合承諾書,32個國家決定投資80億歐元(約合641億)研發新一代超算。 80億歐元的投資對超算來說是非常龐大的開支了,美國研發新一代百億億次超算投資也不過5億美元,因為歐盟的EuroHPC不只是建造超算那麼簡單,而是一項持續13年(從2021到2033)的長期計劃。 這個計劃中,歐本本身出資只有35億歐元,剩下的45億歐元實際上來自參與計劃的各個國家。 這筆錢首先會用來建設新一代的百億億次超算,而其中最重要的一部分就是歐盟的EPI(歐洲處理器計劃)芯片,要由歐盟的公司來研發自己的超算處理器,而不是簡單的采購美國公司的產品。 EPI處理器計劃也不是一款產品,而是有多代規劃,現在所知的是法國SiPearl公司基於ARM的Neoverse架構研發的Rhea處理器。 前不久,網上泄漏了Rhea處理器的部分規格,可以看到是台積電7nm工藝生產,支持4x HBM2e,還支持4-6通道的DDR5內存。 作者:憲瑞來源:快科技
NVIDIA創始人回饋母校 出資3.5億裝了台安培超算

NVIDIA創始人回饋母校 出資3.5億裝了台安培超算

提到NVIDIA創始人,大家第一個想到的就是黃仁勛,他確實是NVIDIA的靈魂人物,不過創始人不止他一個。日前另一位創始人Chris Malachowsky宣布向自己的母校——佛羅里達大學捐贈一台700PFLOPS性能的安培超算。 Chris Malachowsky是NVIDIA的聯合創始人之一,1993年跟黃仁勛、Curtis R. Priem三人聯合成立了NVIDIA公司,不過Curtis R. Priem已經在2013年去世。 Chris Malachowsky於1983年畢業於佛羅里達大學,獲得了電子工程學士學位,1986年獲得了聖克拉拉大學的碩士學位,在半導體行業擁有30多年的經驗,是集成電路設計方面的權威,擁有40多項專利,是NVIDIA創始人中的技術派,黃仁勛更強大的地方則是管理、銷售。 這次Chris Malachowsky給佛羅里達大學捐贈的超算性能高達700PFLOPS,也就是70萬億次,雖然主要是AI性能,但在美國大學中已經是最強大的了,預計在2021年投入使用。 這套超算主要使用NVIDIA的DGX SuperPOD集群來打造,總價高達7000萬美元,其中Chris Malachowsky個人出資2500萬美元,NVIDIA公司則是提供了價值2500萬美元的安培加速卡、軟件及培訓等產品和服務,另外的2000萬美元是大學自己出資。 這麼一算的話,光是Chris Malachowsky自己及NVIDIA提供的部分就高達5000萬美元,約合3.5億元,這大概也是佛羅里達大學近年來最高的校友捐助了。 優惠商品信息>>作者:憲瑞來源:快科技
中國超算被擠出前三 日本9年後登頂 美國專家表態

中國超算被擠出前三 日本9年後登頂 美國專家表態

在6月底的最新一屆TOP500超算排名中,,這是日本時隔9年後再次登頂超算第一,而中國最強的超算已經被擠出前三。不過這個局面恐怕持續不了多久,因為百億億次超算很快就來了。 2011年的時候,日本憑借K(京)超算拿下了TOP500冠軍,這也是全球首個達到1億億次性能的超算,使用的是日本富士通研發的SPARC64處理器,但之後的9年中TOP500超算冠軍都是中美輪流,其中中國靠着天河二號、太湖之光蟬聯了10屆冠軍,美國則是最近幾次的冠軍。 富岳Fugaku超算現在為日本扳回一局,這代超算最大的變化就是CPU變成了ARM架構,峰值浮點性能高達513PFLOPS(51.3億億次),Rmax性能也有415.5PFLOPS,是第二名超算Summit頂點的2.5倍以上,不過功耗也達到了28MW,是Simmit的2.8倍。 在富岳Fugaku之後,美國的Summit、Sierra兩款超算位列第二、第三,而中國的神威·太湖之光位列第三,跌出了TOP3排行榜。 不過日本拿到TOP500第一可能無法維持長久,因為2020年底到2021年初,中國及美國新一代百億億次超算就要問世了,性能是富岳Fugaku超算的2倍多,TOP500排名很快就要發生變化。 美國勞倫斯伯克利國家實驗室執行主任Horst Simon也表示,考慮到美國能源部橡樹嶺國家實驗室和勞倫斯利弗莫爾國家實驗室的超算,以及中國的超算,Fugaku 世界最快超級計算機的地位不會呆太久。 折扣商品信息>> 作者:憲瑞來源:快科技
只要415萬日元 你就可以買到TOP500超算同款最強CPU

只要415萬日元 你就可以買到TOP500超算同款最強CPU

前幾天的ISC 2020大會上,TOP500上半年榜單更新了,,浮點性能高達415.5PFLOPS,使用的是48核ARM處理器。現在這款處理器可以單獨買了,只要415.5萬日元就能買一套超算同款最強CPU。 Fugaku超算的使用的是48核ARM處理器A64FX,浮點部分是與ARM合作的SVE指令擴展,使用了512bit浮點運算單元,每個節點使用48核+4輔助核,IO及計算節點則是48核+4輔助核結構。 Fugaku超算這次拿下TOP500冠軍意義重大,不僅僅是日本時隔9年之後重返TOP500第一,也是ARM處理器首次拿下超算冠軍,之前連TOP10都沒進去過,一改以往性能不足的印象。 為了紀念這個成績,日本公司推出了PRIMEHPC FX700服務器,2U機架,一套系統可以安裝8個節點,使用的也是同款A64FX處理器,總性能可達2.768TFLOPS,搭配Red Hat Enterprise Linux 8.0或CentOS 8.0。 售價方面,這樣的一套迷你超算售價是415.53萬日元,跟富岳超算的性能數值是一樣的,約合27.5萬元,特價持續到今年底。 特惠商品推薦>>作者:憲瑞來源:快科技

ARM處理器大發神威,一舉登頂TOP500超算排名

一直以來超算的處理器都是在Intel、AMD、IBM之間作選擇,而ARM架構的處理器則是一直認為太弱了而幾乎被忽略不計,大部分時間只能在消費級產品上面看到它的身影。但是最近,這個局面就被打破了,因為來自日本,以富士通的48核ARM處理器A64FX打造的超級計算機Fugaku在TOP500世界500強超級計算機的6月份測試中奪得第一名,為ARM處理器多年來首次「登頂」。 這套安裝在日本理化學研究所科學計算中心(RIKEN Center for Computational Science)的Fugaku超級計算機以415.5petaflops的成績遠超原本第一、現在第二的Summit超級計算機,並且各項參數比起後者都要強不少:比後者多3.05倍核心數、在LINPACK官方測試中得分是後者的2.8倍,並且耗電量也是2.8倍。 Fugaku所用的158,976個A64FX處理器,是一種基於Arm v8-A,針對計算進行了優化的48+4(48核運算,4核輔助)的處理器。 這對於ARM處理器是一大突破,因為此前從來沒有ARM處理器的系統進入過世界超算500強之列,更不用說前10了。所以這次一舉奪得第一名對於ARM處理器來說可以算是終於徹底洗去了其性能弱的說法了。 迄今為止A64FX是ARMhi98.2-A可擴展向量延伸(Scalable Vector Extensions,SVE)之下的唯一一個處理器。SVM的目標是希望允許ARM用戶可以製造從128位到2048位的向量單元的硬體,這樣在SVE上運行的任何軟體都可以自動擴展。 目前Fugaku處理過的計算包括日本的新冠病毒追蹤應用程式,而在將來基於A64FX處理器的超算系統也會在其他國家部署。 ...
NVIDIA為80%全球最快超級計算機提供加速

NVIDIA為80%全球最快超級計算機提供加速

最新TOP500超級計算機榜單顯示,目前,全球排名前十的超級計算機中有8台採用了NVIDIA GPU、InfiniBand網絡技術,或同時採用了兩種技術。 其中包括美國、歐洲和中國最強大的超級計算機系統,在TOP500榜單的所有系統中,有三分之二的系統(333套)採用了NVIDIA(現已與Mellanox合並)為其賦力。 在能效方面,使用NVIDIA GPU的系統表現也都脫穎而出。與不使用NVIDIA GPU的系統相比,其能效(以gigaflops/watt為單位)平均高出2.8倍。 最能夠證明此能效表現的是NVIDIA內部研究集群的新成員——Selene。該系統在Linpack基準測試中以27.5 petaflops的性能表現,在最新Green500榜單中排名第二,在整個TOP500榜單中排名第七。Selene的功耗為20.5 gigaflops/watt,與Green500榜單上的第一名相差甚微,但排名第一的系統體積更小,其性能表現僅排在第394位。 特惠商品推薦>>來源:快科技
ARM首次登頂 日本超算Fugaku成為TOP500新一任冠軍

ARM首次登頂 日本超算Fugaku成為TOP500新一任冠軍

ARM處理器在低功耗移動領域已經是王者,蘋果將正式把它引入到Mac電腦中,無獨有偶的是ARM今天又證明了它在HPC高性能計算中的地位,在最新的TOP500超算中,使用48核ARM芯片的日本Fugaku超算位列第一。 在超算領域,最近幾年都是中美爭霸,不過2011年的時候,日本憑借K(京)超算拿下了TOP500冠軍,這也是全球首個達到1億億次性能的超算,使用的是日本富士通研發的SPARC64處理器。 K超算去年就已經退役,日本理化研究所聯合富士通打造了新一代超算,之前的代號叫做Post-K,也就是京超算後一代的意思,最終正式名字是Fugaku,這代超算最大的變化就是CPU變成了ARM架構,峰值浮點性能高達513PFLOPS(51.3億億次),Rmax性能也有415.5PFLOPS,是第二名超算Summit頂點的2.5倍以上,不過功耗也達到了28MW,是Simmit的2.8倍。 Fugaku超算的使用的是48核ARM處理器A64FX,浮點部分是與ARM合作的SVE指令擴展,使用了512bit浮點運算單元,每個節點使用48核+4輔助核,IO及計算節點則是48核+4輔助核結構。 目前Fugaku超算的性能還不是完整版,後續還會繼續升級到1000PFLOPS,也就是百億億次,最終要在2021年左右跟中國、美國的新一代百億億次超算一較高下。 視頻會員活動匯總>>作者:憲瑞來源:快科技
NVIDIA號召對抗新冠病毒 40萬PC玩家堆出47億億次最強「超算」

NVIDIA號召對抗新冠病毒 40萬PC玩家堆出47億億次最強「超算」

NVIDIA前不久號召用戶家參與[email protected]項目,現在有40萬PC玩家參與,貢獻的算力性能已達47億億次,是全球TOP500最強超算的2倍還多。 COVID-19病毒在全球肆虐,對抗它的最好辦法是迅速找到合適的藥物,這也是全球科研攻關的重點。3月14日,NVIDIA GeForce官方推特發布公告稱:「PC玩家們,讓我們的GPU一起加入工作吧。加入我們,用閒置的GPU算力支持[email protected]項目,以對抗新冠病毒「。 [email protected]是一個研究蛋白質折疊、誤折、聚合及由此引起的相關疾病的分布式計算工程。由斯坦福大學化學系的潘德小組(Pande Group)主持,於2000年10月1日正式啟動。 [email protected]是目前世界上最大的分布式計算項目,於2007年為吉尼斯世界記錄所承認。簡單來說,這就是一台大型分布式超級計算機,而用戶們可以為此貢獻一個節點。 2月27日,[email protected]宣布加入新冠病毒研究,以幫助研究人員開發出治療方法。 在NVIDIA呼籲之前,全球大約有3萬人參與到了[email protected]的COVID-19運算中,不過NVIDIA官方建議之後,參與該項目的人數大增,截至3月20日,全球有40萬PC玩家參與對抗COVID-19病毒。 這使得該項目的算力大增,從之前的100PFLOPS(10億億次)暴漲到了470PFLOPS(47億億次),這個性能包當前TOP500超算冠軍Summit的峰值性能20億億次還高出一倍多,是其Linpack性能14.8億億次的3倍左右。 作者:憲瑞來源:快科技
Zen2性價比征服美國氣象局 斥資35億元購買AMD超算系統

Zen2性價比征服美國氣象局 斥資35億元購買AMD超算系統

由AMD EPYC處理器支撐的高性能超算,不僅得到了美國海軍的青睞,美國海洋和大氣管理局(NOAA)宣布,未來10年將拿出5.05億美元(約35億)采購兩套Cray公司的AMD平台超算,新超算將用於氣象分析、預報等。 規格方面,每套超算設置10個機櫃,2560個雙路節點,AMD 64核EPYC(Rome)7742處理器,等價於327680個Zen2核心,1.3PB內存,64TB SSD,12.5PB HDD。 每套超算的理論峰值性能可達12petaflops(千萬億次浮點運算),按照去年11月的超算500強排名,大約能在25位左右。 目前,NOAA有8套超算,並由IBM管理,合同2022年結束。此後,GDIT將在未來8年接管NOAA的超算,並開始替換和部署。GDIT此次選擇的AMD超算系統滿足了NOAA招標99%的要求,而且每一分錢都花到刀刃上。 作者:萬南來源:快科技
NVIDIA DGX-2 AI超算用於抗病毒研發 2個月工作2天完成

NVIDIA DGX-2 AI超算用於抗病毒研發 2個月工作2天完成

NVIDIA日前表示,上海交通大學魏冬青教授的團隊使用了5台NVIDIA研發的DGX-2 AI超算超算用於尋找抗病毒藥物,篩選效率從之前的2個月提升到2天,而且發論文的數量也是之前的十多倍。 在對抗新冠病毒的過程中,尋找有效治療藥物是關鍵,現代藥物研發就需要超強的計算能力了,AI人工智能也是必不可少的。 魏冬青教授帶領研究團隊選擇利用人工智能技術進行分子動力學模擬,在現有小分子藥物(包括FDA已批準的藥物)中篩選能夠對新冠病毒起到抑制性作用的藥物,以實現老藥新用,進而可以馬上進行臨床應用。 據魏教授介紹,在藥物篩選過程中,研究團隊需要對幾十萬種分子進行分子動力學模擬計算,面對如此大規模的計算量,如按照目前常規的算力條件,團隊需要1到2個月的時間才能完成全部模擬。 但是疫情面前,時間就是生命。最終魏教授的團隊選擇了5台NVIDIA的DGX-2人工智能超算用於此次的研究。 NVIDIA表示,DGX-2人工智能超級計算機是NVIDIA GPU計算和存儲能力的集大成者,其配置了16張NVIDIA Tesla V100 GPU, 可擴展架構使得模型的復雜性和應用的規模不受傳統架構局限性的限制,由多台DGX-2組成的GPU集群更是可以輕松應對數據科學各種復雜的AI和HPC挑戰。 NVIDIA表示,有了超高性能的計算資源助力,再配合先進的醫學研究深度學習軟件,團隊的藥物研究進程得到了極大地提速,原本需要1到2個月才能完成的模擬計算,如今只用1到2天就完成了。 不僅工作效率大幅提升,NVIDIA還強調發表科研成果的速度變了,過去魏教授每三年發表的論文也就是4-5篇,最多不超過10篇。 藉助於AI技術的廣泛應用,現在魏教授帶領團隊在3年的時間里發表了90余篇論文成果,科研進程相比於過去有了極大的提速。 詳細情況可以參考NVIDIA官方發表的博文——超強DGX-2加速抗新冠病毒藥物研究,助力打贏抗 「疫」戰 作者:憲瑞來源:快科技
英國16億美元建設全球最強氣象超算 至少20億億次性能

英國16億美元建設全球最強氣象超算 至少20億億次性能

本周一,英國政府宣布撥款12億英鎊,約合15.6億美元(約合110億人民幣)用於研發新一代超算,目標是在2022年獲得全球性能最強的天氣預報超算。 天氣預報、氣象模擬是超算使用最廣泛的領域之一,復雜多變的天氣最能發揮出高性能運算的優勢。目前英國有三台美國Cray公司的XC40超算,最高性能性能乘客達14PFLOPS(1P=1千萬億次)。 英國的新超算預計性能是當前超算的20倍以上,預計性能水平至少是200PFLOPS的,也就是20億億次性能,跟當前TOP50冠軍的美國Simmt超算性能差不多。 不過英國政府還沒宣布他們的新氣象超算會使用什麼樣的配置,基本上可以確定是CPU+GPU異構體系的,但具體如何在AMD、NVIDIA及Intel三家中選擇就不好說了。 如果要猜的話,這套超算大概率會使用Cray公司的Shasta超算系統,最可能的組合還是AMD EPYC處理器及NVIDIA GPU。 Cray公司日前也宣布獲得了美國海軍超算資源中心DSRC的新超算訂單,為後者研發12.8PFLOPS性能的新超算,使用的就是AMD EPYC霄龍處理器。 在此之前,AMD二代霄龍已經贏得了多筆超算訂單,比如德國的Hawk,美國的Frontier(百億億次號稱世界最快)、Perlmutter、BullSequana、芬蘭的某超算,每一套都是成千上萬顆,而且多數都是最頂級的64核心型號。 作者:憲瑞來源:快科技
歐盟牽頭研發高性能處理器 ARM/RISC-V異構設計、台積電6nm

歐盟牽頭研發高性能處理器 ARM/RISC-V異構設計、台積電6nm

自研處理器似乎開始進入一場與地緣陣營有關的「軍備競賽「。 據外媒報道,歐盟牽頭的EPI項目(European Processor Initiative,歐洲處理器倡議)公布了一份較為清晰的路線圖。 該項目最早2017年第三季度啟動,在多次新增成員並修改技術草案後,第一顆芯片已於去年底流片。 根據早先公布的信息,該芯片將用於歐盟研製的超級計算機中,採用異構設計,CPU部分為ARM體系,參考方案是Neoverese服務器核心中的「Zeus」迭代而成,匹配DDR5內存,PCIe 5.0接口等。 AI運算單元(矢量/張量核心)基於RISC-V體系,支持FP32, FP64, INT8, bfloat16等,匹配HBM存儲芯片。 值得一提是,芯片由台積電6nm EUV工藝打造,預計最快2020年內完工並交付量產。 作者:萬南來源:快科技
54屆TOP500超算排行榜來了 美國性能第一 中國數量第一

54屆TOP500超算排行榜來了 美國性能第一 中國數量第一

11月18日,第54屆TOP500超算排行榜來了,最強的超算依然是美國的Summit,浮點性能200PFLOPS(20億億次),第二名是Summit超算的姊妹Sierra,性能125PFLOPS,中國的神威·太湖之光之位列第三,不過總數上依然是中國以227台制霸,美國超算的數量為118台。 與6月份的超算相比,本次TOP500的前十名實際上沒有變化,排名及性能都沒升級,前兩名都是IBM、NVIDIA使用Power 9處理器、Teslak V100加速卡建設的超算,只是規模不同而已,Summit超算有241萬個核心,峰值性能達到了200PFOPS,Rmax性能148.6PFLOS,而第二名的Sierra峰值性能125.7PFLOPS,Rmax性能94.6PFLOPS。 第三、第四名是中國的神威·太湖之光、天河2A,峰值性能分別是125.4PFLOPS、100PFLOPS,Rmax性能分別是93PFLOPS、61PFLOPS。 從數量上來看,中國入圍TOP500的超算相比6月份增加了8台,從219台增加到了227台,在數量上繼續占據優勢,而美國則從6月份的116台略微增加到了118台,但依然處於歷史低點水平,數量上已經不復當年之勇了。 不過美國在超算上的實力依然不能被小覷,總算力上美國依然遙遙領先其他國家,118台超算占了全部算力的37.8%,中國只占31.8%。 不過中國超算追趕的速度也在加快,6月份的時候雙方的算力份額還是38.8%、29.9%,差距正在縮小。 在中美之外,其他國家的超算數量就少多了,第三位的日本擁有29台,法國18台,德國16台,荷蘭15台,愛爾蘭14台,英國11台,其他國家就是個位數了。 具體到廠商上來看,聯想以174台TOP500超算的位置位列第一,其次是中國曙光的71台,再次是浪潮的65台——沒錯,中國廠商包攬了前三,美國最大的超算公司Cray位列第四,建設了36台,第五的是HPE公司,建造了35台,不過HPE已經收購了Cray,兩者加起來有71台,實際上可以並列第二。 在芯片方面,TOP500中有470台超算都使用了Intel的處理器,第二位的是IBM Power處理器,總計有14台,但前兩個都是IBM Power處理器,還有3套超算使用了AMD的處理器,其中2個是最新的霄龍處理器。 文章糾錯 作者:憲瑞來源:快科技

新超算將比現「霸主」快25%

據美國趣味科學網站13日報道,一個國際團隊歷時5年,最近完成了兩台超級計算機中第一台的工程設計工作。該超級計算機如果研製成功,運算速度將比目前世界上運行速度最快的超級計算機快25%。這兩台超級計算機一起被稱為「科學數據處理器」(SDP),主要負責管理「平方公里射電陣」(SKA)望遠鏡收集的海量數據。 SKA是由位於澳大利亞珀斯和南非開普敦的射電望遠鏡組成的網絡,由數千個較小的碟形天線構成,將負責解答一系列科學疑問,其中包括行星如何形成、引力波如何拉伸宇宙的結構以及首批形成的星系如何演化等。 來自11個國家的國際研究團隊歷時5年,共同設計硬件、軟件和算法,現已完成第一台超級計算機的工程設計工作。 SDP項目經理毛里奇奧·米科里斯說,這兩台強大的處理器將分別安裝在珀斯和開普敦,每年將收集600PB(1PB等於100萬GB)數據,這些數據「足以填滿超過100萬台筆記本電腦」。 研究人員估計,SDP的運算速度將高達每秒25億億次浮點運算,比目前世界上運行速度最快的超級計算機——IBM的「頂點」(Summit)快25%,「頂點」的浮點運算速度為每秒20億億次。 據SDP代表稱,SDP在以創紀錄的速度從射電望遠鏡那兒獲得海量數據的同時,還將進行近乎實時的數據分析,以便從噪聲中篩選出信號。來源:cnBeta

富士通開始生產日本百億億次超算,配最強ARM處理器A64FX

日本富士通公司2006年啟動超算研究,2012年聯合日本理化所RIKEN正式推出京(Kyo)超算,這個名字來自日本單詞Kei,指的是1億億次,因為京是全球首個1億億次浮點性能的超算,憑此拿下了2011年兩次TOP500冠軍。不過京超算今年8月份就要退役了,接替它的是富士通、RIKEN聯合研發的Post-K超算,目標是百億億次性能,為此富士通開發了7nm 52核架構的A64FX處理器,雙精度浮點性能可達2.7TFLOPS。日前富士通宣佈正式啟動Post-K超算生產計畫,預計2021年到2022年之間部署這台超算。 與現有的超算相比,下一代京超算最大的變化就是處理器從SPARC64架構全面轉向ARM,此前富士通已經宣佈推出自主研發的ARMv8 SVE(可伸縮矢量擴展)芯片,使用了512bit浮點運算單元,每個節點使用48核+2輔助核,IO及計算節點則是48核+4輔助核結構。 Post-K超算的重點就是A64FX處理器,這個處理器的架構設計也很特別,有48個計算核心及4個協助核心組成,分為四個CMG單元,每個單元13個核心,28Gbps I/O帶寬,16條PCIe 3.0通道。 A64FX將使用高性能的HBM 2內存,每個CMG單元配備8GB HBM 2,帶寬256GB/s,總計32GB HBM 2,1024GB/s帶寬。 富士通的A64FX處理器將使用7nm FinFET工藝生產,87.86億個晶體管,性能可達2.7TFLOPS,是前代的SPARC V9處理器1.1TFLOPS的2.5倍左右。 富士通公司日前宣佈已經與RIKEN簽署合同,正式開始製造Post-K超算,其中關鍵的計算系統由富士通IT產品有限公司負責製造,未來將安裝、部署在RIKEN的計算科學中心內。 除了為RIKEN研發製造Post-K超算之後,富士通還會把開發Post-K研發出來的技術用於商業超算生產,計畫在2019財年下半年正式推出,它將成為富士通PRIMEHPC FX100超算系統的繼任者,為了應對更廣泛的市場需求,富士通還會推出更易於部署的入門級超算,或者將這些技術提供給其他開發商。 來源:超能網

日本超算「京」年中退役,新一代百億億次超算耗資1300億日元 …

去年的TOP500超算中,美國Summit超算第二次奪得了第一,蟬聯了冠軍地位,20億億次的峰值性能短時間內是沒有超算可以超越了,因為中國、美國以及歐盟、日本下一代超算直接是百億億次級別的,也就是E級超算,最快也要到2020年問世。在超算領域,中美競爭激烈,日本事隔多年之後也再一次加入世界第一的比賽中,今年中日本最快的超算京就要退役了,未來取而代之的是百億億次超算,預計2021-2022年問世,日本官方及私人總計投資1300億日元,約合79億元人民幣。 日本現在最強的超算就是京(Kyo),它的名字來源於日本數字,京K的名字就來源於日文單詞Kei,1京代表1兆的1萬倍,因為京是首個達到1億億次性能的超算,憑此拿下了2011年兩次TOP500冠軍,是2004年日本的地球模擬器超算被擠下第一之後日本再次拿到TOP500第一。 京超算是日本富士通研發製造的,說用的是SPARC64處理器,總計68544個處理器、548352個內核,不過這幾年沒什麼升級,TOP500排名中已經被中國、美國的超算擠到了第十名的位置,所以過去幾年中富士通一直在政府支持下研發京超算的下一代。 與現有的超算相比,下一代京超算最大的變化就是處理器從SPARC64架構全面轉向ARM,此前富士通已經宣佈推出自主研發的ARMv8 SVE(可伸縮矢量擴展)芯片,使用了512bit浮點運算單元,每個節點使用48核+2輔助核,IO及計算節點則是48核+4輔助核結構。 根據日本理化研究所的消息,京超算今年8月份就要退役了,8月16日面向外部研究人員及企業的應用支持會停止,然後大部分設施就要拆除,這也要花費數億日元。 日本新一代超算計畫被稱為Post-Kyo,也就是京超算後一代的意思,目前還沒有正式定名,預計在2021-2022年問世,也會安裝在現有京超算的地方,整個項目耗資大約1300億日元,約合12億美元或者79億人民幣。 中國目前有三個百億億次超算項目,山東濟南超算中心的是神威E級,另外還有國防科大/天津超算中心的天河三號、中科曙光的E級超算。根據國家超算濟南中心副主任潘景山的數據,神威E級超算+E級存儲的項目總投資約為40億元,其他兩個項目的投資尚無明確數據。 來源:超能網

AMD 7nm 64核羅馬處理器再獲超算訂單,20萬核6400萬億次性能

11月初的New Horizon大會上,AMD宣佈了全球首個7nm工藝的數據中心處理器羅馬,使用的是7nm工藝及Zen 2架構,首發用於EPYC系列處理器,從目前的32核64線程升級到了64核128線程。在服務器/數據中心市場上,英特爾Xeon至強處理器的占有率高達98%,AMD目前只斬獲2%份額,不過7nm 64核羅馬處理器有望幫助AMD繼續擴大份額,現在處理器還沒上市,羅馬又拿下了一份HPC訂單,芬蘭IT科技中心將采購3125顆64核羅馬處理器,建設一套超過20萬核心的6400萬億性能的超算。 芬蘭IT科技中心CSC正在建設新一代HPC超算平台,它實際上有兩期工程,第一期采購的是英特爾的Cascade Lake-AP 48核處理器,而第二期則會采購3125顆AMD羅馬處理器,後者是64核128線程,所以二期工程的HPC系統總計擁有超過20萬個CPU核心,整套平台的性能為6.4PFLOPS,也就是6400萬億次。 芬蘭CSC的超算是AMD的7nm羅馬處理器獲得的第二個HPC超算訂單了,此前斯圖加特高性能計算中心的歐洲新一代超算使用的也是AMD新一代7nm羅馬處理器。 來源:超能網