Home Tags 數據中心

Tag: 數據中心

華為發布業界首款數據中心OTN:單框容量百T級 加速萬兆超寬帶

快科技2月29日消息,MWC2024上,華為發布業界首款面向數據中心場景的OTN(光傳送網)產品OptiX OSN 9800 K36。 其單波容量1.6T,業界首個雙3D正交,單框容量百T級。該新品將支撐全球運營商建設F5G-A全光目標網,加速萬兆超寬帶發展,開啟F5G-A商用元年。 Huawei OptiX OSN 9800 K36,首次引入面向高能效DC機房的前進風後出風的風道設計理念,過智能天鴿風扇、導熱材料等一系列創新散熱技術,令單板散熱能力大幅提升,同時功耗也能得到降低,實現綠色數據中心的建設。 全新的Huawei OptiX OSN 9800 K36產品擁有三大創新點: 1、全面升級單波容量到1.6Tbps,容量提升4倍,單比特成本降低30%; 2、構建業界首個雙3D正交,將業務單板進行靈活拆分,實現了槽位數量翻倍,支持超高速Serdes互聯,單框容量達到百T級,輕松應對數字時代的流量激增; 3、內置智能單元實現毫秒級檢測和實時智能故障分析,支撐數位化光網絡的精準構建,確保網絡始終處於最佳工作狀態,支持網絡可用率提升。 來源:快科技

Intel正式發布五代至強:最多64核心/320MB三級緩存、省錢77%

快科技12月15日消息,酷睿Ultra消費級處理器登場的同時,Intel還正式發布了面向伺服器、數據中心的第五代至強可擴展處理器,代號Emerald Rapids。 五代至強延續了現有四代的Intel 7製造工藝、CPU架構、LGA4677封裝接口,但在布局設計、規格特新上做了升級和增強,算是過渡性質的一代。 五代至強依然是多晶片整合封裝,但是從四晶片改為雙晶片,每顆晶片組的最大核心數量則從15個增加到32個,因此從最多60核心120線程提高到了64核心128線程。 64核心旗艦的有三款,分別是鉑金8593Q、鉑金8592V、鉑金8592+。 同時還有60、56、52、48、36、32、28、24、16、8核心等不同配置,相比四代取消了44、40、20、18、12、10核心版本,SKU型號總數也從55款之多精簡到28款。 三級緩存容量更是大幅增加,從最多112.5MB來到320MB,相當於每核心從1.875MB增至5MB,接近2.7倍之多。 內存還是八通道,但是放棄了DDR4,同時將DDR5的頻率從4800MHz提高到5600MHz,單路最大容量還是4TB。連接通道則還是80條PCIe 5.0。 最高加速頻率范圍從1.9-4.2GHz不等來到了3.4-4.1GHz,雖然極限頻率低了100MHz,但是總體大大提升,基準頻率也從1.7-3.7GHz不等提高到了1.9-3.9GHz。 不可避免的是功耗明顯提高了一個台階,四代的范圍是115-350W,現在范圍則是150-385W。 但是按照Intel的說法,五代至強的性能、能效都實現了重大飛躍,同等熱設計功耗下的平均性能提升了21%,每瓦性能則提升高達36%。 具體到細分領域,圖像分割、圖像分類AI推理性能提升最多分別42%、24%,建模和模擬HPC性能提升最多42%,網絡安全應用性能提升最多69%。 網絡與雲原生負載能效提升最多33%,基礎設施與存儲負載能效提升最多24%。 按照典型的五年更新周期計算,五代至強可以讓客戶的總體擁有成本(TCO)降低最多達77%,但沒有公布每款SKU的具體價格。 四代至強就內置了AMX AI加速器,五代至強又進一步升級,能夠微調200億參數的大語言模型,而至強目前仍然是唯一一款擁有MLPerf訓練和推理基準性能測試的通用CPU。 同時,QAT快速助手、DLB動態負載均衡器、DSA數據流加速器、IAA存內分析加速器等依然存在,並且都可以按需付費開啟。 客戶應用實例方面,IBM watsonx.data平台的網絡查詢吞吐量提高了2.7倍,Palo Alto Networks的基於深度學習模型的威脅檢測性能提升了2倍,Gallium Studios遊戲工作室Numenta AI平台的推理性能比GPU雲實例提高了多達6.5倍。 明年上半年,Intel將推出基於全新Intel 3製造工藝、純E核架構的Sierra Forest,也是至強系列第一次引入E核,最多做到288核心288線程。 緊隨其後的是同樣Intel 3製造工藝、純P核設計的Granite Rapids,但核心數量等規格未披露。 來源:快科技

AMD Instinct加速器真是彪悍 但別忘了EPYC 它也是AI高手

快科技12月7日消息,AMD今天正式發布了,一個是傳統GPU加速器,一個是獨一無二的CPU+GPU融合加速器。 同時,AMD還宣布了下,其中集成的Ryzen AI NPU引擎將提速60%,而下一代的Strix Point更是會採用新一代XDNA 2架構,AI性能提升超過3倍! 事實上,無論是AI還是HPC,AMD最大的優勢不是某條產品線多麼強大,而是有著完整的平台化解決方案。 這包括目前世界上最強大的EPYC CPU處理器,以及Alveo加速卡、Pensando網絡互連產品,它們和GPU/APU加速器一起,共同構成了一個齊備的矩陣。 在這其中,EPYC無疑扮演著核心角色,沒有它就不足以成為平台化方案,其中MI300A融合加速器里的CPU部分,也正是直接復用了EPYC的設計。 MI300A除了集成六個XCD GPU模塊(228個計算單元)、四個IOD模塊(256MB無限緩存)、八個HBM3內存模塊(128GB),還有三個CCD模塊。 這三個CCD模塊和EPYC 9004系列處理器中的CCD一模一樣,也是每個內部有8個Zen4 CPU核心、32MB三級緩存,總計24個核心、96MB三級緩存。 這樣的融合設計,使得MI300A成為一個真正獨立、全能的加速器,自身就可以構成完整的系統,這也是AMD獨一無二的優勢。 再說到EPYC,雖然本次大會上沒有新的宣布,但作為當今世界上最強大的通用處理器,憑借5nm製造工藝、Zen4架構的精妙設計,第四代EPYC面對無論是AI還是HPC,都遊刃有餘。 第四代EPYC在該產品歷史上首次多點開花,分為四個不同的子系列,更有針對性地服務不同應用領域和場景。 其中,Genoa EPYC 9004系列是通用性最強的,擁有最多96核心192線程、最多384MB海量三級緩存、最高4.4GHz加速頻率、12通道DDR5-4800內存(單路最大容量6TB)、128條PCIe 5.0總線。 Genoa-X EPYC 9004X系列加入了獨有的3D V-Cache堆疊緩存,是世界上首個採用3D晶片堆疊緩存的數據中心處理器,最多達768MB,加上原緩存合計可達1254MB,可滿足對極強計算性能的需求。 Bergamo EPYC 9704系列首次採用精簡版的Zen4c架構,面積更小,能效更高,擁有遙遙領先的128核心256線程,內存、PCIe連接也是滿血,最為適合對計算密度有著高要求的雲原生計算領域。 Siena EPYC 8004系列則是面向基礎設施和智能邊緣計算領域,Zen4c架構,有著非常高的能效和計算密度。 2017年誕生以來,AMD EPYC經過連續四代的進化,有著有業界最高的計算密度、最高的性能、最高的效率,或者直白地說有著最多的核心、最大的緩存、最高的頻率,以及極為豐富的技術特性,而且性價比極高,對於數據中心客戶無疑是No.1級別的存在。 按照路線圖,AMD即將推出代號Turin的下一代EPYC,全新升級到4nm/3nm製造工藝、Zen5架構,更加值得期待。 來源:快科技

30.72TB 鎧俠發布迄今最大PCIe 5.0 SSD CD8P:性能平平

快科技8月8日消息,鎧俠今天發布了面向數據中心的頂級SSD CD8P,不但擁有最高30.72TB的超大容量,還支持PCIe 5.0。 鎧俠CD8P提供U.2、E3.S兩種形態,單個埠,主控、快閃記憶體、固件全套都是鎧俠自主解決方案。 其中,快閃記憶體是112層堆疊的BiCS5 TLC,主控支持PCIe 5.0 x4、NVMe 2.0,固件支持各種企業級特性,諸如快閃記憶體晶片失效保護、掉電保護、端到端數據保護、SIE安全及時擦除、SED自加密等。 性能方面是偏讀取的,順序、隨即讀取分別可達12GB/、200萬IOPS,但依然沒有滿血,而順序、隨機寫入則分別只有5.5GB/、40萬IOPS。 根據使用場景不同,CD8P分為了兩個子系列,一是面向混合使用負載的CD8P-V,容量1.6TB、3.2TB、6.4TB、12.8TB,每天可以3次全盤寫入,質保5年。 二是面向讀取密集型負載的CD8P-R,容量1.92TB、3.84TB、7.68TB、15.36TB、30.72TB,每天1次全盤寫入,質保也是5年。 鎧俠沒有公布CD8P系列的出貨時間,至於價格,這種產品什麼時候公布過?你使勁猜就行了。 一年前,鎧俠還發布過,雙埠,容量最高12.8TB,順序讀寫最高14GB/、7GB/,隨機讀寫最高270萬IOPS、60萬IOPS。 來源:快科技

全球首個商用海底數據中心在海南下水:算力高、散熱不費電

3月31日下午,全球首個商用海底數據中心在海南省陵水黎族自治縣下水。 據介紹,這個項目承建方為深圳海蘭雲數據中心科技有限公司,此前聯合國家海洋環境監測中心,對海底數據中心建設海域篩選後落戶到陵水黎族自治縣英州鎮清水灣。 數據中心由岸站、水下中繼站、水下數據終端和海纜組成,岸站承載電力、網絡接入和中央監控等設施,水下中繼站是負責電力及網絡分發、控制和回傳的中間接續水下設施的統稱,水下數據終端則集中放置電子信息設備和水下設施。 其中,水下中繼站和水下數據終端部署在指定目標海底。 數據中心的核心裝備海底數據艙呈圓柱形罐體狀,艙內是恆濕、恆壓和無氧的安全密閉環境,重量達1300噸,相當於1000輛小汽車的重量,罐體直徑達3.6米,與“天和號”空間站核心艙相當,是目前全球最大的海底數據艙,結構設計壽命為25年,應用水深超30米。 通過將伺服器安放在海底的數據艙中,以海洋為自然冷源,具有省電、不需淡水、節約土地資源、高安全、高算力、快速部署的優點。 目前,已有中國電信等9家企業與海底數據中心簽約合作。 來源:快科技

對Intel窮追猛打 AMD Zen4c 128核心上半年殺來

去年下半年,AMD搶先發布Zen4架構的霄龍9004 Genoa系列,不但時間上比Intel Sapphire Rapids第四代可擴展至強,而且在核心數量等規格上優於競品,關鍵是還便宜。 最新的季度財務會議上,AMD CEO蘇姿豐又確認,今年將會發布三個系列的全新霄龍產品,分別是Bergamo、Genoa-X、Siena。 其中,Bergamo將在今年上半年如期登場,下半年全面普及。 它基於Zen4c架構,指令集兼容Zen4但面積更小、能效更高,最多128核心256線程,支持12通道DDR5記憶體、PCIe 5.0通道,和霄龍9004系列共享SP5封裝接口,平台兼容。 Bergamo系列主要面向需求高密度、高吞吐量的雲市場,不但對標Intel HBM版至強,還要競爭亞馬遜等的Arm架構產品。 Intel則會在明年推出純E核設計的Sierra Forest,,採用龐大的LGA7529封裝接口。 Genoa-X就是添加3D V-Cache緩存的版本,官方披露緩存總容量將超過1GB,預計命名為霄龍9004X系列,今年內發布,預計下半年。 Siena面向智能邊緣計算和通信基礎設施領域,也是Zen4c架構,最多64核心128線程,今年內發布,預計下半年。 蘇姿豐還提到,隨著Zen4家族產品出貨量不斷提高,預計會在今年第四季度超過Zen3,成為絕對主力。 來源:快科技

NVIDIA 144核心超級CPU揭秘:3.5倍能效碾壓AMD 128核心

2022年3月的GTC技術大會上,NVIDIA正式發布了,同時打造了兩顆超級晶片,一是Grace CPU二合一,二是Grace CPU+Hopper GPU二合一。 Grace CPU二合一 Grace CPU+Hopper GPU二合一 現在,NVIDIA官方詳細揭示了Grace Superchip超級晶片的設計與性能、能效。 它通過NVLink-C2C晶片間互連總線,將兩顆Grace CPU整合在一塊基板上,彼此之間的雙向帶寬多達900GB/。 Grace CPU基於Armv9-A 9.0架構、Neoverse V2 64位內核,以4個128-bit功能單元的方式配置了兩組SIMD矢量指令集,一是SVE 2(縮放矢量擴展第二版),二是NEON(高級SIMD)。 它還支持LSE(大型系統擴展),可提供低成本的原子操作,改進CPU通信吞吐。 NVIDIA聲稱,這種核心的能效,是如今伺服器常見x86核心的2倍。 Grace CPU單顆集成72個核心,互相通過3.2TB/超高帶寬的NVIDIA縮放一致性Fabric總線互連,而二合一的超級晶片上就是144個核心。 每核心64KB一級指令緩存、64KB一級數據緩存、1MB二級緩存,一顆超級晶片的所有核心共享234MB三級緩存。 記憶體整合封裝了LPDDR5X,最大容量960GB,最高帶寬1TB/(每一顆500GB/),還支持ECC。 對比傳統的八通道DDR5,這種設計不但帶寬高出53%,單位功耗也只有1/8。 對比海量帶寬的HBM2e,單位成本只有1/3,容量則可達8倍。 擴展支持八組PCIe 5.0 x16,總帶寬1TB/,還有用於管理的低速PCIe通道。 性能方面,一顆超級晶片的FP64雙精度峰值浮點性能可達7.1TFlops(每秒7.1萬億次計算),熱設計功耗500W。 NVIDIA對比了AMD Zen3架構的霄龍7763 64核心,雙路組成128核心,號稱性能可領先1.5-2.5倍,能效可領先2.0-3.5倍! 當然,AMD已經有了Zen4架構、最多96核心的霄龍9004系列,NVIDIA Grace依然還沒有商用。 來源:快科技
單核性能暴漲32%Zen3 64核心霄龍型號、規格曝光

AMD被大大看好:搶走Intel 30%市場

投資機構KeyBanc近日發布了一份報告,重點分析了AMD、NVIDIA的市場前景。 AMD這邊,遊戲顯卡的庫存周期依然有4個月,比去年第四季度的4-5個月有所改善,但仍然不夠健康,而且全球遊戲市場相當萎靡,尤其是中國。 新發布的銳龍7000系列需求疲軟,除了價格因素,舊產品的庫存也有些偏高,渠道商都在努力清理。 數據中心市場是AMD表現最好的,尤其是在雲服務市場,去年12月出貨量環比增加5%,同比增加100%,主要是受Rome第三代霄龍7003系列的推動,以及微軟的力挺。 新發布的Genoa第四代霄龍9004系列也前景看好,面對Intel Sapphire Rapids第四代至強競爭力非常強,尤其是核心數量更多、功耗更低。 KeyBanc預計,AMD在數據中心市場的份額,將從去年底的22%,提高到今年底的30%。 要知道,Zen架構誕生之前,AMD在數據中心市場機會沒有任何存在感,短短五六年就搶走Intel 30%的市場,非常可怕。 綜合來看,KeyBanc雖然降低了對AMD股價的預期,但讓然給予了買入的評級。 NVIDIA這邊,預期股價從230美元調低到220美元。 舊顯卡庫存看起來已經趨於穩定,不過RTX 30系列仍然還有很多很多。 RTX 4090需求旺盛,RTX 4080雖然差一些但也基本健康。 但因為市場頹勢,預計NVIDIA新一季度的遊戲業務收入會減少25億美元。 數據中心市場上,NVIDIA的勢頭也有點遲緩,去年12月出貨量環比只增加了2%,同比增幅為24%。 來源:快科技

性能領先至多3倍 第四代AMD EPYC處理器上市:96核心功耗僅360W

AMD “Zen4”架構的銳龍7000系列在桌面處理器上已經展示了強勁的實力,現在又閃電殺到了伺服器、數據中心市場。 代號“Genoa”(熱那亞)的第四代AMD EPYC(霄龍)處理器——AMD EPYC 9004系列正式降臨,新一輪大戰正式開啟! 回顧歷史,2017年,AMD憑借全新的“Zen”架構重返高性能計算市場,發布了代號“Naples”的第一代EPYC 7001系列通用處理器,2019年帶來了代號為“Rome”的第二代EPYC 7002系列。 代號“Milan”的第三代 EPYC 7003系列,第一次衍生出了特殊的“Milan-X”,加入獨立的3D V-Cache堆疊緩存技術,實現更高性能。 全新的第四代AMD EPYC處理器家族更加豐富,其中通用型代號“Genoa”(熱那亞),就是今天推出的AMD EPYC 9004系列。 據AMD在今年財務分析師日上展示的信息顯示,陸續還會推出採用3D V-Cache技術的“Genoa-X”,面向雲計算服務的“Bergamo”(貝爾加莫),以及面向電信基礎設施和邊緣計算的“Siena”(錫耶納)。 這意味著,AMD EPYC將不再局限於單純的傳統計算市場,而是會把觸角伸向更豐富的應用領域,拓展至更靈活的場景和負載,從更多角度與Intel至強進行競爭。 此外,未來的第五代“Turing”(圖靈)家族,也已經在躍躍欲試了,將會升級全新的“Zen5”架構,無論是產品規格、性能,還是應用市場,必將再次實現新的突破,值得期待。 第四代EPYC有四大突出特點: 1、升級5nm工藝、“Zen4”架構,延續chiplet布局,最大核心數量從64個增至96個(192線程),無論單核性能還是整機性能都繼續保持領先。 2、升級支持DDR5記憶體,最高頻率4800MHz,而且支持多達12個通道,最大容量6TB,相比上代八通道DDR4帶寬提升超過2.3倍。 3、升級支持下一代IO,提供最多160條PCIe 5.0,相比上代128條PCIe 4.0實現質的飛躍,並引入CXL 1.1+高速互連,64條通道,可提供突破性的記憶體擴展能力。 4、升級加密計算,比如增強記憶體加密、SEV-SNP訪客數量翻倍、Infinity Guard功能集補充等。 值得一提的是,EPYC 9004系列同樣支持AVX-512指令集,對於諸多企業級應用可以帶來加速,尤其是AI推理,有望實現數倍的性能提升。AI無處不在的今天,這一點無疑是至關重要的。 正因為如此一系列的巨變,EPYC 9004系列的封裝接口也變成了全新的SP5,OEM廠商也正在跟進設計中。 在介紹EPYC 9004系列具體型號、規格之前,先了解下命名規則,非常簡單明了: 第一位數字固定為9,代表產品序列。 第二位數字代表核心數量,分別為0 8核心、1 16核心、2...

業界首個 華為首發微存儲新品:1ms穩定低時延

華為全聯接大會2022中國深圳站期間上,華為發布業界首個面向數據中心Diskless架構的微存儲——華為OceanStor Micro系列,打造綠色集約、安全可靠的數據中心。 據了解,華為OceanStor Micro微存儲本質上是傳統盤框的智能化升級,以基於NOF+技術的高速網絡連接Diskless伺服器,支持上層分布式軟體的透明訪問,實現計算和存儲資源獨立彈性擴展,消除兩者的生命周期管理差異。 華為快閃記憶體存儲領域總裁黃濤詳細闡述了OceanStor Micro微存儲的創新設計理念。他表示,海量數據的爆發式增長,給全球雲和網際網路數據中心帶來四大挑戰: 首先,雲和網際網路數據中心普遍採用基於本地盤的伺服器搭建存儲系統,存算無法獨立彈性擴展。同時,由於數據需要長期保存,數據比CPU算力的生命周期(3-4年)至少長3年以上,這種差異導致本地盤伺服器架構下,大量數據在CPU算力升級時被迫遷移,不僅費時費力,還會增加數據丟失和業務中斷的風險。 其次,雲和網際網路數據中心通常採用三副本等簡單技術保證數據可靠性,一份數據需保存三個副本,與專業存儲成熟的數據縮減方式相比,會造成機櫃空間極大浪費,同時也帶來能耗高的問題,無法滿足數據中心綠色節能的常態化要求。 再次,大規模數據中心本地盤數量通常超過10萬個,海量數據盤的健康管理也成為一大難題。 此外,雲和網際網路數據中心應用多樣、需求各異,承載應用數據的存儲面臨兼容性、性能、安全等多重挑戰,使得分布式軟體及應用的開發變得極為復雜。 面對以上關鍵挑戰,華為推出微存儲產品,通過四大創新,用專業存儲能力助力大規模雲和網際網路數據中心實現綠色節能、高性能、高可靠。 創新一:微存儲面向Diskless伺服器架構設計,發揮存算分離的優勢,實現計算和存儲獨立彈性擴容,CPU算力升級時免數據遷移,同時疊加場景化數據縮減編碼等關鍵技術,實現機櫃空間和設備能耗節省40%。 創新二:通過FLASHLINK?智能盤控協同算法等軟硬體結合技術,大幅優化數據處理效率,IOPS性能提升30%,進而提升上層應用性能。 創新三:通過雙控Active-Active架構、硬碟亞健康管理和慢盤智能優化等多重可靠性技術,實現系統級可靠,數據盤故障可預測、可視可管,大幅降低運維難度。 創新四:通過微存儲和Diskless伺服器之間的網絡技術創新,基於性能無損的NOF+網絡,將復雜的數據存儲能力卸載到微存儲,從而實現Ceph、Lustre等分布式軟體的開發簡化和性能加速。 黃濤表示:“微存儲將成為數據中心的必備通用標準部件,推出微存儲產品是華為打造多雲戰略的關鍵一步。” 雙11紅包活動推薦: 來源:快科技

美國禁售 NVIDIA打造中國特供A800 GPU:居然只砍了一刀

隨著美政府對NVIDIA A100、H100兩款數據中心加速GPU實施出口禁令,不得銷售給中國,NVIDIA一方面爭取推後禁售時間,,在規格上符合管制政策。 現在,媒體曝光了A800的具體規格,看樣子來自NVIDIA官方文檔,但是官網上沒有任何蹤跡,現在異常低調。 A800將有三種不同版本,分別是40GB HBM2線程PCIe接口、80GB HBM2e顯存PCIe接口、80GB HBM2e顯存SXM接口,可滿足不同客戶和環境的需求。 對比來看,A800隻是在A100的基礎上,將NVLink高速互連總線的帶寬從600GB/降低到400GB/,僅此而已。 其他規格也完全不變,比如9.7TFlops FP64雙精度、19.5TFlops FP32單精度等計算性能,1.6-2.0TB/顯存帶寬,單卡最多7個實例,支持單卡到八卡並行,PCIe 4.0系統總線,250-400W熱設計功耗(PCIe為雙插槽風冷或單插槽液冷)。 換言之,A800隻是多卡互連性能受到影響,計算能力則完整保留! 這麼看老黃還真是良心,能保留的都保留,希望不要被監管再次盯上。 雙11紅包活動推薦: 來源:快科技

Intel發布全新GPU Flex:轉碼性能5倍於NVIDIA 功耗僅一半

Intel獨立GPU雖然是後起之秀,但正在無處不在! 今天,Intel正式發布了全新的數據中心GPU Flex系列(曾用代號Arctic Sound-M),主要用於視頻轉碼與傳輸、視覺AI推理、雲遊戲、桌面虛擬化等領域。 早在2020年11月,Intel就發布了,基於Xe LP低功耗架構的DG1核心,面向的就是高密度、低時延的安卓雲遊戲、流媒體服務。 全新的Flex系列則是基於Arc A系列獨立顯卡同款的Xe HPG高性能架構、DG2核心,支持H.264、H.265(HEVC)、AV1硬體編解碼,VP4解碼與傳輸。 該系列包括兩款型號: 一是Flex 170,滿血的32個Xe核心(512個執行單元/512個XMX引擎)、32個光追核心,基準頻率1950MHz,最高加速2050MHz,搭配256-bit 16GB GDDR6顯存,等效頻率18GHz,帶寬576GB/。 整卡功耗150W,單插槽設計,PCIe 4.0 x16系統接口。 二是Flex 140,一半的16個Xe核心(256個執行單元/256個XMX引擎)、16個光追單元,基準頻率、最高加速分別降低至1600MHz、1950MHz,搭配192-bit 12GB GDDR6顯存,等效頻率14GHz,帶寬336GB/。 整卡功耗也減半來到75W,系統接口同樣減半至PCIe 4.0 x8。 這樣的規格,應該分別對應桌面頂級型號Arc A770、主流型號Arc A580的水平,當然它們倆是沒有視頻輸出接口的,頻率、功耗估計也會不太一樣。 Flex GPU系列集成最多四個Xe媒體引擎,相比於NVIDIA A10,可提供5倍的媒體轉碼吞吐性能、2倍的媒體解碼吞吐量,而且只需要一半的功耗,開源的AV1硬體編碼器還能節省30%以上的帶寬。 它單卡即可支持多達36路視頻流的1080p60轉碼吞吐量、8路視頻流的4K60轉碼吞吐量。 在4U伺服器中擴展到10卡配置時,可以支持多達360路視頻流的H.265-H.265 1080p60轉碼吞吐量。 搭配Deep Link超級編碼功能,Flex 140可在單卡上配備兩套編解碼設備,滿足“一秒時延”要求,同時提供8K60實時轉碼,適用於AV1、H.265 HDR格式。 安卓雲遊戲方面,Flex...

曾經幾近消失:AMD EPYC伺服器份額創紀錄達到16.5%

日前,AMD發布了2022年第一季度財報,表現亮眼。當季收入達到創紀錄的59億美元,年增71%,即便排除收購而來的賽靈思,收入也是創紀錄的53億美元,年增55%,同時毛利率達到48%,年增1.9個百分點。 產品方面,銳龍處理器、Radeon顯卡、EPYC霄龍處理器也是三線起飛,帶動各自業務部門都是創紀錄的營收。 伴隨而來的是市場份額的不斷提升。 根據Mercury的收入估計顯示,AMD伺服器的收入份額在2022年第一季度達到了16.5%,相比上個季度增加了2.1個百分點,年同比增長5.7個百分點。 曾幾何時,AMD在伺服器市場上幾近消失,Zen架構的EPYC誕生後一路勢如破竹,不斷攻城略地,啃下一個又一個硬骨頭,得到了行業和客戶的普遍信賴。 根據AMD財報提供的數據,目前已有465個雲實例部署了AMD EPYC處理器,其中微軟Azure HBv3虛擬機已全面升級基於AMD 3D V-Cache緩存堆疊技術的第三代EPYC 7003X系列,Google Cloud C2D虛擬機、Amazon EC2 C6a/Hpc6a也都使用了AMD EPYC處理器。 來源:快科技

亞馬遜第三代處理器降臨 550億電晶體、七合一64核心

官宣半年之後,亞馬遜雲(AWS)自研的第三代處理器Graviton3終於落地商用了,應用於最新的C7g實例。 亞馬遜Graviton3也採用了時下流行的chiplets小晶片設計,封裝多達7個小晶片,一顆主晶片周圍圍繞著六顆輔助晶片。 造型布局很別致,腦洞大開的媒體還把亞馬遜雲的LOGO改了一下P上去,一個手腳齊全的小胖機器人呼之欲出。 這是內部結構簡圖。主晶片中是最多64個ARM架構核心,八橫八縱呈Mesh網格狀分布。 左右兩側的四個是DDR5記憶體控制器,目前信息是四通道。下方兩個則是PCIe 5.0控制器。 單獨把控制器做成小晶片,倒也是頭一次見。 製造工藝不詳,官方只透露集成了大約550億個電晶體。 性能方面,相比上代單核性能提升25%,浮點性能提升2倍,加解密性能提升2倍,機器學習性能提升3倍。 官方還稱,延遲一致性優於AMD霄龍、Intel至強,包括後者即將發布的下一代Sapphire Rapids。 多路並聯方面非常詭異,亞馬遜Graviton3不是傳統的雙路、四路,而是三路,也就是一個節點三顆處理器,計算密度因此比雙路輕松高出一半。 亞馬遜使用了一個名為Nitro的子卡,來統一管理三顆處理器,以及存儲、網絡、安全等。 來源:快科技

700W功耗撐不住了 NVIDIA計算卡第一次上液冷:節能30%

對於下一代顯卡,AMD、NVIDIA在台北電腦展期間都三緘其口,絲毫沒有提及。AMD只講處理器,NVIDIA則只說數據中心GPU、CPU。 NVIDIA宣布,Ampere架構的計算卡A100、桌面超算HGX A100,Hopper架構的計算卡H100、桌面超算HGX H100,將在該系列中首次引入液冷散熱,從而提高散熱效率、降低能耗、節省空間和成本。 NVIDIA表示,它們都採用了直接晶片(Direct-to-Chip)冷卻技術。 HGX A100、HGX H100系統採用的都是SXM樣式計算卡,在機架內直接整合液冷散熱系統,取代傳統的系統風冷散熱,體積更加緊湊,前者現已出貨,後者今年第四季度。 A100 PCIe(80GB)、H100 PCIe獨立計算卡則有些類似桌面液冷顯卡,整合水冷頭,不過接口放置在尾部,以便對接液冷系統,前者今年第三季度出貨,後者明年初。 數據中心服務商Equinix正在實驗室中測試自己的首款液冷GPU方案,結果發現,採用液冷技術的數據中心工作負載可與風冷設施持平,同時消耗的能源減少了約30%。 同時,液冷版的A100/H100 PCIe只需占用一個插槽位,相比傳統兩個插槽位的風冷版,可以節省最多66%的機架空間。 NVIDIA估計,液冷數據中心的PUE(電源使用效率)可能達到1.15,遠低於風冷的PUE 1.6。 採用台積電4nm工藝製造、CoWoS 2.5D晶圓級封裝,集成800億個電晶體、18432個CUDA核心、576個Tensor核心、60MB二級緩存,可搭配6144-bit HBM2e/HBM3高帶寬記憶體。 H100計算卡支持SXM、PCIe 5.0兩種形態,其中後者功耗高達史無前例的700W,相比A100多了整整300W。 SXM5版本只開啟15872個CUDA核心、528個Tensor核心、50MB二級緩存。 PCIe 5.0版本則只有14952個CUDA核心、456個Tensor核心。 來源:快科技

雙芯功耗只有區區75W Intel全新數據中心顯卡首次實拍

日前的Intel On產業創新峰會上,Intel分享了代號Arctic Sound-M(ATS-M)的全新數據中心GPU顯卡的諸多細節,並第一次進行了實卡公開展示。 ATS-M同樣基於Xe HPG架構、DG2核心,算力達150TOPS(每秒150萬億次),面向多媒體轉碼、視覺圖形處理、雲遊戲、雲端推理等應用場景,也是Intel第一次在數據中心領域支持AV1視頻編解碼,也支持AVC、H.265、VP9。 它有兩種形態版本,其一為3/4長度、全高尺寸,集成32個Xe內核,功耗150W,其二是全長、半高尺寸,封裝兩顆GPU晶片,共有16個Xe內核。 二者都有4個Xe媒體引擎、光追單元、GDDR6記憶體,都支持XMX AI加速。 這是150W版本,造型異常簡潔,不過有趣的是現場擺放了多個設計樣式,正面的文字就有明顯不同,不知道是沒有最終定型,還是面向不同客戶、應用。 尾部一個8針供電接口。 頂部這里不知道是做什麼用的,難道是多卡並聯接口? 從背面看,甚至有大量的元器件並沒有焊接。 尾部連8針接口都沒有加上。 這是75W版本,更加細長,表面除了Intel LOGO別無其他。 只可惜,不讓拆開看內部設計。 Intel ATS-M顯卡將在第三季度發布上市,現已獲得超過15款設計,來自戴爾、超微、思科、慧與、浪潮、新華三等合作夥伴。 來源:快科技

Intel官宣全新數據中心顯卡:首發AV1編碼、雙芯功耗僅75W

近日,Intel舉辦了一場Intel On產業創新峰會(Intel Vision),期間公布了在晶片、軟體、服務方面取得的多項進展,展現了全面、強大的技術和生態系統整合實力。 峰會上,Intel公開介紹了全新的數據中心GPU顯卡,代號Arctic Sound-M(ATS-M),面向多媒體轉碼、視覺圖形處理、雲遊戲、雲端推理的單一GPU解決方案。 它和消費級遊戲市場上的Arc A系列一樣,都採用了Xe架構、DG2 Alchemist內核,集成最多32個Xe核心、32個光追單元、4個Xe媒體引擎、XMX AI加速單元、AV1硬體編解碼器,也是Intel在數據中心領域首款支持AV1編解碼的獨立GPU。 視頻轉碼方面,它可以同步處理超過30條1080p視頻流,而在雲遊戲方面,可以同時滿足超過40位遊戲玩家,另外支持62個虛擬化功能、AI推理算力每秒150萬億次運算(150 TOPS)。 ATS-M採用全開放的理念,開發人員可以利用oneAPI支持的開放軟體堆棧,開展相關設計工作,系統和軟體適配工作也在快速推進中。 它將搭配代號Sapphire Rapids的第四代至強可擴展處理器,每個節點支持兩塊ATS-M、兩顆Sapphire Rapids。 ATS-M有兩種不同的形態設計,一是單晶片,面向需要峰值性能的工作負載,功耗150W;二是雙晶片,面向高密度、多用途的工作負載,功耗僅75W。 Intel ATS-M顯卡將在第三季度發布上市,現已獲得超過15款設計,來自戴爾、超微、思科、慧與、浪潮、新華三等合作夥伴。 同時,Intel還進一步介紹了Xe HPC架構、代號Ponte Vecchio的首款高性能計算加速卡,以及基於它和Sapphire Rapids至強可擴展處理器的超級計算機「Aurora」。 該超算由Intel、慧與、美國能源部、阿拉貢國家實驗室聯合打造,最新披露的算力已經超過2EFlops,也就是200億億次每秒。 Ponte Vecchio 而說到Sapphire Rapids至強處理器,Intel最新透露,它將集成AI、加密、網絡、數據中心等不同目的加速器,針對快速增長的各種工作負載類型進行優化,滿足海量數據處理需求。 它還會首次整合封裝HBM2E高帶寬記憶體,最多四顆,總容量最大64GB,但這個是可選項。 Sapphire Rapids目前已經開始出貨首批型號。 Sapphire Rapids Sapphire Rapids和邊緣的四顆HBM2E記憶體 來源:快科技

西數發布頂級15.36TB SSD:好一把「大刀」

除了,西部數據今天還發布了全新的頂級SSD Ultrastar DC SN650,容量高達15.36TB。 西數SN650 SSD面向大型數據中心客戶,配備下一代BiCS5 3D TLC快閃記憶體晶片,支持PCIe 4.0、NVMe。 它還採用了西數自研的主控、固件,並進行垂直整合優化。 提供兩種形態樣式,一是2.5英寸、U.3接口,二是更長更薄、形如一把「大刀」的E1.L,二者最大容量都是15.36TB。 更多細節如性能、壽命、功能等暫未公布。 西數SN650已經送樣,將在下半年量產出貨。 來源:快科技

微軟創建世界最大的數據中心廢熱回收計劃,將為芬蘭南部居民供暖

近期微軟宣布將在芬蘭興建新的數據中心,對於地方政府來說當然是個好消息,可以帶動當地的經濟發展,預計該項目可創造11000個新的工作崗位。以規模而言,這是芬蘭歷史上最大的單一ICT投資項目之一,預計未來四年內會創造超過172億歐元收入。微軟的新數據中心不僅僅可以加速芬蘭數字轉型、幫助當地發展經濟、創造更多就業機會,而且還能為所在地居民提供更好的生活保障。 據芬蘭廣播公司(YLE)報導,微軟和能源公司Fortum合作,不但會打造一座節能的數據中心,而且還將創建世界最大的數據中心廢熱回收計劃。新設施不僅僅考慮作為超大型數據中心的核心計算功能,而且還考慮到環保方面的問題,為此准備了一系列的解決方案。 微軟和Fortum將使用零排放電力為數據中心供電,同時會將廢熱引導到當地居民家中,覆蓋芬蘭南部Espoo、Kauniainen和Kirkkonummi的市鎮區域,預計可以滿足該地區25萬供熱居民約40%的需求。當數據中心全面投入使用,加上處理廢水產生的廢熱,整個地區60%的供暖都將由環保廢熱產生。 據Fortum指出,與微軟合作的廢熱回收項目,可以每年減少約40萬噸的二氧化碳排放。 ...

500多億美元沒白花 AMD推全新光電模塊:4W功耗跑出3.2Tbps網速

2月份,AMD宣布正式完成對賽靈思公司的收購,這筆交易的價值從之前的350億美元漲到了500多億美元,不過AMD通過這次的收購大大加強了數據中心領域的實力,現在聯合Ranovus推出了全新的光電模塊,用4W功耗就能做到3.2Tbps的吞吐量。 這套系統原本是Ranovus與賽靈思合作開發的,現在名正言順變成了AMD、Ranovus合作的,它使用了AMD賽靈思的Versal ACAP FPGA加速平台以及後者的Odin CPO 2.0單晶片光電晶片。 數據中心處理的數據量越來越多,除了對算力要求極高之外,對數據傳輸速度同樣也有超高的要求,目前的光電模塊數據吞吐量多為400Gbps、800Gbps,而AMD聯合開發的這套光電模塊集成度更高,同樣的空間內可以做到3.2Tbps,4倍於之前的網速。 不僅網速更高,而且這套系統成本、功耗更低,Ranovus稱現有400Gbps模塊價格大約是800美元,每gbps約合2美元,他們的模塊成本可以做到1/10。 功耗方面,該模塊只需要消耗大約4W,而它替換的模塊功耗通常在14-17W之間。 AMD及Ranovus將在3月8日到10日的OFC 2022大會上展示這套光電系統。 來源:快科技

美光宣布送樣176層NAND快閃記憶體的數據中心SSD,將於4月發售

大約半年前美光宣布推出兩款採用業界首款176層3D TLC NAND快閃記憶體晶片的新款SSD,分別是2450系列和3400系列,均支持PCI-E 4.0,分別面向主流PC市場和高性能應用的消費級市場,其中美光3400現在經常在高性能筆記本電腦上看到了。隨著對於176層NAND快閃記憶體技術的愈加熟練,他們已經打算將其推廣到數據中心業務了。 今天(2022年3月4日)在上海,美光宣布送樣全球首款基於176層垂直集成NAND技術的數據中心固態硬碟(SSD)——美光7450 NVMe SSD。據稱美光7450 SSD可實現2毫秒或更低的服務質量(QoS)延遲,提供豐富的存儲容量和外形規格,以滿足數據中心工作負載的嚴苛要求。 據了解這款全新數據中心SSD採用了美光NAND技術來實現具備超高效率的設計,包括176層存儲單元以及CMOS陣列下(CMOS-under-the-array)技術。7450 SSD集成了美光自有DRAM、內部開發的SoC系統級晶片和相關固件,並支持更強的設備安全功能。 美光7450 SSD提供從400GB到15.36TB的容量范圍,其中包括一款領先業界的8TB緊湊型E1.S規格。此外,該款數據中心SSD還提供廣泛的外形規格選項,包括U.3、M.2和E1.S三種規格可滿足不同的空間、功耗和散熱需求。其中業界唯一的U.3規格PCIe 4.0 SSD提供15mm和7mm兩種厚度,可供需要2.5英NVMe硬碟的平台靈活選用。 大幅降低延遲是美光7450 SSD的最大亮點,據稱美光7450 SSD在普通、混合、隨機工作負載下,將通過2毫秒或更低的延遲,實現高達99.9999%的QoS,從而提升多種資料庫的性能。 據悉,美光7450 SSD將於4月開始通過代理商向客戶發售。 ...

全球首發 Marvell推出80萬兆網絡方案

Marvell(美滿電子)今天宣布了全球第一個800Gbps(80萬兆)或者8×100Gbps的多模平台網絡解決方案,面向數據中心基礎架構,可實現短距離光模塊、有源光纖(AOC)的超快傳輸。 新平台只要有三大部分,一是Marvell Spica PAM4 DSP,業界首個支持800G光模塊,QSFP-DD800和OSFP形態,擁有高性能、低功耗的特點,並針對光傳輸、單模/多模進行了優化。 二是Marvell IN5614DV,低功耗的56GBaud VCSEL近線多模驅動器。 三是Marvell IN5669TA,低功耗的56GBaud VCSEL TIA,寬動態范圍可滿足不同性能、連結的需求。 Marvell表示,新方案已經送樣給主要客戶。 去年6月,Marvell曾發布「Alaska 88X93160」,相當於160萬兆,5nm製造工藝,可以在乙太網骨幹網上實現1.6Tbps的超高速傳輸,也就是每秒200GB,五部藍光電影一秒鍾就可以搞定。 來源:快科技

Ampere已做好推出首批數據中心定製晶片的准備

作為一家充滿雄心壯志的伺服器初創企業,Ampere 一直希望將基於 ARM 架構的晶片引入數據中心和邊緣計算領域,並且與 Intel / AMD 的競品一較高下。此前,該公司已展示過能夠與 Intel 和 AMD 競品一較高下,且採用了標準的 ARM Neoverse N1 架構的 80 核 Altra / 128 核 Altra Max...

Armv9架構首秀:ARM Neoverse N2平台發布 性能暴漲40%

3月底,Arm正式發布了,號稱十年來最重要的創新,在兼容現有Armv8的基礎上,重點強化了安全性、矢量計算、機器學習、數位訊號處理,同時繼續加強性能,IPC提升幅度高達30%。 今天,Arm又發布了第一個基於Armv9指令集架構的平台「Arm Neoverse N2」,在安全性、能耗、性能等方面都有全面的提升,可為新一代基礎設施核心鋪平道路。 Neoverse N系列平台最為注重性能的擴展性、平衡性,特別針對單位功耗、單位面積的性能,以及單位功耗、面積的核心數。 相比主要搭檔7nm工藝的上代平台N1,新一代N2最佳搭檔是5nm,兩相對比在保持相同水平的功率、面積效率的基礎上,N2的IPC同頻性能(約等於單線程性能)可提升達40%,而頻率也可以提高10%。 N2平台可以橫跨從高吞吐量計算到功率與尺寸受限的邊緣、5G應用場景,且性能提升明顯,例如在雲端上提升1.3倍的NGINX,在5G和邊緣應用上提升1.2倍的DPDK數據包處理,以及提升1.4倍的SPECint2006。 N2平台內部集成了Armv9.0-A CPU核心、指令集單元、64KB一級指令緩存、64KB一級數據緩存、512KB/1MB ECC二級緩存、異步橋接(Async Bridges)、AMBA 5 CHI直接連接、CoreSight等模塊,微架構全方位改進,重點增強基準測試、實際伺服器工作負載。、 而在外部系統連接中,它可以支持DDR5記憶體、PCIe 5.0總線、HBM3高帶寬記憶體,等等。 N2還是第一個具備SVE2功能的平台,可為雲到邊緣的性能效率帶來巨大的提升,比如機器學習、數位訊號處理、多媒體、5G等場景中,還具備編程簡易性、可移植性等優勢。 SMT同步多線程是如今處理器架構設計的一個核心要素,不過另一方面,在雲端等共享環境中,專屬內核可以提供更具可預測性、確定性的性能,而且更有利於抵禦常見的側信道攻擊,這也是N2的理念。 同時,它維持了相同的功耗、面積效率,加入了性能定義功耗管理(PDP)。 N2平台起步就是32核心32線程,最多可以做到128核心128線程,對比N1平台翻了一番,同時比傳統架構的64核心128線程更具競爭力。 生態方面,Marvell美滿電子已經發布了基於Neoverse N2平台的OCTEON系列網絡解決方案,預計2021年底前試產,相比上代性能提升高達3倍。 阿里雲在即將上線的Arm架構ECS實例上已經完成測試,SPECjbb測試數據表現驚艷,而且基於Arm架構運行的DragonWell JDK性能提高了 50%。 騰訊也在硬體測試和軟體支持方面持續投入,雲應用上已經可以採用Arm Neoverse技術。 來源:快科技
Intel 10nm至強隆重登場 46%飆升、40核心25倍性能碾壓64核心

Intel 10nm至強隆重登場 46%飆升、40核心25倍性能碾壓64核心

說到處理器,對於大眾用戶而言,關注最多的自然是距離最近的桌面、筆記本消費級產品,而作為廠商最新技術的最強代表,服務器、數據中心才是真正的殺場。 ,擁有7nm工藝、Zen3架構、64核心128線程等傲人規格。近幾年,AMD在數據中心領域也是不斷取得突破,市場份額已經從當初的0.7%,來到了7%之上。 但在這個龐大的市場上,Intel依然是王者一般的存在。雖然單看產品性能參數可能有些不敵,但無論是多達13倍的市場份額領先,還是全面豐富的技術特性,抑或更廣闊的生態應用系統,都不是一個數量級。 事實上,這麼多年來,Intel至強幾乎已經等於服務器、數據中心的代名詞,2013年至今累計雲端部署超過10億個核心,雲服務商超過800家,發展了三代的可擴展至強累計出貨也已超過5000萬顆。 現在,Intel終於帶來了第三代至強可擴展平台Ice Lake-SP,再次將自己的優勢展現得淋漓盡致,尤其是豐富的產品矩陣。 本次中國區發布會選在了首鋼園三高爐,頗有賽博朋克氣息,也是冬奧會場地,往昔與未來在這里交織 Intel副總裁兼中國區總經理王銳發表主題演講 新至強擁有全新的10nm製造工藝、最多40核心80線程、全新Sunny Cove CPU架構、20% IPC性能提升、46%平均性能提升、74% AI推理性能提升,堪稱Intel至強近年來最大的一次飛躍。 但是,新至強不是單打獨鬥,周邊圍繞着Intel GPU、XPU、FPGA、記憶體、存儲、連接、安全等等各條產品線和技術,從而構成一個軟硬結合的完整解決方案。 此前已經陸續發布的傲騰持久記憶體Pm200系列、傲騰SSD P5800X、閃存SSD D5-P5316/D7-P5510、20萬兆以太網卡E810、Agilex FPGA等等,這些都是新至強的得力助手,互相結合大大拓展了整體平台的實力。 按照Intel的說法:「我們沒有把至強稱作一個服務器產品,它是一個數據中心產品。「 需要指出的是,去年6月19日發布的Cooper Lake,也是屬於第三代至強可擴展家族,區別在於Cooper Lake只用於四路、八路市場,而新的Ice Lake-SP則是針對單路、雙路市場。 說起來,Ice Lake-SP可謂命運多舛,發布時間一再延遲,主要是和新上的10nm工藝有關,而且引入了全新架構(Cooper Lake還是14nm和老架構),導致同一家族的兩個系列產品間隔了將近10個月。 當然了,對於數據中心平台而言,正式發布並不是開始,事實上在發布之前,Ice Lake-SP已經出貨了20多萬顆,擁有了極為豐盛的產品、方案。 王銳也表示:「至強處理器的出貨有保證,特別是數據中心。我們在全力提升產能,實際的提升比計劃更高。」 另外在新的CEO帕特·基因格上任後,Intel已經在大刀闊斧地變革自己,包括加速推進新架構新工藝新產品,強化製造和產能,開放代工和外包。 接下來,我們就從架構技術、性能、生態三個方面,深入了解一下Ice Lake-SP。 Intel市場營銷集團副總裁兼中國區數據中心銷售總經理陳葆立展示Ice Lake-SP 一、架構技術:全面翻新、延遲優秀 Intel提出,新至強最值得關注的變化,主要有三個方面,一是目前唯一內建AI加速的x86數據中心處理器,二是高級先進的安全解決方案,三是可擴展性、靈活性、可定製性。 接下來的解讀中,我們也會逐一涉及這三個方面。 架構方面,新至強引入了Sunny Cove,也就是輕薄筆記本上Ice Lake-U 10代低功耗酷睿平台的同款(事實上二者處理器代號都是相通的),都是首次結緣10nm,當然這次針對數據中心應用做了調整優化。 至於為何二者發時間錯開了一年半,筆記本端去年都已經進化到第二代10nm Tiger Lake,架構也已升級為Willow Cove,你應該懂的。 簡單來說,Sunny...
AMD正式發布第三代EPYC Zen3沖上64核心、輕松領先117%

AMD正式發布第三代EPYC Zen3沖上64核心、輕松領先117%

桌面、筆記本消費級市場之後,AMD全新的Zen3架構今天終於正式進入數據中心、服務器領域,這就是——第三代EPYC(霄龍)7003系列,代號「Milan「(米蘭)。 經過第一代AMD EPYC 7001系列(Naples)、第二代 AMD EPYC 7002系列(Rome)兩代產品三年多的耕耘,AMD在服務器市場已經取得不小的突破。 權威市調機構Mercury Research數據顯示,2020年第四季度,AMD EPYC的市場份額已經達到了7.1%,同比增加2.6個百分點。 第三代EPYC 7003系列採用和銳龍5000系列同款的Zen3架構,IPC(每時鍾周期指令數)對比Zen2提升19%,而在特定企業級負載、雲端負載、HPC高性能計算負載中,更是都可以帶來最多大約2倍的性能提升。 Zen3架構的設計細節,這里不再贅述, 不過針對數據中心市場,Zen3架構還有一些特定的變化,比如說ISA指令集,就新增了多達7條。 加速、加密、解密算法部分擴展了AVX2指令,可以支持到256位。 安全部分是改進最大的,比如SEV(安全加密虛擬化)可以限制中斷的注入,防止惡意管理程序注入SEV-ES訪客中斷/異常類型; 比如SNP(安全嵌套分頁),在現有SEV-ES對虛機記憶體、寄存器加密保護的基礎上,增加系統完整性保護,防止惡意管理程序通過重放、損壞、重新映射做攻擊; 比如CET Shadow Stack(影子堆棧),可以防止ROP編程攻擊。 EPYC 7001系列上市的時候,正好碰上幽靈、熔斷安全漏洞爆發,AMD產品雖然受影響較小,但AMD仍然以為當時的解決方案相對比較倉促,不夠完美。 在最新的EPYC 7003系列上,AMD已經在架構上最好了強防禦,同時對性能的影響也降到了最低。 這是EPYC 7003系列的內核布局圖、特性亮點。 EPYC 7003系列除了升級架構,基本延續了上一代的整體設計和布局,還是內部集成最多八個CPU Die、一個IO Die,仍然最多64核心128線程、256MB三級緩存,但是在細節特性上仍有很多變化。 記憶體方面,還是支持DDR4-3200,單路最大容量4TB,但是在四通道、八通道之外,新增加了六通道模式,稍後細說。 IO方面,每顆處理器還是128條PCIe 4.0通道,但是在雙路系統中,對外除了128條通道之外,還增加了162條可選,也就是將雙路彼此互連的通道數降為94條,依然不影響性能。 這些對外的PCIe通道可以靈活配置,用於PCIe、SATA、一致性互連等,最多支持32個SATA/NVMe存儲設備。 三級緩存的變化是Zen3架構的一大突出亮點。Zen2、Zen3上每一個CPU Die都是32MB三級緩存,但是前者是分離的兩部分,各自16MB,都只能由一半4個核心共享。 Zen3上則是32MB一體化,八個核心都可以訪問全部容量,等於每個核心可用的三級緩存容量直接翻了一番,有利於加速核心、緩存之間的通信,有效降低記憶體延遲。 三級緩存容量更大了之後,配置也更加靈活。Zen2架構上,每四個核心共享的16MB三級緩存,可以配置8MB存放所有核心共享的數據,另外8MB存放每個核心自己的數據。 Zen3上所有核心共享數據還是8MB的話,每個核心可以私用的容量最大就是24MB,可以輕松緩存更多數據和指令,進而提高命中率、提高性能。 記憶體方面,剛才也提到了,這次支持三種通道模式,其中八通道是最完整的,可以對稱插入8條或16條記憶體。 六通道、四通道的話,自然分別是6條、12條或者4條、8條,不過注意對插槽安裝順序有一定要求,而且這時候是處於交叉存取(interleaving)的交織狀態,也就是奇數地址、偶數地址分開,不影響連續字節刷新,便於加快記憶體訪問速度。 四通道模式是針對成本優化,適合記憶體需求不高的客戶。六通道則提供了更靈活的選擇,兼顧成本、性能,適合四通道不夠用、八通道太浪費的場景。 接下來說說具體型號。EPYC 7003系列共有包括19款不同型號,包括15款雙路型、4款單路型,按照核心數量劃分有八種,包括8/16/24/28/32/48/56/64核心。 旗艦型號是EPYC 7763,64核心128線程,頻率2.45-3.50GHz,熱設計功耗280W。 另一款64核心是EPYC 7713(EPYC 7713P),頻率2.0-3.675GHz,熱設計功耗225W。 頻率最高的是EPYC 72F3,也是唯一的8核心,基準就有3.7GHz,最高加速可達4.1GHz,熱設計功耗180W。 EPYC...

法國數據中心火災,把《Rust》玩家的存檔燒沒了

火了,但不是我們期望的方式。 當地時間3月10日凌晨,位於法國斯特拉斯堡的OVH數據中心突發火災。OVH是歐洲最大的雲服務與託管伺服器供應商,在此地共有四座數據中心,據OVH的官方網站發布的聲明,火情始於第二座數據中心,即SBG2,不久便迅速蔓延至SBG1與SBG3。 SBG2與SBG3消失在了官網的伺服器列表中 在上百名當地消防員的努力下,火勢於早上得到了控制。火災完全摧毀了SBG2的所有伺服器兼數據,而SBG1的伺服器損毀了三分之一,剩下兩座數據中心安然無恙,但需要等到下周才能恢復正常運作。 包括公司員工與消防員在內,沒有任何人受傷。火災原因尚不明確,目前仍在調查中。 OVH的總裁Octave Klaba收到火災的消息後,立即實時跟蹤並在推特上報導事件進展。他的第一條推文就在呼籲客戶趕緊進行災難恢復,對數據資料予以及時的備份。 據路透社報導,斯特拉斯堡數據中心起火後,癱瘓的法國政府、企業與公共事業網站需以數百萬計。一些遊戲開發商選擇了OVH存貯玩家及伺服器的數據,他們的歐洲業務也受到了或多或少的影響。 《機甲戰士Online》便是其中之一,火災發生時所有的歐洲伺服器全面宕機。一天後,《機甲戰士Online》官推發表推文稱,他們確保了所有歐洲伺服器數據的安全,並且正在著手建立新的伺服器。 提供西洋棋對戰伺服器的Lichess網站也一度無法訪問。事後Lichess官推表示:「少數位於數據中心的伺服器被燒毀……多虧了我們熱心的系統管理員與他的伺服器備份,我們唯一失去的只有24小時的象棋謎題歷史記錄。」 《歐洲卡車模擬》的歐洲伺服器,因火災降低了伺服器流量,現在已經恢復正常。 與這幾個幸運兒不同,沙盒模式生存遊戲《Rust》遭受了相對嚴重的損失。《Rust》的官方推特透露,位於OVH數據中心的25台歐洲伺服器在火災爆發後陷入離線狀態,當SBG-2數據中心確認完全燒毀時,他們便預計將會有大量的數據遺失。 事態比他們想的還要糟一些,他們的下一條推文,便是證實這25台伺服器在火災中完全損毀,且里面的數據「無法被修復」。目前官方恢復了21台伺服器,但所有的玩家存檔已經重置。 在大批遊戲與網站因為及時備份數據而最小化損失的背景下,《Rust》明顯缺乏應對措施。考慮到這部2018年的遊戲在今年年初迎來了第二春,在線人數與伺服器數量大幅上漲,想要維護如此體量的數據想必會有一定的困難。 不過,為了防止伺服器過載崩潰、添加新的遊戲內容,《Rust》此前便有每個月刪除一次伺服器存檔的設定,在每個月的第一個周四(周五),不論官服還是私服,所有伺服器都會強制刪除所有玩家的角色、物品與建築等數據。 Rust服主可以縮短刪檔周期 也就是說,這場火災摧毀的遊戲存檔,最長的遊戲時間不會超過一周,《Rust》玩家都知道自己的存檔遲早要刪除,按理說不必擔心這次火災會打擊歐洲玩家的積極性。 只是對於開發商Facepunch工作室來說,25台伺服器的損失倒是實打實的。大火熄滅數小時後,工作室的負責人Garry Newman(就是《蓋瑞模組》的那個Garry)在推特上傳了一張形象的表情包,表達自己的悲傷。 來源:遊研社

OVH數據中心火災導致《Rust》歐洲服務器全損

早些時候,法國斯特拉斯堡 OVH 數據中心的 SBG2 號設施內發生了嚴重的火災,導致歐洲地區的許多服務器都受到了影響。與此同時,《腐蝕》(Rust)遊戲開發商 Facepunch 也發出了一則嚴厲的警告,聲稱大量玩家的數據已經丟失且無法恢復。 《Rust》是一款首發於 2013 年,且最近在 Steam 上再次大放異彩的第一人稱生存網絡遊戲。但現在,Facepunch 的 25 個歐洲服務器都已處於離線狀態。 火災發生前 據悉,斯特拉斯堡 OVH 數據中心發生的本次事故,已經摧毀了當地設施的一棟建築物,並且讓至少另一棟建築物遭受了連帶損失。 滅火後繼續灑水降溫 慶幸的是所有工作人員都已順利撤離,目前暫無人員傷亡報告。Rust 運維團隊表示,預計受影響的服務器將丟失大量數據,後續他們將盡可能分享更多細節。 在看到微軟網絡安全分析師 Kevin Beaumont 分享的火災前後對比鏡頭之後,OVH 創始人兼董事長 Octave Klaba...
法國斯特拉斯堡OVH數據中心遭遇火災 諸多客戶遭遇嚴重打擊

法國斯特拉斯堡OVH數據中心遭遇火災 諸多客戶遭遇嚴重打擊

Bleeping Computer 報道稱,一次史無前例的重大事故,導致位於法國斯特拉斯堡的 OVH 數據中心被大獲燒毀。作為歐洲最大、世界第三的託管服務提供商,這家雲計算企業有為客戶提供 VPS、專用服務器、以及其它 Web 服務。由狀態頁面可知,本次事故已導致多個數據中心離線,且對全球網站也造成了沖擊。 截圖(來自:OVH 狀態頁面) Bleeping Computer 指出,大火摧毀了 OVH 斯特拉斯堡 SBG2 數據中心,但 SBG1、SBG3 和 SBG4 也都被迫關閉,以免受到火災的附帶影響。該公司在聲明中稱: 我司位於斯特拉斯堡的數據中心遭遇了重大事故,SBG2 號建築物中發生了火災。盡管消防人員立即抵達了現場,但遺憾未能控制這里的火勢。 目前整個站點都已被隔離,因而對 SBG1、SBG3 和 SBG4...
《Rust》歐洲數據中心突發大火受影響數據全部丟失

《Rust》歐洲數據中心突發大火受影響數據全部丟失

<p由Facepunch Studios打造的開放世界多人生存冒險遊戲《腐蝕(Rust)》近來火爆,然而遊戲的歐服的部分服務器昨日莫名關閉,官方表示技術人員正在調查該問題。 <p今日官推發布公告表示,由於今日凌晨OVH數據中心發生火災,25台歐盟服務器仍處於離線狀態。非常不幸的是,大火燒毀了SBG-2建築物,受影響的服務器數據全部丟失,且無法復原。目前官方正在更換受影響的服務器。經過官方人員搶修,部分歐服已經恢復連接,所有遊戲進度都已重製。 <p《腐蝕》是由《蓋瑞模組》的開發商Facepunch Studios打造的一款開放世界多人在線生存沙盒遊戲,在遊戲中的唯一目標就是生存。要做到這一點,你需要克服諸如與飢餓,乾渴和寒冷之類的鬥爭。生火。建造庇護所。殺死動物取肉。保護自己免受其他玩家的襲擊,並且幹掉他們取肉。與其他玩家建立聯盟,組建城鎮。盡一切可能生存下來。 來源:遊俠網

《Rust》歐洲數據中心突發火災 大量玩家數據丟失

據Eurogamer報道,《Rust》開發商Facepunch在推特上發布了一則嚴峻的警告:一場大火襲擊了本作在歐歐洲的服務器,該事故造成了服務器的損壞,並導致大量玩家的數據丟失。 據悉,這場位於斯特拉斯堡的OVH數據中心大火之後,這部熱門遊戲的服務器現在已經因大火受損離線,但目前沒有人員傷亡的報告。 該數據中心的老闆Octave Klaba表示:「盡管消防人員立刻趕到了現場,但仍然無法控制該數據中心的火勢。目前,整個數據中心已被封閉,但所有服務器都關閉了服務。」 此外,Octave在推特中表示將在接下來的1-2周進行對服務器的緊急修復,完全恢復時間待定。 《Rust》是採用Unity 3D引擎製作的一款喪屍類生存網絡遊戲,遊戲是採取PVP(player vs player)方式,玩家看見其他玩家的時候,可以選擇結伴、無視、或是直接殺了對方,搶奪其身上的任何資源。遊戲除了注重戰鬥部分外,還擁有非常豐富的生存要素。玩家在遊戲中除了要防範動物、殭屍、玩家的襲擊,並依靠各類物品進行生存。 本作現已登陸PC平台,將於2021年年內登陸Xbox One、PS4平台。 來源:遊民星空
微軟智能雲在華新增數據中心區域 雲服務翻倍擴容

微軟智能雲在華新增數據中心區域 雲服務翻倍擴容

微軟宣布繼續加大對中國市場雲服務的投入,通過與世紀互聯合作,新增微軟智能雲在華數據中心區域,並計劃於 2022 年春季將其正式投入商業運營,實現微軟智能雲矩陣 Microsoft Azure、Microsoft Office 365、Microsoft Dynamics 365 及 Microsoft Power Platform 服務能力的翻倍擴容,以便更好滿足中國市場及海內外客戶對國際公有雲的多樣化需求。 微軟通過與本土運營商世紀互聯的合作,將微軟智能雲服務引入中國市場,並開創了全球公有雲服務合法合規在華商業運營的成功典範。2014 年 3 月,由世紀互聯運營的 Microsoft Azure 在中國華北、華東兩個數據中心區域率先開啟商業運營,2014 年 5 月,由世紀互聯運營的 Microsoft Office 365 正式商業運營,2019 年...
AMD四代霄龍曝光 5nm Zen4架構、96核心、12通道DDR5

AMD四代霄龍曝光 5nm Zen4架構、96核心、12通道DDR5

AMD將在這個月正式發布代號「Milan「(米蘭)的第三代霄龍7003系列數據中心處理器,基於7nm工藝、Zen3架構,最多還是64核心128線程,支持八通道DDR4-3200記憶體、128條PCIe 4.0通道。 再往後,自然就將是5nm工藝、Zen4架構,代號為「Genoa」(熱那亞),產品序列應該是第四代霄龍7004系列。 只是發布時間可能要耐心等等,預計最快也得2021下半年,甚至到2022年初。 現在,推特博主@ExecutableFix 首次曝光了四代的核心規格: 1、核心數量最多96個,線程數量最多196個,比現在增加整整一半。 內部仍是chiplet小芯片結構,每顆8核心,總計12顆,另外繼續一顆IO芯片。 2、記憶體支持新一代DDR5,最高頻率達5200MHz,通道數也增加一半的達到12個。 每通道2條記憶體,那麼單路最多就是24條,使用128GB記憶體條的話,單路就是最多3TB記憶體。 3、輸入輸出支持新一代PCIe 5.0,單路還是最多128條通道,但是雙路對外可提供160條。 這意味着,雙路之間內部通信所需通道數從128條減少到96條,畢竟帶寬翻番了。 4、熱設計功耗最高達到320W,比現在增加40W,同時支持最高上調到400W(cTDP)。 5、接口首次更換為新的SP5 LGA6096,比現在的SP3 LGA4094增加多達2002個觸點。 畢竟要支持DDR5、PCIe 5.0,但有趣的是SP4的名字被跳過去了。 二三代霄龍、四代霄龍(模擬圖)內部結構對比 競品方面,,規格同樣是飛躍的,但是相比於四代霄龍各方面都遜色不少。 10nm Enhanced SuperFin製造工藝,Golden Cove CPU架構,MCM多芯封裝,最多4顆小芯片、60核心120線程(至少初期隱藏4個核心),集成最多64GB HBM2e高帶寬記憶體,支持最多8通道DDR5-4800、80條PCIe 5.0,熱設計功耗最高400W,接口換成新的LGA4677-X。作者:上方文Q來源:快科技
三星最牛SSD量產 換掉機械硬盤 省電14.84億度

三星最牛SSD量產 換掉機械硬盤 省電14.84億度

三星電子宣布,已經開始量產該公司迄今為止最為先進的數據中心SSD,型號為「PM9A3」。 三星PM9A3 SSD完全符合開放計算項目(OCP)的NVMe Cloud SSD規范,搭配創新的EDSFF E.1S接口形態,可滿足各種企業級負載的需求。 它採用三星的第六代V-NAND閃存,100多層堆疊(具體數字未公開),相比於第五代V-NAND閃存的PM983a M.2,持續讀寫性能翻番達到3GB/,隨機讀寫性能則分別提升40%、150%,達到了750K IOPS、160K IOPS。 看性能似乎很一邊,但是這款PM9A3的最牛之處在於超高的能效——每瓦特性能的順序寫入性能可達283MB/,相比於上代每瓦特188MB/提升了幾乎50%。 這意味着什麼?三星打了個比方:如果將2020年發布的所有服務器機械硬盤都換成PM9A3 4TB,就可以節省1484GWh的能耗,也就是14.84億度電,足夠一個大城市的所有家庭在夏天使用一個月。 它還提供了9個檔次的不同功耗指標,結合不同接口形態,可滿足不同應用環境的需求,包括8.25W功耗的M.2形態,35W功耗的EDSFF形態,等等。 技術方面,除了用戶數據加密與驗證等標準安全特性,它還支持安全啟動、回滾保護,後者能避免硬盤回滾或者降級到有缺陷的固件版本。  作者:上方文Q來源:快科技

大陸節點|數據中心的T3/T3+代表著什麼?

作者:小陸 編輯:Cecilia 等級認證,是一種信用保證形式。每個行業都有專業的認證機構進行認證,數據中心行業也是如此,數據中心等級是評判數據中心高低最重要的指標。 那麼,目前國內對於數據中心的認證有哪些標準?市場上經常提到的T3和T3+又是怎樣的標準呢?聽小陸為您一一解答。 什麼是T3? T3是IDC數據中心機房的第三個等級,IDC數據中心機房的等級是Uptime Institute創建的行業評判標準,用於評估數據中心基礎設施的建設方法。數據中心機房包括機房設施、網絡通信、存儲設備、機房電源電力、冷卻系統、備份資源等設施,等級越高的數據中心各項性能越高,數據中心分為4個等級,分別是Tier1,Tier2,Tier3和Tier4。數據中心級別依次為T4>T3>T2>T1。 T3數據中心包括所有T1級和T2級功能,不需要關閉設備更換和維護,可同時維護數據中心機房:多路可用,只有一個路徑處於運行狀態,具有冗餘設施,並且可同時維護(可提供99.98%的可用性,每年停機時間最多為1.6小時) 有沒有T3+的標準? 那數據中心的T3+指什麼呢?現在市場上大部分數據中心介紹的時候號稱自己是T3+標準(Tier3+),那麼T3+標準到底有沒有,答案是沒有。為什麼數據中心運營商說自己的機房建設標準是T3+呢?,他們所說的T3+標準就是高於T3低於T4,所以自封為T3+,雖然沒有T3+標準,但市場上大多數人都這麼認為,默認為比T3好,接近於T4。 比較大的公司會選擇T3數據中心,因為T3的在線率是99.982%,一年不到1.6小時的宕機時間。宕機率低是因為T3有更全面的備份資源和設備,備用電源多,降溫方法多,如果在用的電源或者降溫設備出現的錯誤,可以自動開啟備用資源。在T3數據中心,所有的計算機設備都有備用資源。有不宕機維修和處理問題的具體處理流程。 數據中心存儲和計算著我們重要的數據資源,因IPFS技術逐步走入普通大眾視野,新基建政策中將大數據中心也納入重要的建設範疇,未來,數據中心發展將進入快車道! 來源:kknews大陸節點|數據中心的T3/T3+代表著什麼?
NVIDIA A100頂級計算卡陷入缺貨 要持續幾個月

NVIDIA A100頂級計算卡陷入缺貨 要持續幾個月

缺貨風暴今年席捲了幾乎所有顯卡,AMD、NVIDIA這一代和上一代產品幾乎無一倖免。現在,數據中心也淪陷了。 NVIDIA加速計算業務部門副總裁Ian Buck承認,基於安培架構的頂級計算平台A100 GPU也嚴重供應不足,無法滿足高性能計算客戶的需求,而且預計要幾個月才能達到供需平衡。 事實上,眼下無論是NVIDIA還是AMD,都將產能優先分配給高價格、高利潤的數據中心計算GPU,但即便如此都要缺貨這麼久,消費級遊戲卡更是可想而知…… NVIDIA A100加速卡是今年3月發布的,首發安培架構,並應用台積電7nm工藝(RTX 30系列是三星8nm),集成542億晶體管,核心面積達826平方毫米,擁有6912個FP32 CUDA核心,搭配40GB HBM2顯存,帶寬1.6TB/,熱設計功耗400W。 就在日前,,而且從HBM2升級到了HBM2e,頻率從2.4GHz提高到3.2GB,帶寬首次來到恐怖的2TB/。 另外,,7680個流處理器,搭配32GB HBM2e,帶寬1.23TB/,支持PCIe 4.0、Infinity Fabric高速總線,功耗300W,FP64雙精度浮點性能首次突破10TFlops(也就是每秒1億億次),並在架構設計上專門加入了Matrix Core(矩陣核心)。 作者:上方文Q來源:快科技
NVIDIA、AMD大舉並購 Intel數據中心遭受雙面夾擊

NVIDIA、AMD大舉並購 Intel數據中心遭受雙面夾擊

多年以來,芯片巨頭Intel在服務器CPU領域一直占據絕對優勢,即使AMD在服務器、數據中心等高性能計算進行針對性的加強和優化設計,推出了服務器CPU產品EPYC,但Intel仍然占據大約94%的數據中心市場份額,堪稱「數據中心之王」。 如今,情況發生了變化。除了AMD在服務器CPU市場上卷土重來,以GPU聞名的芯片公司NVIDIA也於今年9月宣布以高達400億美元的價格收購Arm。 盡管Intel和AMD基於x86指令集開發的芯片是PC和服務器市場主流,但基於Arm架構的芯片也正在從移動設備市場向數據中心拓展,如今已有多家公司試圖將Arm芯片引入數據中心,不過取得的成績還十分有限。 NVIDIA憑借其GPU,有着龐大的數據中心客戶群,最終可以幫助Arm擴大其在數據中心領域的業務和客戶。NVIDIA最新一個季度財報顯示,該公司的數據中心部門收入為17.5億美元。 AMD與賽靈思的交易是更大的威脅 如果說AMD的服務器CPU和NVIDIA即將將Arm引入其數據中心業務還不足以對Intel造成威脅,那麼還有更大的威脅在等待着Intel。 本周二,AMD同意以350億美元通過全股票交易的方式收購賽靈思,賽靈思擁有可針對特定任務加速的可編程處理器(FPGA),早期與Altera分食FPGA市場,後者於2015年被Intel收購。 AMD已經在銷售面向數據中心的CPU和GPU,隨着賽靈思的加入,該產品組合將擴展到包括FPGA和其他專用芯片。 需要注意的是,Intel也正在准備使用其最新的Xe架構獨立顯卡擴展其數據中心業務。 無論是AMD與賽靈思的交易,還是NVIDIA與Arm的交易,兩家公司都將提供同Intel競爭的各種數據中心產品。AMD預計將在2021年底之前完成與賽靈思的交易,NVIDIA預計將在18個月內完成對Arm的收購。 疫情當下,Intel數據中心產品的價格劣勢 另一方面,即使沒有其他公司帶來的競爭壓力,受新冠疫情的影響,Intel的數據中心業務已經出現了一些問題。 在該公司公布的2020年第三季度財報中,其數據中心部門的收入下降了7%,面向企業和政府客戶的銷售額下降了47%,面向雲客戶的銷售額僅上漲15%。 由於Intel的數據中心客戶正面臨着前所未有的經濟不確定性,一些客戶減少支出也不足為奇。在嚴峻的經濟環境中,一些原先Intel的客戶可能會尋求成本更低的替代方案。 幾年前,對於數據中心而言,還沒有比Intel更好的替代品可供選擇,但在今天AMD卻是一個不錯的選擇。如果NVIDIA可以將Arm芯片銷售給其客戶,那麼未來NVIDIA也會成為另一個可靠選擇。 以往,在幾乎沒有數據中心競爭的市場上,Intel的表現十分出色,但這一市場即將不復存在,AMD已經開始蠶食Intel服務器CPU的市場份額,與賽靈思的交易將使該公司的競爭力更強。NVIDIA也將基於Arm的芯片與其競爭。 盡管Intel在數據中心的主導地位不會瞬間消失,但隨着競爭的加劇,可能會損失不少市場份額。 - THE END - #AMD#Intel#NVIDIA#數據中心 原文鏈接:雷鋒網 責任編輯:上方文Q來源:快科技
取代IntelNVIDIA數據中心專用處理器揭秘 一顆DPU頂替125顆x86 CPU

取代IntelNVIDIA數據中心專用處理器揭秘 一顆DPU頂替125顆x86 CPU

當地時間周一,NVIDIA(NVIDIA)在線上召開了GTC 2020大會,NVIDIACEO黃仁勛再一次在自家的廚房發布了多款新的硬件產品,其中就包括全新的可軟件定義的數據中心專用處理器DPU(Data Processing Unit)及其生態產品路線圖,並且宣布將在服務器市場力推ARM架構,以期在利潤最豐厚的服務器處理器市場取得更大市場份額。 過去多年來,GPU芯片一直是NVIDIA的主打產品,並且被大量應用在圖形處理等領域。但近年來,它們也被大量應用於人工智能訓練領域,幫助提高人工智能對於圖像識別等任務的速度。這些芯片通常安裝在Intel中央處理器旁邊,幫助加速人工智能相關工作的計算。而現在,NVIDIA計劃通過全新的可軟件定義的數據中心專用處理器DPU來取代Intel的CPU。 黃仁勛表示:「數據中心已成為新型計算單元。在現代化、安全的加速數據中心中,DPU已成為其重要的組成部分。CPU、GPU和DPU的結合,可構成完全可編程的單一AI計算單元,提供前所未有的安全性和算力。「 根據計劃,NVIDIA將在2021年,推出兩款DPU芯片:BlueField-2和BlueField-2X。 其中,BlueField-2集成了8顆64位ARM-Cortex A72內核,擁有2個超長指令字(VLIW)加速引擎,集成NVIDIA Mellanox ConnectX-6 Dx NIC(智能網卡),可提供兩個100Gb/的網絡通道,並加速關鍵的數據中心安全性、網絡和存儲任務,其中包括隔離、信任根、密鑰管理、RDMA/RoCE、GPU Direct、彈性塊存儲、數據壓縮等。 據介紹,經過優化的BlueField-2 DPU可從CPU上卸載關鍵的網絡、存儲和安全任務,使企業能夠將其IT基礎設施轉變為最先進的數據中心。此類數據中心可實現加速、具有完全可編程性,並具有「零信任」安全功能,防止數據泄露和網絡攻擊。 在性能方面,NVIDIA稱,一顆BlueField-2 DPU可以提供相當於125顆x86 CPU處理器所能提供的數據中心服務。 值得一提的是,BlueField DPU脫胎於NVIDIA以69億美元收購的Mellanox公司時獲得的智能網絡芯片SmartNIC技術,Mellanox其與ARM公司(NVIDIA已經宣布以400億美元收購)的處理器IP結合,形成了BlueField IPU,兼顧了軟件定義解決方案的速度和靈活性,並且提高了安全性、加速了性能並改善了效率。第一代的BlueField IPU芯片已經在2019年正式發布。BlueField-2 DPU則是似乎在Mellanox於今年3月宣布的BlueField-2 IPU 基礎上進化而來。 而後續將推出的BlueField-2X DPU將具備BlueField-2 DPU的全部關鍵特性。同時,還將可應用於數據中心安全、網絡和存儲任務的NVIDIAAmpere GPU集成在一個系統中,可採用AI進行實時安全分析,包括識別提示竊取機密的異常流量、線速加密流量分析、惡意活動的主機自檢、以及動態的安全編排自動化響應(SOAR)。 NVIDIA企業計算負責人Manuvir Das表示,在BlueField-2X加入GPU就是為了人工智能應用的加速。 據介紹,BlueField-2 DPU目前可提供樣品,預計2021年將在領先服務器製造商的新系統中使用。BlueField-2X...
7nm安培勢頭太猛 發布2個月就貢獻1/4服務器營收

7nm安培勢頭太猛 發布2個月就貢獻1/4服務器營收

NVIDIA今天發布了2021財年Q2財報,營收38.7億美元,大漲50%,淨利潤13.7億美元,大會79%,,大漲167%,首次超過了GeForce遊戲卡業務。 NVIDIA上季度中數據中心業務大漲有多個原因,其中很重要一點就是7nm安培顯卡,今年5月份正式發布A100加速卡,到7月底不過2個月時間,它就貢獻了數據中心業務1/4的營收了。 按照17.5億美元的營收來算,1/4大概就是4.4億美元,差不多是30億人民幣,雖然我們不知道A100加速卡的具體售價,但是超過1萬美元太容易了,估計差不多賣出4萬塊了。 當然,考慮到DGX A100的存在,實際數量可能會更少一些,這麼一算2個月時間出貨至少是3-4萬塊A100加速卡的樣子。 與上代Tesla V100發布之後期貨了大半年的情況不同,7nm安培這一代直截了當,NVIDIA發布的時候就已經開始出貨了,畢竟GTC大會原本是3月份召開的。 對NVIDIA來說,A100加速卡現在還是產品發售的初期,增長勢頭才剛剛開始,2個月時間就已經這麼猛了,後續前途無量。 NVIDIA的A100核心是台積電7N工藝,核心面積826mm2,542億晶體管,集成108組SM單元,SXM4架構,6912個CUDA核心。 Tensor Core減少到了432個,但是性能大幅增強,支持全新的TF32運算,浮點性能156TFLOPS,同時INT8性能624TOPS,FP16性能312TFLOPS。 顯存方面,A100配備的也是HBM2顯存,頻率從1.75Gbps提升到了2.4Gbps,位寬5120bit,相比V100的4096bit增加了1024bit,容量也從16/32GB增加到了40GB。 作者:憲瑞來源:快科技
摩爾定律再迷思 Intel的繁榮還是困境?

摩爾定律再迷思 Intel的繁榮還是困境?

本文編譯自,在不更改原意的前提下內容略有調整,原作者Kevin Morris。 題記:如果摩爾定律的盡頭是一堵牆,第一個撞牆的人,就是跑在最前面的那個。 近日,Intel發布了其2020年第二季度的財報。我們很少研究「商業新聞「,但在這篇文章中,我們將會討論技術、觀點和資金之間的關系。 我們觀察到,Intel於7月23日宣布了其季度業績,在幾天之內,他們的股票從徘徊了幾個月的每股60美元左右跌至每股50美元左右,損失超過了15%。這對於一家市值約2000億美元的公司來說,並不是一筆小數目。 這種情況每天都在發生。大公司發布季報,市場就會做出反應,但Intel這次的情況卻顯然不同。 Intel本季度營收同比增長20%,超過了分析師的預期,並在「以數據為中心」的營收上實現了34%的大幅增長——這是該公司實現長期增長的關鍵市場機會。為什麼這樣一份聽起來不錯的報告,卻引發了其股價大幅下跌? Intel在本季度的財報中提到,其7nm的量產被推遲了6個月。財經新聞對此進行了報道,並做出了以下解釋:「芯片上的電路寬度以納米為單位,即十億分之一米。電路越小,處理器運行速度越快,效率越高。台積電為Intel的競爭對手AMD製造芯片,正在通過批量生產5nm芯片來贏得在更小工藝節點上的競爭。「 因此,關注此新聞的非技術人員或半技術人員得出的結論大致如下:「Intel現在採用10nm工藝,而台積電採用的是5nm工藝,相比之下,兩者之間就相差了兩代工藝節點。這也就意味着Intel在製造數據中心處理器方面落後了大約四年。」 當然,這是完全錯誤的。 Intel還暗示,在此期間,他們可能會讓一些產品組使用外部(非Intel)晶圓廠為他們生產芯片。這讓Intel正走向衰敗的想法變得更加根深蒂固。 有人可能(錯誤地)得出結論:Intel不僅在技術上落後了4年,而且他們還在舉旗投降——讓台積電或三星等競爭對手為其生產芯片。 當然,這也是錯誤的。 Intel自成立以來,就與摩爾定律密不可分,畢竟戈登·摩爾是這家公司的創始人之一,而且在半導體的整個現代發展史上,Intel在「將更多的元件塞入集成電路「中保持着明顯的領先地位。幾十年來,Intel作為一家科技公司,在領導芯片製造發展和超越摩爾定律方面做了無數工作。 Intel建立了一個PC處理器的帝國,後來接管並主導了數據中心處理領域。數據中心的主導地位很可能既代表着未來的機遇,也可能代表着Intel的挑戰。 Intel的至強處理器系統在數據中心擁有絕對領先的市場份額,因此增長空間很小,甚至沒有增長空間,所以需要市場自身的增長來抵消PC市場的長期下滑。他們需要繼續捍衛自己的統治地位,來對抗越來越多有能力的競爭對手。 就數據中心市場的增長而言,Intel前景看好。隨着雲服務、人工智能訓練和推理的加速,隨着數據驅動應用的爆炸式增長,數據中心擴張的驅動力是非常豐富、非常給力的。 如果Intel能夠保持其統治地位的市場份額,將迎來巨大的增長浪潮。即使他們的市場份額下滑了幾個點,但也會在全球數據中心的擴展和升級中迎接未來二十年的發展機遇,從而輕松獲得盈利。這種機會已經體現在了Intel的利潤中,即「以數據為中心」的業務同比增長了34%。 但是,要在目前的數據中心保持市場份額,所涉及的不僅僅是簡單地使至強處理器比最新的AMD芯片快幾個FLOPS。事實上,擁有一個稍微快一點的處理器,多幾個核心,或者稍微高一點的電源效率,已經從數據中心的核心技術問題變成了幾乎無關緊要的問題。 下一代數據中心將不會受到至強等傳統馮·諾依曼處理器的性能驅動。它將基於CPU、GPU、FPGA、AI加速器等各種類型專用芯片的異構架構,來處理更大規模也更為復雜的數據計算。 從歷史發展來看,Intel從三個維度建立了保障其數據中心領導地位的屏障。 第一個是在「市場營銷「方面的保障,這一點基本上可以歸結為「沒有人會因為購買Intel而被解僱。」如果你在運營一個數據中心,而你購買的系統當中有90%都是Intel的數據中心,那麼你的職業生涯就真的沒有任何大風險。 第二種防禦是x86指令集架構,幾十年來它一直是行業標準,也是大多數軟件編譯器的默認目標,這使得大多數舊軟件都可在x86的環境下持續兼容運行。離開x86范圍,比如ARM,你總會遇到一個大問題:你要確認是否所有的軟件都能正常工作。 第三點則是他們在芯片製造上的領導地位。Intel的芯片通常比競爭對手略勝一籌,僅僅是因為它們採用了更先進的半導體工藝製造。 但現在,Intel所建立起來的優勢屏障正在被逐漸瓦解。 獨立於指令集架構的計算的興起,以及數據中心對異構計算需求的巨大增加,減少了對x86軟件環境的依賴。 Intel自身也在通過oneAPI計劃擁抱異構架構,為x86防禦系統的消亡而做出打算,oneAPI允許軟件開發並可將其輕松地定位到各種混合計算架構中。 當涉及到指令集時,虛擬機和容器以及其他如今流行的主流技術的普及已基本拉平了競爭環境。而且,由於下一代數據中心的異構性質,跨越多個體系結構和指令集架構的工作負載的復雜重定向是基本要求。在新的數據中心中,x86不再像以前那樣代表「鎖定「,這種趨勢只會在未來繼續下去。 就製造和工藝技術優勢而言,摩爾定律已經走向了終結,任何一家依賴於率先生產一種新的、更密集的工藝的企業,都會逐漸發現這種優勢正在減弱。 事實上,在最近幾代工藝製程中,集成更多晶體管所帶來的回報是遞減的,工藝技術的巨大進步來自於FinFET晶體管等創新,以及其他和晶體管縮小的技術進步。 正如我們在之前的文章中所討論的,7nm、10nm、5nm等術語都是虛假的。從目前來看,越來越多的收益已經從提升製程轉向了更先進的技術,比如封裝,而在這一領域,Intel具備無可比擬的技術優勢,如嵌入式多晶片互連橋接技術(EMIB)以及Foveros 3D堆疊技術。 但是,在半導體技術的競爭中,Intel究竟處於什麼樣的地位?確切地解釋這個問題有點困難。 從功耗、性能、面積的角度來看,Intel 10nm節點與台積電7nm節點非常相似。如果Intel 7nm與台積電剛剛投產的5nm相似,那麼根據Intel最近宣布的7nm因良品率問題而推遲量產的消息來看,Intel比台積電落後了幾個月到一年。 當然,台積電在數據中心業務上並不是Intel的直接競爭對手,但他們為AMD生產芯片,後者是Intel在數據中心傳統的主要競爭對手。 Intel似乎是未雨綢繆,宣布他們可能依賴於其他晶圓廠——當然,這種外包製造對於Intel來說實際上不是新鮮事,因為台積電一直在生產Intel的FPGA等產品,比如Arria已經使用了好幾年。 這意味着,即使Intel的芯片工廠遇到了新的和未預料到的問題,他們仍然可以使用AMD所用的相同技術來生產芯片。 在數據中心的競爭中,AMD表示,他們預計將在2022年底前推出採用台積電5nm工藝的「Genoa」(熱那亞)處理器。Intel則表示,他們的7nm CPU要到「2022年底或2023年初「才能上市。 因此,從單純的工藝節點角度,或者CPU角度來看,他們兩者之間的時間表可能會非常接近。與此同時,Intel也正在交付其10nm Xeon處理器,所以這兩家公司在未來幾年的處理器性能可能接近相同。 通過與台積電(或三星)達成CPU生產協議,Intel對沖了他們的風險。未來,無論是台積電還是三星在更先進的節點中取得勝利,Intel都可以選擇更具優勢的晶圓廠來製造他們的CPU。 但是,正如我們在上面指出的,對於數據中心和一般計算來說,先進工藝為處理器帶來的性能提升只是整個領域的一個縮影。總而言之,這不再是納米的問題了。 未來在數據中心取勝的服務器將是那些具有支持針對不同工作負載的異構架構服務器,它們將大量記憶體資源放在本地,並在為這些處於雲邊端的芯片提供高帶寬。 在那個世界里,封裝技術、芯片架構、GPU、FPGA等加速器、專用的人工智能引擎、先進的記憶體和存儲技術以及整個計算系統的架構將成為驅動性能的主要因素,而這種性能提升將遠遠超過由先進製程所帶來的進步。 Intel清楚地認識到這一點,並採取了更全面的方法來保護其在數據中心的地位,還大量收購了AI和FPGA相關的公司和技術,開發Optane傲騰非易失性存儲器,開發了用於嵌入式高密度互連異構芯片的嵌入式多芯片互連橋(EMIB),推出了用於3D芯片堆疊的Foveros技術,以及開展oneAPI計劃。Intel這一系列基於非納米技術的布局,令人印象深刻。 未來幾年,Intel在數據中心的市場份額還會下降嗎?這幾乎是可以肯定的。當你在一個有價值且不斷增長的市場上占有絕對的市場份額時,你真的別無選擇。對競爭對手來說,想辦法擠入市場、分一杯羹的動機太強烈了。 Intel的數據中心收入會繼續快速增長嗎?同樣,這幾乎也是可以肯定的。即使Intel的市場份額縮水,但整體市場仍將以驚人的速度保持增長,在這個過程當中,最大的增長將會發生在市場份額最大的公司的身上——這很可能就是Intel。 其中,最值得關注的是數據中心架構變化所帶來的影響。這里有兩種對立的力量在起作用。首先,大量新架構的出現為眾多新玩家打開了市場的大門,開發各種人工智能加速器的初創公司的數量猛增就可以證明這一點。而且,為了適應這些新的處理器而開放的架構將消除過去幾十年的技術「鎖定」。 數據中心最大的七個客戶與其他用戶之間的差別,也是一件值得關注的事。對數據中心需求量最大的七個企業是Facebook、Google、微軟、亞馬遜、百度、阿里巴巴、騰訊。 這些公司擁有充足的資金,從經濟上來說,它們幾乎可以做任何事情來獲得數據中心容量、吞吐量或效率方面的優勢。他們有能力開發自己定製的芯片和處理器,創建自己的服務器平台,並與前沿創業公司合作以獲得新技術。 數據中心市場的其他用戶則正好相反。他們希望用最標準化、可互換、支持良好的平台來構建數據中心,並希望每五年左右進行一次更新。因此,即使是其中一家初創公司接到了7巨頭的訂單,這也並不意味着他們將占領更大的數據中心市場份額。  在未來的數據中心市場中,任何擁有和控制在分散異構計算架構上運行應用程序的硬件和軟件架構的公司,以及可以在標準化的、可互換的、支持良好的平台上進行交付的企業,都將擁有巨大的影響力。 至於誰將推動行業標準,誰將擁有關鍵非摩爾技術的製造,例如在存儲器與這些尚未定義的異構計算之間遷移數據所需的高級封裝/小芯片生態系統,我們還沒有明確的方向,但很明顯,Intel正試圖在大批用戶到來之前占領這一市場,並且他們不會毫無競爭力。這很值得業界去關注。 作者:上方文Q來源:快科技