阿里平頭哥發布首顆SSD主控鎮岳510:誤碼率領先業界標杆1個數量級

11月1日,在2023雲棲大會上,阿里巴巴平頭哥發布旗下首顆SSD主控晶片鎮岳510。

該晶片為雲計算場景深度定製,實現4μs超低時延,比業界主流降低30%以上,誤碼率低至10^-18,比業內標杆領先一個數量級。

鎮岳510將率先在阿里雲數據中心部署,可應用於AI、在線分析、在線交易、大數據分析、高性能資料庫等業務場景。

阿里平頭哥發布首顆SSD主控鎮岳510:誤碼率領先業界標杆1個數量級

阿里平頭哥發布首顆SSD主控鎮岳510:誤碼率領先業界標杆1個數量級

為何要自研SSD主控晶片?雲計算對存力提出了更高的需求

雲計算符合馮諾依曼架構:數據從存儲設備中取出,通過網絡傳送到計算單元,運算結果通過網絡傳輸至存儲設備中保存。

算力、網力、存力,共同構築了雲計算的基礎。

為了滿足雲上業務的迅猛發展,以CPU為代表的通用算力,以GPU、NPU為代表的的AI算力,以指數級迅速增加;而網絡也從25GE、100GE、200GE快速演進,並將進入400GE、800GE時代。

以SSD為代表的存力,同樣面臨了新的挑戰和訴求。

阿里平頭哥發布首顆SSD主控鎮岳510:誤碼率領先業界標杆1個數量級

●極致的性能。

SSD是計算數據的來源與結果數據的目的地,其讀寫吞吐速率的高低,將制約整個計算系統的性能。

●復雜負載下的穩定時延。

時延是SSD從收到命令到返回命令響應的耗時。雲上為了提高並發能力,業務請求通常會被拆分為多筆子請求分散到眾多SSD並發執行。任何一塊SSD的時延發生抖動,都會造成整個業務請求的延遲。

●更優的TCO。

綠色、減碳是雲數據中心的一貫追求。如何提升能效,以更低的功耗,提供更高的性能,是SSD的重要挑戰。

●更高的存儲密度。

提高數據中心資源利用率是雲的核心訴求。提高SSD的存儲密度,在單塊SSD內提供更大的存儲容量,可以有效減少所需部署的伺服器數量、交換機/路由器數量。

隨著雲技術進入深水區,雲開始與底層晶片全方位融合聯合設計,提供更好的用戶體驗。

阿里平頭哥發布首顆SSD主控鎮岳510:誤碼率領先業界標杆1個數量級

第一:消除SSD接口稅。通過存儲軟體與NAND特性完美契合,達到數據排布的最優化,後台操作的最小化。

第二:全鏈路QoS優化。延遲敏感型與帶寬敏感型IO實現了精細化區分處理,提升延遲敏感型IO的SLA。

第三:智能卸載。可靠性計算卸載至SSD,實現全路徑存儲語義校驗,同時也減輕了伺服器主機算力開銷。

隨著這一系列雲計算對存力提出的新的需求的出現,也使得對於SSD主控晶片的能力的要求也越來越高。基於此,平頭哥選擇自研了更符合“雲計算需求”的SSD主控晶片鎮岳510。

鎮岳510發布:內置玄鐵910 RISC-V多核CPU,誤碼率領先業界標杆一個數量級

和CPU一樣,SSD是計算機系統的核心部件,主控晶片作為SSD的「大腦」,負責主機交互、協議解析與執行、數據讀寫、數據糾錯、數據管理等核心任務,不僅直接影響整個系統的性能,還保障了業務的安全與穩定。

鎮岳510則是平頭哥旗下第一顆SSD主控晶片。

鎮岳510支持先進的PCIe 5.0接口,支持DDR 5.0技術,內置玄鐵910 RISC-V多核CPU,採用平頭哥自研緊耦合晶片架構,對SSD任務進行高度抽象,可固化任務硬化為加速算子以提升性能,FTL關鍵任務則運行於玄鐵910CPU以保持靈活性。

阿里平頭哥發布首顆SSD主控鎮岳510:誤碼率領先業界標杆1個數量級

阿里平頭哥發布首顆SSD主控鎮岳510:誤碼率領先業界標杆1個數量級

鎮岳510每秒可處理高達340萬筆IO,一枚鎮岳510的性能,相當於1萬塊高性能HDD的性能總和。

此外鎮岳510擁有極高的能效比,每瓦功耗可提供42萬筆IO訪問

。以一個部署了10萬塊SSD的數據中心為例,相比目前主流的PCIe 4.0SSD,鎮岳510在相同的性能下,僅主控晶片即每年節省260萬度電.

按照一度電排放0.785千克二氧化碳計算,每年可減少二氧化碳排放2千噸。

鎮岳510內置創新的IO自動化處理機制,前端IO解析與處理,由專用硬體模塊自動完成,實現了業界領先的超低的時延(4μs),可以帶給應用極佳的體驗,比業界SSD降低30%以上。

不僅如此,鎮岳510晶片內實現了IO/YS/GC的全鏈路隔離,極大的降低這些任務之間的相互干擾,提供了既低又穩定的時延表現。

鎮岳510內置了平頭哥自研的高性能LDPC糾錯算法,編碼效率逼近香農極限,同時ErrorFlow相比業內SSD更優一個數量級;

同時藉助平頭哥自研快閃記憶體電壓預測算法,可以在各種快閃記憶體的不同工況、壽命、溫度等條件下,准確預測快閃記憶體電壓漂移,進一步降低LDPC解碼器的輸入誤碼率。

它實現了低至10^-18的UBER,相當於每讀取百億億筆數據,才可能有一筆數據糾錯失敗。

鎮岳510做了哪些定製?

鎮岳510不僅具備更強存力、更高可靠等特點,還通過為雲定製,帶來更優秀的存儲體驗。

在傳統的系統方案中,SSD與存儲系統分離設計。

SSD負責底層快閃記憶體數據排布,但無存儲語義而無法達到最佳排布;SSD負責後台任務,但無法判斷最佳啟停時機;而存儲系統有存儲語義卻無法排布快閃記憶體數據,有最佳時機卻無法啟停SSD後台任務。

上下的割裂給整個存儲系統的性能與壽命帶來了額外消耗,這被稱為“SSD接口稅”。

因此ZNS協議被發展出來,通過將盤內FTL層上移至存儲系統,達到了存儲系統與快閃記憶體特性的完美匹配,消減了“SSD接口稅”。

2021年5月,ZNS協議被收入NVMe規范2.0版本中,並得到了SPDK、Linux以及各設備商的支持。

阿里平頭哥發布首顆SSD主控鎮岳510:誤碼率領先業界標杆1個數量級

鎮岳510完美實現了ZNS協議,通過靈活的硬體表項加速保持了高IO性能,而Zone分區狀態則交由玄鐵910CPU維護,保留了對新協議的靈活性。

此外,鎮岳510定製了Last Sector 隨機寫功能,實現了小報文的多次反復下盤,簡化了ZNS的應用難度。

阿里平頭哥發布首顆SSD主控鎮岳510:誤碼率領先業界標杆1個數量級

數據請求可以分為帶寬敏感型與時延敏感型,不同的請求應予以不同的處理策略,才能達到業務最佳SLA。

NVMe規范中制定了以隊列為粒度的標准SQ調度機制,但其靈活性較差,對於業務種類復雜、追求靈活可配的雲存儲系統來說,它並不是最佳選擇。

鎮岳510在支持NVMe標準的SQ調度機制的同時,額外定製了基於IO粒度的優先級調度機制,允許系統按IO打標,優先級種類多達8級,結合雲存儲系統,能夠更好的保障延遲敏感型業務的服務質量。

阿里平頭哥發布首顆SSD主控鎮岳510:誤碼率領先業界標杆1個數量級

雲存儲系統的完整數據鏈路 ,從計算端開始,通過網絡到存儲伺服器,再通過內部互聯到達SSD。

為了保障數據的高可靠,全鏈路應採用語義一致的完整性校驗。

但NVMe規范只規定了以Sector為單位按照T10 DIF/DIX的校驗機制,與存儲系統的語義並不相同,因此SSD的校驗與存儲系統的校驗產生了差異。

阿里平頭哥發布首顆SSD主控鎮岳510:誤碼率領先業界標杆1個數量級

鎮岳510以IO為粒度,遵循上層存儲語義進行校驗,補齊了整個存儲系統的數據鏈路校驗的最後一環。

不僅如此,鎮岳510還支持以存儲語義對內部數據進行後台巡檢,而無需再讀出至伺服器,節省了寶貴的PCIe帶寬、伺服器記憶體帶寬與CPU算力。

據介紹,鎮岳510將率先在阿里雲數據中心部署,可應用於AI、在線分析、在線交易、大數據分析、高性能資料庫等業務場景。

得益於基於鎮岳510的SSD與阿里雲數據存儲底座——飛天盤古平台的軟硬協同設計,提升了數據可靠性、SLA以及存儲效能,構建了從晶片到系統的全棧自研分布式存儲。

阿里平頭哥發布首顆SSD主控鎮岳510:誤碼率領先業界標杆1個數量級

此外,鎮岳510提供的ZNS能力與飛天盤古存儲引擎協同,增強了雲存儲的靈活性,推進了數據中心往軟體定義快閃記憶體方向發展。

小結:

過去5年,平頭哥已推出多款算力晶片,其雲原生處理器晶片倚天710已在阿里雲數據中心規模化部署,算力性價比提升超30%,已服務數千家電商、短視頻、在線教育等領域客戶。

此次鎮岳510的問世,意味著平頭哥的晶片產品家族從算力擴展到了存力領域,進一步為雲計算行業提供高性價比的技術底座。

平頭哥產品總監周冠鋒也表示:“算力、網力、存力共同構築了雲計算的基礎,算力和網絡在過去幾年已實現快速演進,以SSD為代表的存儲技術也必須與雲計算軟體系統融合設計,為企業用戶帶來更優秀的存儲體驗。”

來源:快科技