全球企業正在為 NVIDIA OVX 計算系統提供多種經過 NVIDIA 驗證的存儲選項。
生成式 AI 部署的急劇增加正在推動各行業企業的業務創新。但這也給他們的 IT 團隊帶來了巨大挑戰,因為漫長而復雜的基礎設施部署周期導致他們無法使用自己的數據快速啟動 AI 工作負載。
為了幫助克服這些障礙,NVIDIA 推出了針對NVIDIA OVX計算系統的 Storage Partner Validation Program。率先完成 NVIDIA OVX 存儲驗證的高性能存儲系統包括 DDN、Dell PowerScale、NetApp、Pure Storage 和 WEKA。
NVIDIA OVX伺服器將高性能 GPU 加速計算與高速存儲訪問和低延遲網絡相結合 ,可應對一系列復雜的 AI 和圖形密集型工作負載。例如,聊天機器人、摘要和搜索工具需要大量數據,而高性能存儲對於更大限度提升系統吞吐量至關重要。
為了幫助企業將正確的存儲設備與 NVIDIA 認證的 OVX 伺服器配對,新計劃為合作夥伴提供了驗證其存儲設備的標准化流程。他們可以使用驗證 NVIDIA DGX BasePOD 參考架構存儲所需的相同框架和測試。
想要通過驗證,合作夥伴必須完成一套 NVIDIA 測試,測量存儲性能以及跨多個參數的輸入/輸出擴展,這些參數代表了各種企業 AI 工作負載的嚴苛要求。這包括不同 I/O 大小的組合、不同數量的線程、緩沖 I/O 與直接 I/O、隨機讀取、重新讀取等。
每個測試都會運行多次,以驗證結果並收集所需的數據,然後由 NVIDIA 工程團隊審核以確定存儲系統是否通過測試。
該計劃提供規范性指導,以確保使用NVIDIA OVX系統的企業 AI 工作負載獲得最佳存儲性能和可擴展性。但其整體設計仍然靈活,因此客戶可以定製系統和存儲選擇,以適應現有的數據中心環境,並將加速計算用於數據所在的任何地方。
生成式 AI 用例與傳統企業應用程式有著不同的要求,因此 IT 團隊必須仔細考慮其計算、網絡、存儲和軟體的選擇,以確保高性能和可擴展性。
NVIDIA 認證系統經過測試和驗證,可為 AI 工作負載提供企業級性能、可管理性、安全性和可擴展性。與從頭開始獨立構建相比,這些系統靈活的參考架構有助於提供更快、更高效且更具成本效益的部署。
OVX 伺服器由 NVIDIA GPU 提供支持,伺服器中包含 NVIDIA AI Enterprise 軟體與 NVIDIA Quantum-2 InfiniBand 或 NVIDIA Spectrum-X 乙太網,以及 NVIDIA BlueField-3 DPU。這些伺服器針對生成式 AI 工作負載進行了優化,包括:針對小型 LLM(例如 Llama 2 7B 或 70B)的訓練,微調現有模型,以及高吞吐量和低延遲的推理。
NVIDIA 驗證的 OVX 伺服器現已推出,包括技嘉、惠普和聯想在內的全球系統供應商正在提供支持。在與 NVIDIA 的協作下,系統製造商能夠為這些伺服器提供全面的企業級支持。
供應情況
經過驗證的 NVIDIA 認證 OVX 伺服器存儲解決方案現已推出,各個存儲和系統供應商將在未來幾周內發布參考架構。
了解有關的更多信息。
來源:快科技