強到沒對手的NVIDIA:把天花板又抬高了

今年的 GTC,老黃又放了一堆「核彈」。

9 月 20 日晚上 11 點,英偉達 CEO 黃仁勛的主題演講為 2022 GTC 揭開序幕。一個半小時的時間里,他介紹了英偉達下一代 RTX GPU 和支持 AI 工作流的新型雲服務,以及各種新系統、晶片和軟體。

對於遊戲玩家和創作者而言,他們將獲得首批基於全新 NVIDIA Ada Lovelace 架構的 GPU。較上一代旗艦 GPU RTX 3090Ti,此次發布的 RTX 4090 的性能將提升至前者的四倍。

但在這場演講里,4090 也只是「開胃菜」。在剩下的一個多小時,黃仁勛介紹了英偉達在企業級市場和汽車市場的進展。

首先是今年 3 月發布的新一代計算卡「H100」,黃仁勛宣布 Nvidia H100 Tensor Core 現在已經全面投產,預計將在 10 月份上市。為元宇宙開發搭建的 Omniverse 平台也迎來全面更新,並將推出 Omniverse Cloud——一款 IaaS 雲服務產品。

而在汽車領域,英偉達公布了新一代自動駕駛晶片 Thor,並放棄了此前發布的 Atlan。據英偉達透露,極氪將首發搭載該晶片,時間為 2025 年,此外如小鵬汽車、輕舟智能等也將使用該晶片。

GeForce RTX 40 系列

首先是最受關注的 GeForce RTX 40 系列顯卡,會前曾有傳言此次 GTC 40 系列顯卡有可能缺席,結果並沒有成真。

今年 GTC 英偉達發布了 40 系列兩款高端顯卡,其中 GeForce RTX 4090 將於 10 月 12 日上市,建議零售價 12999 元起;GeForce RTX 4080 將於 11 月推出,採用 12GB 和 16GB 顯存兩種配置版本,建議零售價分別為 7199 元和 9499 元起。

上一代 RTX 3090 和 RTX 3080 的首發價分別為 11999 元和 5499 元,40 系列顯卡的價格提升了不少,但相比上一代產品,40 系列的性能也有了顯著提升。根據黃仁勛介紹,GeForce RTX 4090 的性能將提升至上一代 RTX 3090 Ti 的 4 倍,GeForce RTX 4080 也比上一代產品在性能和功耗上有很大進步。

「和加速計算一樣,計算機圖形也是一項全棧挑戰。」黃仁勛解釋道,「若要實現突破,需要在架構、設計和算法方面進行創新。」

而在上述幾個維度,尤其是架構和算法上,40 系列新顯卡都有跨越式的提升。

在架構方面,40 系列顯卡建立在全新的第三代 RTX 架構——即 Ada Lovelace(Ada 架構)。在優化的 4N 工藝下,Ada GPU 可以集成 760 億個電晶體和超過 18000 個 CUDA 核心,比上一代 Ampere GPU 多了 70%。

新架構下,所有三類處理器均有改進,包括:SM 多單元流處理器、RT Core 和 Tensor Core。值得注意的是,單個 Ada GPU 即可支持 RacerX(基於物理定律的仿真)的運行。

在算法上,40 系列顯卡在基於深度學習的神經網絡渲染上取得了突破——引入了第三代 DLSS 技術。

光線追蹤所需的計算量近乎瘋狂,CGI 電影的每一幀畫面渲染都需要數小時。英偉達 RTX 打開了實時光線追蹤世界的大門,並且,通過引入基於深度學習的超解析度技術,進一步提高了遊戲幀率。

DLSS 3 通過將新幀和上一幀進行比較來了解場的變化,從而利用 AI 生成全新幀。與傳統渲染相比,它能將遊戲性能提高多達 4 倍。在這項技術的加持下,無論是對 GPU 性能要求較高的遊戲還是受到 CPU 限制的遊戲,都將從中受益。

強到沒對手的NVIDIA:把天花板又抬高了

老黃總結道:相較於 4 年前首次引入實時光線追蹤技術,今天藉助 AI,英偉達在 4 年內將光追的性能升了 16 倍;與此同時,GPU 中負責此類計算的電晶體數量並沒有以同比增加,一些像素通過計算得出,而大多數像素則通過 AI 預測得出。

另外值得注意的是,此次英偉達只發布了兩款 40 系列的高端顯卡,這與遊戲顯卡市場需求疲軟、英偉達急於去庫存有一定關系。

黃仁勛在會後接受分析師采訪時表示:終端市場目前需求疲軟,英偉達減少了供應,來幫助下游消化 3080、3080 積壓的庫存,並預計用兩個季度完成。對於 Ada 架構的新顯卡,英偉達會在這個季度開始進行小規模生產,並在明年進行更多的公布。

此外,對於市場環境是否會影響 4080 和 4090顯卡的銷售,黃仁勛認為,4080、4090 主要針對高端遊戲玩家,受到的市場影響較小。

簡單來說,4080 和 4090 兩款高端旗艦顯卡相較上一代性能有明顯提升,有換代需求的高端玩家依然會正常購買。但對於 4070、4060 這些在性能上與 3080、3080 這些上一代旗艦性能相近的產品,為了避免影響下游去庫存,英偉達會在更晚的時間點發布。

Omniverse 推出雲服務

網際網路的下一次演化方向被視作元宇宙,而英偉達對於元宇宙的理解是「數字孿生」。英偉達於 2019 年正式推出 Omniverse,一個用來構建和運行元宇宙應用的平台。

簡單來說,Omniverse 是一個實時的大型 3D 資料庫,一個可以共享的 3D 世界,一個基於 USD 構建的網絡;同時,它也是一個計算平台,使用者可以編寫在 Omniverse 上運行的應用,這些應用如同進入 Omniverse 虛擬世界的門戶。

此外,英偉達也編寫了一些 Omniverse 應用,例如用於協作的 Create 和 View,用於合成數據生成的 Replicator,以及用於數字孿生模擬的 Isaac Sim 和 Drive Sim。

作為一個新的計算平台,Omniverse 由三部分構成:RTX 計算機(供創作者、設計師和工程師使用)、OVX 伺服器(用來託管與 Nucleus 資料庫的連接並運行虛擬世界模擬)以及第三部分:NVIDIA GDN(進入 Omniverse 的門戶)。

會上,黃仁勛介紹了第二代 OVX 系統,後者將由 Ada Lovelace L40 數據中心GPU提供支持,該 GPU 現已全面投產。

此外,英偉達還宣布推出 Omniverse Cloud。這是一款Iaas產品,可連接在雲上、本地或單個設備上運行的 Omniverse 應用。

黃仁勛介紹:新的 Omniverse 容器現已可以部署到雲端,該容器包括用於合成數據生成的 Replicator、用於擴展渲染農場的 Farm 以及用於構建和訓練AI機器人的 Isaac Sim。

Omniverse 上雲一方面意味著將進一步方便協作,提升效率;另一方面,也意味著英偉達數字孿生業務將覆蓋更大的應用場景和客戶。

黃仁勛表達了自己對元宇宙的看法:未來,所有的產品都將具有數字孿生。製造商利用數字孿生模擬產品在物理世界中的作用和性能。如果不對軟體的數字孿生版本進行測試,則無法大規模部署該軟體所運營的的物理產品。

黃仁勛列舉了很多客戶案例來解釋不同領域的公司如何利用 Omniverse,比如為工廠、物流倉庫、自動化生產線和工業廠房創建數字孿生;如何利用 Omniverse 實現團隊互聯,以全保真度可視化他們的數據並生成合成數據,從而訓練AI模型,模擬數字孿生。

自動駕駛:放棄 Atlan,擁抱 Thor

最後,多少有點出乎意料,英偉達公布了新一代自動駕駛平台 Thor。

目前,想要實現汽車中的主動安全、停車、駕駛員監測、攝像頭後視鏡、集群和車載信息、娛樂系統等功能通常需要不同的計算機提供支持。而未來,它們將由在中央計算機上運行的軟體統一提供支持,並隨著時間的推移不斷改進。

去年,英偉達推出了 Atlan,一款 1000 TOPS 的 SoC。雖然這款產品還沒有投產,但是黃仁勛宣布 Atlan 不再是第一了,它將被 Thor 取代。

新推出的 DRIVE Thor 平台,集成了基於 Hopper 的 Transformer Engine、基於 Ada 的GPU和基於 Grace 的 CPU。

黃仁勛表示,Hopper 的 Transformer 引擎以及 Vision Transformer 的快速變革,它們都至關重要,必須納入到下一代的機器人處理器,而 Ada 中多實例GPU的發明將有助於車載計算資源的集中化可將成本降低數百美元,Grace 的 CPU 則正好擁有非常出色的單線程性能。

基於這些基礎,Thor 的吞吐量是上一代 Atlan 的兩倍,交付的性能也是 Atlan 的兩倍以上。並且,Thor 能夠與目前被用於量產汽車、可提供每秒 254 萬億次浮點運算性能的 DRIVE Orin 無縫銜接。

使用場景上,Thor 處理器可以應用在機器人、醫療儀器、工業自動化和邊緣AI系統等。

對於英偉達取消 Atlan 的原因,黃仁勛在會後接受分析師采訪時表示,Atlan 的產品包括GPU、CPU 和 Tensor Core 三個關鍵的架構。這三個架構,在過去兩年都發生了巨大的進步。每過兩年。機器人系統的研發都會迎來重大更新,這是他們做出取消 Atlan 直接做 Thor 的原因。

此外,黃仁勛還進一步透露,除了會上公布的極氪等中國車廠,到 2025 年,奔馳、捷豹路虎等車企的車隊,都會由英偉達提供全棧式的解決方案。公司預計未來在汽車業務領域中的商業化速度以及競爭將會加劇。目前英偉達大概有 110 億美金的在手訂單和汽車業務相關。

強到沒對手的NVIDIA:把天花板又抬高了

來源:快科技