Blackwell Archives

英偉達首批Blackwell架構遊戲顯卡包括RTX 5090/5080，兩者或相隔數周上市

今年英偉達將發布新一代遊戲顯卡，基於Blackwell架構的Geforce RTX 50系列，預計最快會在今年第四季度到來，與之前的Geforce RTX 30/40系列一樣，初期將專注於高端產品。過去一段時間里，有關今年內是否能同時看到RTX 5080和RTX 5090的話題引起了玩家的關注，問題主要集中於RTX 5080。近日有網友透露，英偉達大機率會同時發布RTX 5090和RTX 5080，不過兩者發售時間並不一致，中間會相隔幾周的時間，其中RTX 5080會更早上市。這點與Geforce RTX 40系列有些不同，雖然RTX 4090和RTX 4080都在2022年9月20日發布，但是先上市的是更高端的RTX 4090（10月12日），而RTX 4080晚了大概一個月（11月16日）。根據之前的說法，基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、GB206和GB207五款晶片，對應的顯存位寬分別是512/384-bit、256-bit、192bit、128-bit和128-bit。其中RTX 5090搭載的是GB202，RTX 5080搭載的是GB203。新產品採用台積電（TSMC）4NP定製工藝製造，也就是現有4N工藝的改進型，同時也會支持新一代GDDR7。傳聞GB202和GB203的差別較大，前者的規模要大得多，預計會有192組SM（24576個CUDA核心），而後者僅為一半，擁有96組SM（12288個CUDA核心）。RTX 5090不會啟用所有SM，預計會用到其中的170至180組。RTX 5080同樣如此，以便在半代更新時提供「Ti」或者「SUPER」的型號，開啟更多的SM提升性能。 ...

傳「Rubin」將接替「Blackwell」架構，英偉達或安排2025年底上市

在美國加州聖何塞會議中心舉行的GTC 2024大會上，英偉達創始人兼CEO黃仁勛帶來了Blackwell架構GPU，包括用於取代H100/H200的B200 GPU，另外還有與Grace CPU相結合的GB200。新款數據中心產品再次鞏固了英偉達在人工智慧市場的主導地位，開創了AI計算的新時代。雖然英偉達只是剛剛發布了Blackwell架構GPU，相關產品要等到下半年才出貨，但下一代架構已經開始浮出水面。據Wccftech報導，新架構的代號為「Rubin」，是以美國天文學家Vera Rubin來命名。除了為AI GPU帶來性能的飛躍，新一代產品的設計重點是降低功耗，這顯得尤為重要，畢竟目前架構的產品已逼近千瓦范圍，且無法無限擴展。據了解，首款基於Rubin架構的GPU是R100，預計在2025年第四季度進入量產階段，這意味著發布的時間會更早一些，以便選定的客戶可以更快地去做評估，大概能在2026年初收到新款晶片。傳聞Rubin架構GPU將採用台積電（TSMC）的3nm工藝製造，與B100使用了CoWoS-L封裝，很可能是首批搭載HBM4的產品之一。去年10月，英偉達在投資者簡報中介紹了包括HBM3e、PCI Express標准（6.0/7.0）更新和多GPU互聯技術更新等內容，同時還放出了產品路線圖，上面展示了其2024年至2025年數據中心的規劃。其中Blackwell架構產品之後還會有X100和GX200，當時裡面使用的「X」無法確定是紀念哪一位科學家。不過隨後就有網友透露，英偉達正在開發面向數據中心的R100和GR100，路線圖所使用的「X」實際上就是「R」，代表的是Vera Rubin。 Vera Rubin是美國的一名天文學家，出生在賓夕法尼亞州費城，瓦薩爾學院天文學專業畢業，並在康奈爾大學讀研，。隨後在喬治敦大學獲得博士學位並留校任教數年後，魯賓進入非營利科研機構卡內基科學學會工作，成為了研究所地磁部的首位女研究員。Vera Rubin在1981年被選入美國國家科學院，成為其歷史上第二位女院士。 ...

英偉達Blackwell架構遊戲顯卡再生疑團，RTX 5080或早於RTX 5090發布？

此前有報導稱，今年英偉達將發布新一代遊戲顯卡，不過與Geforce RTX 30/40系列首發三款產品不同，只提供旗艦級的Geforce RTX 5090。雖然只有一款產品，不過大家也能對Blackwell架構GPU和各種新功能有一個基本的認識，英偉達同樣會針對新架構做技術概述。僅僅過去一天，就有網友（@Kopite7kimi）給出了不同的消息，稱英偉達最早發布的Blackwell架構遊戲顯卡將是Geforce RTX 5080。至於今年內是否能同時看到RTX 5080和RTX 5090，還是說確實只有一款產品，暫時還不清楚。由於該位網友過往泄露了不少英偉達的消息，且准確率較高，新的說法似乎更為可靠，不過英偉達有可能還沒有確定最終的發布計劃。根據之前的說法，基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、GB206和GB207五款晶片，對應的顯存位寬分別是512/384-bit、256-bit、192bit、128-bit和128-bit。新一代產品採用PCIe 5.0接口，支持DisplayPort 2.1顯示輸出，搭載16Gb（2GB）的GDDR7模塊，還可能支持24Gb（3GB）模塊，速率為28 Gbps。 Geforce RTX 5080搭載的是GB203，擁有96組SM，共有12288個CUDA核心。GeForce RTX 5090搭載的是GB202，擁有192組SM，共有24576個CUDA核心，可能採用MCM多晶片封裝，類似於用在數據中心產品的Blackwell架構B200晶片。傳聞英偉達將對Blackwell架構進行較大規模的修改，雖然不是全新的設計，不過SM和CUDA會有一個新的結構，RT單元有可能被PT單元所取代，光線追蹤性能也會得到進一步優化和加強。 ...

搭載GB200的DGX伺服器將於2024H2進入量產，或為英偉達帶來巨額收益

今年3月，英偉達在美國加州聖何塞會議中心舉行的GTC 2024大會上，帶來了Blackwell架構GPU，包括用於取代H100/H200的B200 GPU，另外還有與Grace CPU相結合的GB200。此外，還基於新款晶片打造了新一代DGX系列伺服器。據Wccftech報導，搭載GB200的DGX伺服器將於2024年下半年進入量產階段，有望在人工智慧（AI）市場掀起新一輪熱潮。憑借新架構的改進，加上市場的追捧，很可能為英偉達帶來巨額收益。有消息稱，相比於Hopper架構的產品，基於Blackwell架構的新一代AI伺服器更加受市場歡迎，采購量也更大，預計到2025年將超過40000台新款伺服器流入市場。據了解，英偉達計劃將搭載GB200的AI伺服器進行劃分，面向三個不同的細分市場，分別提供DGX NVL72、NVL32和HGX B200。之前英偉達已經介紹過NVL72，這是一個全機架解決方案，有18個1U伺服器組成的機櫃，每台伺服器里帶有兩個GB200 Grace Blackwell Superchip，合計共有36個Grace CPU和72個Blackwell GPU。傳聞NVL72的單價約為300萬美元，預計會銷售10000個機櫃，將為英偉達帶來300億美元的收益，而且還不算其他配套的產品。富士康和廣達將負責大部分DGX系列伺服器的供應，隨著市場對AI算力的需求不斷增長，未來收益會更高，似乎沒有什麼可以阻止英偉達及其相關供應商爆炸性的財務增長。 ...

英偉達今年內僅推出RTX 5090，其餘Blackwell架構遊戲顯卡要等到明年

此前有報導稱，英偉達最快會在今年第四季度帶來GeForce RTX 50系列，與之前的Geforce RTX 30/40系列一樣，初期將專注於高端產品，首批提供RTX 5090和RTX 5080等。基於Blackwell架構的GeForce顯卡與數據中心產品一樣，將採用台積電（TSMC）4NP定製工藝製造，也就是現有4N工藝的改進型。據Moore's Law is Dead報導，今年英偉達將發布新一代遊戲顯卡，不過與Geforce RTX 30/40系列首發三款產品不同，僅提供旗艦級的Geforce RTX 5090，預計再一次實現性能飛躍。即便只有一款產品，大家也能對Blackwell架構GPU和各種新功能有一個基本的認識，英偉達也會在發布時對新架構做一個技術概述。據了解，英偉達這次在GeForce RTX 50系列發布上採取了較為保守的策略，主要原因可能是為了讓市場有更多的時間消化GeForce RTX 40系列的庫存，同時也為了基於新架構的GPU在AI方面有更高的優先級，利用高端產品切入為其帶來更高的利潤。根據之前的說法，基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、 GB206和GB207五款晶片，對應的顯存位寬分別是512/384-bit、256-bit、192bit、128-bit和128-bit。新一代產品採用PCIe 5.0接口，支持DisplayPort 2.1顯示輸出，搭載16Gb（2GB）的GDDR7模塊，還可能支持24Gb（3GB）模塊，速率為28 Gbps。 ...

英偉達Blackwell新平台產品需求看漲，或帶動台積電全年CoWoS產能提升逾150%

今年3月，在美國加州聖何塞會議中心舉行的GTC 2024大會上，英偉達創始人兼CEO黃仁勛帶來了Blackwell架構GPU，新款數據中心產品再次鞏固了自身在人工智慧市場的主導地位，開創了AI計算的新時代。 Blackwell平台產品包括了用於取代H100/H200的B200 GPU，另外還有與Grace CPU相結合的GB200。同時英偉達在去年末，還以現有的Hopper架構為基礎，推出了H200和GH200產品線，在Blackwell平台產品到來之前作為過渡，其中GH200占據了英偉達高端GPU約5%的出貨量。雖然距離發貨還有一段時間，但供應鏈對GB200寄予厚望，預計2025年出貨量可能上百萬級別，占據英偉達高端GPU約40%至50%的出貨量。據TrendForce報導，Blackwell平台的產品將採用更復雜、更高精度的CoWoS-L封裝技術，驗證方面也耗費更多的時間，預計B100、B200和GB200等產品要到今年第四季度才會少量出貨，真正放量至少要等到2025年第一季度。 B100、B200和GB200等產品也需要消耗更多的CoWoS產能，這也迫使台積電（TSMC）在2024年需要全面提升封裝產能，預計年底每月產能將達到4萬片，相比於2023年提升至少150%。此外，台積電已經在規劃2025年的CoWoS產能計劃，很可能還要實現倍增，其中英偉達的需求占據了一半以上。年初有報導稱，英偉達轉向英特爾尋求封裝服務。不過英特爾的技術仍然以CoWoS-S封裝為主，最多隻能滿足英偉達H系列產品的要求，短期內技術也難有突破，所以相應的產能擴張計劃也較為保守，除非未來能額外得到其他訂單。 ...

Jim Keller大神建議NVIDIA放棄私有標准：可以省幾十億美元

快科技4月14日消息，Jim Keller不僅僅是晶片設計大神，技術了得，更是開放技術的忠實擁躉，對於那些封閉技術一直深惡痛絕。很自然的，NVIDIA就成了他的“仇人”。最近，Jim Keller又提出，NVIDIA最新的Blackwell GPU在多晶片互連、網絡互連方面，不應該使用私有的NVLink標准協議，而應該換成開放的乙太網標准，這樣可以給NVIDIA節省幾十億美元。他還認為，NVIDIA在數據中心網絡中，也不該使用自己的方案InfiniBand，也得換成乙太網。 NVIDIA Infiniband網絡雖然具備低延遲、高帶寬，最高可達200GbE，但是乙太網能做到400GbE乃至是800GbE。 AMD、博通、Intel、Meta、微軟、甲骨文等巨頭也正在合作開發下一代超高速乙太網(Utlra Ethernet)，吞吐量更高，更適合AI、HPC應用。此外，Jim Keller對於NVIDIA CUDA封閉生態也一直很不滿，曾經罵它是沼澤而非護城河。 Arm、Intel、高通、三星等也合作組建了統一加速基金會(UXL)，目標之一就是取代NVIDIA的方案。不過對於黃仁勛來說，不管NVLink還是CUDA，都是自己公司多少年砸了多少億美元的成果，更是維護自家利益的神器，怎麼能輕易放棄呢？來源：快科技

傳英偉達將限制RTX 40系列GPU的供應，為RTX 50系列騰出空間

此前有報導稱，最近一段時間GeForce RTX 40系列顯卡都處於供應緊張的狀態，一部分原因是來自人工智慧（AI）和加密貨幣的需求增長，另外英偉達並沒有額外加大供應量，使得今年第一季度的貨源變得越來越緊缺，而且還會蔓延到4月，供應形勢會更加嚴峻，還存在漲價的可能。據Wccftech報導，有業內人士指出，英偉達減少消費端產品供應的做法一方面是人工智慧晶片的強烈需求，隨著Blackwell架構GPU的推出，將接收到大量數據中心訂單，另一方面市場對今年新款GeForce RTX 40 SUPER系列顯卡的反應不冷不熱，也擔心囤積太多晶片，從而影響下一代Geforce RTX 50系列顯卡的發布，這種情況在Geforce RTX 30系列顯卡末期就曾出現過。英偉達希望通過更好的庫存管理，在保持GeForce RTX 40系列產品線定價的同時，為新一代顯卡逐步騰出空間。雖然GeForce RTX 40系列裡有部分產品非常受市場歡迎，但售價方面總體上還是處於下降趨勢，這主要反映在一些高端型號上。根據之前的說法，基於Blackwell架構的GeForce顯卡最快會在今年第四季度到來，與數據中心產品一樣，將採用台積電（TSMC）4NP定製工藝製造，也就是現有4N工藝的改進型。 ...

英偉達只在部分RTX 50系列顯卡選用GDDR7，僅三款GB20x系列GPU支持

隨著英偉達創始人兼CEO黃仁勛在美國加州聖何塞會議中心舉行的GTC 2024大會上，帶來了面向數據中心的Blackwell架構產品，大家也將目光逐漸投向了同樣屬於Blackwell架構遊戲顯卡。雖然近期有關GeForce RTX 50系列的消息不少，但相關產品大概要到2024年底才會到來。據Tweaktown報導，GeForce RTX 50系列採用新款顯存沒有太大懸念，但是並非所有新一代顯卡都是如此，英偉達僅會在三款定位相對較高的GB20x系列上支持GDDR7，分別是GB202、GB203和GB205，覆蓋RTX 5070至RTX 5090的產品線。傳聞支持的是16Gb（2GB）的GDDR7模塊，還可能支持24Gb（3GB）模塊，速率為28 Gbps，低於標準的32 Gbps。剩下定位相對較低的GB206和GB207仍採用當前一代顯存，暫時不清楚是GDDR6還是GDDR6X。目前GDDR6X已提供16Gb（2GB）模塊，速率達23 Gbps，完全可以滿足中低端產品的需求。即便是普通的GDDR6，現在速率也提升至20 Gbps，未來還有可能更快，如果放在入門級顯卡可是相當夠用了。根據之前的說法，GB20x系列包括GB202、GB203、GB205、 GB206和GB207五款晶片，對應的顯存位寬分別是512/384-bit、256-bit、192bit、128-bit和128-bit，都將採用台積電（TSMC）4NP定製工藝製造。在這次GTC 2024大會上，三星就向外界展示了為新一代GeForce顯卡所准備的GDDR7顯存。 ...

花費 100 億美元打造，史上最強 AI 晶片到底強在哪？

這兩天，我們再次回顧了黃仁勛在 GTC 2024 上的演講，在對產品做更深一層的分析解讀時，發現了一些當時熬夜忽略掉的亮點。一是老黃的演講風格，幽默、自然、很有交流感，也難怪能把一場科技產品發布會開成演唱會的模樣。二是結合著前幾代產品，再次審視最新發布的 Blackwell 架構以及系列 GPU，只能說它的算力性能、成本造價和今後表現，遠超乎我的想像。就如英偉達的名字一樣，NVIDIA 的前兩個字母 N 和 V，代表著 Next Version「下一代」。與往年的 GTC 一樣，英偉達如期發布了下一代產品，性能更高、表現更好；但又和以前完全不同，因為 Blackwell 所代表的不僅是下一代產品，更是下一個時代。重新認識，地表最強 GPU 自我介紹一般都從名字開始，那這顆最新最強的 AI 晶片，也從這里講起吧。 Blackwell 的全名是 David Harold Blackwell，他是美國統計學家、拉奧-布萊克韋爾定理的提出者之一。更重要的是，他還是美國國家科學院的首位黑人院士，和加州大學伯克利分校的首位黑人終身教員。 GTC...

傳英偉達投入100億美元開發Blackwell架構平台，新產品售價在3到4萬美元

在美國加州聖何塞會議中心舉行的GTC 2024大會上，英偉達創始人兼CEO黃仁勛帶來了Blackwell架構GPU，新款數據中心產品再次鞏固了自身在人工智慧市場的主導地位，開創了AI計算的新時代。對於潛在買家來說，可能需要付出一大筆錢去購買英偉達的新款AI GPU。有網友透露，英偉達為了盡可能滿足市場對新產品的期待，前後花費了100億美元開發基於Blackwell架構的平台，這是其創紀錄的研發投入。據了解，B200的製造成本超過了6000美元，基於這款GPU打造的計算卡售價估計在3萬到4萬美元之間。 B200採用了台積電（TSMC）改進的4NP定製工藝製造，整合了兩個獨立製造的Die，共有2080億個電晶體，使用了新的NVLink 5.0技術來連接兩塊晶片，這也是英偉達首個MCM設計的GPU。其擁有160組SM，對應20480個核心，搭配的使192GB的HBM3E，提供了高達8TB/s的帶寬，功耗達到了700W。B200單個GPU提供了20 petaflops的AI性能，大概五倍於H100的4 petaflops。近期AMD新一代針對數據中心的Instinct MI300系列產品有著不錯的銷量，不過英偉達似乎不打算留給競爭對手任何空間。不少投資者都期待英偉達財務上能有更好的表現，預計一系列圍繞Blackwell架構打造的產品能讓其投資回報率翻一番。此前就有市場研究機構表示，到2026年，英偉達的營收預計將達到1300億美元，相比2021年增加約1000億美元，相當於總收入增長了125%。 ...

英偉達RTX 50系列GPU或採用台積電4NP工藝，與Blackwell架構B100相同

在美國加州聖何塞會議中心舉行的GTC 2024大會上，英偉達創始人兼CEO黃仁勛帶來了Blackwell架構GPU，包括用於取代H100/H200的B200 GPU，另外還有與Grace CPU相結合的GB200。這些都屬於數據中心產品，同樣屬於Blackwell架構的GeForce遊戲顯卡還要等上一些時日，最快也要到2024年底。 B200採用了台積電（TSMC）4NP定製工藝製造，只是現有4N工藝的改進，都屬於台積電5nm製程節點的一部分，並非人們所期待的3nm/N3工藝。已經有網友透露，未來將取代AD102的GB202也將使用相同的工藝製造，密度方面提升了30%。此外，傳聞GB202的L1緩存在設計上相比AD102及GA102會有明顯變化。根據之前的說法，基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、 GB206和GB207五款晶片，對應的顯存位寬分別是512/384-bit、256-bit、192bit、128-bit和128-bit，與以往最大的不同，是AD104之後沒有GB204這款x04晶片，而是變成了x05的GB205。新一代產品將採用16Gb（2GB）的GDDR7是模塊，還可能支持24Gb（3GB）模塊，速率為28 Gbps。其中定位最高的GB202將用於GeForce RTX 50系列的旗艦型號，規模是GB203的兩倍。從B200的情況來看，這樣的設計的是有可能的，整合了兩個獨立製造的Die，再使用NVLink技術來連接兩塊晶片。有消息稱，GB202擁有192組SM，而GB203為96組SM。此外，GeForce RTX 50系列應該都會採用PCIe 5.0接口，支持DisplayPort 2.1顯示輸出，同時會配備新款的「12V-2×6」連接器。 ...

黃仁勛拋出2700W功耗的真核彈還有240TB顯存的AI超級計算機

快科技3月19日消息，今天凌晨，黃仁勛正式拿出了新一代Blackwell GPU架構，以及基於此的B100/B200 GPU晶片、GB200超級晶片、DGX超級計算機，再次將“戰術核彈”提升了全新的境界，傲視全球。 Blackwell B200 GPU首次採用了chiplet晶粒封裝，包含兩顆B100，而B200之間再通過帶寬翻倍達1.8TB/的第五代NVLink 5總線互連，最多可連接576塊。 B100採用專門定製的台積電4NP工藝製造(H100/RTX 40 4N工藝的增強版)，已經達到雙倍光刻極限尺寸，彼此通過10TB/帶寬的片間互聯帶寬，連接成一塊統一的B200 GPU。 B100集成多達1040億個電晶體，比上代H100 800億個增加了足足30％，B200整體就是2080億個電晶體。核心面積未公布，考慮到工藝極限應該不會比814平方毫米的H100大太多。 CUDA核心數量也沒說，但肯定會大大超過H100 16896個，不知道能不能突破2萬個？每顆B100連接四顆24GB HBM3E顯存/內存，等效頻率8GHz，位寬4096-bit，帶寬達4TB/。如此一來，B200就有多達192GB HBM3E，總位寬8096-bit，總帶寬8TB/，相比H100分別增加1.4倍、58％、1.4倍。性能方面，B200新增支持FP4 Tensor數據格式，性能達到9PFlops(每秒9千萬億次)，INT/FP8、FP16、TF32 Tensor性能分別達到4.5、2.25、1.1PFlops，分別提升1.2倍、1.3倍、1.3倍，但是FP64 Tensor性能反而下降了40％(依賴GB200)，FP32、FP64 Vector性能則未公布。 Blackwell GPU還支持第二代Transformer引擎，支持全新的微張量縮放，在搭配TensorRT-LLM、NeMo Megatron框架中的先進動態范圍管理算法，從而在新型4位浮點AI推理能力下實現算力和模型大小的翻倍。其他還有RAS可靠性專用引擎、安全AI、解壓縮引擎等。至於功耗，B100控制在700W，和上代H100完全一致，B200則首次達到了1000W。 NVIDIA宣稱，Blackwell GPU能夠在10萬億參數的大模型上實現AI訓練和實時大語言模型推理。 GB200 Grace Blackwell是繼Grace Hopper之後的新一代超級晶片(Superchip)，從單顆GPU＋單顆CPU升級為兩顆GPU加一顆CPU，其中GPU部分就是B200，CPU部分不變還是Grace，彼此通過900GB/的帶寬實現超低功耗片間互聯。在大語言模型推理工作負載方面，GB200超級晶片的性能對比H100提升了多達30倍。不過代價也很大，GB200的功耗最高可達2700W，可以使用分冷，更推薦使用液冷。基於GB200超級晶片，NVIDIA打造了新一代的AI超級計算機“DGX SuperPOD”，配備36塊超級晶片，也就是包含36顆Grace...

英偉達發布Blackwell架構GPU：包括B200和GB200，大幅提升AI計算性能

在美國加州聖何塞會議中心舉行的GTC 2024大會上，英偉達創始人兼CEO黃仁勛英偉達創始人兼CEO黃仁勛帶來了Blackwell架構GPU，包括用於取代H100/H200的B200 GPU，另外還有與Grace CPU相結合的GB200。 B200採用了台積電（TSMC）改進的4NP定製工藝製造，整合了兩個獨立製造的Die，共有2080億個電晶體，將使用新的NVLink 5.0技術來連接兩塊晶片。其擁有160組SM，對應20480個核心，搭配的使192GB的HBM3E，提供了高達8TB/s的帶寬，功耗達到了700W。B200單個GPU提供了20 petaflops的AI性能，大概五倍於H100的4 petaflops。由於引入了第二代Transformer引擎，將有助於自動將模型轉換為適當的格式以達到最佳性能。此外，Blackwell架構GPU還支持新的FP6格式，這是一種介於FP4和FP8兩者之間的解決方案。暫時還不清楚台積電4NP工藝的細節，但密度方面應該不會有明顯的提升，而之前的H100基本上已經是一個完整的掩模版，晶片尺寸為814mm2，而理論最大值為858mm2。為此B200使用了兩個全尺寸掩模版製造的晶片，每個對應四個HBM3E堆棧，每個堆棧的接口為1024-bit、容量為24GB、帶寬為1TB/s。相比之下，每個H100晶片對應六個HBM3接口，意味著B200每個晶片可以減少內存控制器所需要的晶片面積，從而將更多的電晶體用於計算單元。此外，用於兩個晶片互連的NV-HBI接口也會占用一些空間。英偉達的Superchip被設計為人工智慧（AI）和高性能計算（HPC）工作負載的典型平台，這次將Blackwell架構GPU與Grace CPU結合推出了GB200 Grace Blackwell Superchip。其配備了兩個B200 GPU和一個Grace CPU，後者配有72核心的Arm Neoverse V2內核，可配置TDP高達2700W。新平台提供了40 PetaFlops的計算性能（INT8），並擁有864GB的龐大內存池，HBM3E具有16TB/s的內存帶寬，晶片之間通過3.6TB/s帶寬的NVLink進行互連。英偉達還帶來了全新的GB200 NVL72計算平台，這是一個全機架解決方案，有18個1U伺服器。其提供的FP8性能為720 petaflops，FP4計算性能為1440 petaflops，可處理多達27萬億個AI LLM參數模型。每台伺服器里帶有兩個GB200 Grace Blackwell Superchip，合計共有36個Grace...

英偉達Blackwell架構B100細節泄露：將配備192GB的8層堆疊HBM3E

GTC 2024大會將於2024年3月18至21日在美國加州聖何塞會議中心舉行，線上大會也將同期開放。這次英偉達會將重點放在人工智慧（AI）領域，在過去的一年裡，這是業界最熱門的話題。英偉達下一代面向伺服器產品的Blackwell架構也會登場，在數據中心市場繼續壓制其他競爭對手。此次的主題演講為「面向開發者的1# AI峰會（1# AI Conference for Developers）」，英偉達創始人兼CEO黃仁勛將登台亮相。隨著時間的臨近，有網友爆料稱，英偉達這次將發布Blackwell架構B100，採用了兩個基於台積電（TSMC）的CoWoS-L封裝技術的晶片，連接8個8層堆疊的HBM3E，容量達到了192GB。此外，英偉達大概會在一年後帶來B200，改用12層堆疊的HBM產品，容量達到了288GB。這意味著B100的顯存容量將達到AMDInstinct MI300X的水平，而且同樣8顆顯存晶片，HBM3E比起HBM3也更進了一步。CoWoS-L是台積電在去年推出的封裝技術，能夠製造更大的中間層，最初量產的目標時間是2025年，現在看來似乎還提前了。暫時還不清楚明年的B200升級的12層堆疊HBM產品是HBM3E還是HBM4，傳聞AMD也打算對Instinct MI300系列進行升級，將顯存從HBM3變成HBM3E，以提高部分工作負載下的性能表現。 ...

英偉達RTX 50系列GPU新爆料：GB203/205分別為256/192-bit位寬

近期接二連三傳出有關Blackwell架構遊戲GPU的消息，比如GeForce RTX 50系列採用的GDDR7是速率為28 Gbps的16Gb（2GB）模塊、可能還會支持24Gb（3GB）模塊、GB202的位寬到底是384-bit還是512-bit等。有網友帶來了新的爆料，稱GB203的位寬為256-bit，而GB205的位寬為192-bit。如果GB202的位寬真的是512-bit，那麼意味著次一級的GB203在位寬上僅有GB202的一半，傳聞SM數量也是如此，分別為96組和192組，兩者差距還挺大的。根據之前的說法，基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、 GB206和GB207五款晶片，與以往最大的不同，是AD104之後沒有GB204這款x04晶片，而是變成了x05的GB205。除了GB202、GB203和GB205以外，剩下的GB206和GB207兩款晶片的位寬都是128-bit。目前有關GB20x系列幾款晶片具體規格的信息並不多，與之前提早大面積被曝光的AD10x系列有很大的不同，事後也證明最初有關AD10x系列的規格是非常準確的，這也與英偉達因安全漏洞問題，大量機密信息被泄露有關。 GTC 2024大會將於2024年3月18至21日在美國加州聖何塞會議中心舉行，雖然安排的內容主要與人工智慧（AI）相關，涉及Blackwell架構的內容應該也是面向數據中心的產品，不過也能從側面讓大家了解到新一代架構的情況。 ...

傳RTX 50系列採用28Gbps的GDDR7，英偉達仍可能提供512-bit位寬

近期有關Blackwell架構遊戲GPU的消息似乎又多了起來，傳聞GeForce RTX 50系列採用的GDDR7是16Gb（2GB）模塊，還可能支持24Gb（3GB）模塊，另外GB20x系列在顯存接口配置上與AD10x系列相同，旗艦級顯卡最多也是384-bit，與現有產品一致。近日有網友透露，盡管首批GDDR7的速率達到了32 Gbps，不過GeForce RTX 50系列採用的GDDR7速率為28 Gbps，速度會慢一些。在顯存位寬一致的情況下，28 Gbps的GDDR7將比18 Gbps的GDDR6高出55%的帶寬，比21 Gbps的GDDR6X高出33%的帶寬。在首發產品上選擇更低的顯存速率，這種情況以前也發生過。英偉達首款採用GDDR6的顯卡來自GeForce RTX 20系列，雖然存儲廠商提供了16 Gbps的產品，但是英偉達最終將速率定在了14 Gbps。早在去年，三星就宣布完成了業界首款GDDR7晶片的開發工作。與現有GDDR6使用的NRZ/PAM2或GDDT6X的PAM4信號編碼機制不同，GDDR7採用的是PAM3信號編碼機制。NRZ/PAM2每周期提供1位的數據傳輸，PAM4每周期提供2位的數據傳輸，而PAM3每兩個周期的數據傳輸為3位。此外，傳聞GB20x系列裡的旗艦晶片GB202仍可能提供512-bit位寬，這意味著顯卡會擁有更大的顯存，同時GDDR7在速率28 Gbps的情況下，顯存帶寬比起AD102高出近80%。 ...

單卡功耗可達1400W 黃仁勛：下代GPU伺服器必須水冷

NVIDIA CEO黃仁勛在近日的2024 SIEPR經濟峰會上透露，下一代DGX GPU伺服器將會採用水冷散熱，整個系統非常壯觀(magnificent)、非常迷人(beautiful)。黃仁勛還提到，新一代DGX伺服器很快就會到來，暗示著Blacwell B100 GPU加速卡距離發布已經不遠了——官方只說2024年內，消息稱已提前到二季度。，NVIDIA明年還會推出升級版B200 GPU，最高功耗可達1000W，甚至有說法稱會有恐怖的1400W！ NVIDIA目前的主力AI GPU H100和升級版H200最大功耗為700W，核心面積814平方毫米，均只需風冷。 AMD MI300X則需要750W，但是面積也更大一些達到了1017平方毫米。現如今，伺服器和數據中心使用浸沒式液冷散熱已經稀鬆平常，但也有很多專家對這種發展途徑吃反對態度。 Moor Insights & Strategy的創始人、CEO兼首席分析師Patrick Moorhead就明確提出，為了提高性能，並控制合理的功耗、發熱，我們已經窮盡了手段，但接下來該怎麼辦？上液氮嗎？是時候重新思考了。來源：快科技

英偉達在RTX 50系列維持現顯存接口配置：最高端GPU顯存仍為384位

GTC 2024大會將於2024年3月18至21日在美國加州聖何塞會議中心舉行，英偉達很可能會選擇在這次活動上帶來有關Blackwell架構的最新消息，主要涉及的是數據中心產品。傳聞下一代遊戲GPU同樣是Blackwell架構，不過近期流出的信息相對較少。近日有網友透露，GB20x系列在顯存接口配置上與AD10x系列相同，這意味著不會有512-bit位寬的產品，旗艦級顯卡最多也是384-bit。圖：已故美國統計學家和數學家David Harold Blackwell 雖然顯存位寬沒有增大，但是下一代GPU將支持GDDR7，顯然會帶來更高的帶寬。此前有報導稱，首批支持GDDR7的GPU使用16Gb（2GB）模塊，不排除也會有採用24Gb（3GB）模塊的產品，以便在顯存位寬沒有增大時可以提升顯存的容量。去年三星就已完成業界首款GDDR7晶片的開發工作，每個數據I/O接口的速率達到了32Gbps，意味著同樣是384-bit的情況下，提供了高達1.536 TB/s的帶寬，遠超目前GeForce RTX 4090的1.008 TB/s。有消息指出，Blackwell架構會有較大的變化，SM和CUDA將有一個新的結構，RT單元有可能被PT單元所取代，光線追蹤性能也會得到進一步優化和加強。據稱，基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、 GB206和GB207五款晶片，對應的顯存位寬分別是384-bit、256-bit、192bit、128-bit和128-bit，與以往最大的不同，是AD104之後沒有GB204這款x04晶片，而是變成了x05的GB205。 GB20x系列GPU預計採用台積電（TSMC）的3nm工藝製造，並支持DisplayPort 2.1顯示輸出。 ...

功耗高達1000W NVIDIA B200 GPU加速器明年到來

根據各方信息和路線圖，NVIDIA預計會在今年第二季度發布Blackwell架構的新一代GPU加速器“B100”，官方稱，是現在H200的兩倍甚至更多。 B100之後，還有更強大的升級版B200，一如現在H100、H200的關系。戴爾營運長兼副董事長在最近的一次會議中確認了B200的存在，發布時間在明年。他沒有披露更具體的規格，比如升級之處，但聲稱戴爾有能力搞定單顆GPU 1000W的功耗，甚至不需要液冷，這無疑是在暗示B200的功耗將大幅提高。相比之下，H100 SMX版本的峰值功耗為700W。 NVIDIA GTC 2024圖形技術大會將於3月18-21日舉行，必然會披露新一代GPU加速器的情況，甚至有可能正式宣布。來源：快科技

Dell確認英偉達明年推出Blackwell架構B200，功耗或達到1000W

去年10月，英偉達在投資者簡報中介紹了包括HBM3e、PCI Express標准（6.0/7.0）更新和多GPU互聯技術更新等內容，還放出了產品路線圖，上面展示了其2024年至2025年數據中心的規劃，將帶來基於Blackwell架構的GB200NVL、GB200、B100和B40等產品。近日Dell營運長Jeff Clarke接受了媒體的采訪，表示對接下來的B100和B200感到興奮，其工程團隊已經為英偉達的新款數據中心產品做好了准備，為每個GPU帶來了滿足1000W功耗所需的散熱解決方案，明年的B200有機會讓Dell展示工程技術及為此所做的相關工作，期間運用了大量的專業知識讓液體冷卻可以大規模運行。其中我們可以了解到，英偉達還有一款名為B200的產品，這是之前放出的產品路線圖上所沒有的，而現有H200的接替者是B100，針對不同的應用場景還將提供GB200和GB200NVL。同時作為英偉達在數據中心領域主要的合作夥伴之一，Dell的高管還確認了B200的發布時間為2025年。此外，B200的功耗有可能達到1000W的水平，而目前H100 SXM的功耗為700W。已經有媒體聯系英偉達和Dell想進一步了解B200的消息，不過都被拒絕了。GTC 2024大會將於2024年3月18至21日在美國加州聖何塞會議中心舉行，英偉達很可能會選擇在這次活動上帶來有關Blackwell架構的最新消息。 ...

黃仁勛預警：下一代GPU 會非常難買

無論遊戲顯卡還是AI加速卡，NVIDIA GPU如今都是現象級的存在，尤其是AI加速卡，賣十幾萬都被瘋搶，訂單往往能排好幾個月，導致遊戲顯卡的產能也很緊張。 NVIDIA早就確認，，可以輕松搞定1730億參數的大語言模型，是現在H200的兩倍甚至更多。至於具體時間，曝料稱原計劃是第四季度，但提前到了第二季度。季度財報發布後的溝通會上，黃仁勛在接受采訪時表示：“我們所有的產品，都是嚴重供不應求，這也是新產品的天然屬性，所以我們在竭盡可能滿足需求，只不過整體來看，我們的需求增長實在太快了。” NVIDIA CFO Colette Kress也補充說：“我們預計下一代產品的供應會非常緊張，因為需求遠遠超過了供應能力。” 至於RTX 50系列顯卡，很可能要等到今年底才會發布。想買也不一定有啊來源：快科技

英偉達預計Blackwell架構GPU供應依然受限：市場需求遠遠超過供應量

此前有報導稱，由於人工智慧（AI）需求激增，市場需要性能更強大的解決方案，英偉達已經決定將下一代Blackwell架構GB100 GPU的發布時間從2024年第四季度提前到2024年第二季度末，在數據中心市場繼續壓制其他競爭對手。同時英偉達已經與SK海力士達成協議，選擇在新一代B100計算卡上採用後者面向人工智慧的超高性能DRAM新產品HBM3E。據Seeking Alpha報導，雖然目前用於AI和HPC的H100計算卡交貨時間大幅度縮短，不過下一代基於Blackwell架構的新品在供應方面並不樂觀。英偉達首次財務官Colette Kress在與金融分析師和投資者舉行的財報電話會議上表示，由於需求遠遠超過供應，預計下一代產品的供應將受到限制。傳聞已經有英偉達的客戶預訂了少量的B100計算卡，問題是真正發布後，採用全新組件的B100 SXM和B100 PCIe及配套的DGX伺服器，能以多快的速度提高產量。如果市場需求巨大，那麼很可能重演H100發貨初期出現的大面積延遲情況。基於Blackwell架構的GB100 GPU採用小晶片設計和MCM封裝，可以更容易地提升晶片的產品，但是多晶片封裝解決方案也可能讓後期的封裝工作變得更加復雜。除了B100以外，英偉達還准備了用於企業和訓練應用的B40，以及結合了B100和Grace CPU的GB200產品，另外還有用於大型語言模型訓練的GB200 NVL。 ...

三星GDDR7顯存將達37GHz RTX 5090有望首發

快科技1月30日消息，三星、SK海力士都將在2月20日的ISSCC 2024國際固態電路大會上，首次展示下一代高速GDDR7顯存，但規格略有不同。 GDDR7顯存不僅會按慣例繼續提升速度，還會改進功耗，為此引入PAM3、NRZ信號調制機制，能在和GDDR6/6X差不多的功耗上帶來更高性能。三星GDDR7將達到驚人的37GHz等效頻率，SK海力士的則是35.4GHz，對比當下美光GDDR6X 19-24GHz有著質的飛躍。 37GHz的高頻率下，GDDR7即便搭配256-bit位寬也能提供1.18TB/的帶寬，超過384-bit 24GHz GDDR6。如果搭配384-bit位寬，32GHz GDDR7的帶寬就將有幾乎1.8TB/，相比於RTX 4090領先足足80％，並且差不多是RX 7900 XTX的兩倍。美光的GDDR7有望在今年上半年搶先推出，三星、SK海力士沒有公布具體時間，但也應該在今年內。顯卡方面，NVIDIA Blackwell RTX 50系列有非常大的希望首發採納GDDR7。 AMD RDNA4 RX 8000系列還不好說，暫時放棄旗艦卡，而出於成本考慮，可能不會急著上GDDR7。來源：快科技

RTX 50有望明年底發布：開始放肆擠牙膏了

快科技12月29日消息，，RTX 40 SUPER系列即將登場，而下一代的RTX 50系列，也不會太遠了，最新說法稱可能會在2024年第四季度內發布，但具體時間待定。 RTX 50系列架構代號Blackwell，該架構既用於AI計算卡B100，也用於遊戲卡，但優先級顯然前者更高，據說發布時間已經從原計劃的2024年第四季度提前到第二季度。畢竟，NVIDIA數據中心GPU上的收入是遊戲GPU收入的多達五倍。 Blackwell架構的具體情況不詳，但是提升幅度要比Ada Lovelace相對於Ampere的變化更小。再加上AMD下一代的RNDA4架構不會有旗艦型號，NVIDIA在遊戲卡上的壓力變得小得多，在升級換代的步伐上自然可以不緊不慢。根據傳聞，Blackwell架構的RTX 50系列將採用台積電3nm工藝製造，官方稱同等電晶體數量、功耗下的性能可提升15％。 RTX 50系列將有GB202、GB203、GB205、GB206、GB207等不同核心晶片，首次升級PCIe 5.0，並支持DisplayPort 2.1，還會升級新版的12V-2x6 16針供電接口，更穩定更安全。來源：快科技

RTX 50系列遊戲顯卡或在2024Q4到來，疊代性能提升幅度進一步減小

去年的Arete技術大會上，英偉達副總裁兼加速計算首席總監Ian Buck重申了英偉達致力於每兩年更新主要GPGPU架構的計劃，確認Blackwell架構GPU將會在2024年推出，將首先用於數據中心產品，而GeForce顯卡則要等到2025年。近日Moore's Law is Dead表示，搭載Blackwell架構GPU的GeForce RTX 50系列遊戲顯卡已改在2024年第四季度發布，具體時間還要看Ada Lovelace架構產品的銷售情況，以及競爭對手AMD新一代產品的性能水平。圖：已故美國統計學家和數學家David Harold Blackwell 據了解，Blackwell架構相對於Ada Lovelace架構的提升幅度比Ada Lovelace架構相對於Ampere架構更小，對遊戲玩家來說這肯定不是一個好消息。目前英偉達數據中心GPU的營收是遊戲GPU的五倍，而且傳聞AMD下一代RDNA 4架構不會有旗艦型號，隨著業務重心的遷移及競爭壓力減小，似乎英偉達升級換代的步伐也有所減緩。此前有報導稱，基於Blackwell架構的GeForce RTX 50系列GPU將改用台積電（TSMC）3nm工藝製造。按照台積電過去的說法，比起現有的5nm製程節點，在相同功耗和電晶體數量情況下，3nm製程節點能帶來15%的性能提升。有傳言稱，GeForce RTX 50系列GPU將會有GB202、GB203、GB205、 GB206和GB207五款晶片，採用PCIe 5.0接口，支持DisplayPort 2.1顯示輸出，同時會配備新款的「12V-2×6」連接器。 ...

RTX 50系列GPU將採用台積電3nm工藝，英偉達為其配備DP 2.1接口

目前英偉達基於Ada Lovelace架構的GeForce RTX 40系列GPU不支持DisplayPort 2.1和PCIe 5.0等關鍵技術，部分用戶認為英偉達在一些策略上似乎有點顯得有些過於保守。近日有網友透露，基於Blackwell架構的GeForce RTX 50系列GPU將改用台積電（TSMC）3nm工藝製造。按照台積電過去的說法，比起現有的5nm製程節點，在相同功耗和電晶體數量情況下，3nm製程節點能帶來15%的性能提升。圖：已故美國統計學家和數學家David Harold Blackwell GeForce RTX 50系列GPU另一項重要更新是支持DisplayPort 2.1，但暫時還不清楚具體是哪個標准。AMD已經在現有RDNA 3架構的Radeon RX 7000系列GPU上引入了對DisplayPort 2.1的支持，滿足了UHBR13.5連結速率（54Gbps）的要求，如果是用於工作站的Radeon Pro W7000系列GPU，更是能支持UHBR20鏈路速率（80Gbps）。此外，GeForce RTX 50系列GPU也將採用PCIe 5.0接口，同時會配備新款的「12V-2×6」連接器。「12V-2×6」是基於即將發布的CEM 5.1規范，尖端向內偏移量由之前的0.45mm改為1.7mm。相比於原有的設計，新的連接器縮短了感測引腳（定義瓦數的四個數據引腳），如果沒有完全接入12VHPWR線纜，將被限制供電，以防止功率過高出現的過熱熔化。根據之前的說法，基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、 GB206和GB207五款晶片，與以往最大的不同，是AD104之後沒有GB204這款x04晶片，而是變成了x05的GB205。 Display，這也導GeForce...

RTX 50系列旗艦GPU將改用GDDR7，英偉達仍採用384位顯存位寬

去年的Arete技術大會上，英偉達副總裁兼加速計算首席總監Ian Buck重申了英偉達致力於每兩年更新主要GPGPU架構的計劃，確認Blackwell架構GPU將會在2024年推出，將首先用於數據中心產品，而GeForce顯卡則要等到2025年。近日有網友表示，GeForce RTX 50系列旗艦GPU不再使用GDDR6X，將改用GDDR7，不過顯存位寬仍保持在384位，而不是之前傳言裡的512位。目前三星已經完成了業界首款GDDR7晶片的開發工作，每個數據I/O接口的速率達到了32Gbps，首款16Gb的GDDR7晶片在位寬為384位的情況下，能提供了高達1.536 TB/s的帶寬。圖：已故美國統計學家和數學家David Harold Blackwell 根據之前的說法，基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、 GB206和GB207五款晶片，與以往最大的不同，是AD104之後沒有GB204這款x04晶片，而是變成了x05的GB205。此外，GeForce RTX 50系列會採用PCIe 5.0接口，而基於GB102的頂級型號將擁有192組SM，即24567個CUDA核心，L2緩存為128MB，或許還會改用台積電（TSMC）3nm工藝製造。傳聞用於GeForce RTX 50系列的Blackwell架構GPU仍然是單晶片設計，只有數據中心產品才會採用MCM封裝。雖然Blackwell架構不是全新的設計，不過英偉達仍進行較大規模的修改，SM和CUDA會有一個新的結構，RT單元有可能被PT單元所取代，光線追蹤性能也會得到進一步優化和加強。 ...

AI太火 NVIDIA躺贏下一代GPU提前半年問世

據曝料，NVIDIA下一代Blackwell B100 GPU原計劃在2024年第四季度發布，但眼下AI需求實在是太火爆了，發布時間提前到了第二季度。 Blackwell架構將通吃高性能計算、遊戲，前者核心編號B100，後者核心編號B20x系列，當然遊戲卡不會著急，肯定要等到2025年。還有報導稱，B100計算卡將會獨家採用韓國SK海力士的下一代HBM3e高帶寬內存。 NVIDIA已經在8月份拿到SK海力士HBM3e的早期樣品，預計明年初獲得正式版本，進行最終的質量測試。目前，NVIDIA已經占據AI GPU市場多達90％的份額，A100、H100都是一卡難求，產能極為緊張。來源：快科技

英偉達將提前發布Blackwell架構GB100：改至2024Q2，搭配HBM3E

此前有報導稱，英偉達近期與台積電簽下了3nm工藝的訂單，提前至2024年第四季度推出Blackwell架構GB100，採用小晶片設計和MCM封裝，在數據中心市場繼續壓制其他競爭對手，而用於GeForce顯卡的Blackwell架構GPU要等到2025年，沿用單晶片設計。據Wccftech報導，由於人工智慧（AI）需求激增，市場需要性能更強大的解決方案，英偉達已經決定將下一代Blackwell架構GB100 GPU的發布時間從2024年第四季度提前到2024年第二季度末。同時英偉達已經與SK海力士達成協議，選擇在新一代B100計算卡上採用後者面向人工智慧的超高性能DRAM新產品HBM3E。傳聞英偉達從2023年6月以來一直在加快Blackwell架構GB100 GPU的開發進度，並在8月收到了SK海力士提供了首批HBM3E樣品。考慮到大批量生產的質量問題，SK海力士將會在明年初向英偉達提供晶片進行最終的測試。憑借Ampere架構的A100和Hopper架構的H100，英偉達已經占據了人工智慧GPU市場90%以上的份額，Blackwell架構的B100將進一步鞏固英偉達在人工智慧市場的領導地位。有業內人士透露，如果沒有SK海力士的HBM3E，英偉達的B100計算卡將無法銷售，一旦HBM3E達到英偉達制定的質量標准，簽下供應合同只是時間問題。根據英偉達近期的介紹，B100後續的X100也被提上了日程，預計會在2025年發布。 ...

英偉達公開2024-2025年數據中心路線圖：確認GB200和GX200

近日，英偉達在投資者簡報中介紹了包括HBM3e、PCI Express標准（6.0/7.0）更新和多GPU互聯技術更新等內容，同時還放出了產品路線圖，上面展示了其2024年至2025年數據中心的規劃，非常地齊全。英偉達最近幾年在分享路線圖方面較為保守，可能涉及到市場競爭加劇及製程工藝等多方面挑戰，並不會輕易給出具體的時間點。去年的Arete技術大會上，英偉達副總裁兼加速計算首席總監Ian Buck重申了英偉達致力於每兩年更新主要GPGPU架構的計劃，確認Blackwell架構GPU將會在2024年推出。預計GTC 2024年可能是Blackwell架構將首次登場，用於數據中心和人工智慧領域的產品，消費級GeForce顯卡要等到2025年。根據這次英偉達公布的2024年至2025年數據中心路線圖，目前基於Hopper架構的GH200將會在2024年至2025年之間被基於Blackwell架構的GB200，一年之後還會有GX200。英偉達這次的路線圖證實了GB200是用於數據中心，而不是之前一直傳聞的GB100/102，對應的產品名稱是B100等。 Blackwell架構是一個跨越數據中心到消費端的新一代架構，涵蓋計算卡、遊戲顯卡、人工智慧（AI）和視覺運算等產品，其他產品的一些代號還有待確認。此外，Blackwell之後英偉達使用的是「X」，暫時無法確定是紀念哪一位科學家。此外，英偉達的架構更新周期一般在兩年左右，而Blackwell到「X」僅相隔一年，這速度似乎有點太快了。 Blackwell的名字來自於已故的美國統計學家和數學家David Harold Blackwell（1919–2010），在伊利諾伊大學厄巴納香檳分校分別於1938、1939年和1941年獲得數學學士、碩士和博士學位，1947年成為霍華德大學全職教授，1954年他進入加州大學伯克利分校直到退休，並成為該校歷史上首位黑人終身教授，1965年當選為美國科學院首位黑人院士。 ...

英偉達Blackwell架構GPU更多細節曝光：GB100/202分別會有160/192組SM

此前有報導稱，英偉達近期與台積電簽下了3nm工藝的訂單，提前至2024年第四季度推出Blackwell架構GB100，在數據中心市場繼續壓制其他競爭對手，而用於GeForce顯卡的Blackwell架構GPU要等到2025年。傳聞面向數據中心的GB100系列採用小晶片設計和MCM封裝，而面向遊戲和工作站的GB200系列仍然堅持單晶片設計。近日有網友透露，GB100共有8組GPC，每組GPC里含有10個TPC，而每個TPC帶有2個SM，也就是說有160組SM。如果每組SM有128個CUDA / FP32核心，那麼總是就達到20480個搭。與其搭配的顯存位寬為8192位，有可能採用的是HBM3E。圖：已故美國統計學家和數學家David Harold Blackwell GB200系列裡最高端的是GB202，結構上與GB100有所不同。GB202共有12組GPC，每組GPC里含有8個TPC，而每個TPC帶有2組SM，共計192組SM，對應的就是24567個CUDA核心，搭配的顯存為512位，有可能採用GDDR7。 GB202的這一規格與之前傳聞的GeForce RTX 5090情況基本相同，不過英偉達似乎還沒有確定新一代旗艦型號的具體規格，也就是說最終的產品在規格參數上可能會有不同。有消息指出，Blackwell架構會有較大的變化，SM和CUDA將有一個新的結構，RT單元有可能被PT單元所取代，光線追蹤性能也會得到進一步優化和加強。據稱，基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、 GB206和GB207五款晶片，與以往最大的不同，是AD104之後沒有GB204這款x04晶片，而是變成了x05的GB205。 ...

NVIDIA明年上馬3nm 私人定製但不是遊戲卡

快科技9月26日消息，NVIDIA將在明年推出採用台積電3nm級工藝的下一代高性能計算GPU Blackwell GB100，以及下一代加速卡B100。 NVIDIA現有的GH100 GPU使用的是台積電4nm工藝，而且是定製版。台積電3nm有多種版本，包括性能增強版N3P、高性能計算專屬N3X，NVIDIA GB100具體用哪個尚不清楚，估計很可能也會是定製版本。事實上，NVIDIA Ampere、Ada Lovelace使用的台積電工藝，同樣都有很大的定製成分。至於下一代遊戲顯卡GB20x GPU，應該也會是台積電3nm工藝代工，但要到2025年才能見到了。蘋果是迄今唯一推出3nm工藝的廠商，A17 Pro用的是台積電第一代N3B，而聯發科已經使用第二代N3E工藝，完成下一代旗艦天璣9400的流片。未來兩年，Intel、AMD、高通等也都會紛紛升級台積電的3nm工藝。來源：快科技

英偉達已向台積電3nm工藝下單，Blackwell架構B100將於2024Q4到來

目前台積電（TSMC）已量產了3nm工藝，不過直到現在也僅有蘋果一個大客戶下單，且搭載於iPhone 15 Pro系列的A17 Pro在能效方面的表現並不太好。傳聞台積電3nm工藝報價達到2萬美元的高價，加上半導體行情持續低迷，不少台積電的大客戶都修改了原定的計劃，推遲採用3nm工藝，至少要等到2024年下半年才導入。憑借人工智慧（AI）對數據中心GPU的強勁需求，英偉達是少數能在市場不景氣的大環境裡逆勢而起的科技公司，大量的訂單一定程度上彌補了台積電營收下降的缺口。據DigiTimes報導，英偉達近期還與台積電簽下了3nm工藝的訂單，而且打算趁熱打鐵，提前至2024年第四季度推出Blackwell架構B100，在數據中心市場繼續壓制其他競爭對手，早於原來計劃的2025年。 AMD最早採用3nm工藝的是EPYC伺服器處理器，如無意外也會在2024年下半年出現。隨著市場回暖，高通和聯發科也計劃在2024年下半年採用台積電的3nm工藝。雖然三星更早進入3nm代工市場，不過截至目前幾乎所有大的訂單都是集中在台積電手上。此前有報導稱，台積電的3nm產能利用率可能會下降，2024至2025年年間大概在每月7萬片到8萬片晶圓。即便現在接連傳出利好消息，台積電的3nm產能規劃仍然比較保守，現階段對2024年3nm月產能規劃也就提升至10萬片晶圓。值得注意的還有英特爾，由於高度不確定性，台積電並沒有將其納入統計中。如果下一代ArrowLake如傳言那樣將部分計算模塊改用台積電的3nm工藝，那就是額外的進補。 ...

傳英偉達將RTX 5090的CUDA核心數量增加50%，性能是前一代產品的1.7倍

近日，有網友在CHH上透露了英偉達下一代旗艦GeForce RTX 5090的一些情況，表示相比前一代產品，CUDA核心數量增加50%、顯存帶寬提升52%、緩存提升78%（應該是L2緩存）、頻率還會有15%提升，綜合起來性能是GeForce RTX 4090的1.7倍。這意味著，GeForce RTX 5090擁有192組SM，即24567個CUDA核心，頻率達到了2.9 GHz左右，L2緩存為128MB，而顯存位寬可能為512位，配備速率為24 Gbps的GDDR6X顯存，顯存帶寬大概在1.53 TB/s左右。目前三星已經完成了業界首款GDDR7晶片的開發工作，每個數據I/O接口的速率達到了32Gbps，首款16Gb GDDR7晶片在位寬為384位的情況下，提供了高達1.536 TB/s的帶寬，或許英偉達會改用GDDR7。根據英偉達的計劃安排，GeForce RTX 50系列GPU要到2025年才出來，距離現在還有一年多的時間，一切似乎還言之過早。此前同一位網友曾表示，基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、 GB206和GB207五款晶片，與以往最大的不同，是AD104之後沒有GB204這款x04晶片，而是變成了x05的GB205。近日有報導稱，基於Blackwell架構的數據中心產品將改用小晶片設計，採用MCM多晶片封裝。不過消費級產品似乎繼續採用單晶片設計，最大優勢是時間可控及低風險，可以按時生產產品。傳聞英偉達將對Blackwell架構進行較大規模的修改，雖然不是全新的設計，不過SM和CUDA會有一個新的結構，RT單元有可能被PT單元所取代，光線追蹤性能也會得到進一步優化和加強。 ...

RTX 5090頻率破3GHz、顯存上GDDR7？AMD表示有點絕望

Blackwell RTX 50系列還要兩年左右才會正式登場，但傳聞已經開始出現了，當然開發工作現在還處於非常早期的階段，各種說法都會有甚至互相矛盾，大家看看就好了。曝料高手kopite7kimi的說法指出，，但是核心數量不會增加太多，同時高性能計算版本GB100將會首次引入MCM多晶片整合封裝，GB20x系列遊戲卡核心則繼續單晶片。還有說法稱，Blackwell架構的旗艦顯卡(按慣例叫做RTX 5090)，將會實現50％的規模提升、52％的顯存帶寬提升、78％的緩存提升、15％的頻率提升，綜合性能可提升多達1.7倍！所謂規模提升不清楚具體指的是什麼，按理說應該是CUDA核心數量，但是和之前的曝料矛盾。顯存帶寬提升52％，那必然要上下一代GDDR7。 RTX 4090 GDDR6顯存位寬是384-bit，頻率是21GHz，對應帶寬約1TB/，提升一半就是1.5TB/，位寬不變就需要32GHz的超高頻率。也有說法稱位寬會增加到512-bit，顯存頻率就只需要28GHz，但這種可能性比較小。緩存增加72％，那就是從現在的72MB變成128MB，而大緩存對高顯存位寬的需求更低，512-bit更不可能了。頻率提升15％，那就是2.9GHz左右，實際肯定能超過3GHz，但是頻率肯定是最後階段才確定的。來源：快科技

NVIDIA下一代GPU架構巨變首次上馬多晶片學習AMD/Intel

NVIDIA RTX 40系列、AMD RX 7000系列……這一代顯卡都已經布局完畢，而下一代還要等差不多兩年，至少NVIDIA Blackwell在路線圖上看要到2025年才會推出——明年來一波Super系列？ 2021年就第一個曝出Blackwell這個代號的曝料高手kopite7kimi給出的最新說法稱，Blackwell不會明顯增加GPC、TPC等計算單元的數量，CUDA核心數自然也不會大幅提升，但是會在基礎架構上做出巨大的革新。考慮到現在的Ada Lovelace架構已經有著極高的能效，Blackwell如果繼續大改，表現自然會更加出色，對手也更加追趕無望。另一方面，Blackwell似乎和當年的Fermi架構在設計理念上有些類似，針對高性能計算、遊戲渲染進行統一設計，而不再兵分兩路。從目前的跡象看，Blackwell的高性能計算分支有GB100、GB102兩種核心，遊戲部分則有GB202、GB203、GB205、GB206、GB207五種核心。 kopite7kimi透露，Blackwell的高性能計算版本GB100將首次引入MCM多晶片整合封裝，不像現在的GH100、GA100那樣是一個龐大的單晶片。這倒是和AMD MI300系列、Intel Ponte Vecchio有著異曲同工之妙，通過多個模塊分立式架構設計再整合封裝的做法，提高性能、技術的靈活性，也有利於降低成本。順帶一提，技嘉之前曾經提到過，GB100的功耗會再次飆升。不過，GB20x系列遊戲卡核心，應該還是單晶片，這倒是和AMD Navi 31/32不一樣。來源：快科技

Blackwell架構GPU或改用小晶片設計，英偉達在GB100上採用MCM封裝

去年的Arete技術大會上，英偉達副總裁兼加速計算首席總監Ian Buck重申了英偉達致力於每兩年更新主要GPGPU架構的計劃，確認Blackwell架構GPU將會在2024年推出。預計GTC 2024年可能是Blackwell架構將首次登場，用於數據中心和人工智慧領域的產品，消費級GeForce顯卡要等到2025年。近日有網友透露，基於Blackwell架構的GB100可能會選擇小晶片設計，採用MCM多晶片封裝，這將是英偉達產品線的一大進步。另外有消息指出，Blackwell架構GPU的GPC或TPC數量不會明顯增加，但是單位架構上會有很大變化。最初傳出Blackwell架構消息的時候，就被認為是英偉達首個採用小晶片設計的GPU。不過隨後有傳言稱，英偉達可能堅持使用單晶片設計。事實上，單晶片和小晶片設計都有各自的優缺點，不過考慮到性能提升所需要的成本和效率，競爭對手英特爾和AMD紛紛轉向小晶片設計，結合更為先進的封裝技術。需要說明的是，採用小晶片設計的Blackwell架構GPU面向的是數據中心和人工智慧領域，已知會有GB100和GB102兩款GPU。消費級GeForce顯卡所使用的Blackwell架構GPU仍可能堅持單晶片設計，屬於GB200系列。傳聞英偉達正在評估三星3nm GAA工藝，如果一切順利，預定在2025年量產。不過似乎並不會用於Blackwell架構GPU，至少用於數據中心和人工智慧領域的產品仍然會選擇台積電代工，三星代工的有可能是其他產品。 ...

傳英偉達GeForce RTX 50系列陣容：從GB202至GB207共五款晶片

去年的Arete技術大會上，英偉達副總裁兼加速計算首席總監Ian Buck重申了英偉達致力於每兩年更新主要GPGPU架構的計劃，確認Blackwell架構GPU將會在2024年推出。預計Blackwell架構將會在伺服器產品中首次登場，GeForce顯卡則要等到2025年才會出現。近日有網友在CHH上表示，英偉達下一代基於Blackwell架構的GeForce RTX 50系列陣容，將會有GB202、GB203、GB205、 GB206和GB207五款晶片。與以往最大的不同，AD104之後沒有GB204這款x04晶片，而是變成了x05的GB205，這可能與英偉達市場策略的定位策略改變有關。圖：已故美國統計學家和數學家David Harold Blackwell 預計GeForce RTX 50系列陣容定位： GB202 - 超級發燒友 GB203 - 發燒友 GB205 - 高端 GB206 - 主流 GB207 - 入門傳聞用於GeForce RTX 50系列的Blackwell架構GPU仍然是單晶片設計，數據中心產品則採用MCM封裝。在消費級上延續單晶片設計的最大優勢是時間可控及低風險，可以按時生產產品。英偉達將對Blackwell架構進行較大規模的修改，雖然不是全新的設計，不過SM和CUDA會有一個新的結構，RT單元有可能被PT單元所取代，光線追蹤性能也會得到進一步優化和加強。此外，GeForce RTX 50系列會採用PCIe 5.0接口，GPU核心頻率將達到3GHz或以上。基於GB102的RTX...

RTX 50五大核心集體曝光：不一樣了 512位顯存王者歸來？

Ada Lovelace RTX 40系列已經布局完畢，而根據路線圖，NVIDIA的下一代遊戲顯卡要到2025年才會推出，代號“Blackwell”(布萊克維爾)，根據此前說法，Blackwell有望採用台積電3nm工藝製造，首次引入MCM多晶片封裝，SM單元結構全新變革，RT光追單元引入降噪加速器而大幅提升性能，顯存或許有望升級GDDR7。根據曝料高手kopite7kimi給出的說法，NVIDIA下一代GPU核心將有五款，編號分別是GB202、GB203、GB205、GB206、GB207。看出什麼問題了嗎？提示一下，RTX 30 Ampere的核心編號是GA102、GA103、GA104、GA106、GA107，RTX 40 Ada的核心編號則是AD102、AD103、AD104、AD106、AD107。對比來看，x04核心不見了，取而代之的是x05。按理說，單純的數字編號並無太大實際意義，想怎麼叫都可以，但是有說法稱，x04級別的核心經過三代妥協之後，已經完成了歷史使命，新的市場定位即將形成。具體什麼意思暫時沒有明確說法，猜測和顯存位寬有關。 RTX 40 Ada時代，NVIDIA走的是“重緩存輕顯存”路線，通過增大內部緩存，減少對顯存位寬、帶寬的依賴。這在技術上是沒有問題的，但問題是NVIDIA把位寬砍下來的同時，產品型號命名卻強行提高，再加上價格持續走高，自然讓玩家無法接受。 NVIDIA必然也會意識到這一問題，下一代產品肯定要做出改變。有一種猜測認為，GB20x系列五種核心對應的顯存位寬應該分別是512-bit、384/320-bit、192-bit、128-bit、64-bit。當然，就算有512-bit，也幾乎不可能做成遊戲卡，而是偏向計算卡、專業卡。來源：快科技

12 Page 1 of 2

Tag: Blackwell