英偉達 Archives

聯發科或與英偉達合作，開發遊戲掌機使用的SoC

此前有報導稱，聯發科與英偉達展開合作，開發面向Windows PC的Arm處理器，挑戰高通的驍龍X系列，最終目標是進入高端筆記本電腦市場。傳聞新款晶片將在2024年第三季度完成設計，第四季度進入驗證階段，採用台積電3nm工藝製造，並計劃2025年發布。聯發科與英偉達的合作似乎不僅僅局限於AI PC以及汽車領域，可能還會擴展到其他細分市場。近日有網友透露，聯發科正在開發帶有英偉達GPU的SoC，瞄準最近兩年變得火熱的遊戲掌機領域。傳聞英偉達對任天堂感到沮喪，不過也看到了遊戲掌機市場的巨大潛力。這並非英偉達第一次涉足遊戲掌機市場，多年前就曾帶來NVIDIA SHIELD掌機，搭載了Tegra系列晶片，只是不太成功。隨後英偉達與任天堂合作，為Nintendo Switch系列提供了半定製SoC。這次重新嘗試進入遊戲掌機市場，英偉達選擇了與聯發科合作，一些中國大陸廠商已經對這款SoC表達了興趣。遊戲掌機市場似乎是一次機遇，AMD早已行動，為Valve的Steam Deck掌機提供了代號Van Gogh的定製APU以及為華碩的ROG掌機提供了Ryzen Z1系列晶片，加上其他各類Windows遊戲掌機大多選擇使用Ryzen晶片，取得了不錯的收益和市場口碑。 ...

英偉達Blackwell架構計算卡或3萬美元起步，AI伺服器高達300萬美元

今年3月，在美國加州聖何塞會議中心舉行的GTC 2024大會上，英偉達創始人兼CEO黃仁勛帶來了Blackwell架構GPU，包括用於取代H100/H200的B200 GPU，還有與Grace CPU相結合的GB200，未來還將帶來其他不同規格和類型的產品。據Wccftech報導，基於Blackwell架構的晶片是目前世界上最快的AI晶片，也是迄今為止最昂貴的晶片。雖然英偉達要等到今年下半年開開始出貨基於Blackwell架構的各類產品，但是預訂的價格已經被推得相當高。來自匯豐銀行的分析師預計，GB200 NVL36/NVL72計算平台的定價分別為180萬美元和300萬美元，GB200的定價為6萬至7萬美元，B100的定價為3萬至3.5萬美元。分析師提供的定價可能還沒有考慮到市場的狀況，比如購買量和其他因素。根據不同買家購買的類型和訂單數量，實際數字可能會更高或者更低。如果與過去幾代產品比較，Blackwell架構的產品仍然要更貴一些。除了人工智慧市場的火熱影響了供需關系，Blackwell架構的高昂開發成本也可能是原因之一。此前有報導稱，英偉達為了盡可能滿足市場對新產品的期待，前後花費了100億美元開發基於Blackwell架構的平台，這是其創紀錄的研發投入。 ...

聯發科攜手英偉達推進Arm處理器開發：用於AI PC，計劃2025年發布

去年就有報導稱，聯發科與英偉達展開合作，開發面向Windows PC的Arm架構處理器，而且會在首款產品上採用台積電（TSMC）的2.5D封裝，最終目標是進入高端筆記本電腦市場。據Notebookcheck報導，聯發科希望能在Windows PC領域挑戰高通的驍龍X系列，選擇了與GPU巨頭英偉達並肩作戰，爭奪AI PC市場份額。有消息稱，新款晶片將對標蘋果M4，預計2024年第三季度完成設計，第四季度進入驗證階段，將採用台積電3nm工藝製造，並計劃2025年發布。聯發科與英偉達合作開發的這款晶片並不便宜，傳聞定價可能高達300美元（約合人民幣2167.86元）。據了解，新款SoC定價如此之高，可能與製造工藝有關，台積電在新一代製程節點上的收費高達每片晶圓2萬美元，明顯高於舊的製程節點。聯發科有可能選擇在今年Computex 2024上公布用於AI PC的Arm架構處理器，宣布進軍Windows PC市場。前一段時間，Arm執行長Rene Haas在與金融分析師的電話會議上表示，未來12到36個月內，將會有多家晶片設計公司為Windows on Arm提供服務，迎來供應商產品的多樣化，為終端消費者提供多種不同定位、不同價格、以及不同使用體驗的晶片。 ...

英偉達首批Blackwell架構遊戲顯卡包括RTX 5090/5080，兩者或相隔數周上市

今年英偉達將發布新一代遊戲顯卡，基於Blackwell架構的Geforce RTX 50系列，預計最快會在今年第四季度到來，與之前的Geforce RTX 30/40系列一樣，初期將專注於高端產品。過去一段時間里，有關今年內是否能同時看到RTX 5080和RTX 5090的話題引起了玩家的關注，問題主要集中於RTX 5080。近日有網友透露，英偉達大機率會同時發布RTX 5090和RTX 5080，不過兩者發售時間並不一致，中間會相隔幾周的時間，其中RTX 5080會更早上市。這點與Geforce RTX 40系列有些不同，雖然RTX 4090和RTX 4080都在2022年9月20日發布，但是先上市的是更高端的RTX 4090（10月12日），而RTX 4080晚了大概一個月（11月16日）。根據之前的說法，基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、GB206和GB207五款晶片，對應的顯存位寬分別是512/384-bit、256-bit、192bit、128-bit和128-bit。其中RTX 5090搭載的是GB202，RTX 5080搭載的是GB203。新產品採用台積電（TSMC）4NP定製工藝製造，也就是現有4N工藝的改進型，同時也會支持新一代GDDR7。傳聞GB202和GB203的差別較大，前者的規模要大得多，預計會有192組SM（24576個CUDA核心），而後者僅為一半，擁有96組SM（12288個CUDA核心）。RTX 5090不會啟用所有SM，預計會用到其中的170至180組。RTX 5080同樣如此，以便在半代更新時提供「Ti」或者「SUPER」的型號，開啟更多的SM提升性能。 ...

性能跨時代飛躍英偉達下一代架構「Rubin」曝光：台積電3nm、HBM4記憶體

快科技5月10日消息，據媒體報導，英偉達的Blackwell系列人工智慧GPU才開始出貨不就，其下一代架構就已經開始浮出水面。報導稱，英偉達新架構的代號為“Rubin”，是以美國天文學家Vera Rubin來命名。預計將在性能上實現跨時代的飛躍，同時重點關注降低功耗，以應對未來計算中心的擴展需求。據分析師郭明錤透露，基於“Rubin”架構的首款AI GPU——R100預計將於2025年第四季度進入量產階段。這也就意味著R100可能會在更早的時間亮相，以便客戶進行評估，並在2026年初開始收到這些晶片。 R100預計將採用台積電的3納米EUV FinFET工藝，與當前的Blackwell B100相比，R100將採用4倍光罩設計，並繼續使用台積電的CoWoS-L封裝技術。此外，R100有望成為首批採用HBM4堆疊內存的晶片之一，預計具有8個堆疊，盡管具體的堆疊高度尚未明確。同時，Grace Ruben GR200 CPU+GPU組合可能採用在3納米節點上製造的全新"Grace" CPU，並可能採用光學收縮技術以進一步降低功耗。來源：快科技

傳「Rubin」將接替「Blackwell」架構，英偉達或安排2025年底上市

在美國加州聖何塞會議中心舉行的GTC 2024大會上，英偉達創始人兼CEO黃仁勛帶來了Blackwell架構GPU，包括用於取代H100/H200的B200 GPU，另外還有與Grace CPU相結合的GB200。新款數據中心產品再次鞏固了英偉達在人工智慧市場的主導地位，開創了AI計算的新時代。雖然英偉達只是剛剛發布了Blackwell架構GPU，相關產品要等到下半年才出貨，但下一代架構已經開始浮出水面。據Wccftech報導，新架構的代號為「Rubin」，是以美國天文學家Vera Rubin來命名。除了為AI GPU帶來性能的飛躍，新一代產品的設計重點是降低功耗，這顯得尤為重要，畢竟目前架構的產品已逼近千瓦范圍，且無法無限擴展。據了解，首款基於Rubin架構的GPU是R100，預計在2025年第四季度進入量產階段，這意味著發布的時間會更早一些，以便選定的客戶可以更快地去做評估，大概能在2026年初收到新款晶片。傳聞Rubin架構GPU將採用台積電（TSMC）的3nm工藝製造，與B100使用了CoWoS-L封裝，很可能是首批搭載HBM4的產品之一。去年10月，英偉達在投資者簡報中介紹了包括HBM3e、PCI Express標准（6.0/7.0）更新和多GPU互聯技術更新等內容，同時還放出了產品路線圖，上面展示了其2024年至2025年數據中心的規劃。其中Blackwell架構產品之後還會有X100和GX200，當時裡面使用的「X」無法確定是紀念哪一位科學家。不過隨後就有網友透露，英偉達正在開發面向數據中心的R100和GR100，路線圖所使用的「X」實際上就是「R」，代表的是Vera Rubin。 Vera Rubin是美國的一名天文學家，出生在賓夕法尼亞州費城，瓦薩爾學院天文學專業畢業，並在康奈爾大學讀研，。隨後在喬治敦大學獲得博士學位並留校任教數年後，魯賓進入非營利科研機構卡內基科學學會工作，成為了研究所地磁部的首位女研究員。Vera Rubin在1981年被選入美國國家科學院，成為其歷史上第二位女院士。 ...

英偉達GeForce Game Ready 552.44 WHQL驅動：為《對馬島之魂》做好准備

英偉達發布GeForce Game Ready 552.44 WHQL驅動程序，為支持DLSS 3的遊戲《對馬島之魂：導演剪輯版（Ghost of Tsushima Director's Cut）》做好准備，提供最佳遊戲體驗。同時還對那些支持DLSS技術的新遊戲做好優化，比如即將到來的《家園3（Homeworld 3）》。此前PlayStation官方已宣布，開放世界動作冒險類遊戲《對馬島之魂：導演剪輯版》將會在2024年5月16日登陸PC，移植工作由Su_cker Punch Productions、Nixxes Software和PlayStation Studios共同完成。《家園3》是由Blackbird Interactive開發、Gearbox Publishing發行的太空即時戰略（RTS）遊戲，經過兩次延期後，已定於2024年5月14日發售。在該版本驅動程序中，還為5款遊戲添加了GeForce Experience和NVIDIA App的最佳設置，包括：《Content Warning》《灰區戰爭（Gray Zone Warfare）》《莊園領主（Manor Lords）》《惡意不息（No Rest...

前十IC設計公司2023年營收合計增長12%，英偉達超越高通登頂

TrendForce發布了最新的研究報告，顯示全球前十IC設計公司2023年合計總收入為1676億美元，按年增長了12%。其中最為關鍵的是英偉達帶動了整個產業向上，其營收按年增長幅度達到了105%，不過部分企業受到行業不景氣及去庫存影響，營收出現了衰退。英偉達（NVIDIA）在人工智慧熱潮下，營收和市場占有率均登頂，2023年的營收增至552.68億美元，105%的增幅將其他公司遠遠拋在了身後，目前超過80%的AI晶片都被英偉達拿下，是業務成長的關鍵，相信今年推出的Blackwell架構產品會繼續帶動英偉達營收增長；高通（Qualcomm）受智慧型手機市場不景氣影響，2023年的營收減至309.13億美元，按年減少了16%；博通（Broadcom）布局人工智慧伺服器相關產品有著不錯的收獲，基於AI晶片的解決方案占據了近15%的營收，帶動2023年的按年增長7%，至284.45億美元。 AMD因PC端需求下降及去庫存使得營收下滑，主要依靠數據中心業務和嵌入式的業務的貢獻，2023年營收減少4%至226.8億美元；聯發科（MediaTek）受到了智慧型手機市場的沖擊，2023年的營收大幅度下滑了25%，至138.88億美元；第六到第十名里，變化最大的是Cirrus Logic跌出了前十，被電源管理IC大廠MPS所取代，另外瑞昱（Realtek）降至第八名，2023年營收減少19%至30.53億美元，主要受到PC市場出貨大幅衰退等因素影響。展望2024年，TrendForce認為經歷了長時間的IC去庫存後，已經讓庫存回到了健康水平，受惠於人工智慧（AI）熱潮帶動，各大雲端服務供應商將持續擴大大語言模型的建設，同時AI相關應用將滲透到個人裝置，預計IC設計公司的營收將持續向上。 ...

郭明錤：英偉達下一代AI晶片R系列/R100將在明年四季度量產

快科技5月8日消息，天風國際分析師郭明錤預測，英偉達下一代AI晶片R系列/R100將在2025年4季度量產，系統/機櫃方案預計將在2026年上半年量產。據悉，R100將采台積電的N3製程與CoWoS-L封裝(與B100相同)。R100採用約4x reticle設計（vs. B100的3.3x reticle設計）。 R100的Interposer尺寸尚未定案，有2–3種選擇。R100預計將搭配8顆HBM4。 GR200的Grace CPU將采台積電的N3製程（vs. GH200/GB200的CPU採用台積電N5）。目前，英偉達已經意識到，AI伺服器的高耗能已成為CSP（雲服務提供商）/Hyperscale（超大規模數據中心）采購和數據中心建設的重要挑戰。因此，在R系列晶片與系統方案的設計中，除了提升AI算力外，還特別注重了能耗的改善，以滿足市場對高效能、低功耗AI解決方案的迫切需求。來源：快科技

英偉達Blackwell架構遊戲顯卡再生疑團，RTX 5080或早於RTX 5090發布？

此前有報導稱，今年英偉達將發布新一代遊戲顯卡，不過與Geforce RTX 30/40系列首發三款產品不同，只提供旗艦級的Geforce RTX 5090。雖然只有一款產品，不過大家也能對Blackwell架構GPU和各種新功能有一個基本的認識，英偉達同樣會針對新架構做技術概述。僅僅過去一天，就有網友（@Kopite7kimi）給出了不同的消息，稱英偉達最早發布的Blackwell架構遊戲顯卡將是Geforce RTX 5080。至於今年內是否能同時看到RTX 5080和RTX 5090，還是說確實只有一款產品，暫時還不清楚。由於該位網友過往泄露了不少英偉達的消息，且准確率較高，新的說法似乎更為可靠，不過英偉達有可能還沒有確定最終的發布計劃。根據之前的說法，基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、GB206和GB207五款晶片，對應的顯存位寬分別是512/384-bit、256-bit、192bit、128-bit和128-bit。新一代產品採用PCIe 5.0接口，支持DisplayPort 2.1顯示輸出，搭載16Gb（2GB）的GDDR7模塊，還可能支持24Gb（3GB）模塊，速率為28 Gbps。 Geforce RTX 5080搭載的是GB203，擁有96組SM，共有12288個CUDA核心。GeForce RTX 5090搭載的是GB202，擁有192組SM，共有24576個CUDA核心，可能採用MCM多晶片封裝，類似於用在數據中心產品的Blackwell架構B200晶片。傳聞英偉達將對Blackwell架構進行較大規模的修改，雖然不是全新的設計，不過SM和CUDA會有一個新的結構，RT單元有可能被PT單元所取代，光線追蹤性能也會得到進一步優化和加強。 ...

搭載GB200的DGX伺服器將於2024H2進入量產，或為英偉達帶來巨額收益

今年3月，英偉達在美國加州聖何塞會議中心舉行的GTC 2024大會上，帶來了Blackwell架構GPU，包括用於取代H100/H200的B200 GPU，另外還有與Grace CPU相結合的GB200。此外，還基於新款晶片打造了新一代DGX系列伺服器。據Wccftech報導，搭載GB200的DGX伺服器將於2024年下半年進入量產階段，有望在人工智慧（AI）市場掀起新一輪熱潮。憑借新架構的改進，加上市場的追捧，很可能為英偉達帶來巨額收益。有消息稱，相比於Hopper架構的產品，基於Blackwell架構的新一代AI伺服器更加受市場歡迎，采購量也更大，預計到2025年將超過40000台新款伺服器流入市場。據了解，英偉達計劃將搭載GB200的AI伺服器進行劃分，面向三個不同的細分市場，分別提供DGX NVL72、NVL32和HGX B200。之前英偉達已經介紹過NVL72，這是一個全機架解決方案，有18個1U伺服器組成的機櫃，每台伺服器里帶有兩個GB200 Grace Blackwell Superchip，合計共有36個Grace CPU和72個Blackwell GPU。傳聞NVL72的單價約為300萬美元，預計會銷售10000個機櫃，將為英偉達帶來300億美元的收益，而且還不算其他配套的產品。富士康和廣達將負責大部分DGX系列伺服器的供應，隨著市場對AI算力的需求不斷增長，未來收益會更高，似乎沒有什麼可以阻止英偉達及其相關供應商爆炸性的財務增長。 ...

英偉達今年內僅推出RTX 5090，其餘Blackwell架構遊戲顯卡要等到明年

此前有報導稱，英偉達最快會在今年第四季度帶來GeForce RTX 50系列，與之前的Geforce RTX 30/40系列一樣，初期將專注於高端產品，首批提供RTX 5090和RTX 5080等。基於Blackwell架構的GeForce顯卡與數據中心產品一樣，將採用台積電（TSMC）4NP定製工藝製造，也就是現有4N工藝的改進型。據Moore's Law is Dead報導，今年英偉達將發布新一代遊戲顯卡，不過與Geforce RTX 30/40系列首發三款產品不同，僅提供旗艦級的Geforce RTX 5090，預計再一次實現性能飛躍。即便只有一款產品，大家也能對Blackwell架構GPU和各種新功能有一個基本的認識，英偉達也會在發布時對新架構做一個技術概述。據了解，英偉達這次在GeForce RTX 50系列發布上採取了較為保守的策略，主要原因可能是為了讓市場有更多的時間消化GeForce RTX 40系列的庫存，同時也為了基於新架構的GPU在AI方面有更高的優先級，利用高端產品切入為其帶來更高的利潤。根據之前的說法，基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、 GB206和GB207五款晶片，對應的顯存位寬分別是512/384-bit、256-bit、192bit、128-bit和128-bit。新一代產品採用PCIe 5.0接口，支持DisplayPort 2.1顯示輸出，搭載16Gb（2GB）的GDDR7模塊，還可能支持24Gb（3GB）模塊，速率為28 Gbps。 ...

英偉達疑煽動三星、SK海力士價格競爭：壓低HBM記憶體價格

據韓國媒體BusinessKorea近日報導，在人工智慧晶片對於高帶寬內存HBM需求的推動下，自2023年以來，第三代的HBM3的報價已經上漲超過5倍。這對於英偉達等AI晶片大廠來說，所需的關鍵HBM價格大漲，勢必會影響其AI晶片的成本。在此背景下，市場傳聞稱，英偉達似乎故意煽動三星電子、SK海力士彼此競爭，以便勢壓低HBM的價格。 4月25日，SK集團董事長崔泰源（Chey Tae-won）匆匆前往矽谷與英偉達CEO黃仁勛（Jensen Huang）會面，似乎跟這些策略有關。雖然過去一個多月來，英偉達一直在測試三星領先業界開發出的12層堆疊的HBM3E，卻遲未下單采購。市場解讀，這是一種策略，目標是激勵三星與SK海力士進行價格競爭。在最新的一季度財報會議上，三星表示，將繼續增加HBM供應，以滿足對生成人工智慧不斷增長的需求。本月，三星已經開始量產8層堆疊的HBM3E ，並計劃在第二季度量產12層堆疊的HBM3E產品。 SK海力士社長郭魯正（Kwak Noh-Jung）也在一季度財報會議上表示，2025年的AI晶片組用的HBM幾乎全數售罄，2024年的供應也已全部訂光。他說，12層堆疊的HBM3E將在今年5月送樣，預計第三季開始量產。SK海力士正在與一些客戶就HBM的長期合同進行談判。來源：快科技

黃仁勛稱下代GPU會非常難買蘇姿豐迎戰：AMD今年GPU收入要超40億美元

快科技5月3日消息，蘇姿豐正面向英偉達發起挑戰，今年AMD在GPU收入預估超過40億美元。近日，蘇姿豐在AMD公司財報電話會議中表示：“MI300的需求持續增強，預計2024年數據中心GPU收入將超過40億美元，高於我們1月份指導的35億美元”。 “40億美元之上沒有上限，我們有能力超過這個數字的供應能力。在第二季度，我們的需求確實比現在的供應更多，而且我們正在繼續努力拉動部分供應。”蘇姿豐說道。雖然AMD在GPU銷售上表現的很樂觀，但是跟英偉達相比，簡直不值得一提。按照分析師的預測，今年英偉達在GPU上的銷售額預計要超過400億美元，至少是AMD的10倍以上。除了AMD外，Intel也希望在GPU市場大展拳腳，不過這兩家廠商暫時對英偉達不會有任何實質性威脅。黃仁勛之前已經預警：“英偉達預計下一代GPU產品的供應會非常緊張，因為需求遠遠超過了供應能力。” 來源：快科技

搭載AD103的GeForce RTX 4070顯卡現身，英偉達禁用了近一半的SM

此前就有報導稱，英偉達會為部分GeForce RTX 40系列顯卡准備更新，提供新的晶片使用，包括了RTX 4070、RTX 4060 Ti和RTX 4060，覆蓋了主流至中高端的部分區域。其中RTX 4070會最先出現，新版不同於現有的AD104-251晶片，而是使用AD103-175-KX晶片。英偉達在今年3月初發布的GeForce Game Ready 551.86 WHQL驅動程序里，已經支持這些搭載新晶片的顯卡了。據Techpowerup報導，有用戶向其提供了一款奇怪的型號，是名為「MSI RTX 4070 Ventus 3X E 12G OC」的顯卡，表示GPU-Z無法正確檢測。通過對用戶提交的數據和設備ID的研究，發現這張顯卡搭載的正是AD103晶片的新版RTX 4070產品。 Geforce RTX 4070搭載的AD104-251晶片裡，啟用了60個SM中的46個，也就是76.67%，換成AD103-175-KX晶片，也就是啟用了80個SM中的46個，可用的SM占比將降至57.5%，也就是接近一半被英偉達禁用了。由於AD103和AD104占用的PCB面積、引腳和封裝尺寸相似，英偉達的合作夥伴基本可以在現有的電路板設計上實現無縫集成。未來英偉達還有可能將AD103用於Geforce RTX 4070...

分析稱英偉達繼續主導2024年AI GPU市場：銷售額400億美元，遠超AMD和英特爾

過去一年多里，人工智慧（AI）、高性能計算（HPC）市場需求在迅速增長，以ChatGPT為首的人工智慧工具在全球范圍內掀起了一股熱潮，市場對高性能數據中心GPU的需求大幅度提升，也讓英偉達的營收實現了快速增長，同時股價飆升，成為了業界最耀眼的明星。據相關媒體報導，有分析師對2024年人工智慧（AI）GPU市場的銷售進行了預測，表示英偉達將繼續主導該市場，銷售額將達到400億美元（約合人民幣2898.76億元）。作為對比，競爭對手AMD和英特爾的銷售額分別為35億美元（約合人民幣253.64億元）和5億美元（約合人民幣36.23億元）。從該數據可以看到英偉達在業界的影響力，在用於人工智慧GPU的銷售上遠遠超過了競爭對手，剛剛推出的Blackwell架構GPU再次鞏固了其自身在人工智慧市場的主導地位。這樣巨大的差距或許超過了不少人的想像，某程度上參與人工智慧競賽的公司之間的距離可能越拉越大。雖然AMD的同類產品性能不俗，近期Instinct MI300系列在銷售上也很給力，且35億美元甚至高於內部最初20億美元的預期，但是比起英偉達還差很多。AMD近期已經做了大量的工作，包括軟體方面，比如頻繁地更新ROCm，只是看起來還遠遠不夠。至於英特爾的差距就更大了，近期推出Gaudi 3加速器在銷售上也低於市場的預期，這也是其2024年第一季度財報公布後股價下跌的原因之一。人工智慧市場未來前景廣闊，盡管英偉達占據了主導地位，但是其他晶片公司仍然表現得很樂觀，希望能從中分得一杯羹。不過AMD和英特爾要想在人工智慧GPU領域趕上英偉達，還有太多的工作需要完成。 ...

你買A卡還是N卡 AMD痛失一重要夥伴：微星全力做英偉達RTX系顯卡

快科技4月27日消息，微星（MSI）官網很難找到AMD Radeon 7000系列產品，官方表示已經停產。隨後，微星官方確認，公司未來發展將專注於推出英偉達GeForce RTX系列GPU顯卡產品。微星官方表示：“在顯卡方面，公司當前的重心放在推出更多RTX顯卡上。和AMD公司的合作對我們來說依然非常重要，我們在主板等方面有著更深入的合作”。今天早些時候，供應鏈給出消息稱，英偉達計劃上調遊戲顯卡的售價，預計漲幅約為10%。據悉，RTX 40系列的供貨依舊緊缺，而主力型號的RTX 4060 Ti系列貨源出現了較大的問題，使得供應量大幅度減少。雖然市場需求飆升，但是英偉達近期採取以不變應萬變的策略，沒有追加訂單，使得RTX 4060 Ti系列的情況更為突出。來源：快科技

英偉達CEO黃仁勛將在Computex 2024前發表主題演講，分享AI推動新的工業革命

今年台北國際電腦展（COMPUTEX Taipei）的主題演講日常安排非常地緊湊，目前已經宣布了多個重要的主題演講，包括AMD、英特爾、聯發科、高通和Arm等業界大巨頭，預計都涉及產品陣容的重大調整。去年曾登台的英偉達創始人兼執行長黃仁勛，今年似乎沒了動靜。事實證明，英偉達還是有自己的計劃安排的。英偉達已經宣布，黃仁勛將會在台北國際電腦展開幕前的6月2日晚上7點，在台灣大學綜合體育館發表主題演講，分享人工智慧（AI）時代如何在全球范圍內推動新的工業革命。這次演講會進行現場直播，可以通過網絡在線觀看。值得注意的是，雖然有一些媒體將英偉達組織的這次主題演講標記為台北國際電腦展的活動，但其實並不是台北國際電腦展主題演講的正式部分，沒有被官方列入名單，同時英偉達也沒有提及這次展會，所以兩者是無關的。今年的台北國際電腦展（COMPUTEX 2024）將會在2024年6月4日到7日之間，在中國台北南港展覽館1號館及2號館舉行，涵蓋了人工智慧運算、前瞻通訊、未來移動、沉浸現實、綠能永續及創新等六大領域。本屆展會以「AI串聯、共創未來（Connecting AI）」為主軸，聚焦全球AI最新技術與產業趨勢，吸引了1500家參展企業、使用了4500個攤位。 ...

英偉達向OpenAI交付首台DGX H200，黃仁勛親自出鏡合影

近日，英偉達向OpenAI交付了全球首台DGX H200超級計算機，OpenAI的總裁兼聯合創始人Greg Brockman在推特上發了一張與黃仁勛的合影，並在推文中寫道：「世界上第一台NVIDIA DGX H200，由Jensen（黃仁勛）親手交付給OpenAI，致力於『推進人工智慧、計算機和人類發展』」。從合影照片上可以看到，DGX H200超級計算機體積不小，外殼上還有手寫的標語和黃仁勛親筆簽名。NVIDIA在去年年底正式推出H200和GH200產品線，以現有的Hopper架構為基礎，增加了更多的內存和計算能力。其中H200配備141GB的HBM3e內存，運行速率約為6.25 Gbps，六個HBM3e堆棧為每個GPU帶來4.8 TB/s的總帶寬。相比於H100的SXM版本，H200的SXM版本將內存容量和總帶寬分別提高了76%和43%。不過原始計算能力較H100無太大提升，只是在個別應用場景里會受益於更大的內存配置。而GH200的AI性能則達到了1 Exaflop級別，內部包括了256個GH200 Grace Hopper晶片，晶片間共享144TB內存，並首次引入了新的NVLink Switch拓撲結構來構建整個超級計算機集群。新結構可提供比前一代系統更高的帶寬，GPU-GPU和CPU-GPU的帶寬分別高出10倍和7倍，互連能耗效率比競品高出5倍。 Grace Hopper晶片則是將Hopper架構GPU和Arm架構Grace CPU結合，使用NVLink-C2C進行連接，其擁有72個Arm v9架構CPU內核和16896個FP32CUDA核心，同時配備96GB的HBM3和512GB的LPDDR5X內存。這個組合可以讓CPU和GPU在面對HPC或AI計算時更好地對工作負載進行分配，達到最佳的運行效率。 ...

全球首塊英偉達H200 AI超級晶片交付：黃仁勛給OpenAI「送貨上門」

快科技4月25日消息，今天凌晨，OpenAI總裁兼聯合創始人格雷戈里·布羅克曼在X平台上表示，英偉達CEO黃仁勛已向OpenAI親手交付全球范圍內第一塊AI超級晶片DGX H200。他還曬出了自己和黃仁勛、OpenAI的CEO薩姆·奧特曼以及DGX H200的合照。 H200基於英偉達Hopper架構打造，並配備英偉達H200 Tensor Core GPU，處理速度為4.8TB/秒。 H200擁有141GB的內存，與前代產品H100相比，H200的容量幾乎翻了一番，運行大模型的綜合性能相比前代H100提升了60%到90%。英偉達此前表示，H200在運行GPT-3時的性能，將比原始A100高出18倍，同時也比H100快11倍左右。值得一提的是，H200還將與H100兼容，使用H100訓練/推理模型的AI企業，可以無縫更換成最新的H200晶片。來源：快科技

英偉達股價下跌引發市場擔憂，高成本或促數據公司尋找替代品

在美國當地時間19日，英偉達的股價較前一個交易日下跌10%，是公司自2020年3月16日以來最大單日跌幅。據ChosunBiz報導，此次下跌與美國伺服器供應商超微公司（Supermicro，SMCI）所引起的恐慌不無關系：該公司在19日並沒有提前公布第一季度的初步財報，導致投資者信心受挫，連帶英偉達也受到了影響。英偉達股價的下跌引發了市場對於其在AI半導體市場壟斷地位的質疑，從供應鏈上看，英偉達所依賴的代工廠台積電已在最近下調了對今年半導體市場的增長預期，同時減少了投資建設生產設施的意願，這意味著英偉達相關產品的產出與市場的需求並不對等，從而對整個IT行業的發展造成掣肘。另外，光刻機製造商ASML也宣布，其今年第一季度獲得的新訂單總額只有36億歐元，比市場預期的54億歐元低33%，這也從側面反映了AI半導體供應鏈缺乏增長動力，超微公司不提前公布財報的行為進一步強化了投資者對於未來AI半導體市場的擔憂。同時也有分析稱，使用英偉達GPU來構建數據中心的公司從其所帶來的巨額成本感受到了壓力。韓國最大的網際網路公司Naver的一位官員表示，如果公司生成式AI伺服器使用昂貴的GPU，如英偉達的H100和A100，那麼數據中心的建設成本就會遠高於公司預期，需要不知道多長的周期才能實現盈利。另外，英偉達GPU的功耗問題同樣是巨額成本的來源之一，有業內人士表示，假設數據中心都使用英偉達的產品，那麼到2027年，全球數據中心的功耗將增加至85-134TWh，相當於荷蘭、阿根廷、瑞典的年用電量。因此，尋找英偉達GPU的替代品或許是下個階段數據公司的方向之一，Naver官方已經表示其正在與英特爾和三星合作，希望能得到英偉達GPU的替代品，以在某些領域實現有意義的成本節約。 ...

英偉達將與日本機構合作，打造「ABCI-Q」量子計算系統

據相關媒體報導，英偉達將與日本國立研究機構，也就是日本產業技術綜合研究所（AIST）合作，打造新的量子計算系統，專為與未來的量子硬體集成而設計。富士通也參與了該項目，預計2025年初部署，在2025年4月或稍晚時間起，向企業和研究人員提供有償服務。這個名為「ABCI-Q」的新項目，將由英偉達加速和量子計算平台提供支持，旨在推進日本的量子計算計劃，將為跨行業的研究提供高效的量子模擬。其高性能、可擴展的系統集成了NVIDIA CUDA-Q，這是一個開源的混合量子計算平台，具有強大的仿真工具和對混合量子經典系統進行編程的能力，共部署了2000多塊H100計算卡分布在500多個節點里，再通過NVIDIA Quantum-2 InfiniBand互連，是世界上唯一完全可卸載的網絡內計算平台。英偉達高性能計算和量子計算總監Tim Costa表示，研究人員需要高性能仿真來解決量子計算中最困難的問題，而CUDA-Q和H100能夠幫助ABCI-Q等先驅取得關鍵進展，加快量子集成超級計算機的發展。此前英偉達的創始人兼執行長黃仁勛曾去日本，與政府高級官員會面，談到要加強多領域合作，為日本的需求提供穩定的人工智慧設備供應，這次的ABCI-Q項目至雙方建立廣泛合作關系的第一步。 ...

英偉達承認AI市場「競爭激烈」，重申旗下業務包括硬體和軟體

過去一年多里，人工智慧（AI）成為了業界最熱門的詞匯。以ChatGPT為首的人工智慧工具在全球范圍內掀起了一股熱潮，對高性能數據中心GPU的需求大幅度提高，讓英偉達成為了半導體行業里最耀眼的明星，營收也實現了大幅度的增長。隨著人工智慧市場規模快速增長，AMD和英特爾等其他晶片公司都想從中分得一杯羹，投入了大量的資源，希望能搶奪更多的市場份額。作為開發GPU加速軟體的通用並行計算架構，英偉達耗費多年構建的完整CUDA生態系統可以說是其最重要的護城河之一，鞏固了其作為領先GPU計算和人工智慧晶片製造商的地位。競爭對手步步逼近也讓英偉達感到了前所未有的壓力，似乎開始意識到，想保持人工智慧晶片市場的壟斷地位不是一件輕松的事。近日，英偉達應用深度學習研究副總裁Bryan Catanzaro在其社交媒體帳戶上表示，現在人工智慧市場的競爭很激烈，而且越來越激烈，不過這是必然的，因為人工智慧是歷史上最大的計算問題。 Bryan Catanzaro的表態並不代表英偉達對競爭感到恐懼，而且還強調了另外一件事，即人們對英偉達的發展歷程以及其從以硬體為中心向以軟體為中心的轉變存在普遍的誤解。英偉達設計的GPU很強大，比如最新的Blackwell架構GPU，但通過軟體優化盡可能提升計算效能同樣關鍵，如果要有完善的管理計算能力，需要一個強大的軟體生態系統，將硬體性能推向極致。 AMD和英特爾一直試圖通過自己的開放API產品，包括ROCm和oneAPI進入計算領域。近期高通、英特爾和谷歌聯手還建立UXL基金會，這是以oneAPI構建的開源項目，為那些使用CUDA生態系統的用戶提供另外一種選擇，最終目標就是要推翻英偉達的統治。目前人工智慧市場還處於起步階段，未來的情況還很難說，而真正的戰爭似乎才剛剛開始。 ...

四月AI晶片三連發英偉達無懼競爭

四月我們迎來了AI晶片三連發！ 4月9日Intel打頭陣，在Vision 2024活動中，發布了新一代Gaudi 3 AI晶片。同一天，Cloud Next 2024大會上，Google Cloud首度公開專為數據中心設計的首款Arm架構CPU──Google Axion。隔天，4月11日Meta官方發文，展示新款自研AI晶片MTIA。在這三款產品中，Intel新一代Gaudi 3與NVIDIA H100展開直接競爭。在AI模型算力中，Gaudi3 AI晶片的模型訓練速度、推理速度都更出色，分別提升了40%和50%，平均性能提升達到了50%，能效更是提高了40%。更重要的是，Gaudi3 AI晶片的成本比H100更低，妥妥的性能更強，價格更低。從官方公布的數據來看，Gaudi 3即使是面對NVIDIA的H200 GPU，表現也毫不遜色。在LLAMA-7B以及LLAMA-70B的部分場景與H200基本是伯仲之間，差距基本在10%以內。 Intel在Vision 2024上也同步介紹了這款晶片的生產節點，計劃在今年第三季度向客戶發貨Gaudi 3 AI晶片，包括聯想、惠普、Dell和Supermicro等OEM廠商都會使用這款新品構建系統。但是Gaudi 3很難撼動NVIDIA在AI新領域的地位，即便加上AMD的Instinct MI300。美銀分析師Vivek Arya發表研究報告指出，英偉達2024年AI加速器的占有率將超過75%，定製化晶片（如Google TPU、亞馬遜Trainium/Inferentia加速器、微軟Maia）的占有率為10~15%，而剩餘的10~15%才是AMD、英特爾及其他未上市企業的天下。盡管目前定製化晶片市場占有率不高，但幾乎所有服務商都在加速開發各類晶片晶片產品，Google也不例外。在9日舉行的Cloud Next 2024大會上，Google Cloud首度公開專為數據中心設計的首款Arm架構CPU──Google...

AMD和英偉達AI晶片發展迅猛，加速HBM3E今年下半年將成主流

在人工智慧（AI）和高性能計算（HPC）的影響下，近兩年HBM產品發展逐漸加速，也推動著存儲器廠商的收入增長，而新一代HBM3E也逐漸成為了各種新款晶片的搭配首選。今年英偉達帶來了基於Blackwell架構的新產品，首發的B200和GB200都選用了HBM3E。有消息稱，AMD今年將推出改用4nm工藝製造的Instinct MI350系列，搭配的顯存也將換成HBM3E。據TrendForce報導，AMD和英偉達都加快了主力人工智慧（AI）應用晶片的開發步伐，而且都在規劃採用更高規格的HBM產品，以進一步提升性能。從目前情況來看，2024年將會有三大趨勢： HBM3將進階到HBM3E - 預計英偉達下半年開始擴大搭載HBM3E的H200齣貨，取代H100成為主流，B200和GB200也會採用HBM3E。AMD年底前會帶來Instinct MI350系列，在此之前還會有Instinct MI32x系列，均選定了HBM3E。 HBM容量持續增大 - 目前市場主流的H100搭載的是80GB的HBM3，至2024年底改用HBM3E的新品，容量將提升至192GB到288GB。 HBM3E將從8層往12層堆疊發展 - 英偉達首批Blackwell架構產品都採用了8層堆疊的HBM3E，到了明年將引入12層堆疊的HBM3E。AMD今年的Instinct MI350系列，以及明年的Instinct MI375系列，都將採用12層堆疊的HBM3E，將容量提升至288GB。此前三星已官宣了業界首款擁有12層堆疊的HBM3E，傳聞SK海力士在今年2月已經向英偉達發送了新款12層堆疊HBM3E樣品，以進行產品驗證測試。另外有趣的是，報導中還提及了之前沒有出現的AMD Instinct MI375系列。 ...

英偉達Blackwell新平台產品需求看漲，或帶動台積電全年CoWoS產能提升逾150%

今年3月，在美國加州聖何塞會議中心舉行的GTC 2024大會上，英偉達創始人兼CEO黃仁勛帶來了Blackwell架構GPU，新款數據中心產品再次鞏固了自身在人工智慧市場的主導地位，開創了AI計算的新時代。 Blackwell平台產品包括了用於取代H100/H200的B200 GPU，另外還有與Grace CPU相結合的GB200。同時英偉達在去年末，還以現有的Hopper架構為基礎，推出了H200和GH200產品線，在Blackwell平台產品到來之前作為過渡，其中GH200占據了英偉達高端GPU約5%的出貨量。雖然距離發貨還有一段時間，但供應鏈對GB200寄予厚望，預計2025年出貨量可能上百萬級別，占據英偉達高端GPU約40%至50%的出貨量。據TrendForce報導，Blackwell平台的產品將採用更復雜、更高精度的CoWoS-L封裝技術，驗證方面也耗費更多的時間，預計B100、B200和GB200等產品要到今年第四季度才會少量出貨，真正放量至少要等到2025年第一季度。 B100、B200和GB200等產品也需要消耗更多的CoWoS產能，這也迫使台積電（TSMC）在2024年需要全面提升封裝產能，預計年底每月產能將達到4萬片，相比於2023年提升至少150%。此外，台積電已經在規劃2025年的CoWoS產能計劃，很可能還要實現倍增，其中英偉達的需求占據了一半以上。年初有報導稱，英偉達轉向英特爾尋求封裝服務。不過英特爾的技術仍然以CoWoS-S封裝為主，最多隻能滿足英偉達H系列產品的要求，短期內技術也難有突破，所以相應的產能擴張計劃也較為保守，除非未來能額外得到其他訂單。 ...

英偉達推出RTX A1000 / A400：單槽Ampere架構工作站顯卡，TDP僅50W

英偉達宣布，推出基於Ampere架構的新款工作站顯卡，分別為RTX A1000和RTX A400，兩者都採用了極簡的設計風格。這是英偉達時隔兩年半以後，再次推出Ampere架構專業顯卡，此前最後一款產品是RTX A2000 12GB。從官方提供的渲染圖就能看到，RTX A1000和RTX A400都採用了簡潔的設計，厚度只有單槽，而且都不需要任何外接供電，TDP都控制在了50W，發熱量應該都不大。與基於Ada Lovelace架構GPU的產品不同，RTX A1000和RTX A400缺乏AV1編碼支持，不過可以對包括H.264和H.265等其他視頻格式進行編解碼。英偉達尚未確定RTX A1000和RTX A400的定價，前者將很快上市，後者要等到下個月。 ...

英偉達GeForce Game Ready 552.22 WHQL驅動：修復了舊顯卡存在已久的問題

英偉達發布GeForce Game Ready 552.22 WHQL驅動程序，為遊戲《莊園領主（Manor Lords）》和《惡意不息（No Rest for the Wicked）》做好准備。對於4月26日的《莊園領主》，驅動程序不僅增加了day-zero優化，而且還支持DLSS 2。已修復的問題，包括：《絕地求生》 - 在英特爾第12代酷睿平台上擴展遊戲玩法的遊戲穩定性問題。 GeForce GTX 10 / RTX 20系列 - 當Windows硬體加速GPU調度和NVIDIA SLI同時啟用時，PC可能會隨機死機。 HTC Vive Pro 2...

曝英偉達計劃四季度推出RTX 5090 採用GDDR7、核心數增加50%

快科技4月14日消息，據媒體報導，英偉達計劃在今年第四季度推出RTX 5090及RTX 5080顯卡。此將有助於英偉達合作夥伴擴大出貨量，尤其是隨著越來越多的玩家向高端升級，這些GPU的推出還將有助於提高GPU的平均售價。報導表示，RTX 5090價格可能超過2500美元（約合18093元人民幣）。根據曝光的信息，代號GB202的RTX 5090 CUDA內核數量將增加50%，達到24576個，比RTX 2080內核數量高出8倍以上。 RTX 5090還將首次採用新一代GDDR7顯存，相比目前RTX 4090的GDDR6X提升了52%。 RTX 5090最大的升級之一就是時鍾頻率預計將提高15%提升至2.9GHz，在遊戲場景下可輕松超過3GHz。此外在光線追蹤方面，英偉達RTX 5090的性能目標是提高2.5倍，計算能力將提高2倍，功耗可能高達520W。英偉達RTX 4090 來源：快科技

RTX 4090供電接口過熱熔化問題依然嚴重？GPU維修機構稱每個月需維修200塊

英偉達基於Ada Lovelace架構的中高端GeForce RTX 40系列顯卡都配備了16Pin的12VHPWR接口，2022年末起，就頻繁有用戶報告顯卡供電接口處過熱熔化，線纜的插頭處也出現損壞，這種情況在RTX 4090這類高端高功耗顯卡上最為明顯。為此PCI-SIG在2023年准備了名為「12V-2×6」的連接器改良設計，出現在了CEM 5.1規范里，以減少此類事件的發生。近日，GPU維修機構NorthridgeFix發布了一段視頻，表示RTX 4090供電接口過熱熔化問題依然嚴重，每個月大概需要維修200塊RTX 4090顯卡，並展示了一整箱燒熔的12VHPWR連接器。同時NorthridgeFix還透露，其中不少RTX 4090顯卡使用了Cablemod的12VHPWR定製適配器，NorthridgeFix認為該設計本身是不錯的，可惜建立在不完善的標准之上。美國消費品安全委員會已在兩個月前發出通知，要求消費者立即停止使用，並聯系Cablemod召回這些12VHPWR定製適配器。由於受到不同的電源、連接器、工作負載程度等因素影響，並非所有RTX 4090顯卡都遇到這類問題，或者出現問題的時間點不一樣，有些可能只是使用了幾個月，有些可能在一年多以後才出現損壞。此外，NorthridgeFix沒有說明這些出現問題的RTX 4090顯卡，基於新舊標準的連接器分別有多少。視頻的最後，NorthridgeFix還演示了更換連接器的過程。 ...

英偉達與Google Cloud合作，將幫助初創企業加速AI開發

近日，英偉達與Google Cloud宣布了新的合作，將幫助全球各地的初創企業加速建立生成式人工智慧（AI）應用程式和服務。其結合了針對初創公司的NVIDIA初創加速計劃和Google for Startups Cloud計劃，以擴大獲得雲端積分、市場推廣支持和技術專業知識，協助初創公司更快地為客戶提供價值。 NVIDIA初創加速計劃是一項全球性計劃，支持了超過18000家初創企業，符合資格的會員可以加速使用Google Cloud基礎設施，並獲得Google Cloud的積分，而專注於人工智慧的企業最高可獲得350000美元的積分，並能用於NVIDIA DGX Cloud。 Google for Startups Cloud計劃的成員可以加入到NVIDIA初創加速計劃，獲得技術專業知識、英偉達的深度學習機構課程學分、英偉達軟硬體等。同時符合資格的會員能夠參與到英偉達其他的輔助計劃，比如讓那些對人工智慧領域感興趣的創投公司接觸初創企業。上個月在美國加州聖何塞會議中心舉行的GTC 2024大會上，英偉達創始人兼CEO黃仁勛帶來了Blackwell架構GPU，並推出了針對數據中心的新產品。明年初，基於Blackwell架構構建的平台將入駐Google Cloud，並與Google Cloud第四代先進液冷散熱系統相結合，其中NVIDIA HGX B200將負責AI、資料分析和高效能運算等工作負載，而NVIDIA GB200 NVL72會用於下一代前沿、大規模訓練模型。 ...

英偉達AI GPU供應短缺即將結束，交付周期縮短到8到12周

從去年開始，負責英偉達AI晶片的製造及封裝的台積電（TSMC）在先進封裝方面的產能變得緊張，AI GPU的供應一直處於供不應求的狀態，也導致了較長的交付周期，比如基於H100構建的伺服器交付周期大概需要36周到52周不等。據Wccftech報導，來自Dell相關負責人的消息，稱現在AI伺服器交付給客戶的時間已大大縮短，交付周期比過去減少了至少一半，從40周縮減到8到12周，對未來的供應表現得非常樂觀。Dell的情況具有相當代表性，根據市場統計數據，其占據了主流AI伺服器大概24.5%的出貨量，接近四分之一，而且市場份額還處於上升階段。在Dell看來，這與英偉達過去幾個月里多方面的努力密不可分，包括增加新的合作夥伴，實現供應鏈的多元化，特別是在先進封裝方面，效果尤為明顯。目前台積電已大幅度提升了CoWoS封裝產能，計劃今年產能翻倍，同時近期英偉達還在三星下單，以滿足不斷增長的先進封裝產能需求。上個月在美國加州聖何塞會議中心舉行的GTC 2024大會上，英偉達創始人兼CEO黃仁勛帶來了Blackwell架構GPU，包括用於取代H100/H200的B200 GPU，另外還有與Grace CPU相結合的GB200。業界擔心隨著新款產品的到來，會讓先進封裝產能更加緊張，不過從現在的供應情況來看，暫時可以打消這種顧慮。 ...

英偉達Blackwell架構遊戲顯卡最快年底到來：首批提供RTX 5090/5080

此前有報導稱，英偉達希望通過更好的庫存管理，在保持GeForce RTX 40系列產品線定價的同時，為新一代顯卡逐步騰出空間。基於Blackwell架構的GeForce顯卡與數據中心產品一樣，將採用台積電（TSMC）4NP定製工藝製造，也就是現有4N工藝的改進型。據UDN報導，英偉達的合作夥伴預計，GeForce RTX 50系列最快會在今年第四季度到來，與之前的Geforce RTX 30/40系列一樣，初期將專注於高端產品，首批提供RTX 5090和RTX 5080等。有分析師給出了較為樂觀的預期，認為英偉達每兩年一次的GPU架構重大升級將提升板卡廠商今年的出貨量，並推高顯卡的平均售價（ASP）。雖然大家都能猜到型號，最後大機率也不會有什麼偏差，但是落實到具體規格就很難說了。傳聞英偉達還沒有最終敲定每款型號的規格，鑒於之前曾發生過Geforce RTX 4080 12GB未上市就被取消的事件，相信這次英偉達會更加地謹慎。根據之前的說法，基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、 GB206和GB207五款晶片，對應的顯存位寬分別是512/384-bit、256-bit、192bit、128-bit和128-bit。新一代產品採用PCIe 5.0接口，支持DisplayPort 2.1顯示輸出，搭載16Gb（2GB）的GDDR7模塊，還可能支持24Gb（3GB）模塊，速率為28 Gbps。 ...

性能比4090快近一倍 RTX 5080/90最快年底發：英偉達要提高顯卡平均售價

快科技4月9日消息，英偉達似乎已經准備就緒，計劃在今年第四季度推出下一代GeForce RTX 5090和RTX 5080。這一舉措將有助於英偉達的板卡合作夥伴擴大出貨量，尤其是隨著越來越多的玩家向高端升級，這些GPU的推出還將有助於提高GPU的平均銷售價格（ASP）。根據最新曝光的細節，代號為GB202的旗艦產品RTX 5090的CUDA內核數量將增加50％，達到24576個。這比基於圖靈的RTX 2080的內核數量多出8倍多。此外，旗艦新卡的內存帶寬也將通過使用32Gbps GDDR7提升52％，高於當前RTX 4090的GDDR6X。時鍾速度預計將提高15％，這是最大的升級之一。這將使RTX 5090的頻率提升到2.9GHz，在遊戲工作負載中輕松超過3GHz。而現有的RTX 4090的最高頻率為2.52GHz。然而，隨著性能提升，價格也將相應上漲。據稱，RTX 5090的價格可能超過2500美元，約合人民幣1.8萬+。來源：快科技

三星獲得英偉達2.5D封裝訂單，將採用I-Cube封裝技術

目前英偉達的H100等數據中心GPU都是由台積電（TSMC）負責製造及封裝，SK海力士則供應HBM3晶片。不過人工智慧（AI）的火熱程度顯然超出了大家的預期，導致台積電的先進封裝產能吃緊。雖然台積電不斷擴大2.5D封裝產能，以滿足英偉達不斷增長的需求，但是英偉達在過去數個月里，與多個供應商就2.5D封裝產能和價格進行談判，希望能夠分擔部分工作量。據The Elec報導，三星已經獲得了英偉達的2.5D封裝訂單。其高級封裝（AVP）團隊將向英偉達提供中間層，以及I-Cube封裝。 I-Cube屬於三星自己開發的2.5D封裝，是一種異構集成技術，可將一個或多個邏輯管芯（Logic Chip）和多個高帶寬內存晶片（HBM，High Bandwidth Memory）使用矽中介層，從而使多個晶片排列封裝在一個晶片裡。三星表示，從高性能計算（HPC）到人工智慧、5G、雲和大型數據中心等各種應用場景使用的晶片，都可以選擇I-Cube封裝，可帶來更高的效率。三星在去年年底成立了先進封裝團隊，目的就是要擴大晶片封裝業務的收入。三星去年開啟談判後，曾向英偉達建議，可以從台積電拿到製造好的晶片，然後從三星的存儲器業務部門采購HBM3，並使用三星的I-Cube封裝來完成後續的工作。對三星來說稍微有點遺憾的是，這次並沒有同時拿到英偉達的HBM3訂單。 ...

英偉達RTX 4090 D和H20不受新禁令影響，將繼續在中國市場銷售

近日，美國政府修訂了最新的管制條例，4月4日開始實施APP禁令對「可調整峰值性能」超過70 Weighted TeraFLOPS（TW）的相關設備實行限制，進一步加強管控的力度。由於RTX 4090 D（73.5 TFLOPS）和H20（74 TFLOPS）都超過了對應的標准，加上英偉達此前曾被美國政府點名，從而傳出這兩款針對中國市場的合規版可能被禁的流言，鬧得沸沸揚揚。據Benchlife報導，已經與英偉達的合作夥伴確認，說法與官方一致，RTX 4090 D和H20並不包含在這次實施的APP禁令裡面，同時系統集成商的出貨也不會受到相關管制條例的影響。在去年版本的RIN 0694-AI94文檔里，其實已經有涉及Weighted TeraFLOPS的內容，提到「29 Weighted TeraFLOPS (WT)的限制快要被提高到70 WT」，而這段描述在最新的版本里是沒有的。認為RTX 4090 D和H20可能會受到限制，是由於理解上應該與FP16/FP32或TF32有關。事實上，今年在3月13日更新的Commerce Control List（CCL4）文檔中，裡面提到的APP禁令指出的是64位浮點操作，甚至提及了一個計算中的係數，「針對矢量處理器，Wi=0.9；針對非矢量處理器，Wi=0.3」。如今市面上大家購買的Geforce顯卡，雙精度浮點幾乎都被砍掉，所以無論WT是29還是70，都不會有什麼影響。此外，基於Blackwell架構的Geforce 50系列很大可能不會在2024年登場。傳聞英偉達內部正在思考如何合理運用「刀法」，才能避開相關的APP禁令，與合作夥伴一起滿足龐大的中國消費市場需求。 ...

英偉達發布Streamline 2.4.0 SDK和DLSS 3.7.0：新預設可提高圖像質量

近日，英偉達發布了Streamline 2.4.0 SDK和DLSS 3.7.0庫，支持DirectX 11和Vulkan 1.2或更高版本的GPU，有望進一步改善圖像質量。英偉達的Streamline是一種開源跨平台解決方案，旨在簡化其升級技術的集成，同時讓開發人員更簡單地對第三方升級解決方案進行整合。包括DLSS、DLAA、NVIDIA Real-Time Denoiser（NRD）技術等。在之前的GDC 2024上，微軟公布了一項名為「Microsoft DirectSR」的新技術。遊戲開發者利用DirectSR API，可以一次性開發，兼容當前市場上的主流超解析度技術，包括了NVIDIA DLSS、AMD FSR、以及Intel XeSS等。即便如此，英偉達在未來一段時間內還是會致力於提供Streamline SDK，畢竟DirectSR還沒有具體的時間表。新版本里，最顯著的新增功能是代號「eager_donkey」的質量「E」預設，與DLSS 3.5相比，引入了更清晰的圖像、普遍提高的細節穩定性、更少的重影、以及更好的時間穩定性。有試用過的用戶稱，《地平線：西之絕境》在1440P解析度下會有明顯的差異，也有用戶在《賽博朋克2077》里比較了DLSS 3.5.10、DLSS 3.6.0和DLSS 3.7.0的差異。一般來說，DLSS 3.7.0可以直接替代舊版本的DLSS，用戶使用DLSS Tweaks，甚至手動修補最新的DLSS 3.7.0 DLL，並強制最初未發布或未更新的遊戲支持最新的DLSS 3.7.0...

英偉達GeForce Game Ready 552.12 WHQL驅動：為9款遊戲添加GFE

英偉達發布GeForce Game Ready 552.12 WHQL驅動程序，針對《使命召喚20：現代戰爭3（Call of Duty：Modern Warfare III）》第三季度和《使命召喚：戰區（Call of Duty Warzone）》第三季度做了優化，包括對DLSS 3幀生成和Reflex的支持。此外，還對《暗黑破壞神4（Diablo IV）》的光線追蹤進行了優化。在該版本驅動程序中，還為9款遊戲添加了GeForce Experience和NVIDIA App的最佳設置，包括：《Desynced》《龍之信條2》《碧藍幻想：RELINK》《地平線：西之絕境》《帝國神話》《夜鶯》《超自然車旅》《碧海黑帆》《奇喚士》。已修復的問題，包括：《地平線：西之絕境》 - Resizable BAR配置文件。已知的問題，包括： GeForce GTX 10 / RTX 20系列...

英偉達2023Q4銷售額飆升23%：成為全球最大的半導體供應商

得益於人工智慧（AI）和高性能計算（HPC）前所未有的需求水平，英偉達過去幾個財季的營收實現了大幅度的增長。其中數據中心業務成為了最大的亮點，以往並駕齊驅的遊戲業務在營收上被越拋越遠。據TechInsights報導，2023年第四季度，英偉達半導體銷售額增長了23%，達到了198億美元。這樣的表現讓其超越了以往在半導體行業排名靠前的幾位巨頭，包括台積電（196億美元）、三星（164億美元）和英特爾（146億美元），成為全球最大的半導體供應商。 GPU最初是專門為遊戲和圖形行業製造半導體器，而英偉達是GPU開發的先驅。現在GPU除了用於電子遊戲，還非常適合用於人工智慧和機器學習等領域，提供了強大的計算性能，對於快速增長的數據中心市場也變得越來越重要。毫無疑問，英偉達是過去一年多里人工智慧市場快速發展的主要受益者，在2023年第二季度的銷售額就幾乎翻了一番，到了第三季度繼續維持強勁的增長，到了第四季度，半導體銷售規模已經是2023年第一季度的三倍以上。上個月，在美國加州聖何塞會議中心舉行的GTC 2024大會上，英偉達創始人兼CEO黃仁勛帶來了Blackwell架構GPU，包括用於取代H100/H200的B200 GPU，另外還有與Grace CPU相結合的GB200。可以預見，2024年裡英偉達的收入大機率會繼續攀升。 ...

高算力顯卡管控力度加強，RTX 4090 D也要和我們說再見了

去年年底，為了適應美國政府對尖端人工智慧（AI）晶片新的出口管制，英偉達針對中國大陸市場推出了合規版的RTX 4090 D顯卡，以取代被列入限制名單的旗艦產品GeForce RTX 4090。然而，近日據報導，美國政府修訂了最新的管制條例，對「可調整峰值性能」超過70 TFLOPS的相關設備實行限制，進一步加強管控的力度，其中就包括了RTX 4090 D（73.5 TFLOPS）和NVIDIA H20（74 TFLOPS），並且涉及的地區新增了中國澳門和D:5組別地區。此外，光刻機、AI晶片等高新技術產品也被列入最新的管制的范圍之內，新修訂的條例將會在4月4日（應該為美國時間）正式生效。早期，英偉達僅需在RTX 4090的規格基礎上做減法處理即可符合綜合運算性能（TPP）4800的限制要求達到上市條件，畢竟RTX 4090無論FP8還是FP16的TPP都是5286，比限制值超出了10%左右。RTX 4090 D的出現能夠保持RTX 40系列產品線在中國大陸市場的完整性，盡最大努力排除其他因素的影響，避免可能存在的產品線缺失，以充分滿足高端玩家對於高性能遊戲顯卡的追求。隨著新規出台，可能玩家只能將目光轉向RTX 4080 SUPER或者AMD的RX 7900 XTX了。 RTX 4090 D搭載了AD102-250 GPU，CUDA核心數量從RTX 4090的16384個減至14592個，Tensor核心數量從512個減至456個，RT核心數量從128個減至114個。不過RTX...

12 3...36 Page 1 of 36

Tag: 英偉達