Home Tags 英偉達

Tag: 英偉達

台積電和新思科技啟用英偉達計算光刻平台進行生產,加速下一代先進晶片製造

英偉達宣布,台積電(TSMC)和新思科技(Synopsys)兩大半導體行業巨頭將使用計算光刻平台進行生產,加速製造並突破下一代先進半導體晶片的物理極限。目前新思科技已經將名為「cuLitho」的計算光刻庫與其軟體、製造工藝和系統集成,以加快晶片製造速度,並在未來支持最新一代Blackwell架構GPU。 英偉達創始人兼執行長黃仁勛表示,計算光刻是晶片製造的基石,英偉達與台積電和新思科技合作,利用cuLitho與新算法結合,應用加速計算和生成式人工智慧,為半導體開辟了新的領域,相比於當前基於CPU的方法,極大地改進了半導體製造工藝。 計算光刻是英偉達聯合台積電、阿斯麥和新思科技,歷時四年終於完成了計算光刻技術的一項重大突破,為下一代2nm工藝奠定了基礎。其主要通過軟體對整個光刻過程進行建模和仿真,使用光掩模文件的數學預處理來調整光學光刻中的像差和效果,以優化光源形狀和光罩形狀,減小光刻成像與晶片設計差距,從而使光刻效果達到預期狀態,從而提高良品率。不過隨著晶片的製造工藝向3nm及以下發展,每個光罩的負擔呈指數級增長,使得晶片製造的難度加大。 目前計算光刻的過程也成為了晶片設計和製造領域中最大的計算負擔,大型數據中心需要7x24連續運作,每年消耗數百億CPU小時,去創建用於光刻系統的光罩,每年需要的資本支出和能源消耗量也十分地驚人。英偉達表示,通過GPU而不是CPU運算,可以將計算光刻的效率提高40倍,大大減輕晶圓廠的負擔。 利用cuLitho計算光刻庫,可以將工作負載轉換成GPU並行處理,使得500個NVIDIA DGX H100就能完成40000個CPU組成的系統所完成的工作,從而縮短生產時間,同時降低成本、空間和功耗。 ...

英偉達發布Blackwell架構GPU:包括B200和GB200,大幅提升AI計算性能

在美國加州聖何塞會議中心舉行的GTC 2024大會上,英偉達創始人兼CEO黃仁勛英偉達創始人兼CEO黃仁勛帶來了Blackwell架構GPU,包括用於取代H100/H200的B200 GPU,另外還有與Grace CPU相結合的GB200。 B200採用了台積電(TSMC)改進的4NP定製工藝製造,整合了兩個獨立製造的Die,共有2080億個電晶體,將使用新的NVLink 5.0技術來連接兩塊晶片。其擁有160組SM,對應20480個核心,搭配的使192GB的HBM3E,提供了高達8TB/s的帶寬,功耗達到了700W。B200單個GPU提供了20 petaflops的AI性能,大概五倍於H100的4 petaflops。由於引入了第二代Transformer引擎,將有助於自動將模型轉換為適當的格式以達到最佳性能。此外,Blackwell架構GPU還支持新的FP6格式,這是一種介於FP4和FP8兩者之間的解決方案。 暫時還不清楚台積電4NP工藝的細節,但密度方面應該不會有明顯的提升,而之前的H100基本上已經是一個完整的掩模版,晶片尺寸為814mm2,而理論最大值為858mm2。為此B200使用了兩個全尺寸掩模版製造的晶片,每個對應四個HBM3E堆棧,每個堆棧的接口為1024-bit、容量為24GB、帶寬為1TB/s。相比之下,每個H100晶片對應六個HBM3接口,意味著B200每個晶片可以減少內存控制器所需要的晶片面積,從而將更多的電晶體用於計算單元。此外,用於兩個晶片互連的NV-HBI接口也會占用一些空間。 英偉達的Superchip被設計為人工智慧(AI)和高性能計算(HPC)工作負載的典型平台,這次將Blackwell架構GPU與Grace CPU結合推出了GB200 Grace Blackwell Superchip。其配備了兩個B200 GPU和一個Grace CPU,後者配有72核心的Arm Neoverse V2內核,可配置TDP高達2700W。新平台提供了40 PetaFlops的計算性能 (INT8),並擁有864GB的龐大內存池,HBM3E具有16TB/s的內存帶寬,晶片之間通過3.6TB/s帶寬的NVLink進行互連。 英偉達還帶來了全新的GB200 NVL72計算平台,這是一個全機架解決方案,有18個1U伺服器。其提供的FP8性能為720 petaflops,FP4計算性能為1440 petaflops,可處理多達27萬億個AI LLM參數模型。每台伺服器里帶有兩個GB200 Grace Blackwell Superchip,合計共有36個Grace...

2080億電晶體 英偉達推出最強AI晶片GB200:今年上市

快科技3月19日消息,在英偉達GTC 2024大會上,英偉達CEO黃仁勛在GTC宣布推出新一代GPU Blackwell。 第一款Blackwell晶片名為GB200,將於今年晚些時候上市。 據介紹,Blackwell GPU體積龐大,採用台積電的4納米(4NP)工藝製程,將兩塊晶片整合到一起,使用10 TB/ec NVLink 5.0連接,共有2080億個電晶體。 前一代GPU“Hopper”H100採用4nm工藝,集成電晶體800億。 黃仁勛表示:“Hopper很棒,但我們需要更大的GPU。Blackwell不是一個晶片,它是一個平台的名字。” 英偉達表示,基於Blackwell的處理器,如GB200,為人工智慧公司提供了巨大的性能升級,其AI性能為每秒20千萬億次浮點運算,而H100為每秒4千萬億次浮點運算。 該系統可以部署一個27萬億參數的模型,而GPT-4使用了約1.76萬億個參數來訓練系統。 GB200包含了兩個B200 Blackwell GPU和一個基於Arm的Grace CPU組成,推理大語言模型性能比H100提升30倍,成本和能耗降至25分之一。 來源:快科技

深夜炸場!英偉達發布全球最強 AI 晶片,性能暴漲 30 倍,老黃才是這個時代的賈伯斯

剛剛,英偉達發布了全球最強的 AI 晶片。 生成式 AI 已經達到了引爆點。 兩個小時的 GTC 2024 大會,更像一場大型演唱會,英偉達高級科學家 Jim Fan 調侃「黃仁勛是新的泰勒·斯威夫特」。 目前英偉達黃仁勛在 AI 行業的地位,大抵就是如此。 去年黃仁勛喊出 AI 的「iPhone 時刻」已經到來,讓我們看到了日常生活如何被 AI 改寫,而今天則展示了這個改變的速度正被瘋狂加快。 在過去 10 年裡,英偉達將 AI 推進了大約一百萬倍,遠超摩爾定律,或者說英偉達正在書寫自己的疊代定律。從晶片算力到 AI 落地,從汽車製造到醫療物流,英偉達在自身進步的同時,也推動了各行各業發展。 摩爾定律已死,可英偉達讓新的摩爾定律誕生了。 除了電腦顯卡,英偉達在平時很少會被我們感知,但身邊許多產品的技術進步又總離不開它們,看完這篇...

英偉達Blackwell架構B100細節泄露:將配備192GB的8層堆疊HBM3E

GTC 2024大會將於2024年3月18至21日在美國加州聖何塞會議中心舉行,線上大會也將同期開放。這次英偉達會將重點放在人工智慧(AI)領域,在過去的一年裡,這是業界最熱門的話題。英偉達下一代面向伺服器產品的Blackwell架構也會登場,在數據中心市場繼續壓制其他競爭對手。 此次的主題演講為「面向開發者的1# AI峰會(1# AI Conference for Developers)」,英偉達創始人兼CEO黃仁勛將登台亮相。隨著時間的臨近,有網友爆料稱,英偉達這次將發布Blackwell架構B100,採用了兩個基於台積電(TSMC)的CoWoS-L封裝技術的晶片,連接8個8層堆疊的HBM3E,容量達到了192GB。此外,英偉達大概會在一年後帶來B200,改用12層堆疊的HBM產品,容量達到了288GB。 這意味著B100的顯存容量將達到AMDInstinct MI300X的水平,而且同樣8顆顯存晶片,HBM3E比起HBM3也更進了一步。CoWoS-L是台積電在去年推出的封裝技術,能夠製造更大的中間層,最初量產的目標時間是2025年,現在看來似乎還提前了。 暫時還不清楚明年的B200升級的12層堆疊HBM產品是HBM3E還是HBM4,傳聞AMD也打算對Instinct MI300系列進行升級,將顯存從HBM3變成HBM3E,以提高部分工作負載下的性能表現。 ...

功耗要超1000W 英偉達新一代架構Blackwell來了:RTX 50、B200都要用

快科技3月18日消息,英偉達的GTC 2024明日開幕,而黃仁勛也是准備了主題演講,屆時下一代GPU架構會被官宣。 從最新爆料的細節看,B200以及RTX 50系顯卡都會使用這個架構,Blackwell帶來的性能提升也是明顯的。 按照最新爆料,B100將採用兩個基於台積電CoWoS-L封裝技術的晶片,連接到8個 8-Hi HBM3e顯存堆棧,總容量為192GB,而這還不是唯一。 爆料中還提到,B200的下一代Blackwell GP更新將利用12-Hi來實現更高的容量,顯存達到了288GB,但不確定是否是HBM4。 之前,戴爾營運長Jeff Clarke就曾爆料:英偉達將於2025年推出載有“Blackwell”架構的B200產品,功耗或將達到1000W。 事實上基於這個架構的RTX 50系列功耗也不會太樂觀,之前有消息稱,RTX 5090用PCIe Gen 6的16-Pin供電接口後,功耗可以超過600W,而高端系列可以超過450W,中端功耗在300-350W之間。 所以在這樣架構的功耗下,RTX 5090顯卡將比RTX 4090快60%到70%(近一倍)也不稀奇吧? 來源:快科技

黃仁勛焦慮 被英偉達列為對手實力 華為:為全球提供第二個算力選擇

快科技3月16日消息,英偉達首次將中國科技巨頭華為列為競爭對手,在很多人看來兩家公司似乎相隔有點遠,但在AI時代卻開始相互競爭起來了。 在這之前,黃仁勛接受采訪是表示,華為是一家好公司,技術實力非常過硬,願意為他們點贊。 英偉達稱華為在五個領域中的四個領域是其當前的競爭對手,包括AI相關圖形處理器、擁有內部團隊設計AI相關晶片的大型雲服務公司、基於Arm的中央處理器和網絡產品。 事實上也確實如此,華為董事、ICT產品與解決方案總裁楊超斌指出,華為的目標就是為全世界提供第二個算力選擇。 在華為看來,到2028年預計ARM伺服器中國占比將超80%、全球占比將超50%。 同時,截至2023年底,開源歐拉openEuler已占中國伺服器作業系統36.8%的市場份額,成為全國第一,預計今年將保持飛速增長的態勢,中國市場占有率將超50%。 來源:快科技

「東數西算」甘肅樞紐節點算力規模突破5000P:已部署華為、英偉達GPU伺服器

快科技3月15日消息,日前,“慶陽電信”宣布,截止2月底,中國電信東數西算國家樞紐慶陽算力中心先後完成英偉達H800、華為H910B等1000台GPU伺服器的部署工作,中心算力規模達到3500P。 隨著該中心1000台GPU伺服器穩定運行,全國一體化算力網絡甘肅樞紐節點慶陽數據中心集群算力規模突破5000P,達到5300P。 據媒體報導,P代表超算中心的計算能力,業界稱,1P相當於每秒運算一千萬億次,100P的算力就相當於50萬台計算機。 以科研場景為例:天文學家在20萬顆天體的星空圖中要定位某種特徵星體,算力不足之下,耗時可能超100天,如有100P算力,所需時間僅100秒。 目前,慶陽數據中心集群已建成由西安直達北京、上海、廣州、成都等重點城市的網絡鏈路,1.5萬架機櫃上架運行,形成算力規模5300P,智能算力消納達到100%。 值得一提的是,官方表示,中國電信慶陽算力中心計劃6月底前再部署400-500台GPU,新增算力2500P。 來源:快科技

《暗黑破壞神4》本月26日會有光追補丁,《黑神話 : 悟空》將支持DLSS 3.5

2024年度的遊戲開發者大會(Game Developers Conference)將於2024年3月18日拉開帷幕,英偉達發布了幾項有關RTX技術集成的公告,表示將為GeForce RTX遊戲玩家提供出色的PC體驗。 首先《暗黑破壞神4(Diablo IV)》將會在本月26日獲得光線追蹤的支持,而遊戲目前已經支持NVIDIA Reflex和DLSS 3。官方稱,《暗黑破壞神4》啟用光線追蹤後,將增強場景下的陰影效果,添加了額外的細節和深度,盔甲、水、窗戶等會有更適當的反射表現,將變得更加准確、逼真,從而呈現更好的戰鬥效果。 由遊戲科學公司製作的動作角色扮演遊戲《黑神話:悟空(Black Myth:Wukong)》將於2024年8月20日發售,登陸PC(Steam和Epic Games Store)、PlayStation 5和Xbox Series X|S平台。其基於虛幻引擎5打造,將支持全景光線追蹤和DLSS 3.5,將環境效果和細節提升到一個新的水平。 手機通道:嗶哩嗶哩 官方在演示視頻中,展示了全景光線追蹤的水體焦散和反射、全局光照和陰影效果,為畫面增添了細節和動態感。 此外,《永劫無間(NARAKA:BLADEPOINT)》也將支持全景光線追蹤和DLSS 3.5,《星球大戰:亡命之徒》《傳送門 RTX(PortalwithRTX)》《戰國王朝》《第一狂戰士:卡贊》《時空英豪:新起點》等都將加入DLSS 3.5的支持。 ...

你見過晶圓大小的晶片嘛 這家AI獨角獸推新品對標英偉達H100

財聯社3月14日訊(編輯 周子意)當晶片製造商都在試圖將晶片往小了設計時,而這家公司卻反其道而行之。 半導體初創公司Cerebras Systems公司周三(3月13日)推出了一款新的晶片WSE-3,而它的尺寸卻類似晶圓大小,或者說比一本書還要大,單體面積達到約462.25平方厘米。它是目前最大GPU面積的56倍。 據悉,該款晶片將4萬億個電晶體組織在90萬個核心中。 該晶片針對人工智慧訓練的工作負載進行了優化。Cerebras公司聲稱,配備了2048個WSE-3晶片的伺服器集群可以在一天內訓練出市場上最先進的開源語言模型之一Llama 2 70B。 替代英偉達 Cerebras是一家美國人工智慧晶片的獨角獸企業,它背後的投資團隊也都實力夠硬。最新一筆融資是在2021年由Alpha Wave Venture和阿布達比增長基金領投,融資金額2.5億美元,其他的投資人士包括:OpenAI創始人山姆·奧特曼、AMD前首席技術官Fred Weber等。 2021年,Cerebras公司首次亮相了WSE-2晶片,集成了1.2萬億個電晶體、40萬個核心。在同行都在將晶圓分割成數百顆獨立晶片之時,Cerebras公司則是選擇將整個晶圓做成一顆晶片。 而最新發布的WSE-3則是從WSE-2改進而來的。它較WES-2又增加了1.4萬億個電晶體,並擁有90萬個計算核心、44GB的板載SRAM內存。強化部分是通過從7納米製造工藝更新到5納米節點所實現的。 據該公司稱,WSE-3在人工智慧工作負載方面的性能是其前身的兩倍,它的峰值速度可以達到每秒125千萬億次計算。 Cerebras還將WSE-3定位為比英偉達顯卡更為高效的替代品。根據Cerebras官網的數據,該晶片4萬億個電晶體數完全碾壓了英偉達H100 GPU的800億個;核處理器數是單個英偉達H100 GPU的52倍;片上存儲量是H100的880倍。 WSE-3晶片為Cerebras公司的CS-3超級計算機提供動力,CS-3可用於訓練具有多達24萬億個參數的人工智慧模型,對比由WSE-2和其他常規人工智慧處理器驅動的超級計算機,這一數據是個重大飛躍。 加速數據傳輸 雖說將晶圓大小的晶片和單個英偉達H100 GPU相比較並不公平,不過若從數據傳輸速度的角度來看,不將晶圓切割成單獨的晶片確實有它的優勢。 根據Cerebras公司的說法,使用單一的大型處理器可以提高人工智慧訓練工作流程的效率。當WSE-3上的4萬億個電晶體在晶圓上互連時,將會大大加快生成式人工智慧的處理時間。 人工智慧模型就是相對簡單的代碼片段的集合,這些代碼片段被稱為人工神經元。這些神經元被重新組織成集合(稱為層)。 當人工智慧模型接收到一個新任務時,它的每一層都會執行任務的一部分,然後將其結果與其他層生成的數據結合起來。 由於神經網絡太大,無法在單個GPU上運行,因此,這些層需要分布在數百個以上的GPU上,通過頻繁地交換數據來協調它們的工作。 基於神經網絡架構的具體特性,只有獲得前一層的全部或部分激活數據,才能在開始分析數據,並提供給下一層。也就意味著,如果這兩層的數據運行在不同的GPU上,信息在它們之間傳輸可能需要很長時間。晶片之間的物理距離越大,數據從一個GPU轉移到另一個GPU所需的時間就越長,這會減慢處理速度。 而Cerebras的WSE-3有望縮短這一處理時間。如果一個人工智慧模型的所有層都在一個處理器上運行,那麼數據只需要從晶片的一個角落傳輸到另一個角落,而不是在兩個顯卡之間傳輸。減少數據必須覆蓋的距離可以減少傳輸時間,從而加快處理速度。 該公司指出,在如今的伺服器集群中,數以萬計的GPU被用來處理一個問題,而若是將晶片數量減少50倍以上,就可以降低互連成本以及功效,同時或許也可以解決消耗大量電力的問題。 Cerebras聯合創始人兼CEO Andrew Feldman稱,“當我們八年前開始這一旅程時,每個人都說晶圓級處理器是白日夢…WSE-3是世界上最快的人工智慧晶片,專為最新的尖端人工智慧工作而打造。” 對於新推出地WSE-3晶片,分析公司Intersect360 Research執行長Addison Snell認為,Cerebras的WSE-3人工智慧晶片和CS-3系統可以使部分高性能計算用戶受益。 他指出,“該晶片在相同的成本和功率下將性能提高了一倍。” 不過,Tirias Research創始人Jim McGregor則較為現實地指出,盡管這家初創公司增長迅速,並且有能力提高其平台的可擴展性,但與占主導地位的人工智慧供應商英偉達相比,它仍然是一家規模較小的公司。 他還指出,Cerebras專注於人工智慧的一個方面,那就是訓練,不過訓練只是大型語言模型市場的一個利基市場。而英偉達提供了許多其他方面產品。 來源:快科技

市值一年暴漲287%逼近蘋果 美銀:英偉達還要再漲24%

快科技3月14日消息,從年初到現在,英偉達的股價已經飆升了80%,在過去一年內上漲了287%,其股價已經逼近1000美元關口,市值達到了2.2萬億美元逼近蘋果公司。 美國銀行周三在一份報告中表示,盡管英偉達的市值已達到2.2萬億美元,但它的股價仍然不算貴。 該行重申了對英偉達股票的“買入”評級,並將其目標價從925美元上調至1100美元,意味著較當前股價水平還有約24%的上漲空間。 美銀分析師Vivek Arya表示:“盡管年初至今表現優異,但英偉達的估值和所有權與半導體/IT同行相比仍具有吸引力。” 盡管英偉達股價大漲,但由於其晶片在AI市場上仍然供不應求,公司業務收入獲得驚人增長,導致該公司估值仍低於ChatGPT於2022年末首次推出時的估值。 Arya表示,管大多數投資者持有英偉達的股票,但相對於其在標准普爾500指數中的權重,投資者們對該股的持倉比重仍然偏低。 而隨著3月18日英偉達GTC技術大會的開幕,可能會推出其廣受歡迎的H100晶片的後續產品,對英偉達股價來說可能會迎來又一波上漲動力。 來源:快科技

英偉達RTX 50系列GPU新爆料:GB203/205分別為256/192-bit位寬

近期接二連三傳出有關Blackwell架構遊戲GPU的消息,比如GeForce RTX 50系列採用的GDDR7是速率為28 Gbps的16Gb(2GB)模塊、可能還會支持24Gb(3GB)模塊、GB202的位寬到底是384-bit還是512-bit等。 有網友帶來了新的爆料,稱GB203的位寬為256-bit,而GB205的位寬為192-bit。如果GB202的位寬真的是512-bit,那麼意味著次一級的GB203在位寬上僅有GB202的一半,傳聞SM數量也是如此,分別為96組和192組,兩者差距還挺大的。 根據之前的說法,基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、 GB206和GB207五款晶片,與以往最大的不同,是AD104之後沒有GB204這款x04晶片,而是變成了x05的GB205。除了GB202、GB203和GB205以外,剩下的GB206和GB207兩款晶片的位寬都是128-bit。 目前有關GB20x系列幾款晶片具體規格的信息並不多,與之前提早大面積被曝光的AD10x系列有很大的不同,事後也證明最初有關AD10x系列的規格是非常準確的,這也與英偉達因安全漏洞問題,大量機密信息被泄露有關。 GTC 2024大會將於2024年3月18至21日在美國加州聖何塞會議中心舉行,雖然安排的內容主要與人工智慧(AI)相關,涉及Blackwell架構的內容應該也是面向數據中心的產品,不過也能從側面讓大家了解到新一代架構的情況。 ...

傳RTX 50系列採用28Gbps的GDDR7,英偉達仍可能提供512-bit位寬

近期有關Blackwell架構遊戲GPU的消息似乎又多了起來,傳聞GeForce RTX 50系列採用的GDDR7是16Gb(2GB)模塊,還可能支持24Gb(3GB)模塊,另外GB20x系列在顯存接口配置上與AD10x系列相同,旗艦級顯卡最多也是384-bit,與現有產品一致。 近日有網友透露,盡管首批GDDR7的速率達到了32 Gbps,不過GeForce RTX 50系列採用的GDDR7速率為28 Gbps,速度會慢一些。在顯存位寬一致的情況下,28 Gbps的GDDR7將比18 Gbps的GDDR6高出55%的帶寬,比21 Gbps的GDDR6X高出33%的帶寬。 在首發產品上選擇更低的顯存速率,這種情況以前也發生過。英偉達首款採用GDDR6的顯卡來自GeForce RTX 20系列,雖然存儲廠商提供了16 Gbps的產品,但是英偉達最終將速率定在了14 Gbps。 早在去年,三星就宣布完成了業界首款GDDR7晶片的開發工作。與現有GDDR6使用的NRZ/PAM2或GDDT6X的PAM4信號編碼機制不同,GDDR7採用的是PAM3信號編碼機制。NRZ/PAM2每周期提供1位的數據傳輸,PAM4每周期提供2位的數據傳輸,而PAM3每兩個周期的數據傳輸為3位。 此外,傳聞GB20x系列裡的旗艦晶片GB202仍可能提供512-bit位寬,這意味著顯卡會擁有更大的顯存,同時GDDR7在速率28 Gbps的情況下,顯存帶寬比起AD102高出近80%。 ...
RTX 3090/3080/3070正式發布1.2萬元、史上首次流暢8K

黃仁勛直言AMD等友商免費都沒人買 英偉達要靠AI狂賺3000億美元 沒對手

快科技3月12日消息,作為人工智慧的最大受益者,英偉達已經開始賺取了大量的利潤,不過這還遠不夠。 預計到2026年,NVIDIA將獲得高達1300億美元的收入,比23財年高出五倍(幾乎比2021年增加了1000億美元),因此英偉達有望在下一代人工智慧計算市場占據主導地位。 NVIDIA似乎有望在2027年之前從人工智慧驅動的銷售中獲得3000億美元的收入,為其已經極為龐大的市值再增加一大塊。 英偉達今年將從數據中心GPU中獲得 870億美元的收入,同比增長150%。 由於領先優勢太明顯,這也導致黃仁勛接受采訪時表示,英偉達的GPU“非常好,即使競爭對手的人工智慧(AI)晶片是免費的,但它也不夠便宜”,無法擊敗英偉達的GPU。 黃仁勛進一步解釋說,就AI數據中心的總擁有成本(TCO)而言,英偉達GPU定價並不重要。 來源:快科技

GTX 16和RTX 20系列顯卡可開啟Resizable BAR,第三方MOD提供支持

自從AMD推出了Smart Access Memory(SAM)功能後,英偉達很快便藉助PCI Express技術標准,提供了相似作用的Resizable BAR,現在許多主板的BIOS都能開啟這項功能。作為近幾年的一項新的性能優化功能,可以讓CPU直接訪問顯存,消除了瓶頸,從而提升大概10%的遊戲幀數,不過這玩家需要使用基於Ampere架構的GeForce RTX 30系列顯卡才能實現。 近日有第三方開發者上傳了一個名為「NvStrapsReBar」的UEFI MOD,為基於Turing架構的GeForce GTX 16系列和RTX 20系列顯卡帶來了Resizable BAR的解決方案,對於仍然使用舊顯卡的玩家來說非常有用。 通過啟用Resizable BAR,GPU可以與主板協商BAR(基地址寄存器)的大小。該工具可以自動設置,也可以手動確認。雖然看起來比較簡單易用,但是操作涉及到修補主板的UEFI固件,用戶在使用前還是要確保了解所涉及的風險問題。由於英偉達不會為GeForce GTX 16系列和RTX 20系列顯卡提供啟用Resizable BAR的支持,所以暫時也是這些舊款顯卡唯一可用的解決方案。 現在市面上大多數銷售的顯卡都支持Resizable BAR,像英特爾甚至表示銳炫A系列顯卡必須啟用Resizable BAR,以獲得最佳性能,用戶搭配的對應平台要求第10代(Comet Lake)酷睿起步。 ...

英偉達確認下一代DGX系統即將到來,將採用液冷散熱

近日,英偉達創始人兼執行長黃仁勛在2024 SIEPR經濟峰會上透露,英偉達下一款「即將到來」的設備將採用液冷散熱。雖然沒有明確具體是什麼設備,但隨著GTC 2024大會的臨近,行業分析師普遍認為黃仁勛指的是用於人工智慧(AI)的下一代DGX系統。 目前不少大型數據中心伺服器的CPU和GPU仍依賴風冷散熱,包括當前一代的DGX系統。事實上,現有的H100和H200可以很好地在風冷散熱下運行,所以廠商轉向水冷散熱的動力並不大。 近日Dell營運長Jeff Clarke接受了媒體的采訪,表示工程團隊已經為英偉達的新款數據中心產品做好了准備,為每個GPU帶來了滿足1000W功耗所需的散熱解決方案,因此可能需要液冷散熱解決方案。近年來,隨著CPU和GPU變得越來越耗電、發熱越來越大,業界對尖端液冷散熱的投資也在不斷增加,畢竟比起傳統風冷有著更高的散熱效率。 今年初,浪潮信息宣布與英特爾聯合發布全球首個全液冷冷板伺服器參考設計,並面向業界開放,為全球液冷產業鏈上下游提供極具價值的參考樣板。浪潮信息也基於該參考設計,推出了全液冷冷板伺服器,實現伺服器部件接近100%液冷散熱。考慮到數據中心巨大的投入,需要大量的研發工作和足夠的基礎設施來維護,或許英偉達也准備了類似的解決方案。 ...

英偉達在RTX 50系列維持現顯存接口配置:最高端GPU顯存仍為384位

GTC 2024大會將於2024年3月18至21日在美國加州聖何塞會議中心舉行,英偉達很可能會選擇在這次活動上帶來有關Blackwell架構的最新消息,主要涉及的是數據中心產品。傳聞下一代遊戲GPU同樣是Blackwell架構,不過近期流出的信息相對較少。 近日有網友透露,GB20x系列在顯存接口配置上與AD10x系列相同,這意味著不會有512-bit位寬的產品,旗艦級顯卡最多也是384-bit。 圖:已故美國統計學家和數學家David Harold Blackwell 雖然顯存位寬沒有增大,但是下一代GPU將支持GDDR7,顯然會帶來更高的帶寬。此前有報導稱,首批支持GDDR7的GPU使用16Gb(2GB)模塊,不排除也會有採用24Gb(3GB)模塊的產品,以便在顯存位寬沒有增大時可以提升顯存的容量。去年三星就已完成業界首款GDDR7晶片的開發工作,每個數據I/O接口的速率達到了32Gbps,意味著同樣是384-bit的情況下,提供了高達1.536 TB/s的帶寬,遠超目前GeForce RTX 4090的1.008 TB/s。 有消息指出,Blackwell架構會有較大的變化,SM和CUDA將有一個新的結構,RT單元有可能被PT單元所取代,光線追蹤性能也會得到進一步優化和加強。據稱,基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、 GB206和GB207五款晶片,對應的顯存位寬分別是384-bit、256-bit、192bit、128-bit和128-bit,與以往最大的不同,是AD104之後沒有GB204這款x04晶片,而是變成了x05的GB205。 GB20x系列GPU預計採用台積電(TSMC)的3nm工藝製造,並支持DisplayPort 2.1顯示輸出。 ...
NVIDIA RTX 30系列時間表 8月量產、9月發布

你支持過幾塊卡 英偉達市值蘋果相差不足3000億美元:黃仁勛靠AI賺大

快科技3月8日消息,靠著人工智慧,英偉達開啟了坐著火箭賺錢的道路。 截至周四收盤報927.095美元,漲幅4.52%,市值達2.32萬億美元,與蘋果相差不足3000億美元。 從目前機構的角度看,AI人工智慧才剛剛開始,疊加英偉達多到爆的訂單,所以他們超越蘋果成為全球市值第一的公司,應該不會是太大難事。 當然靠著AI,黃仁勛也是賺的麻木了,所以還真別吐槽為啥英偉達顯卡越賣越貴了,他們真的不靠這個賺錢,所以.... 靠著人工智慧的風潮,AMD的市值也在穩步提升,但是兩家公司目前最大的問題就是,由於監管嚴厲,導致旗下諸多強勁的算力硬體無法賣給中國廠商,這就非常難受。 英偉達市值能有今天,想必也有各位的一份功勞,你支持過幾塊卡? 來源:快科技
RTX 30系列顯卡性價比大增 NVIDIA虧了 少賺1%利潤

AI最大贏家 沒有之一 爆炒英偉達的人已財富自由:黃仁勛沒「坑」買他顯卡的用戶

快科技3月7日消息,隨著人工智慧全球爆火,英偉達成為了AI最大的贏家。 自從2022年底,ChatGPT發布掀起AI產業熱潮之後,英偉達就成為了市場的香餑餑,而押注英偉達的投資者們,也迎來了“十年難遇”的造富機會。 剛剛過去的2023年中,英偉達不僅淨利潤同比大漲581%,其股價還從年初的每股100餘美元暴漲至如今的超800美元(超過1000美元指日可待),市值增長超萬億美元。 特斯拉創始人馬斯克曾這樣描述英偉達的火熱:“似乎所有的人和狗都在購買(英偉達)GPU。” 全球已經有不少投資英偉達的人賺的盆滿缽滿,而一些用戶甚至喊話,黃仁勛沒有“坑”買他顯卡的用戶,這才是他們堅信的未來。 GTC是英偉達一年一度的全球開發者大會,也被視為整個AI和深度學習領域的盛會,按照慣例公司將會在會上完成重要產品或技術發布,而按照黃仁勛的說法,未來兩年公司的訂單都滿負荷。 來源:快科技

分析稱英偉達是「kingmaker」,預計2024年僅數據中心GPU就能賺870億美元

據TomsHardware報導,根據市場研究公司Omdia的數據,預計英偉達在2024年僅數據中心GPU就能賺870億美元。其中還分析了英偉達在2023年通過專注於人工智慧(AI)和伺服器所使用的GPU賺了多少錢,以及這種勢頭如何在2024年延續,強調了英偉達龐大的銷售數據如何直接影響OEM之間的市場份額,並稱其為「kingmaker」。 雖然英偉達快速增長的數據中心收入顯然要歸功於其GPU,但是並沒有公布基於Ampere和Hopper架構的產品的具體銷量。英偉達財報上的數據中心部分包括GPU、CPU和網絡硬體,這就模糊了GPU的具體收入。Omdia的工作就是通過分析雲端和數據中心市場的報告,讓這一點變得更加清晰。 2023年第四季度伺服器和數據中心收入比第三季度增長了21.5%,而相比2022年第四季度增長了12.7%。這一增長至少在一定程度上是由英偉達推動的,其第四季度在伺服器BOM市場的份額達到了44%。要知道2023年第一季度時,英偉達的BOM份額僅為15%,這表明數據中心將越來越多的預算投入到英偉達GPU上,而且轉向的速度也很快。 事實上,數據中心似乎優先考慮購買更多英偉達的GPU,而不是更新配備上一代CPU、內存和存儲的舊伺服器。由於英偉達目前在伺服器市場的高度重要性,所有與其關系密切的OEM廠商出貨量都有所提高,比如超微的市場份額已超過10%,高於HPE。 Omdia認為今年GPU的需求將繼續超過供應,雖然H100的供應問題逐漸減少,等待時間已經從2023年底的11個月降至現在的4個月,但預計高需求仍然會導致供應緊張和滯後。在2023年,英偉達數據中心GPU收入的40%要歸功於人工智慧推理,Omdia預計2024年人工智慧將占英偉達數據中心GPU收入的大部分份額,這會進一步推動英偉達走向人工智慧驅動的商業模式。 Omdia稱,英偉達依靠數據中心GPU在2023年總共賺了340億美元,預計2024年將繼續提升,達到870億美元,相比2023年增長150%。 ...

英偉達GeForce Game Ready 551.76 WHQL驅動:針對《奇喚士》優化

英偉達發布GeForce Game Ready 551.76 WHQL驅動程序,針對新遊戲《奇喚士(The Thaumaturge)》進行了優化,其中包括對NVIDIA Reflex和DLSS 3的支持。 該版本驅動程序還支持NVIDIA App測試版,統一了GeForce Experience和NVIDIA控制面板。NVIDIA App並不只是GeForce Experience這個應用的又一次升級,它是一款更具雄心壯志的應用:NVIDIA將會把沿用了數十年的傳統的NVIDIA控制面板、面向玩家的GeForce Experience和面向專業用戶的RTX Experience這三個應用全都融合匯聚在NVIDIA App中,帶來統一且現代化的顯卡驅動體驗。此前我們已經進行了上手體驗,回看文章可點擊此處。 已修復的問題,包括: 《塔羅斯的法則2(The Talos Principle 2)》- 啟用DLSS FG時的遊戲穩定性問題。 在GeForce GTX 16xx GPU上使用NVENC編碼視頻可能會導致視頻損壞或出現錯誤信息。 。 Steamwebhelper.exe阻止筆記本顯示模式切換。使用Edge瀏覽器播放視頻時會出現顯示問題,建議直接打開Windows...

RTX 5090要首發 性能要翻倍 GDDR7顯存標准公布:英偉達AMD加入

快科技3月6日消息,今天JEDEC正式宣布GDDR7為下一代顯存標准,AMD和NVIDIA均已加入。 目前,三星和美光都已制定了下一代GDDR7內存模塊的開發計劃。三星的目標是達到32Gbps的速度,而美光的目標也是24Gb+32 Gbps的晶片。美光在其最新的路線圖中也公布了到2026年達到36 Gbps和24 Gb+的內存模塊。 從公布標准看,JESD239 GDDR7的帶寬是GDDR6的兩倍(獨立通道數量增加一倍,增加至4個),每個器件可達192 GB/,支持16 Gbit至32 Gbit密度,包括支持雙通道模式,使系統容量翻倍。 JEDEC表示:"JESD239 GDDR7標志著高速內存設計的重大進步。隨著向PAM3信號的轉變,存儲器行業有了一條新的途徑來擴展GDDR器件的性能,並推動圖形和各種高性能應用的不斷發展,其不僅注重帶寬,而且通過整合最新的數據完整性功能滿足 RAS 市場需求的GDDR"。 從目前的情況看,RTX 50系列旗艦卡——大機率叫做RTX 5090——將會首發新一代顯存GDDR7,從爆料看,新卡的性能提升很暴力,比上一代性能提高近一倍。 按照之前三星GDDR7曝光的情況,37GHz的高頻率下,GDDR7即便搭配256-bit位寬也能提供1.18TB/的帶寬,超過384-bit 24GHz GDDR6。 如果搭配384-bit位寬,32GHz GDDR7的帶寬就將有幾乎1.8TB/,相比於RTX 4090領先足足80%,並且差不多是RX 7900 XTX的兩倍。 從目前情況看,AMD對於RTX 5090等英偉達旗艦卡,幾乎不會有直接的還手能力。 來源:快科技

英偉達已徹底停產GTX 16系列GPU,預計1到3個月消化完庫存

去年末就有消息稱,英偉達從2024年第一季度開始,GeForce GTX 16系列GPU將徹底、全線停產,將不再向AIC品牌廠商供應相關晶片。要知道搭載這些GPU的顯卡出貨量相當大,即便在最新一期的月度Steam硬體調查里,GTX 1650依然占據第二名的位置。 據博板堂透露,英偉達已經徹底停產GeForce GTX 16系列GPU,包括了GTX 1660 SUPER166016501630系列等,目前庫存也已宣布分給了各大AIC品牌廠商,相關顯卡直到各家庫存消化完截止,這個過程預計需要大概1到3個月的時間。 事實上,英偉達早已將GeForce GTX 1660 SUPER停產,這次主要影響的是GeForce GTX 1650/1630系列顯卡。其中GeForce GTX 1650/1630系列顯卡面向低端/入門級市場,停產後暫時沒有什麼其他替代的型號,讓英偉達的產品線出現真空地帶。近期英偉達帶來了基於Ampere架構的GeForce RTX 3050 6GB,但定位似乎不能完全覆蓋,或許接下來會有其他新產品去填補空缺。 與連續銷售數年的GTX 1650有些不同,GTX 1630其實上市的時間並不長。作為英偉達的低端/入門級產品,GTX 1630發布於2022年6月末,至今銷售了大概20個月。其採用了基於Turing架構的TU117-150-A1 GPU,配備了512個CUDA核心,顯存為4GB的GDDR6,位寬僅為64位,只有TU117-300的一半,顯存速率為12 Gbps,對應的顯存帶寬為96 GB/s。...

HBM低良品率影響產量,美光在英偉達HBM3E資格測試中領先

目前英偉達為人工智慧(AI)和高性能計算(HPC)應用銷售的晶片比業內其他企業都要多,這些高性能計算卡需要大量HBM類晶片,如果想保持這種狀態,就需要穩定的供應。為了更妥善且健全的供應鏈管理,同時為了保證下一代產品的供應,英偉達規劃加入更多的供應商,去年末三星、SK海力士和美光都參與到英偉達下一代AI GPU的資格測試中。 據DealSite報導,英偉達的資格測試似乎給HBM製造商帶來了困難,比起普通的內存產品,HBM類產品的良品率明顯較低,這一定程度上影響了供應。相比市場對於HBM類產品的巨大需求,目前存儲器製造商的產能有所不足,供應十分緊張,SK海力士和美光先後表示2024年HBM產能售罄。 HBM需要在基礎晶圓上通過矽通孔(TSV)連接多層DRAM,如果其中一層出問題就意味著整個HBM堆棧報廢。隨著堆疊層數的增加,良品率有可能會進一步降低。有消息人士稱,現階段HBM類產品的良品率約為65%,如果想要提高這一數字,產量就會下降。存儲器製造商之間的競爭就是在良品率和產量之間找到平衡,提供合適的解決方案。據了解,美光和SK海力士似乎在英偉達的資格測試中處於領先位置,其中前者已經通過了認證階段,開始為下一代H200產品生產HBM3E晶片。 目前SK海力士和三星都打算增加HBM類產品的產量,不過較低的良品率加上更高的需求,從長遠來看是個大問題。 ...

英偉達賺麻了 穩坐檯積電第二大客戶位置

根據台積電最新發布的2023財年審計報告,全球知名的圖形處理單元(GPU)和人工智慧(AI)加速器製造商NVIDIA已經上升為台積電的第二大客戶。 報告顯示,NVIDIA向台積電的訂單金額高達77.3億美元,占據了其總收入的11%。 這一數據並不令人意外,鑒於NVIDIA在近幾年對AI GPU的高銷售量,這些產品不僅推動了公司業績的增長,也對台積電的產能產生了壓力,導致了供應瓶頸的出現。 盡管NVIDIA的增長速度迅猛,但蘋果依舊穩坐檯積電最大客戶的寶座,其在2023年為台積電貢獻了175.2億美元的營收,占比達到了25%。 此外,其他多家知名企業如聯發科、AMD、高通、博通、索尼及美滿電子等,也在本年度為台積電的財務增長做出了貢獻。 特別值得注意的是,NVIDIA和蘋果兩家公司均實現了兩位數的收入占比,顯示出它們在市場上的強大影響力。 台積電的先進工藝技術備受期待,NVIDIA與蘋果都在密切關注並准備採納其即將推出的新一代工藝。當前形勢表明,隨著這兩家公司對台積電產品的持續需求,台積電的營收有望繼續攀升。 在全球供應鏈中,NVIDIA正通過與三星晶圓代工和IFS的合作,努力實現供應來源的多樣化,然而從長期合作的角度來看,NVIDIA似乎更傾向於維持與台積電的合作關系。 這種策略表明,NVIDIA可能在台積電未來的發展中扮演更加重要的角色,如果雙方的合作關系以目前的速度持續發展,NVIDIA甚至有可能在未來超越蘋果,成為台積電的最大客戶。 來源:快科技

Dell確認英偉達明年推出Blackwell架構B200,功耗或達到1000W

去年10月,英偉達在投資者簡報中介紹了包括HBM3e、PCI Express標准(6.0/7.0)更新和多GPU互聯技術更新等內容,還放出了產品路線圖,上面展示了其2024年至2025年數據中心的規劃,將帶來基於Blackwell架構的GB200NVL、GB200、B100和B40等產品。 近日Dell營運長Jeff Clarke接受了媒體的采訪,表示對接下來的B100和B200感到興奮,其工程團隊已經為英偉達的新款數據中心產品做好了准備,為每個GPU帶來了滿足1000W功耗所需的散熱解決方案,明年的B200有機會讓Dell展示工程技術及為此所做的相關工作,期間運用了大量的專業知識讓液體冷卻可以大規模運行。 其中我們可以了解到,英偉達還有一款名為B200的產品,這是之前放出的產品路線圖上所沒有的,而現有H200的接替者是B100,針對不同的應用場景還將提供GB200和GB200NVL。同時作為英偉達在數據中心領域主要的合作夥伴之一,Dell的高管還確認了B200的發布時間為2025年。此外,B200的功耗有可能達到1000W的水平,而目前H100 SXM的功耗為700W。 已經有媒體聯系英偉達和Dell想進一步了解B200的消息,不過都被拒絕了。GTC 2024大會將於2024年3月18至21日在美國加州聖何塞會議中心舉行,英偉達很可能會選擇在這次活動上帶來有關Blackwell架構的最新消息。 ...

英偉達已是台積電第二大客戶,2023年占後者營收的11%

雖然台積電(TSMC)不會主動披露其客戶的業務細節,不過由於其股票憑證同時也在美國紐約證券交易所以TSM為代號掛牌上市,所以根據當地法律法規要求,如果有客戶占其收入的10%以上,必須予以披露。 去年被台積電稱為「客戶A」的蘋果,占據了台積電營收的25%,支付了175.2億美元。與此同時,另一位在文件里稱為「客戶B」的客戶,向台積電支付了77.3億美元,占據了台積電營收的11%。專門研究半導體公司的金融分析師Dan Nystedt表示,這位「客戶B」其實就是去年憑借人工智慧(AI)晶片紅遍業界的英偉達。 此外,去年台積電前十大客戶占據了台積電91%的收入,高於2022年的82%。除了蘋果和英偉達外,還有聯發科、高通、AMD、博通和Marvell等。過去多年裡,蘋果一直是台積電最大的客戶,考慮到蘋果對晶片的需求,未來幾年大機率仍是如此。雖然AMD、高通和聯發科近年來不斷增加訂單,但是很長一段時間里,沒有其他客戶能占據台積電營收的10%以上,從這點可以看出人工智慧熱潮對英偉達的晶片訂單量有多大的影響。 英偉達的A100和H100除了晶片由台積電製造外,也由台積電使用CoWoS封裝技術完成封裝,因此需要同時支付晶片製造和先進封裝服務的費用。隨著業界對人工智慧晶片的需求持續增加,2024年英偉達可能在台積電收入里會占據更大的份額。目前市場對EPYC伺服器處理器和Instinct MI300系列產品的需求也很高,AMD今年也有可能占據台積電收入的10%以上。 ...

英偉達GeForce Hotfix 551.68驅動:解決GTX 16系列顯卡NVENC編碼問題

英偉達發布了GeForce Hotfix 551.68驅動程序,其基於最新的GeForce Game Ready 551.61 WHQL驅動程序,帶來了針對GeForce GTX 16系列顯卡上的NVENC編碼問題進行了修復。GeForce GTX 16系列採用了第6/7代NVENC編碼器,支持H.264和H.265視頻編碼,不過缺乏對AV1編碼的支持。 英偉達會定期發布顯卡驅動程序,一般是有新顯卡或者新遊戲發售的時候,不過偶爾會針對某款遊戲或者之後發現的新漏洞發布Hotfix驅動程序,旨在解決其工程師已經發現並修復的重要問題。通常這些都是針對特定問題的小修復,不涉及任何重大問題。這次的GeForce Hotfix 551.68驅動程序主要針對GeForce GTX 1630/1650/1650 Ti通過NVENC進行視頻編碼的用戶,該錯誤可能導致GPU編碼器使用旗艦視頻損壞或者報錯。 英偉達重申,GeForce Hotfix驅動程序被視為測試版本,質量保證流程比起一般的WHQL驅動程序要少得多。這次的551.68驅動程序不會有其他任何修復或者功能增強,如果並非使用對應型號顯卡進行視頻編碼的用戶不需要下載更新,等待下一個WHQL或Game Ready版本即可。 NVIDIA GeForce Hotfix 551.68驅動程序(Windows 10/11 64位),地址:點此前往>>> ...
台積電越來越依賴ASML的EUV光刻機 3nm需要20層

為何GPU非常難買 AMD前高管怒斥英偉達:操控GPU市場 讓廠商站隊

快科技2月28日消息,據媒體最新報導稱,英偉達利用其行業優勢地位,操控GPU市場供給,讓廠商選擇去站隊。 報導中提到,前AMD圖形業務部門副總裁Scott Herkelman怒斥,英偉達在多個領域都存在類似行為,即壟斷市場並操控GPU供給。 事實上,這件事情的導火索來自晶片廠商Groq,其指控英偉達存在不正當競爭行為,稱其會延緩向同時使用其他廠商數據中心AI處理器的客戶發貨。 當然了,Scott Herkelman的說話也是很有影響力,去AMD之前,其還曾在2012年至2015年擔任英偉達GeForce業務的總經理,對兩家公司的運作模式都有著深入了解。 當然了,英偉達CEO黃仁勛此前曾否認優先對待特定客戶,並表示公司會公平分配供給,同時為等待交貨的客戶提供雲服務商的GPU租用等替代方案。 有趣的是,黃仁勛之前還預警,下一代GPU會非常難買,現在來看這完全看他心情了吧。 來源:快科技

GPU出貨量2023Q4環比增長近6%,動力主要來自移動平台

近日Jon Peddie Research(JPR)發布了最新的GPU市場數據統計報告,顯示2023年第四季度PC使用的GPU出貨量(包括集成和獨立顯卡)為7620萬,環比增長5.9%,同比增長了20%。從長遠來看,Jon Peddie Research預計GPU在2024年到2026年之間將實現3.6%復合年增長率,預測2026年末將逼近50億安裝基數,未來五年PC中獨立顯卡的滲透率將達到30%的水平。 雖然GPU出貨量有了較大幅度的同比增長,不過包括獨立顯卡在內的桌面顯卡卻下降了1%,而筆記本電腦使用的GPU增長了32%,說明增長的主要動力來自於移動平台。另外環比5.9%的增長率遠遠超出過往10年平均增長率(-0.6%),其中AMD和英偉達的出貨量分別下降了2.9%和1.5%,英特爾的出貨量增長了10.5%。 在市場份額方面,AMD和英偉達的市場份額分別下降了1.4%和1.36%,英特爾則增長了2.8%,收復了過去幾個季度里丟掉的市場份額,畢竟筆記本電腦中大多數都採用英特爾的核顯。 在2023年第四季度中,GPU和PC的整體連接率(包括集成和獨立顯卡、台式機、筆記本電腦和工作站)為113%,環比下降3.3%;台式機獨立顯卡比上一季度增加了6.8%;本季度CPU整體市場的季度增長率為9%,年增長率為24%。 GPU一直是PC市場的先行指標,因為在PC供應商發貨之前就會安裝到系統中。Jon Peddie Research表示,盡管2023年第四季度的數據很不錯,但是遠沒有到樂觀的程度,2024年第一季度的表現比起上一個季度預計會有所下降,許多公司希望AI PC能改變一切,也許確實如此,但最快要到年末才逐漸成為主流趨勢。 ...
NVIDIA叫停GTC大會新聞發布 「安培」還得等

AI晶片供應似有緩和跡象:英偉達H100正被拋出 租用更容易

財聯社2月27日訊(編輯 周子意)越來越多的證據表明,人工智慧晶片的供應緊張問題正有所緩和,一些購買了大量英偉達H100 80GB處理器的公司現在正試圖轉售這些處理器。 目前,據悉用於人工智慧(AI)和高性能計算(HPC)應用的英偉達H100 GPU的交付周期已從8-11個月大幅縮短至3-4個月。 據報導,一些公司正在轉售他們的H100 GPU或減少訂單,因為這些晶片的稀缺性開始下降,並且維護這些尚未使用庫存的成本也很高。 此類情形與一年前相比出現重大轉變,當時獲得英偉達的Hopper GPU是一個重大挑戰。 目前人工智慧處理器供應短缺的緩解還表現在,從AWS、谷歌雲和微軟Azure等雲服務提供商租用英偉達的H100 GPU變得更加容易了。 例如,AWS推出了一項新服務,允許客戶安排更短時間的GPU租賃,解決了之前晶片可用性的問題,這導致獲得人工智慧晶片的等待時間在減少。 盡管晶片可得性有所提高,交貨時間也大大縮短,人工智慧晶片的需求仍然遠遠超過供應。 特別是那些自己開發並培訓大型語言模型的公司仍然面臨供應問題,很大程度上是因為他們需要的GPU數量過於龐大。這些公司在獲得所需處理器或容量方面仍面臨著幾個月的延遲。 也正因如此,英偉達H100和其他處理器的價格並沒有下降,該公司也繼續享有高利潤率。 不過,隨著諸多英偉達處理器的替代品接連問世,例如AMD和AWS的處理器,該市場可能會迎來更加平衡的局面。 還有一點原因是,各公司對人工智慧處理器的支出也變得更加謹慎了。 無論如何,就目前而言,市場對人工智慧晶片的需求依然強勁,並且隨著大型語言模型越來越大,對計算性能的需求也越來越高。 來源:快科技
傳GTX 1660 Super顯卡10月29日上市:只貴10美元 帶寬大漲75%

筆記本上跑AI 英偉達推出全新RTX 500/1000 AI顯卡

快科技2月27日消息,日前英偉達推出了RTX 500和RTX 1000系列全新一代筆記本電腦顯卡,主要適用於筆記本電腦和移動工作站,內置神經網絡計算單元(NPU)用於輕型本地AI計算。 據介紹,這些顯卡採用最新Ada Lovelace架構,目前該系列還包含RTX 2000、3000、3500、4000和5000等多款型號。 這些新顯卡的亮點之一就是全部配備了神經網絡計算單元,內置適用於AI處理的張量核心;其中NPU主要負責處理輕型AI任務,如果要進行復雜的AI計算則會使用GPU晶片處理。 RTX 500和RTX 1000顯卡為面向消費者設備和入門工作站的產品,RTX 500的TOPS為154、RTX 1000則為193。 英偉達表示,RTX 500可以提供上一代14倍的生成式AI性能,AI 圖像編輯速度提升3倍,3D渲染圖形性能比僅使用CPU的配置提升10倍。 除此之外,RTX 500和1000還為筆記本帶來了第三代RT核心、GPU專用顯存(RTX 500為4GB,RTX 1000為6GB)、DLSS 3、AV1編碼器等功能。 來源:快科技

英偉達GEAR研究小組成立,為物理和虛擬世界開發AI機器人和NPC

近日,英偉達成立了一個新的研究小組,名為「GEAR(Generalist Embodied Agent Research)」。目標是為了讓英偉達進一步推進和構建基於人工智慧(AI)的實體,並使其能夠在虛擬世界和物理世界中熟練地操作,比如智能機器人和NPC之類。 GEAR研究小組由Jim Fan和Yuke Zhu共同創立,之前雙方合作過幾個項目。作為GEAR研究小組的研究經理兼主管,Jim Fan表示正在打造Foundation Agent,一種具有普遍能力的人工智慧,能夠學會在虛擬和現實的多個世界中熟練地行動。Jim Fan相信,未來每台移動的機器都將是自主的,機器人和模擬代理將像iPhone一樣無處不在。 GEAR研究小組在主頁上提供了四個重點,闡明了研究議程,將從開發多模式基礎模型、通用機器人、虛擬世界中的基礎代理以及仿真和合成數據開始。其表示,2024年是機器人年,是遊戲人工智慧年和模擬年,希望能夠實現它。 GEAR研究小組還分享了四個先前的項目,其中兩個項目涉及《我的世界》,一個是植入遊戲後熟練且主動的人工智慧代理,另一個是優化的機器人強化學習技術,旨在讓機器人達到「超人類水平的靈活性」。 ...

黃仁勛確實怕 英偉達將華為列為最大對手:GPU/CPU實力能與之競爭

快科技2月25日消息,據媒體報導稱,美國晶片巨頭英偉達在本周提交給美國證券交易委員會的文件中,在包含AI晶片等多個類別中,首度將華為認定為“最大競爭對手”。 英偉達提及的其他競爭對手還包括英特爾、超微、博通、高通、亞馬遜和微軟。 英偉達指出,華為在供應圖形處理器(GPU)、中央處理器(CPU)等用於AI的晶片領域,都可與業界競爭。 百度、騰訊、阿里巴巴等過去長期是英偉達的重要客戶,但有消息指出,百度已轉向華為下單,這表明在美國不斷加大對華出口管制的情況下,中國公司已開始擺脫對美國技術的依賴。 此外,面對華為的瘋狂起勢,英偉達也已經開始感受到壓力,特別是前者也發力在算力晶片,而之前黃仁勛就曾表示,華為這樣的對手值得尊敬和重視。 在黃仁勛看來,這次來中國的另外一個原因就是,中國市場超過80%的自動駕駛晶片都來自於英偉達,這是他必須要死守的地方,而這也是華為正在發力的地方,所以與中國車企客戶“聯系友誼”,可能也是黃仁勛此行可能重要目的之一。 來源:快科技

英偉達預計Blackwell架構GPU供應依然受限:市場需求遠遠超過供應量

此前有報導稱,由於人工智慧(AI)需求激增,市場需要性能更強大的解決方案,英偉達已經決定將下一代Blackwell架構GB100 GPU的發布時間從2024年第四季度提前到2024年第二季度末,在數據中心市場繼續壓制其他競爭對手。同時英偉達已經與SK海力士達成協議,選擇在新一代B100計算卡上採用後者面向人工智慧的超高性能DRAM新產品HBM3E。 據Seeking Alpha報導,雖然目前用於AI和HPC的H100計算卡交貨時間大幅度縮短,不過下一代基於Blackwell架構的新品在供應方面並不樂觀。英偉達首次財務官Colette Kress在與金融分析師和投資者舉行的財報電話會議上表示,由於需求遠遠超過供應,預計下一代產品的供應將受到限制。 傳聞已經有英偉達的客戶預訂了少量的B100計算卡,問題是真正發布後,採用全新組件的B100 SXM和B100 PCIe及配套的DGX伺服器,能以多快的速度提高產量。如果市場需求巨大,那麼很可能重演H100發貨初期出現的大面積延遲情況。 基於Blackwell架構的GB100 GPU採用小晶片設計和MCM封裝,可以更容易地提升晶片的產品,但是多晶片封裝解決方案也可能讓後期的封裝工作變得更加復雜。除了B100以外,英偉達還准備了用於企業和訓練應用的B40,以及結合了B100和Grace CPU的GB200產品,另外還有用於大型語言模型訓練的GB200 NVL。 ...

英偉達GeForce Game Ready 551.61 WHQL驅動:支持NVIDIA App測試版

英偉達發布GeForce Game Ready 551.62 WHQL驅動程序,可以為支持DLSS 3技術的最新遊戲提供最佳體驗,比如新遊戲《夜鶯傳說(Nightingale)》。此外,該版本還支持NVIDIA App測試版,統一了GeForce Experience和NVIDIA控制面板。 GeForce Experience優化設置新增了多款遊戲,包括《夜鶯傳說》、《碧藍幻想:Relink(Granblue Fantasy: Relink)》、《超自然車旅(Pacific Drive)》和《碧海黑帆(Skull and Bones)》。 已修復的問題,包括: 《彩虹六號:圍攻》- 運行 Vulkan API 時的穩定性問題。 RTX Video HDR - 在Windows中使用自定義HDR亮度值時,色調映射無法正常工作。 。 Chrome/Edge瀏覽器 -...

英偉達公布2024財年第四財季及全財年財報:數據中心業務收入暴增創下新紀錄

英偉達公布了2024財年第四財季(截至2024年1月28日),以及2024財年全年的財報。英偉達創始人兼CEO黃仁勛先生表示,不到六年的時間,NVIDIA RTX已成為一個用於生成式AI的大型PC平台,受到1億遊戲玩家和內容創作者的喜愛,接下來的一年裡,將有重大的新產品周期和卓越的創新,以幫助推動行業向前發展。 財報顯示,英偉達在2024財年第四財季中,收入為221億美元,同比增長265%,環比增長22%;淨利潤為122.85億美元,同比增長769%,環比增長33%;其中遊戲業務收入為29億美元,同比增長56%,和上一個季度基本持平;數據中心業務收入為184億美元,同比增長409%,環比增長27%;可視化業務收入為4.63億美元,同比增長105%,環比增長11%;汽車業務收入為2.81億美元,同比下降4%,環比增長8%。此外,英偉達的毛利率為76%,與上年同期的63.3%相比上升了12.7個百分點,與上一季度的74%相比上升了2個百分點。 回顧2024財年全年,收入為609.22億美元,增長126%;淨利潤為297.6億美元,增長581%;其中遊戲業務收入為104億美元,增長15%;數據中心業務收入為創紀錄的475億美元,增長217%;可視化業務收入為16億美元,增長1%;汽車業務收入為11億美元,增長11%。另外利潤率為72.7%,與上年的56.9%相比上升了15.8個百分點。 展望2025財年第一財季,英偉達預計收入會繼續攀升,將達到240億美元,正負浮動2%,另外毛利率在76.3%,上下浮動50個基點。 ...

微軟正在開發自研網絡解決方案,以減少對英偉達網絡產品的依賴

近年來,英偉達大規模進軍伺服器市場,特別是在人工智慧(AI)的加持下,取得了非常不錯的成績。除了CPU和GPU這類主力產品外,英偉達還有一項不可忽視的產品,就是收購Mellanox構建的網絡產品線,被大量的數據中心採用。 據The Information報導,微軟正在開發自研網絡解決方案,定製的網卡類似英偉達的ConnectX-7,這款來自NVIDIA Quantum-2 InfiniBand架構的智能網卡可提供400Gb/s吞吐量,並支持NVIDIA網絡計算加速引擎,實現額外加速,為超級計算機、人工智慧和超大規模雲數據中心提供所需的高可擴展性和功能豐富的技術。 領導微軟定製網卡開發項目的是Pradeep Sindhu,曾是Juniper Networks的聯合創始人,同時微軟在去年還收購了伺服器晶片初創公司Fungible。微軟希望通過為人工智慧工作負載量身定製自己的高速網絡硬體,可以加速人工智慧模型訓練,降低所需要的成本,並減少對英偉達網絡產品的依賴。有消息人士透露,開發定製網卡需要大概一年多的時間,最終的設計可能提供800Gb/s吞吐量。 從長遠來看,擁有專門為人工智慧打造的定製網絡技術可能會給微軟帶來競爭優勢,而且在優化和更新數據中心硬體方面獲得更多控制權。隨著人工智慧滲透到更多的商業和消費者應用程式中,微軟正在為以人工智慧為中心的未來在下一代基礎設施上押下重注。 ...

英偉達RTX 4060/4060 Ti供應不足,或持續一個月

此前有報導稱,各個顯卡品牌反映RTX 4060和RTX 4060 Ti系列顯卡的整體貨源供應在今年1月份都不會特別充足。由於英偉達早已分發完貨源,所以廠商都是在賣庫存,供應取決於庫存情況。不過當時臨近傳統農歷新春假期,對玩家來說影響不算大。 據博板堂透露,從英偉達及各個顯卡品牌處得到消息,RTX 4060和RTX 4060 Ti系列顯卡在2月18日到3月10日期間,貨源各方面都不會充足。在2月份,晶片貨源到貨較為緩慢,影響來自於GPU晶片的供應延遲,以及代工廠產能跟不上等因素影響。直到3月份中旬左右,各個顯卡品牌的供應量都不太夠。 有消息稱,隨著人工智慧(AI)熱潮為數據中心業務帶來的高收益,過去一段時間里,英偉達改變了原有的策略,資源更多地向優先級更高的人工智慧晶片傾斜,減少了遊戲GPU的生產。從而導致進入2023年第四季度後,英偉達在消費市場的GPU供應量就出現了下降,不同地區都出現了供不應求的狀況。 從這次得到的最新信息來看,近期主流玩家想購入一塊RTX 4060和RTX 4060 Ti系列顯卡似乎多少會受到影響,而且將持續一段時間。 ...

這功耗飛起 RTX 50細節曝光:英偉達要全用PCIe Gen 6的16-Pin接口

快科技2月19日消息,據媒體報導稱,英偉達GeForce RTX 50系列顯卡將原生配備PCIe Gen 6 的 16-Pin供電接口。 報導中提到,RTX 5080和RTX 5090系列外,RTX 5060也會啟用新的供電接口,據說此舉簡化供應鏈,但帶來的功耗也是不容樂觀。 到底功耗會有多高呢?曝光的消息顯示,RTX 5090用PCIe Gen 6的16-Pin供電接口後,功耗可以超過600W,而高端系列可以超過450W,中端功耗在300-350W之間。 按照之前的說法,RTX 50系列架構代號Blackwell,該架構既用於AI計算卡B100,也用於遊戲卡,但優先級顯然前者更高,據說發布時間已經從原計劃的2024年第四季度提前到第二季度。 Blackwell架構的RTX 50系列將採用台積電3nm工藝製造,官方稱同等電晶體數量、功耗下的性能可提升15%。 RTX 50系列將有GB202、GB203、GB205、GB206、GB207等不同核心晶片,首次升級PCIe 5.0,並支持DisplayPort 2.1,還會升級新版的12V-2x6 16針供電接口,更穩定更安全。 來源:快科技