NVIDIA明年上馬3nm 私人定製 但不是遊戲卡
快科技9月26日消息,NVIDIA將在明年推出採用台積電3nm級工藝的下一代高性能計算GPU Blackwell GB100,以及下一代加速卡B100。
NVIDIA現有的GH100 GPU使用的是台積電4nm工藝,而且是定製版。
台積電3nm有多種版本,包括性能增強版N3P、高性能計算專屬N3X,NVIDIA GB100具體用哪個尚不清楚,估計很可能也會是定製版本。
事實上,NVIDIA Ampere、Ada Lovelace使用的台積電工藝,同樣都有很大的定製成分。
至於下一代遊戲顯卡GB20x GPU,應該也會是台積電3nm工藝代工,但要到2025年才能見到了。
蘋果是迄今唯一推出3nm工藝的廠商,A17 Pro用的是台積電第一代N3B,而聯發科已經使用第二代N3E工藝,完成下一代旗艦天璣9400的流片。
未來兩年,Intel、AMD、高通等也都會紛紛升級台積電的3nm工藝。
來源:快科技
AMD顯卡大佬突然離職 曾經是NVIDIA顯卡一把手
AMD高級副總裁兼圖形事業部總經理Scott Herkleman突然宣布,將在今年底離職。
Scott Herkleman 2016年加入AMD,一直相當於AMD顯卡業務的直接一把手,參與了AMD RDNA系列三代顯卡的發布與推廣。
他本人對外活動、發言也相當積極,比如最近批評12VHPWR 16針供電接口不靠譜,不改良的話AMD顯卡堅決不用,比如承認RX 7900 XT VC均熱板存在缺陷,但承諾AMD會負責到底。
AMD沒有披露他的接替人選,畢竟還有是三個月的時間。
Scott Herkleman本人也沒有明確未來去向,但這樣的人才顯然不愁下家,比如說Intel顯卡就很合適。
Intel確實也從AMD、NVIDIA挖了不少GPU相關人才,大家最熟悉的當然是AMD首席架構師Raja Koduri,2017年底離開AMD就立刻投奔了Intel,領導了Xe GPU的開發,堪稱奠基之人。
有趣的是,在加入AMD之前,Scott Herklema曾在NVIDIA擔任GeForce顯卡事業部的總經理。
來源:快科技
英偉達已向台積電3nm工藝下單,Blackwell架構B100將於2024Q4到來
目前台積電(TSMC)已量產了3nm工藝,不過直到現在也僅有蘋果一個大客戶下單,且搭載於iPhone 15 Pro系列的A17 Pro在能效方面的表現並不太好。傳聞台積電3nm工藝報價達到2萬美元的高價,加上半導體行情持續低迷,不少台積電的大客戶都修改了原定的計劃,推遲採用3nm工藝,至少要等到2024年下半年才導入。
憑借人工智慧(AI)對數據中心GPU的強勁需求,英偉達是少數能在市場不景氣的大環境裡逆勢而起的科技公司,大量的訂單一定程度上彌補了台積電營收下降的缺口。據DigiTimes報導,英偉達近期還與台積電簽下了3nm工藝的訂單,而且打算趁熱打鐵,提前至2024年第四季度推出Blackwell架構B100,在數據中心市場繼續壓制其他競爭對手,早於原來計劃的2025年。
AMD最早採用3nm工藝的是EPYC伺服器處理器,如無意外也會在2024年下半年出現。隨著市場回暖,高通和聯發科也計劃在2024年下半年採用台積電的3nm工藝。雖然三星更早進入3nm代工市場,不過截至目前幾乎所有大的訂單都是集中在台積電手上。
此前有報導稱,台積電的3nm產能利用率可能會下降,2024至2025年年間大概在每月7萬片到8萬片晶圓。即便現在接連傳出利好消息,台積電的3nm產能規劃仍然比較保守,現階段對2024年3nm月產能規劃也就提升至10萬片晶圓。
值得注意的還有英特爾,由於高度不確定性,台積電並沒有將其納入統計中。如果下一代ArrowLake如傳言那樣將部分計算模塊改用台積電的3nm工藝,那就是額外的進補。 ...
AMD圖形大神突然宣布離職:曾炮轟RTX 4090燒毀 重回英偉達還是去Intel?
9月26日消息,AMD圖形大神,也就是圖形業務部門高級副總裁兼總經理Scott Herkelman突然宣布離職。
至於為什麼離開AMD,Scott Herkelman並沒有提及,而接替者是Jack Huynh。
AMD對此消息進行了證實,並且表示,感謝Scott在過去七年中的領導和對AMD顯卡業務的重大貢獻。
在加盟AMD之前,Scott Herkelman還擔任了英偉達GeForce圖形業務總經理,其在AMD主導並推出了三代RDNA顯卡架構。
上次收到Herkelman的消息大約是在一個月前,當時他就GeForce RTX 40系列顯卡上備受詬病的16針電源連接器的早期問題向英偉達投擲炸彈。“具體來說,對於7900系列,甚至7600,我們沒有計劃使用新的電源線,但7800和7700確實有計劃,”赫克爾曼當時說道。
我們不知道Scott Herkelman接下來會去哪裡。英特爾、AMD和英偉達擁有頂尖人才的旋轉門,他們可以從一艘船跳到另一艘船。所以他完全有可能加入英特爾,英特爾正在努力開發下一代Battlemage Arc GPU。
然而,如果Scott Herkelman最終加入了主要競爭對手英偉達,那將是非常有趣的,因為他在過去七年裡一直在“戰壕”中戰鬥。
來源:快科技
微星發布首款「Limited Series」:RTX 4060 GAMING X 8G NV EDITION
此前微星宣布將推出一個新的「The Limited Series」產品線,本周開始將會有一系列產品,在指定期限內通過指定零售商獨家銷售。其首款產品MSI GeForce RTX 4060 GAMING X 8G NV EDITION已正式發布,並登錄電商平台,開啟了預約搶購。
MSI GeForce RTX 4060 GAMING X 8G NV EDITION,價格為2699元,京東地址:點此前往>>>
該款顯卡屬於限量生產的產品,全球限量6000塊。其基於Gaming X魔龍系列打造,顯卡的包裝採用了英偉達的主題配色,以綠色和黑色構成,看起來很像英偉達的Founder Edition公版。微星已將散熱系統升級至TWIN FROZR 9代,配備刀鋒7代風扇、鍍鎳銅底座、特製核心熱管、配有金屬背板、並運用了氣流導向技術,優化提升了散熱效率,同時還具有酷炫的外觀和RGB燈效,帶來強烈視覺沖擊,彰顯玩家個性。此外,顯卡的綠色不僅僅是顏色,其包裝設計採用100%紙質,不含有害塑料,更加地環保。
MSI GeForce...
萌新注意 一文了解公版顯卡與非公顯卡區別
萌新在選購顯卡的時候經常會聽到公版顯卡和非公版顯卡,那麼這些稱謂是什麼意思,與日常購買時遇到的華碩、七彩虹、微星、影馳等顯卡有什麼關系呢?今天就來給萌新小白朋友們解答一下。
首先了解下公版顯卡喝非公顯卡的概念,公版顯卡是由英偉達NVIDIA、超威半導體AMD以及英特爾intel這些晶片製造商直接生產的,可以被看作標准版本顯卡,外觀上也很統一並易於識別,沒有花里胡哨的設計,而且公版顯卡不是每個晶片都會推出,有些顯卡晶片只有公版參數,但沒有推出公版顯卡。
非公版顯卡由其他顯卡生產商基於官方晶片生產,就是我們從華碩、七彩虹、微星、影馳等顯卡廠商買到的顯卡,晶片都是由NVIDIA、AMD、intel提供,屬於“第三方版本”。因此設計和性能都能玩出花來,比如前段時間華碩推出的無線顯卡,就是有明顯基於背插特色設計在裡面。
而在同一個晶片核心下,非公版顯卡除了外觀更為吸引眼球,主要差異還在於頻率和一些散熱設計。有一些非公版顯卡,它們的頻率超越了公版標准,這樣的顯卡我們稱之為OC型號。這類顯卡在同等級別的產品中,用料和設計都更高端,特別是在散熱方面,廠商往往下足了功夫。
那麼,選擇非公版顯卡是否真的能夠獲得更好的性能呢?答案是取決於你選擇的非公版顯卡的具體參數。高端的非公版顯卡由於其出色的散熱和供電設計,可以支持更高的頻率,從而帶來更強的性能。
但如果選擇的非公版顯卡頻率與公版持平,那麼兩者在性能上的差距就不會太大,只會有品牌的特色外觀差異。
所以在購買時,我們依舊需要首先考慮性價比。那些高頻率、高端的OC型號非公版顯卡雖然性能上有所提升,但價格上的提高可能並不劃算,尤其是對於預算有限的玩家來說。
付出更多的金錢,但可能只能得到幾幀的性能提升。對於大多數用戶來說,與公版頻率相近的入門非公版顯卡往往更為合算,這些產品在性價比上更勝一籌,是值得玩家重點考慮的選擇。
來源:快科技
16針供電接口終於完美了:640W功率也沒有燒毀顯卡
12VHPWR 16針供電接口自從用於RTX 40系列以來,已經燒毀了不少RTX 4090,,將會取而代之。
有媒體近日探訪了Linewell,一家為華碩等大品牌製造電源線的企業,後者正在開發12V-2x6接口和相應的數據線。
溝通期間,Linewell對新的接口和數據線進行了各種測試,結果令人欣喜。
一項是50多分鍾的持續壓力測試,接口和電源線的溫度始終未超過46.5℃。
另一項是故意不插緊,模擬疑似容易燒毀RTX 4090的一種場景,結果在55A電流、640W功率的沖擊下,依然非常穩定,電源線溫度也只有41℃。
第三項是故意彎折電源線,各種角度嘗試一遍,仍然沒有出現燒毀。
這足以證明,之前的接口和電源線設計確實有問題,改進後的應該可以放心了。
不過,目前還不清楚什麼顯卡會首先使用新的接口,也不知道現有的RTX 40系列是否會全面升級替換。
12V-2x6接口在外觀造型、物理尺寸上和12VHPWR幾乎完全一致,還是16個針腳,但是從機械結構到電氣結構都都做了改進。
12VHPWR側視圖
12V-2x6側視圖
最顯著的一點就是感應針腳(sense pin)的位置更深了,可以在輸出GPU所需要的高功率電流之前就確保接觸到位。
同時在供電能力方面,感應針腳檢測的檔位除了450W、600W,還增加了150W、300W檔次。
每個針腳的最大供電電流還是9.2A,但是分成了H+、H++兩個級別。
具體區別沒有明確說法,從示意圖上看,H+的頂部多了垂直的兩個開槽,尾部針腳是方形,看起來可能是固定卡扣方式不同。
電源線接頭也有兩種可選,其一在4個信號針腳之外增加了0.7毫米厚的“小尾巴”,應該是為了方便插入後固定得更牢靠。
此外在電源線設計與質量方面,新規范的要求也更加嚴格。
尤其是可靠性方面,要求105℃溫度下的壽命從92個小時延長到168個小時。
好消息是,12V-2x6接口將與12VHPWR保持兼容,意味著現有電源、電源線無需更換。
來源:快科技
英偉達RTX 4090搭配三星G95NC顯示器受限:無法支持雙4K@240Hz
在今年的ChinaJoy上,三星發布了新款玄龍騎士Neo G95NC遊戲顯示器,帶來了相當於兩台32英寸顯示器拼接的雙4K高刷頂級產品。其採用了57英寸的曲面螢幕,支持Mini LED背光技術和QLED量子點技術,曲率為1000R,10bit色深,顯示比例為32:9,解析度為雙4K(7680 x 2160),刷新率為240Hz,響應時間(GtG)為1ms,峰值亮度為1000尼特。
據Wccftech報導,QuasarZone經過測試後發現,盡管有著完整的48 Gbps帶寬,但目前英偉達和英特爾的顯卡都不能通過HDMI 2.1接口實現雙4K@240Hz的完全支持。其中包括了現在市場上性能最為強勁的GeForce RTX 4090顯卡,最多隻能設置為雙4K@120Hz,具體原因暫時還不清楚。
與英偉達和英特爾不同的是,AMD基於RDNA 3架構的Radeon RX 7000系列顯卡無論通過DisplayPort 2.1接口還是HDMI 2.1接口,都能實現玄龍騎士Neo G95NC遊戲顯示器雙4K@240Hz的支持。
有人推測,GeForce RTX 4090的情況可能與DSC(顯示流壓縮)背後的機制有關。作為VESA開發的一種算法,DSC是為了實現更為高效的高解析度輸出,這需要利用GPU的「顯示管道」,而GeForce RTX 4090可能不允許單個顯示輸出接口使用足夠的顯示管道,那麼就會出現瓶頸。另外還有一種可能,就是GeForce RTX 4090雖然支持HDMI 2.1接口,但是並不完善,無法達到Radeon RX 7000系列相同的48...
AMD Software Adrenalin Edition 23.9.3驅動:為DLC《往日之影》做好准備
AMD Software Adrenalin Edition 23.9.3驅動程序發布,支持新遊戲《PAYDAY 3》和《賽博朋克2077:往日之影(Cyberpunk 2077: Phantom Liberty)》。
CD Projekt Red即將帶來《賽博朋克2077》的首部DLC「Phantom Liberty」,遊戲已正式在多個平台開放了預購,並更新了PC配置要求。官方表示,提出新的配置要求是為了能更好地滿足新技術的需要。新的配置要求里並沒有為2K解析度寫出一個推薦配置,只有1080P和4K兩檔解析度。無論哪個配置,硬碟都是SSD,且需要有70GB的可用空間,SSD可以提供更快的讀取速度、改善流式傳輸,有著更好的整體性能表現。
已知的問題,包括:
當使用帶有AV1編解碼器的AMD Software: Adrenalin Edition錄制時,音頻可能會間歇性地與視頻不同步。
使用AMD Link串流特定遊戲時,在更改編碼格式後,顯示屏可能會間歇性卡頓。建議遇到此問題的用戶在串流之前選擇所需的編碼格式,作為臨時解決方法。
性能指標疊加的報告可能不適用於FPS遊戲。
安裝包包含以下內容:
AMD Software:適用於Windows 10和Windows 11的Adrenalin Edition 23.9.3驅動程序版本23.20.11.04(Windows驅動程序商店版本31.0.22011.4008)。
AMD Radeon Software Adrenalin...
官宣整整一年後:Intel Arc A580顯卡依然不見蹤影
2022年9月,Intel宣布了Arc A系列顯卡的完整陣容,從高到帶分別是A770、A750、A580、A380、A310,但是整整一年過去了,Arc A580依然杳無蹤影。
根據當時公布的規格,A580配備24個Xe核心、24個光追單元,相當於A380的整整不是三倍,搭配和A750同樣的128-bit 8GB顯存,只是核心頻率比較低僅為1.7GHz,整卡功耗為175W。
但是不知道為什麼,A580始終沒有正式發布上市,而在上周的技術創新大會期間,Intel也完全沒有提及Arc顯卡,沒有傳說中的Alchemist+升級版,也沒有明年的第二代Battlemage。
看起來,A580很可能早就被取消了,畢竟最高端的A770也就打一下RTX 3060,A580實在缺乏競爭力,價格足夠低的花樣又不如A380。
當然,至少短期內,Intel不會放棄Arc顯卡,更不會放棄獨立GPU,畢竟這是其全棧AI產品的一個重要部分,支撐著GPU Flex、GPU Max系列,也是核顯的基礎。
Intel此前曾披露,第二代顯卡會有新的架構,帶來更好的DX12性能,更好的光追性能,彌補第一代產品的很多不足與缺憾,預計明年第二季度發布。
來源:快科技
英偉達GeForce Game Ready 537.34 WHQL驅動:支持DLSS 3.5
英偉達發布了最新一版GeForce 537.42 WHQL Game Ready驅動程序,新增了DLSS 3.5功能,為《賽博朋克2077:往日之影》做好DLSS 3.5的優化,並且對《戰爭避難所》、《女巫之火》和《猛獸派對》這三款新遊戲提供DLSS與NVIDIA Reflex技術支持。
英偉達官方稱,DLSS 3.5引入了光線重建技術,是進階版AI驅動的神經渲染器的一部分,通過將需要人工設計的降噪器替換為NVIDIA超級計算機訓練的AI網絡(在采樣光線之間生成更高質量的像素),為所有 GeForce RTX 顯卡提升光線追蹤圖像質量。DLSS 3.5訓練的數據量是DLSS 3的5倍,可識別不同的光線追蹤效果,從而可使用時間和空間數據做出更明智的決策,並保留高頻信息以實現更高質量的升級。
而在遊戲和應用支持上面,《心靈殺手2》、《賽博朋克2077》、《傳送門RTX版》、《ChaosVantage》、《D5渲染器》和《NVIDIAOmniverse》都會在今年秋季陸續支持DLSS3.5。
已修復的問題,包括:
交集著色器導致性能下降。
使用numKeys = 2的TLAS的行為不一致和損壞的運動鍵。
已知的問題,包括:
在基於Maxwell架構的GPU上觀察到明顯的性能下降。
在該版驅動程序中,對大量使用內存時出現的創意應用程式穩定性問題進行了修復。我們發現,在運行DaVinci Resolve時,這一修復會導致性能下降。在即將發布的驅動程序中,這些問題都會得到解決。
NVIDIA GeForce Game Ready 537.42...
桌面版Arc A580發布一年後依然沒發售,Innovation 2023上完全沒新顯卡消息
去年9月Intel在Innovation 2022上發布了Arc
A770、A750、A580三款桌面獨立顯卡,再加上此前已經推出的Arc A380,組成了Arc
A系列顯卡家族,隨後10月A770與A750相繼上市,但A580到目前為止依然不見蹤影。
實際上Arc
A580的規格已經公布,它擁有24個Xe-Core,這已經超過了ACM-G11的8組Xe-Core和隨後推出的ACM-G12的16組Xe-Core了,所以只可能是ACM-G10
GPU。
然而讓人意外的是,Intel在發布一年後依然沒有把A580推向市場,在今年的Innovation
2023上也沒看到Arc的任何更新,也沒有傳聞中的Alchemist+的蹤影,從此前泄露的PPT上標著它會在今年第三或第四季度出現。
目前來看Arc A580很可能是受Alchemist多次延遲的影響,錯過了發售窗口,現在已經被放棄了,從當前Arc
A750價格已經降至1600元附近,繼續推出Arc A580的意義也不大,畢竟ACM-G10
GPU的尺寸很大,成本還是很高的,而且A580的性能也不可能與NVIDIA和AMD的最新顯卡造成威脅。
現在Intel的顯卡部門應該是在全力備戰明年的Battlemage架構,可以確定的是BMG-G10
GPU已經出現在Intel馬來西亞封裝廠裡面,現在在進行各種測試,目前這時間點全力准備新一代確實是個更好的選擇。 ...
2023年8月中國顯卡出貨量:七彩虹高居第一,技嘉下滑至第四名
近日,博板堂整理出各個顯卡品牌廠商2023年8月份在中國大陸地區的出貨數據,顯示相比7月份環比下降6%左右,相比2022年7月同比下滑4%左右。在8月份里,網吧的訂單依然比較多,線上表現較為一般,線下渠道銷售表現較為穩定。
以品牌個體來看,前八名分別為七彩虹、華碩、微星、技嘉、影馳、耕升、銘瑄和索泰。其中七彩虹名列第一沒有什麼疑問,位置非常穩固,出貨量與第二名之間有較大的差距。
最大的變化來自於技嘉,上個月剛剛超越了華碩成為了第二名,到了這個月卻出現較大幅度的下滑,從第二名變成了第四名,僅比第五名的影馳高出一些,不知道什麼原因出現如此大的波動。華碩、微星、影馳、耕升、銘瑄和索泰出貨量的變化幅度不大,華碩與微星也順勢回到第二名和第三名。
2023年8月份各個品牌廠商出貨表現一般,主要依賴於網吧的訂單量,零售渠道的表現不溫不火,總體上表現很一般。預計未來兩個月貨源供應情況不會太好,不過預計銷售利潤上可以保持較好的表現。 ...
「飢渴」的AI時代:AMD Instinct加速器面前是一條「星光大道」
AI時代最根本的是什麼?是算力。
隨著AI模型、訓練數據規模的不斷膨脹,對於算力的渴求也是空前高漲,沒有盡頭。
強大的AI算力可以來自CPU,可以來自GPU,可以來自FPGA,可以來自ASIC,各有各的優勢,其中的王者毋庸置疑就是GPU加速器。
如今的AI GPU加速器市場,呈現著明顯的“一家獨大、兩家追趕”的態勢:NVIDIA有著無可比擬的市場地位,尤其是軟體生態遙遙領先;AMD、Intel都有各自的獨特方案,也都有了不俗的成果。
NVIDIA的大家都比較熟了,Intel的才剛剛起步,今天我們重點聊聊AMD Instinct系列加速器,看看它能不能真正挑戰NVIDIA。
畢竟,任何市場領域一家獨大,都不是什麼好事兒,都需要你來我往的競爭,才是對用戶利益、對行業發展最為有利的。
AMD Instinct很多人可能不太熟悉,但其實歷史也很優秀了,可以追溯到2017年。
不過那時候,它還叫Radeon Instinct,基礎架構也是和Radeon遊戲顯卡通用的,包括Polaris、GCN、Vega,一直到2020年的RDNA都用過。
這麼做的好處是開發成本低、推進速度快,但缺點也很明顯,就是在計算方面缺乏針對性和高效率。
2020年誕生的Instinct MI100,成為這條產品線的一個轉折點,因為它首次採用了專門設計的CNDA計算架構,和RDNA圖形架構徹底分道揚鑣,同時去掉了名字中的Radeon字樣,踏上了新的征程。
2021年的Instinct MI200系列又達到了全新的高度,這是AMD第一款ExaScale百億億次計算性能級別的加速器產品,號稱在同類產品中擁有世界上最快的HPC性能、AI性能。
它升級到了第二代CDNA 2架構,首創MCM多芯整合封裝,擁有Infinity Fabric高速互連通道、矩陣核心、128GB HBM2e高帶寬內存等等,性能異常強大,浮點性能約48萬億次每秒。
該系列包括MI250X、MI250、MI210三款型號,在諸多高性能計算、機器學習、人工智慧、超級計算機中都有普遍應用。
尤其是頂級滿血的MI250X戰績彪炳,目前公開性能世界第一、已經三連冠的超算“Frontier”,就是基於它打造的,最大性能高達119.4億億次浮點每秒,是第二名的多達2.7倍,峰值性能更是168億億次浮點每秒,是第二名的3倍還多!
第三名的“LUMI”同樣是採用了MI250X,最大性能30.9億億次浮點每秒,峰值性能42.9億億次浮點每秒,相當於第二名的七八成。
值得一提的是,韓國電信運營商Kt還使用AMD Instinct平台運行了該國第一個大語言模型,支持110億參數。
最新一代的Instinct MI300系列再次實現跨越,並開辟了全新的方向,有了兩款不同的產品。
其中,MI300A是全球首款面向HPC、AI的APU加速器,基於AMD的成熟經驗,開創了CPU、GPU合體加速的先河。
它採用了先進的Chiplet芯粒設計,一共有多達13顆小晶片,其中計算部分9顆,都是5nm工藝製造,基底和擴展部分4顆,都是6nm工藝製造,集成多達1460億個電晶體。
CPU部分為Zen 4架構,三組CCD共24個核心,GPU為最新的CDNA3架構,還有128GB大容量的HBM3高帶寬內存,可以為CPU、GPU所共享。
MI300A使用了標準的Socket獨立封裝,因此不再需要單獨的CPU處理器,自己就能組建一整套加速平台,大大簡化系統設計。
MI300X則是純GPU加速器,相當於把MI300A里的CPU模塊也替換成GPU,同時將HBM3內存容量增加到史無前例的192GB,帶寬達到驚人的5.2TB/。
整體集成的電晶體數量,也達到了同樣史無前例的1530億個。
作為對比,NVIDIA最新的H100加速器也只有800億個電晶體,只有MI300X的一半多點,不在一個層級上。
為方便客戶部署,AMD全新設計了Instinct平台,基於行業標準的OCP計算標准,單系統可集成最多八塊OAM形態的MI300X,HBM3內存總容量達1.5TB。
Instinct MI300系列也已經開始投入商用,比如美國勞倫斯利弗莫爾實驗室的新一代超級計算機EI Capitan,已開始安裝MI300A加速器,搭檔第四代AMD EPYC處理器。
它將在明年上線,預計性能超過200億億次浮點計算每秒,也就是可以超越當今第一的Frontier。
MI300X的強勁性能和超高能效,使之可以輕松應對當今AI對強算力的需求,搞定各種幾百上千億參數的大語言模型,Falcon、GPT-3、PaLM 2、PaLM等等都不在話下。
甚至,MI300X單卡就能運行800億參數的大語言模型,尤其是得益於超大容量的HBM3內存,大模型可以完全在HBM3內存中運行,無需動用系統內存,從而省去數據傳輸與拷貝,大大降低延遲、提升性能。
相比於 NVIDIA 80GB HBM內存加速器,運行同樣參數規模模型,MI300X所需要的GPU數量也更少,自然成本更低。
更關鍵的是,NVIDIA H100/A100加速器過於火爆,價格一路飆升,比如應用最多的H100目前已經要到4.5萬美元一塊,相當於30多萬人民幣,新一代的A100也需要十幾萬。
甚至,就算你捨得花錢,也不一定買到。負責代工的台積電也承認,H100/A100的緊缺狀況還要持續大約一年半之久。
相比之下,AMD的一貫優良傳統恰恰就是高性價比,正好可以給客戶提供更豐富的選擇空間,而不是吊在一棵樹上。
當然了,作為AI加速器,不但需要硬體設計強大,更需要足夠高效的開發平台、足夠優化的軟體和應用適配,才能徹底釋放潛力。
NVIDIA在這方面無疑做得相當透徹,這也是其贏得開發者和市場的一大關鍵。
AMD ROCm開發平台同樣歷史悠久,只是在技術特性、生態適配上一直有待進一步拓展,而今在AI的驅動下正在努力追趕。
比如新一代ROCm 5.x版本,針對HPC、AI做了全方位優化,支持各種流行的AI模型、框架和算法,諸如PyTorch、TensorFlow、ONNX、OpenXLA、Triton、DeepSpeed……方便開發者根據自己的實際需要選擇,靈活滿足不同場景。
值得一提的是,現在部署MI210,AMD還會提供軟體層面的搭建支持,讓客戶的安裝、使用更加簡單、省心。
說到這里順帶一提,除了高性能計算GPU方面,AMD還正在不斷釋放消費級遊戲GPU的AI潛力,比如大火的文生圖應用Stable Diffusion,已經可以在Windows系統下跑在AMD...
《賽博朋克2077》首發升級DLSS 3.5:光線質量逆天、性能飆升多達4.9倍
8月底,NVIDIA正式發布了,加入全新的“光線重建”(Ray Reconstruction/RR)。
它通過NVIDIA超級計算機訓練的AI網絡,基於5倍於DLSS 3的訓練量,取代人工設計的降噪器,使采樣光線之間生成更高質量的像素,從而提高光追畫質,並且支持RTX 20/30/40全系列顯卡。
不過,DLSS 3.5並不會直接取代DLSS 3 /3.1,而是並存,因為後者的幀生成功能僅限於RTX 40系列。
DLSS 3.5的首批遊戲包括《心靈殺手2》、《賽博朋克2077》和《賽博朋克2077:往日之影》、《傳送門》RTX版。
9月21日,《賽博朋克2077》2.0版本正式發布,首發加入了對DLSS 3.5的支持。
NVIDIA也同步更新了Game Ready驅動,提供支持。
9月26日,《賽博朋克2077:往日之影》也將正式登場,同樣具備DLSS 3.5。
順帶一提,新驅動還支持《猛獸派對》(Party Animals)開啟DLSS 2、Reflex,支持《戰爭避難所》(Warhaven)、《女巫之火》(Witchfire)開啟DLSS 3、Reflex。
《往日之影》是《賽博朋克2077》的全新諜戰懸疑冒險資料片,講述的事新美利堅合眾國總統乘坐的軌道太空梭在夜之城最危險的地區被擊落,唯一能救她的你必須化身賽博朋克雇傭兵V,深入諜報活動和政治陰謀交錯的亂局。
隨著故事的推進,你將了解身居高位的權力階層,以及殘酷的黑市雇傭兵世界之間錯綜復雜的恩怨情仇。
在《賽博朋克 2077》系列中打開光線追蹤:“超速模式”(Overdrive Mode),就可以啟用DLSS 3.5,提升光線反射的質量和清晰度,使得全局光照更加精確、光照響應更加動態,遊戲體驗也更逼真、更身臨其境。
RTX 40系列玩家還可以同時開啟幀生成技術,實現最快的幀率。
CD PROJEKT RED全球藝術總監、藝術副總裁Jakub Knapik對於DLSS 3.5的智能技術、AI渲染力贊不絕口,可讓玩家在《往日之影》的最新地點“狗鎮”中獲得出色體驗,包括更清晰的畫面、更精準的光照、更高的幀率。
4K解析度下,在遊戲中開啟全景光追,所有設置最高,通過幀生成、光線重建、Reflex、超解析度,DLSS 3.5可將幀率提升至原生渲染的最高4.9倍!
2K解析度下,DLSS...
微星將帶來RTX 4060 NV Edition:黑綠配色限量版顯卡,共有6000塊
微星宣布,將推出一個新的「The Limited Series」產品線,下周開始將會有一系列產品,在指定期限內通過指定零售商獨家銷售。其中首款顯卡是GeForceRTX 4060 NV Edition,計劃在9月25日發布,並提供了一個頁面,上面還有倒計時。
VideoCardz表示,GeForceRTX 4060 NV Edition屬於限量生產的顯卡,只生產了6000塊。其基於Gaming X系列的散熱器打造,有著定製PCB設計,顯卡的包裝也是英偉達的主題配色,以綠色和黑色構成,看起來很像英偉達的Founder Edition公版。
微星稱,「The Limited Series」具有獨一無二的外觀及獨有的功能,提供了微星35年來所帶來的高性能。對於這款顯卡,微星並沒有過於強調其性能,甚至刻意模糊掉一些顯卡的信息,貼上「限量版」的標簽重點強調的是收藏價值。暫時還不清楚是否會在全球范圍內銷售,還是僅局限於某些地區。
GeForce RTX 4060搭載了AD107-400 GPU,採用PCIe 4.0 x8接口,擁有24組SM,即3072個CUDA核心,搭配8GB的GDDR6顯存,顯存位寬為128-bit,顯存速率為17 Gbps,顯存帶寬為272 GB/s,整卡功耗為115W,只需要一個8Pin外接供電接口。其L2緩存為24MB,顯存等效帶寬增大至453 GB/s。 ...
AMD Software Adrenalin Edition 23.9.2驅動:支持《匹諾曹的謊言》等
AMD Software Adrenalin Edition 23.9.2驅動程序發布,支持新遊戲《匹諾曹的謊言(Lies of P)》、《猛獸派對(Party Animals)》和《飆酷車神:轟鳴盛典(The Crew Motorfest)》。此外,為《星空(Starfield)》、《巫師3:狂獵(Witcher 3)》、《艾爾登法環(ELDEN RING)》和《不朽者傳奇(Immortal of Aveum)》引入了Anti-Lag+支持。
在該版驅動程序中,還提供了額外的SDK支持,包括Microsoft Agility SDK 預覽版 v1.711.3,包含了針對GWG的著色器Model 6.8功能;Microsoft Agility SDK 零售版 1.610.5,包含了增強的屏障和Vulkan對DX12的兼容性功能。
已修復的問題,包括:
某些AMD圖形產品(Radeon RX...
摩爾線程顯卡驅動更新:OpenGL 3.3首次降臨 DX11遊戲飆升超40%
快科技9月20日消息,摩爾線程發布了新的社區版驅動v230.40.0.1,首次在Windows 10作業系統下實現了OpenGL 3.3功能,供遊戲玩家嘗鮮。
同時,新驅動對DX11遊戲、圖形測試性能進行了優化,例如在1080p解析度、最高畫質下,《無畏契約》的幀率相比v222.31.0.2版驅動提升超過40%,《神力科莎》提升超過10%。
CyrEngine引擎性能提升超過40%,Valley引擎提升最高30%。
新驅動還進一步優化了《黑暗之魂:重製版》《GTFO》《銀河破裂者》三款DX11遊戲,以及SketchUp 2023、3D One兩款設計軟體的穩定性。
此外,新驅動修復了多達20個已知Bug:
1、解決運行《永劫無間》進入遊戲大廳機率性花錯的問題
2、解決運行《永劫無間》遊戲,火羅國迷霧森林附近雪地和土地交接的地面機率性畫錯的問題
3、解決運行《Apex英雄》遊戲時,射擊畫面機率性畫錯的問題
4、解決運行NBA2K Online2遊戲,機率性無法進入遊戲的問題
5、解決運行《飆酷車神2》(The Crew2)遊戲過程中貼圖錯誤和畫錯的問題
6、解決MTT S70運行Valley DirectX 11選項時,機率性發生藍屏的問題
7、解決同時長時間運行Heaven、Valley和《電影和電視》機率性花屏的問題
8、解決運行Heaven,在DirectX 11模式下配合3840*2160解析度選項時,機率性花屏的問題
9、解決運行Heaven或Valley時,用腳本進入休眠狀態下機率性死機的問題
10、解決運行3DMark 11配合3840x2160解析度下系統死機的問題
11、解決交替插拔兩個以上Display Port數據線接口時,機率性顯示器無法點亮的問題
12、解決DisplayPort多數據流傳輸(MST)狀態下切換顯示模式至“僅電腦螢幕”系統機率性藍屏的問題
13、解決Display Steam Compression(DSC)狀態下從系統休眠喚醒機率性失敗的問題
14、解決Windows系統睡眠喚醒壓力測試,超過1000次後機率性遇到系統死機的問題
15、解決連接四屏且擴展模式下,用腳本持續重啟動系統,機率性系統死機的問題
16、解決使用OBS軟體窗口採集《原神》遊戲畫面時,出現系統死機的問題
17、解決使用Potplayer同時播放兩路AV1 HDR 7680x4320解析度下出現系統藍屏的問題
18、解決使用Edge或Chrome瀏覽器播放在線視頻,視頻內容機率性畫錯的問題
19、解決點擊PES控制中心安裝包,機率性啟動慢的問題
20、解決PES控制中心非組合鍵成為快捷鍵的問題
玩家可通過PES控制中心,在“更新設置”中勾選“接受社區版驅動推送”,再通過“檢查更新”功能,即可下載全新發布的社區版驅動程序。
來源:快科技
技嘉AORUS官宣成為WBG英雄聯盟分部特約合作夥伴
9月20日,技嘉AORUS正式官宣牽手知名電競戰隊WBG英雄聯盟分部成為其特約合作夥伴。技嘉AORUS將為WBG英雄聯盟分部提供所需的主板配件產品支持,助力WBG英雄聯盟分部在S13世界賽賽場取得好戰績,為中國電競再添新彩!
AORUS作為技嘉旗下高端電競硬體品牌,為玩家提供全方位遊戲電競硬體解決方案。產品線覆蓋電競主板、電競顯卡、鍵鼠、電腦周邊設備等一系列高端產品,致力為全球電競玩家提供更出色的遊戲體驗。AORUS也長期關注中國電競發展,期待與玩家一同無懼挑戰極限,追求終極榮耀!
AORUS為何牽手WBG英雄聯盟分部?
WBG英雄聯盟分部作為LPL最具人氣戰隊之一,於2021年11月作為新浪微博集團旗下的全新項目,正式加入LPL。2020年,隊伍曾以LPL三號種子的身份闖入S10全球總決賽並以新勇之姿黑馬逆襲,獲得亞軍。2023年,WBG成功晉級LPL夏季賽季後賽,並在S13冒泡賽中最終獲得2023英雄聯盟全球總決賽LPL賽區四號種子資格,向世界賽進發。
此次合作是技嘉AORUS在電競領域的重要布局之一,也是其積極拓展電競業務的重要舉措。AORUS將根據職業選手需求、反饋和建議不斷改進自身產品優化方向。相信通過雙方的共同努力,技嘉AORUS與WBG英雄聯盟分部都將會取得豐碩的成果,並為廣大電競愛好者帶來更多精彩紛呈的電競佳話。
來源:快科技
華碩正式發布RTX 4090 ROG Matrix顯卡:核心頻率達2.7GHz,售價3200美元
華碩正式發布了GeForce RTX 4090 ROG Matrix,這是一款限量版產品,也是其最快的旗艦顯卡,定價上也非常高,為3199.99美元(約合人民幣23351.29元)。華碩採用了華麗的緊湊設計和水冷散熱,支持AURA SYNC神光同步,將一切推向了極致。此外,每塊顯卡都捆綁了一個兌換碼,可以換取獨家的NFT。
華碩稱GeForce RTX 4090 ROG Matrix顯卡是其至今最優秀的Ada Lovelace架構GPU設計,使用了一個無縫的金屬框架,厚度為2.5槽,有著漂亮的外罩,帶有RGB燈效,板卡部分沒有配備任何風扇,尾部有金屬支架為導液管連接處提供支撐,整合了液態金屬導熱組件,所有散熱均由一體式水冷解決方案提供。與之搭配的是ROG MF-12 ARGB系列風扇,也就是近期新款ROG Ryujin龍神 III 系列一體式水冷散熱器使用的款式,採用了磁吸式連結的方式,便於玩家操作。
GeForce RTX 4090 ROG Matrix採用了28相供電方案,以及完全定製的PCB,在GPU晶片和供電模塊周圍放置了新的溫度傳感器,搭配對應的固件,能夠定位可能由不均勻的熱墊安裝造成的熱點。其默認功耗為500W,OC模式功耗為600W,達到了12VHPWR接口的供電極限。顯卡在默認情況下的加速頻率為2670MHz,OC模式達到了2700MHz。用戶可以通過GPU Tweak III軟體監控顯卡的運行狀況,並進行參數的調整。
在2023年9月26日至10月10日期間,華碩還會有GeForce RTX 4090...
二手卡漲價 顯卡市場割裂 大家換不起:英偉達高端熱賣、AMD就靠中低端
快科技9月20日消息,你多久沒有給自己換塊顯卡了,是不是也秉承著夠用就用的原則呢?
對於英偉達和AMD來說,高端顯卡市場的讓他們壓力山大,因為確實不好賣了,用戶越來越多轉投去向了二手卡。
瑞銀的最新報告顯示,盡管GPU交易量較低,但其二手市場出現了價格上漲。
AMD的顯卡在二手市場上的平均價格上漲了1%,而英偉達的平均價格上漲了3%。
AMD看到其最高端晶片面臨壓力,但中低端產品“相對穩定”,因此每家公司各自GPU產品組合的價格各不相同。
相反,英偉達的高端市場表現復雜,低端市場的價格普遍下跌。
事實上也確實如此,今年英偉達的RTX 40系列,賣的最好的居然是4090了,萬元價格但性價比綜合來說是最好的,而AMD則是中低端為主,這也凸顯了相對割裂的市場,但整體上也是顯卡價格越來越高,大家換不動了。
來源:快科技
傳英偉達將RTX 5090的CUDA核心數量增加50%,性能是前一代產品的1.7倍
近日,有網友在CHH上透露了英偉達下一代旗艦GeForce RTX 5090的一些情況,表示相比前一代產品,CUDA核心數量增加50%、顯存帶寬提升52%、緩存提升78%(應該是L2緩存)、頻率還會有15%提升,綜合起來性能是GeForce RTX 4090的1.7倍。
這意味著,GeForce RTX 5090擁有192組SM,即24567個CUDA核心,頻率達到了2.9 GHz左右,L2緩存為128MB,而顯存位寬可能為512位,配備速率為24 Gbps的GDDR6X顯存,顯存帶寬大概在1.53 TB/s左右。目前三星已經完成了業界首款GDDR7晶片的開發工作,每個數據I/O接口的速率達到了32Gbps,首款16Gb GDDR7晶片在位寬為384位的情況下,提供了高達1.536 TB/s的帶寬,或許英偉達會改用GDDR7。
根據英偉達的計劃安排,GeForce RTX 50系列GPU要到2025年才出來,距離現在還有一年多的時間,一切似乎還言之過早。此前同一位網友曾表示,基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、 GB206和GB207五款晶片,與以往最大的不同,是AD104之後沒有GB204這款x04晶片,而是變成了x05的GB205。
近日有報導稱,基於Blackwell架構的數據中心產品將改用小晶片設計,採用MCM多晶片封裝。不過消費級產品似乎繼續採用單晶片設計,最大優勢是時間可控及低風險,可以按時生產產品。傳聞英偉達將對Blackwell架構進行較大規模的修改,雖然不是全新的設計,不過SM和CUDA會有一個新的結構,RT單元有可能被PT單元所取代,光線追蹤性能也會得到進一步優化和加強。 ...
英偉達打雞血 RTX 5090更多細節曝光:性能較上代提升70%、瘋狂堆料
快科技9月19日消息,毫無疑問英偉達在打造下一代旗艦卡,相比上代來說,看起來提升迅猛。
據媒體最新消息,NVIDIA的目標是將其下一代"Blackwell"架構GPU的整體性能提升1.7倍。
從曝光的最新細節看,代號為GB202的旗艦產品RTX 5090的CUDA內核增加50%,總數達到24576個。這比基於圖靈的RTX 2080的內核多出8倍多。
此外,旗艦新卡的內存帶寬也將通過使用32Gbps GDDR7提升52%,高於當前RTX 4090的GDDR6X。
時鍾速度預計將提高15%,這是最大的升級之一。這將使RTX 5090的頻率提升到2.9GHz,在遊戲工作負載中輕松超過3GHz。現有 RTX 4090 的最高頻率為2.52GHz。
為了進一步提升性能,NVIDIA計劃將二級緩存增加兩倍,達到 128MB,遠遠超過AMD RX 7900 XTX上的 96MB。這種額外的緩存旨在最大限度地利用 GDDR7 帶來的更高內存帶寬。
如果 NVIDIA 能夠實現這些雄心勃勃的目標,那麼僅從規格上看,RTX 5090 的性能將比RTX 4090高出70%以上。
RTX 5090與RTX 4090的對比:
核心數量比RTX 4090增加50%
內存帶寬增加52%
二級緩存增加78%(可能為128MB)
頻率提高15%,提升時鍾頻率超過3.0GHz
整體性能提升約70%
這提升看起來相當不錯,剩下的就看老黃是不是給力了....
來源:快科技
英特爾發布Arc顯卡31.0.101.4826 beta驅動:為《賽博朋克2077》DLC等優化
英特爾發布了Arc顯卡31.0.101.4824驅動程序,這是一個beta版本的驅動程序。英特爾在該版本驅動程序中,為多款新遊戲優化,包括《賽博朋克2077(Cyberpunk 2077)》DLC「往日之影(Phantom Liberty)」、《Payday 3》、《匹諾曹的謊言(Lies of P)》和《動物派對(Party Animals)》。
相比於31.0.101.4824版本的驅動程序,兩款DX11遊戲可以得到性能提升,其中《殺手:赦免(Hitman Absolution)》在1080P的Ultra設置下提高了17%,《生化奇兵:無限(Bioshock Infinite)》在1080P的Very High設置下提高了27%。
已修復的問題
英特爾Arc顯卡產品:
《賽道狂飆》 (DX11) )可能會在遊戲啟動期間遇到應用程式崩潰。
已知的問題
英特爾Arc顯卡產品:
《星空》 (DX12) 可能會在遊戲的某些區域遇到應用程式不穩定。
《星空》 (DX12) 在使用動態解析度縮放時可能會出現損壞。 解決方法是更改「渲染解析度縮放」刻度滑塊的值。
《星空》 (DX12) 在遊戲過程中可能會在光源上出現紋理閃爍。
《星空》 (DX12) 可能會在遊戲中的某些物體上顯示低紋理細節。
《光環:無限》(DX12) 戰役可能會在某些系統配置上遇到應用程式崩潰。
《黎明殺機》(DX11) 可能會在遊戲過程中遇到應用程式崩潰。
Topaz Video...
NVIDIA下一代GPU架構巨變 首次上馬多晶片 學習AMD/Intel
NVIDIA RTX 40系列、AMD RX 7000系列……這一代顯卡都已經布局完畢,而下一代還要等差不多兩年,至少NVIDIA Blackwell在路線圖上看要到2025年才會推出——明年來一波Super系列?
2021年就第一個曝出Blackwell這個代號的曝料高手kopite7kimi給出的最新說法稱,Blackwell不會明顯增加GPC、TPC等計算單元的數量,CUDA核心數自然也不會大幅提升,但是會在基礎架構上做出巨大的革新。
考慮到現在的Ada Lovelace架構已經有著極高的能效,Blackwell如果繼續大改,表現自然會更加出色,對手也更加追趕無望。
另一方面,Blackwell似乎和當年的Fermi架構在設計理念上有些類似,針對高性能計算、遊戲渲染進行統一設計,而不再兵分兩路。
從目前的跡象看,Blackwell的高性能計算分支有GB100、GB102兩種核心,遊戲部分則有GB202、GB203、GB205、GB206、GB207五種核心。
kopite7kimi透露,Blackwell的高性能計算版本GB100將首次引入MCM多晶片整合封裝,不像現在的GH100、GA100那樣是一個龐大的單晶片。
這倒是和AMD MI300系列、Intel Ponte Vecchio有著異曲同工之妙,通過多個模塊分立式架構設計再整合封裝的做法,提高性能、技術的靈活性,也有利於降低成本。
順帶一提,技嘉之前曾經提到過,GB100的功耗會再次飆升。
不過,GB20x系列遊戲卡核心,應該還是單晶片,這倒是和AMD Navi 31/32不一樣。
來源:快科技
RTX 5090頻率破3GHz、顯存上GDDR7?AMD表示有點絕望
Blackwell RTX 50系列還要兩年左右才會正式登場,但傳聞已經開始出現了,當然開發工作現在還處於非常早期的階段,各種說法都會有甚至互相矛盾,大家看看就好了。
曝料高手kopite7kimi的說法指出,,但是核心數量不會增加太多,同時高性能計算版本GB100將會首次引入MCM多晶片整合封裝,GB20x系列遊戲卡核心則繼續單晶片。
還有說法稱,Blackwell架構的旗艦顯卡(按慣例叫做RTX 5090),將會實現50%的規模提升、52%的顯存帶寬提升、78%的緩存提升、15%的頻率提升,綜合性能可提升多達1.7倍!
所謂規模提升不清楚具體指的是什麼,按理說應該是CUDA核心數量,但是和之前的曝料矛盾。
顯存帶寬提升52%,那必然要上下一代GDDR7。
RTX 4090 GDDR6顯存位寬是384-bit,頻率是21GHz,對應帶寬約1TB/,提升一半就是1.5TB/,位寬不變就需要32GHz的超高頻率。
也有說法稱位寬會增加到512-bit,顯存頻率就只需要28GHz,但這種可能性比較小。
緩存增加72%,那就是從現在的72MB變成128MB,而大緩存對高顯存位寬的需求更低,512-bit更不可能了。
頻率提升15%,那就是2.9GHz左右,實際肯定能超過3GHz,但是頻率肯定是最後階段才確定的。
來源:快科技
SK海力士展示生成式AI加速卡AiMX原型:基於GDDR6-AiM構建
去年SK海力士宣布,已開發出具備計算功能的下一代內存半導體技術,首款基於該技術的產品為GDDR6-AiM(Accelerator-in-Memory/內存加速器),將計算功能添加到速率為16 Gbps的GDDR6上。
近日在AI Hardware & Edge AI Summit 2023上,SK海力士展示了基於內存計算功能技術打造的AiMX加速卡原型產品,裡面搭載了GDDR6-AiM,專門用於生成式人工智慧(AI),比如ChatGPT。SK海力士還在配備了AiMX加速卡的伺服器系統上演示了Meta的opt13b模型,與採用普通的GPU系統相比,數據處理時間縮短了10倍以上,而功耗僅為五分之一。
SK海力士表示,AiMX是一種比傳統GPU更低成本、更低功耗、性能更高的解決方案,未來將繼續開發引領人工智慧時代的存儲技術。作為一種能夠處理大量數據的低功耗高速存儲器解決方案,SK海力士認為AiMX將在數據密集型生成式人工智慧系統的發展中發揮關鍵作用。由於生成式人工智慧的性能會隨著對更多數據的訓練而提高,更加凸顯了對應用於該系統的高性能產品的需求。
除了SK海力士以外,三星也有著相同的看法,在內存上集成的AI處理器,使其可以執行CPU、GPU、ASIC或FPGA的操作,未來還會將這項稱為PIM(processing-in-memory) 的技術擴展到DDR4、DDR5、LPDDR5X、GDDR6和HBM3內存上。三星在今年的Hot Chips 2023上還公布了HBM-PIM和LPDDR-PIM的最新研究成果,在AMD Instinct MI100上配備了HBM-PIM內存,並將其應用於生成式人工智慧。 ...
Blackwell架構GPU或改用小晶片設計,英偉達在GB100上採用MCM封裝
去年的Arete技術大會上,英偉達副總裁兼加速計算首席總監Ian Buck重申了英偉達致力於每兩年更新主要GPGPU架構的計劃,確認Blackwell架構GPU將會在2024年推出。預計GTC 2024年可能是Blackwell架構將首次登場,用於數據中心和人工智慧領域的產品,消費級GeForce顯卡要等到2025年。
近日有網友透露,基於Blackwell架構的GB100可能會選擇小晶片設計,採用MCM多晶片封裝,這將是英偉達產品線的一大進步。另外有消息指出,Blackwell架構GPU的GPC或TPC數量不會明顯增加,但是單位架構上會有很大變化。
最初傳出Blackwell架構消息的時候,就被認為是英偉達首個採用小晶片設計的GPU。不過隨後有傳言稱,英偉達可能堅持使用單晶片設計。事實上,單晶片和小晶片設計都有各自的優缺點,不過考慮到性能提升所需要的成本和效率,競爭對手英特爾和AMD紛紛轉向小晶片設計,結合更為先進的封裝技術。
需要說明的是,採用小晶片設計的Blackwell架構GPU面向的是數據中心和人工智慧領域,已知會有GB100和GB102兩款GPU。消費級GeForce顯卡所使用的Blackwell架構GPU仍可能堅持單晶片設計,屬於GB200系列。
傳聞英偉達正在評估三星3nm GAA工藝,如果一切順利,預定在2025年量產。不過似乎並不會用於Blackwell架構GPU,至少用於數據中心和人工智慧領域的產品仍然會選擇台積電代工,三星代工的有可能是其他產品。 ...
AMD發布適用於遊戲《Lies of P》的驅動程序:僅支持RDNA系列架構GPU
AMD Software Adrenalin Edition 23.20.11.01 for Lies of P驅動程序現已發布,這是一個針對2023年9月19日發售的新遊戲《匹諾曹的謊言(Lies of P)》。該款遊戲支持幾種AMD的圖形技術,包括FidelityFX Super Resolution 2(FSR 2)和組合自適應計算環境遮擋(CACAO)。
為了增強遊戲體驗,AMD推出了為《匹諾曹的謊言》量身定製的專用驅動程序,沒有為其他遊戲帶來額外的驅動程序錯誤修復或者優化,不過與平常的通用版驅動程序有所不同,這個版本僅支持RDNA系列架構GPU,並不支持Polaris和Vega架構的GPU。此外,雖然通過了WHQL測試,不過沒有得到WHQL認證。
盡管暫時還沒有收到使用AMD Software Adrenalin Edition 23.9.1 WHQL驅動程序玩《匹諾曹的謊言》遇到重大問題的反饋,不過遊戲的開發團隊還是建議AMD用戶下載這次專為《Lies of P》推出的驅動程序。
已知問題:
當使用帶有AV1編解碼器的AMD Software: Adrenalin...
分析稱英偉達在今年第二季度售出30萬塊H100,重量達900噸
俗話說淘金先富賣鏟人,這句話同樣也適用於現在的英偉達。隨著生成式人工智慧浪潮席捲,英偉達的H100計算卡成為了AI領域的入場券,在各大科技公司中走俏,龐大的需求量讓英偉達H100一卡難求。瘋狂的需求讓英偉達在2024財年第二季度的數據中心業務營收達到了103.2億美元,沒人知道他們究竟賣出了多少塊H100。
分析機構Omdia估計,英偉達在第二季度出貨超過900噸的H100計算卡,均應用於人工智慧 (AI) 和高性能計算 (HPC) ;而一塊帶有散熱器的H100計算卡的平均重量超過3公斤,因此他們預計英偉達在第二季度H100的出貨量超過30萬 。Omdia表示這是一個大致的計算,並不是一個確切的官方數據。不過至於為什麼要用重量來衡量顯卡的出貨量,Omdia並沒有對此進行解釋,也許是他們從某個供應商中獲取了大致的發貨數據。
盡管900噸的H100相當於4.5架波音747飛機,但這顯然還是不能滿足當下全球對數據中心GPU的需求,AI需求的強勁也讓英偉達計算卡的出貨量加速增長。此前有知情人士透露,英偉達打算將GH100的產量從今年的50萬顆提高到150萬至200萬顆,其中大部分晶片都將用於備受歡迎的H100計算卡。 ...
FurMark 2.0將在本月推出,經典的GPU烤機工具又回來了
FurMark是一款相當流行的GPU壓力測試軟體,但這工具已經很多年沒更新過了,Geeks3D在2022年以來就一直在致力於開發FurMark的新版本,去年底其實已經在內部進行測試,現在他們公布FurMark
2.0將在本月公開發布。
FurMark 2.0使用OpenGL或Vulkan
API,有1080p、1440p和2160p三個解析度作為三個預設基準測試,當然用戶依然可以自由選擇解析度和圖形設置項進行測試,這點和1.0版本保持一致。
FurMark雖然最終會有一個性能得分,但它的主要作用還是對GPU進行壓力測試,因為用該軟體能輕松讓GPU達到最高溫度和最高的功率,所以硬體廠商也對它進行各種限制,當年顯卡的功率限制就是針對這款軟體才弄出來的。在FurMark
2.0裡面依然會有性能得分,而且用戶還能把他們的基準分數提交到公共資料庫,值得注意的是,該排名顯示不同顯卡的分數差異很大,所以它可能依然不太適合用來作為顯卡的性能評估。
值得注意的是,FurMark 2.0依然需要其他工具作為補充,軟體內置了GPU Shark、GPU-Z和CPU
Burner等工具,以提供顯卡的各種信息。
軟體的具體發布時間為止,如果等不及想嘗鮮的話,可以通過加入Geeks3D
Discord社區來獲得測試資格,目前軟體最新版本是8月下旬推出的2.0.10.0版本。 ...
AMD Ryzen Threadripper 7985WX實物曝光:採用SP6插座
AMD應該會在2023年第四季度推出代號「Storm Peak」的下一代Ryzen Threadripper 7000系列處理器,擁有基於Zen 4架構的內核,對應的TR5平台將引入PCIe 5.0和DDR5內存的支持。新一代產品將覆蓋16核心到96核心,不過其中部分型號可能是OEM廠商獨有的。
近日有網友透露,已經有Ryzen Threadripper 7985WX處理器的工程樣品出現在了二手交易平台上,採用的是SP6插座,基於Zen 4架構,擁有64核心128線程,默認TDP為350W,產品代碼(OPN)為100-00000454,這與過往泄露的信息一致。
如果要使用這款處理器,需要搭配新的TRX50主板,不過現在還沒有對應的產品上市,將提供4通道DDR5內存和64條PCIe 5.0通道。此前華擎已經向ECC(歐亞經濟委員會)提交了TRX50 WS主板的信息,專為工作站而設計,主打強勁性能、易管理性與高可靠性。 ...
16GB顯存才是王道 訊景RX 6800圖賞
快科技9月16日消息,訊景日前推出了AMD Radeon RX 6800顯卡,現在這款顯卡已經來到我們評測室,下面為大家帶來圖賞。
訊景RX 6800採用正面三風扇的設計,左右兩個直徑100mm,中間92mm幾乎布滿了顯卡正面,13葉片的風扇增加了總氣流,高負載輕松溫控。
背面配有大面積的金屬板,支持直通式氣流通風,可顯著改善冷卻效果,並補充了Ghost熱浮動護罩設計的開放式設計。
訊景RX 6800使用了AMD RDNA2架構,7nm製程設計,流處理單元3840顆,光柵單元240顆,紋理單元96顆,GDDR6 16GB,位寬256bit,基礎頻率2000MHz,遊戲頻率1815MHz,Boost頻率2105MHz。
接口方面,訊景RX 6800提供三個DP接口,一個HDMI接口,電源接口採用雙8Pin設計。
總的來看,RX 6800的性能到現在還是非常能打的,尤其是在價格上比RTX 4060 Ti 16GB還要便宜了400元左右。
來源:快科技
100FPS光追無壓力 銘瑄RTX 4060 Ti iCraft OC 16GB顯卡圖賞
快科技9月15日消息,今年5月,銘瑄更新了RTX 4060 Ti顯卡產品,包括8GB顯存和16GB顯存。
銘瑄更新了四款GeForce RTX 4060 Ti新品,分別是RTX 4060 Ti iCraft OC8G 璦珈、RTX 4060 Ti iCraft OC8G、RTX 4060 Ti iCraft OC8G 璦珈X2、RTX 4060 Ti終結者W 8G,對應都有16GB顯存款式。
現在銘瑄RTX 4060...
不再擔心燒供電接口 影馳RTX 4090金屬大師AIO OC評測:450W烤機半小時僅61度
一、前言:如果你擔心RTX 4090燒供電接口的話 就買水冷版吧
RTX 4090自上市以來,最受非議的地方就是那個原生12VHPWR 16Pin供電接口,一不小心就會被燒毀。
出現燒毀情況最根本的原因,就是450W功率產生的電流,會在單個供電接口上會導致嚴重發熱的現象,而傳統的8pin接口由於熱量分散,發熱的情況就會好很多。
特別是如果在長時間遊戲時機箱內部風道沒做好,顯卡450W的熱量集無法快速排出機箱外,導致機箱內部溫度過高時,12VHPWR 16Pin供電接口就更有可能會出現燒毀的情況。
RTX 4090想要徹底杜絕供電接口燒毀的現象,最簡單粗暴的方法就是GPU改用水冷散熱,如此以來,顯卡巨大的發熱會直接被排出機箱外,即便是夏天也絲毫不用擔心供電接口會燒毀。
現在,我們收到了剛剛上市的影馳RTX 4090金屬大師AIO OC,這是影馳旗下第一款一體式水冷顯卡產品。
顯卡的外觀以宇宙魔方為靈感,純白全金屬外觀設,內部14層PCB板+22相供電,配合360水冷,擁有極強的超頻能力。
作為一款非公版,RTX 4090金屬大師AIO OC的加速頻率比公版高了65MHz,默認TDP與公版相同,都是450W,但是可以手動拉到510W。
也就是說,這塊顯卡會有非常強勁的超頻潛力。
來源:快科技
4K價位16GB大顯存誰是2K遊戲最佳搭檔?RX 6800大戰RTX 4060 Ti 16GB
一、前言:4K價位16GB大顯存 RX 6800和RTX 4060 Ti 16GB該選誰?
RTX 40系列顯卡已經全部就位,超高的能效,還有DLSS 3這個“獨門絕技”,但玩家們翹首以盼了三年,性能提升的幅度卻並未達到預期,而且價格實在是太貴了。
好在,AMD顯卡一直走價格實惠、量大管飽的路子,RX7000系列已經全部推出,只是從上到下只有六款型號,中間依然還有很大的空檔。
這意味著上代RX 6000系列還會存在一段時間,性價比也會越來越突出。
那麼,AMD上代顯卡VS. NVIDIA這代顯卡,會擦出什麼樣的火花呢?
考慮到現在4K價位是讓主流玩家比較能接受的,最適合的遊戲解析度是2K,我們找來了訊景RX 6800海外版、銘瑄RTX 4060 Ti iCraft 16GB OC這兩款顯卡進行一番比較。
之所以選擇RTX 4060 Ti 16GB版本,是因為RX 6800的顯存也是16GB,而且AMD最近一直在宣傳大顯存的好處,2K解析度下只有8GB顯存的話確實容易被曝掉。
我們先看訊景RX 6800海外版顯卡,基於RDNA2架構,7nm製程工藝。
它配備了60CU單元(等於3840流處理器),每個CU單元還具備1個光追加速器,此外有240個紋理單元、96個光柵單元。
基礎頻率1980MHz,加速頻率高達2190MHz,256Bit的顯存位寬,512GB/的顯存帶寬,為了緩解帶寬不足的問題,配有128MB的AMD Infinity Cache,TGP功耗則為250W。
銘瑄的RTX 4060...
華擎低調發布銳炫A310顯卡:單槽半高,雙風扇支持停轉技術
英特爾在去年低調地發布了銳炫A310,可以說是採用新架構的GPU里性能最弱的一款,定位是取代之前的Iris Xe Max(DG1)。個別廠商也有推出基於銳炫A310的產品,不過型號和數量並不多,比如微星在兩個月前就推出了一款名為「MSI Arc A310 4 GB Low Profile 2X」的產品。
近日,華擎帶來了名為「Intel Arc A310 Low Profile 4GB」的新產品,整體尺寸為169 x 69 x 39 mm。與之前微星的產品一樣,都屬於半高規格,擋板為單槽,散熱器外觀為炭黑色,看上去很低調。
華擎新款銳炫A310顯卡上有兩個小小的風扇,支持低負載下停轉,以實現完全靜音。配備的顯示輸出也僅有一個HDMI 2.0b接口和一個DP 2.0接口,不需要外接供電,整卡功耗不會超過75W。其搭載的是經過削減的ACM-G11晶片,Xe內核為6個,96組EU,顯存為4GB的GDDR6,顯存速率為15.5 Gbps,顯存位寬只有64位。 ...
ROG RTX 4090 Matrix 駭客顯卡將於9月19日正式推出:功耗高達600W
今年五月底,華碩在Computex 2023大會上展出了全新的ROG GeForce RTX 4090 Matrix(駭客)顯卡。這是繼ROG MATRIX GeForce RTX 2080 Ti後,ROG再一次將駭客系列拿了出來。近日ROG官方公布最新消息,ROG RTX 4090 Matrix顯卡將於9月19日正式推出。
ROG RTX 4090 Matrix顯卡使用了無縫的金屬框架設計,厚度為2.5槽,漂亮的外罩帶有RGB燈效。板卡部分沒有配備任何風扇,但整合了液態金屬導熱組件,並且還在GPU核心及其供電模塊周圍加入了全新的溫度傳感器,可實現更高效、更均勻的散熱效果。顯卡尾部有金屬支架為導液管連接處提供支撐,所有散熱均由360一體式水冷解決方案提供。冷排上三把ROG MF-12 ARGB系列風扇為磁吸式連接設計,便於玩家操作。
性能方面,該卡採用了24相供電設計,組件來自MPS,顯卡默認功耗為550W,最高可以提升至600W,在目前眾多品牌型號的RTX 4090顯卡中名列前茅,完全對得起華碩旗下最強性能顯卡的稱號。此前,有極客玩家使用ROG RTX 4090 Matrix顯卡將其核心頻率超頻至4GHz,刷新了當時的RTX 4090顯卡的超頻記錄。
ROG...
華碩准備新款RX 7800/7700 XT顯卡:ROG STRIX/Dual/ProArt均有黑白雙色
此前華碩就推出新款TUF Gaming系列Radeon RX 7800/7700 XT顯卡,提供了黑色和白色兩種配色。由於兩者都基於RDNA 3架構的Navi 32 GPU打造,盡管規格有所不同,但兩款產品採用了相同的散熱技術,改動很小,一定程度上也節約了成本。
最近華碩向歐亞經濟委員會(EEC)提交了新的文件,裡面提到了眾多Radeon RX 7800/7700 XT顯卡,分別屬於4個系列,共64款型號,均提供了黑白雙色可選。除了已發布的TUF Gaming系列外,還有ROG STRIX、Dual和ProArt系列。
相比於英偉達的GeForce顯卡,華碩為Radeon顯卡准備型號一般會少一些,像為AMD單款GPU發布如此多型號十分罕見,這多少反映了華碩的期望。華碩一次性注冊如此多的型號,也有可能只是為未來可能出現的型號提早做准備,以便有需要的時候啟用,最終個別型號並不會上市銷售。
值得注意的是,華碩之前的ProArt系列顯卡里僅提供黑色的產品,而這次新增了白色,或許會讓部分玩家有所期待。
Radeon RX 7800 XT搭載的Navi 32共有60個CU,即3840個流處理器,Infinity Cache為64MB,配備16GB的GDDR6顯存,顯存位寬為256位,顯存速率為19.5 Gbps。Radeon RX 7700 XT搭載的Navi 32經過了削減,CU數量會降至54個,即3456個流處理器,Infinity Cache也相應減少至48MB,顯存為12GB,顯存位寬為192位,顯存速率也將降至18...
主流1080P用戶升級顯卡,選DLSS 3加持的RTX 4060系列
根據Steam 8月硬體調查顯示,當前玩家配置的顯示以1080P為主,占比高達60.75%;而在顯卡份額增長方面,RTX 4060表現十分亮眼,筆記本電腦和台式機分別增加0.70%和0.23%,分別位居第一和第三.顯然當前主流解析度仍是1080P,而“60”系入門級別的顯卡則更受主流玩家的喜愛。
RTX 4060系列顯卡採用 NVIDIA Ada Lovelace 架構,能使用戶體驗到質的飛躍,在最新遊戲和創意應用中感受性能的大幅提升,使玩家能夠在 1080p 的解析度下以出色的保真度暢玩新一代、要求更高的遊戲。非常適合當前還在使用當前使用的顯示器是1080P,顯卡還是20系甚至是10系的玩家進行升級,功耗方面憑借TSMC 4N NVIDIA定製工藝,使得RTX 40系列GPU有著更好的能耗比,部分老玩家甚至都不需要升級電源就可以使用,並且還能體驗到DLSS 3帶來的性能倍增。
NVIDIA DLSS 現已支持超過330個遊戲和應用,DLSS 3也已經支持超過40款遊戲和應用,並且這個數還在逐步增加。在今年科隆遊戲展期間NVIDIA還推出了NVIDIA DLSS 3.5,採用光線重建,可以為密集型光線追蹤遊戲和應用創建更高質量的光線追蹤圖像。DLSS 3.5將於今秋上線並將支持以下遊戲和應用:
RTX 40系列其實還有很多的“黑科技”,從各個方面提升使用體驗。比如可以藉助 Reflex,令 70 多款遊戲帶來更靈敏的響應速度。藉助支持...