NVIDIA | 搜資訊

GTX 16老卡突然打補丁：修復NVENC視頻編碼錯誤

快科技3月1日消息，如果你還在使用幾年前的GTX 16系列老顯卡，並且經常進行視頻編輯，一定不要錯過NVIDIA近日發布的551.61版補丁驅動。它修復了GTX 16系列顯卡使用NVENC進行視頻編碼時，出現視頻損壞或者錯誤信息的問題。不過，並非所有的GTX 16系列顯卡都受影響，僅包括GTX 1650 Ti、GTX 1650、GTX 1630，更高級的GTX 1660系列都沒事。 GTX 16系列集成了第六和第七代NVENC編碼器，支持H.264、H.265格式，最多可同時支持8個並發。下載地址：來源：快科技

Groq CEO控訴NVIDIA：阻礙公平競爭

上個月，美國人工智慧初創公司Groq最新推出的面向雲端大模型的推理晶片引發了業內的廣泛關注。該晶片採用了全新的Tensor Streaming Architecture (TSA) 架構，以及擁有超高帶寬的SRAM，從而使得其對於大模型的推理速度提高了10倍以上，這也使得一些客戶對於Groq的AI晶片產生的興趣。但是，根據最新的報導顯示，Groq CEO Jonathan Ross近日在接受采訪時控訴NVIDIA阻礙公平競爭。 “我們見過的很多人都說，倘若雙方見面的消息傳到NVIDIA耳里，他們會打死不認。” “問題在於，你必須提前一年付款給輝達，但產品交期或許是一年、或許要更久。他們會說：‘哎呀，你跟別人買了，那我猜交貨時間可能要晚點了。’” Jonathan Ross說道。這似乎暗示，即便是微軟、谷歌、亞馬遜這些也在開發AI加速器的科技巨頭，也會堅稱他們不打算成為NVIDIA的競爭對手。 NVIDIA僅是上一季從谷歌、微軟及亞馬遜身上賺取的營收就超過92億美元，對這三家雲服務廠商商同期間的資本支出（約350億美元），占比超過四分之一。微軟通過聲明稱，其定製化晶片與輝達相輔相成、彼此並非替代關系，目的在提供客戶最佳的價格與性能方案選項。熟知詳情的人士也透露，谷歌同時拿出自家晶片與NVIDIA晶片方案，讓客戶依據自身預算及技術需求進行選擇。亞馬遜雖也有自研AI晶片，但仍強調公司2023年跟NVIDIA擴大了長期合作，雲端服務能提供種類最多的晶片。來源：快科技

英偉達GeForce Hotfix 551.68驅動：解決GTX 16系列顯卡NVENC編碼問題

英偉達發布了GeForce Hotfix 551.68驅動程序，其基於最新的GeForce Game Ready 551.61 WHQL驅動程序，帶來了針對GeForce GTX 16系列顯卡上的NVENC編碼問題進行了修復。GeForce GTX 16系列採用了第6/7代NVENC編碼器，支持H.264和H.265視頻編碼，不過缺乏對AV1編碼的支持。英偉達會定期發布顯卡驅動程序，一般是有新顯卡或者新遊戲發售的時候，不過偶爾會針對某款遊戲或者之後發現的新漏洞發布Hotfix驅動程序，旨在解決其工程師已經發現並修復的重要問題。通常這些都是針對特定問題的小修復，不涉及任何重大問題。這次的GeForce Hotfix 551.68驅動程序主要針對GeForce GTX 1630/1650/1650 Ti通過NVENC進行視頻編碼的用戶，該錯誤可能導致GPU編碼器使用旗艦視頻損壞或者報錯。英偉達重申，GeForce Hotfix驅動程序被視為測試版本，質量保證流程比起一般的WHQL驅動程序要少得多。這次的551.68驅動程序不會有其他任何修復或者功能增強，如果並非使用對應型號顯卡進行視頻編碼的用戶不需要下載更新，等待下一個WHQL或Game Ready版本即可。 NVIDIA GeForce Hotfix 551.68驅動程序（Windows 10/11 64位），地址：點此前往>>> ...

現在哪些AIGC筆記本電腦值得入手：開學季RTX 4070筆記本電腦暢快玩轉AI

一、Chat with RTX：部署在本地的聊天機器人應用往年大學生選購筆記本主要看遊戲性能和性價比，但時代不同了，如今不會玩AI就註定無法跟上時代的節奏。對於生成式AI來說，目前主要依賴GPU進行加速，RTX 40系GPU最高可以提供686 TOPS的AI算力，輕松應對各種復雜任務，提升學習效率和工作成果！正值開學季，NVIDIA聯合諸多遊戲本廠商在京東平台開展了盛大的促銷活動，現在購買RTX筆記本，可享限時優惠！一鍵抵達會場： app端： https://pro.m.jd.com/mall/active/zHqTTKaGW39jsUQ5GJz4aTmgG3A/index.html PC端： https://pro.jd.com/mall/active/zHqTTKaGW39jsUQ5GJz4aTmgG3A/index.html 說到AI，很多人可能第一時間就會想到ChatGPT，只是ChatGPT的伺服器在雲端，或多或少存在著一些安全隱患。另外普通用戶能用的只有ChatGPT 3.5，更高級的4.0版需要每個月支付20美元（約合人民幣145元）才能使用，對於大多數用戶而言，算是一筆不菲的開銷。有鑒於此，NVIDIA推出了“ChatwithRTX”，這是一款部署於本地的聊天機器人應用，只要你擁有一塊搭載8GB以上顯存的RTX 30/40顯卡，就可以實現本地、快速、信息定製的生成式AI。 Chat with RTX 可以在Windows RTX PC 和工作站上以本地部署的方式運行，再加上用戶的數據還是保留在本地設備裝置上，因此能夠快速提供查詢結果。與依賴雲端環境的 LLM 服務不同，Chat with RTX 讓用戶能夠在 PC 桌面端處理敏感資料，無需分享給第三方或是連接到網絡。 Chat with RTX工具支持包括.txt、.pdf、.doc/.docx和.xml在內的多種文件格式。將應用程式指向含有這些資料的文件夾，Chat...

GPU出貨量2023Q4環比增長近6%，動力主要來自移動平台

近日Jon Peddie Research（JPR）發布了最新的GPU市場數據統計報告，顯示2023年第四季度PC使用的GPU出貨量（包括集成和獨立顯卡）為7620萬，環比增長5.9%，同比增長了20%。從長遠來看，Jon Peddie Research預計GPU在2024年到2026年之間將實現3.6%復合年增長率，預測2026年末將逼近50億安裝基數，未來五年PC中獨立顯卡的滲透率將達到30%的水平。雖然GPU出貨量有了較大幅度的同比增長，不過包括獨立顯卡在內的桌面顯卡卻下降了1%，而筆記本電腦使用的GPU增長了32%，說明增長的主要動力來自於移動平台。另外環比5.9%的增長率遠遠超出過往10年平均增長率（-0.6%），其中AMD和英偉達的出貨量分別下降了2.9%和1.5%，英特爾的出貨量增長了10.5%。在市場份額方面，AMD和英偉達的市場份額分別下降了1.4%和1.36%，英特爾則增長了2.8%，收復了過去幾個季度里丟掉的市場份額，畢竟筆記本電腦中大多數都採用英特爾的核顯。在2023年第四季度中，GPU和PC的整體連接率（包括集成和獨立顯卡、台式機、筆記本電腦和工作站）為113%，環比下降3.3%；台式機獨立顯卡比上一季度增加了6.8%；本季度CPU整體市場的季度增長率為9%，年增長率為24%。 GPU一直是PC市場的先行指標，因為在PC供應商發貨之前就會安裝到系統中。Jon Peddie Research表示，盡管2023年第四季度的數據很不錯，但是遠沒有到樂觀的程度，2024年第一季度的表現比起上一個季度預計會有所下降，許多公司希望AI PC能改變一切，也許確實如此，但最快要到年末才逐漸成為主流趨勢。 ...

英偉達GEAR研究小組成立，為物理和虛擬世界開發AI機器人和NPC

近日，英偉達成立了一個新的研究小組，名為「GEAR（Generalist Embodied Agent Research）」。目標是為了讓英偉達進一步推進和構建基於人工智慧（AI）的實體，並使其能夠在虛擬世界和物理世界中熟練地操作，比如智能機器人和NPC之類。 GEAR研究小組由Jim Fan和Yuke Zhu共同創立，之前雙方合作過幾個項目。作為GEAR研究小組的研究經理兼主管，Jim Fan表示正在打造Foundation Agent，一種具有普遍能力的人工智慧，能夠學會在虛擬和現實的多個世界中熟練地行動。Jim Fan相信，未來每台移動的機器都將是自主的，機器人和模擬代理將像iPhone一樣無處不在。 GEAR研究小組在主頁上提供了四個重點，闡明了研究議程，將從開發多模式基礎模型、通用機器人、虛擬世界中的基礎代理以及仿真和合成數據開始。其表示，2024年是機器人年，是遊戲人工智慧年和模擬年，希望能夠實現它。 GEAR研究小組還分享了四個先前的項目，其中兩個項目涉及《我的世界》，一個是植入遊戲後熟練且主動的人工智慧代理，另一個是優化的機器人強化學習技術，旨在讓機器人達到「超人類水平的靈活性」。 ...

黃仁勛預警：下一代GPU 會非常難買

無論遊戲顯卡還是AI加速卡，NVIDIA GPU如今都是現象級的存在，尤其是AI加速卡，賣十幾萬都被瘋搶，訂單往往能排好幾個月，導致遊戲顯卡的產能也很緊張。 NVIDIA早就確認，，可以輕松搞定1730億參數的大語言模型，是現在H200的兩倍甚至更多。至於具體時間，曝料稱原計劃是第四季度，但提前到了第二季度。季度財報發布後的溝通會上，黃仁勛在接受采訪時表示：“我們所有的產品，都是嚴重供不應求，這也是新產品的天然屬性，所以我們在竭盡可能滿足需求，只不過整體來看，我們的需求增長實在太快了。” NVIDIA CFO Colette Kress也補充說：“我們預計下一代產品的供應會非常緊張，因為需求遠遠超過了供應能力。” 至於RTX 50系列顯卡，很可能要等到今年底才會發布。想買也不一定有啊來源：快科技

RTX 2080改造升級16GB顯存性能飛升20倍

這兩年，改造升級顯卡顯存容量非常流行，RTX 40/30/20、RX 6000系列一個也沒跑掉，但有時候效果很明顯，有時候就不好說了。快科技2月24日消息，巴西團隊Paulo Gomes最近接到一個特殊的活兒，有客戶覺得自己的RTX 2080 8GB顯存太小了，要求升級，甚至貼心提供了顯存晶片。 RTX 2080發布於2018年，採用TU104-400 GPU，配備了2944個CUDA核心，搭配256-bit 8GB GDDR6顯存。改造過程都是輕車熟路了，拿到舊顯存晶片，換上新顯存晶片，再調整幾個跳線，搞定。 GPU-Z可以正確識別出16GB顯存，標准驅動和軟體也都無障礙安裝。跑了一下非常吃顯存的《惡靈古堡4》，改造前後平均幀率基本沒變，但是1％最低幀從3FPS來到了59FPS，提升了幾乎20倍！這也意味著，遊戲在大顯存下的嚴重卡頓現象幾乎不見了，非常流暢。來源：快科技

共耀光芒： Google Gemma 優化後可在NVIDIA GPU上運行

藉助TensorRT-LLM，Google全新開放語言模型可在NVIDIAAI平台(包括本地RTXAIPC)上加速運行 2024年2月21日，NVIDIA攜手Google在所有NVIDIAAI平台上發布面向Gemma的優化功能，Gemma是Google最先進的新型輕量級2B和7B開放語言模型，可在任何地方運行，從而降低成本並加快特定領域用戶案例的創新工作。 NVIDIA 和 Google的團隊緊密合作，利用NVIDIATensorRT-LLM(用於優化大語言模型推理性能的開源庫)，在數據中心的NVIDIAGPU、雲計算和搭載NVIDIARTXGPU的PC上運行時，加速Gemma性能(Gemma由創建Gemini模型的相同研究和技術構建)。這使開發者能將全球高性能AIPC中超過1億台搭載NVIDIA RTX GPU的用戶作為潛在用戶進行開發。開發者還可在搭載 NVIDIAGPU 的雲端運行Gemma，該實例擁有141GBHBM3e顯存，速度為4.8TB/秒，Google將於今年部署該實例。此外，企業級開發者還可利用NVIDIA豐富的工具生態系統(包括依託NeMo框架的NVIDIAAIEnterprise和TensorRT-LLM)，對Gemma進行微調，並將優化後的模型部署到生產應用中。詳細了解有關TensorRT-LLM如何加快Gemma推理速度的更多信息，以及面向開發者的其他信息：包括Gemma的多個模型文件和模型的FP8量化版本，以上這些都使用TensorRT-LLM進行優化。您可在NVIDIAAIPlayground上直接通過瀏覽器體驗Gemma2B和Gemma7B。 Gemma即將上線ChatwithRTX NVIDIAChatwithRTX 技術演示版也即將支持Gemma，該Demo使用檢索增強生成(RAG)和TensorRT-LLM軟體，為用戶提供在本地Windows RTXPC上的生成式AI功能。視頻連結：https://www.bilibili.com/video/BV1Ky421z7PT/ 藉助ChatwithRTX，用戶可將PC上的本地文件輕松連接到大語言模型，利用自己的數據打造個性化聊天機器人。由於模型在本地運行，因此可快速生成結果，而用戶數據則保留在本地設備上。與依賴基於雲的LLM服務不同，ChatwithRTX可讓用戶在本地PC上處理敏感數據，而無需與第三方共享這些數據或連接網際網路。來源：快科技

歐美一邊封殺一邊賣晶片俄羅斯宣布製造境內最大的超級計算機

快科技2月23日消息，據媒體報導稱，俄羅斯國家杜馬主席維亞切斯拉夫·沃洛金稱，薩拉托夫州將在俄儲蓄銀行在建數據處理中心的基礎上建造俄羅斯最大的超級計算機。這已經不是秘密了，因為之前俄羅斯就表示，計劃在2030年之前建造10台超級計算機，每台計算機將搭載1萬至1.5萬個NVIDIA H100 GPU。這一計劃旨在提供與訓練類似於ChatGPT的大型語言模型相媲美的計算性能。然而，該計劃面臨著巨大的挑戰，其中包括如何克服技術限制、GPU供應的稀缺以及計算能力的成本。目前，俄羅斯在超級計算領域的地位相對較低，其最強大的超級計算機是由Yandex擁有的Chervonenkis，其運算能力在全球排名第27。相比之下，美國擁有150台，中國擁有134台，德國擁有36台，日本擁有33台。這使得俄羅斯計劃建造10台超級計算機的目標看起來更加雄心勃勃，但也更具挑戰性。雖然歐美對俄羅斯進行打擊，但事實的情況是，2023年前9個月，俄羅斯從歐美企業購買了價值超過17億美元的晶片。前20大公司就賣了12億美元，包括：AMD(含賽靈思)、ADI、Intel(含Altera)、英飛凌、Macom、美滿電子(Marvell)、微芯科技(Microchip)、恩智浦(NXP)、意法半導體、瑞昱(Realtek)、德州儀器，等等。對於NV的的AI算立卡，俄羅斯想要獲得其實也不難，正規途徑可能不是那麼容易，但是第三方還是很容易獲得，無非就是價格貴一些而已，當然這些事情這些廠商也是心照不宣。來源：快科技

英偉達預計Blackwell架構GPU供應依然受限：市場需求遠遠超過供應量

此前有報導稱，由於人工智慧（AI）需求激增，市場需要性能更強大的解決方案，英偉達已經決定將下一代Blackwell架構GB100 GPU的發布時間從2024年第四季度提前到2024年第二季度末，在數據中心市場繼續壓制其他競爭對手。同時英偉達已經與SK海力士達成協議，選擇在新一代B100計算卡上採用後者面向人工智慧的超高性能DRAM新產品HBM3E。據Seeking Alpha報導，雖然目前用於AI和HPC的H100計算卡交貨時間大幅度縮短，不過下一代基於Blackwell架構的新品在供應方面並不樂觀。英偉達首次財務官Colette Kress在與金融分析師和投資者舉行的財報電話會議上表示，由於需求遠遠超過供應，預計下一代產品的供應將受到限制。傳聞已經有英偉達的客戶預訂了少量的B100計算卡，問題是真正發布後，採用全新組件的B100 SXM和B100 PCIe及配套的DGX伺服器，能以多快的速度提高產量。如果市場需求巨大，那麼很可能重演H100發貨初期出現的大面積延遲情況。基於Blackwell架構的GB100 GPU採用小晶片設計和MCM封裝，可以更容易地提升晶片的產品，但是多晶片封裝解決方案也可能讓後期的封裝工作變得更加復雜。除了B100以外，英偉達還准備了用於企業和訓練應用的B40，以及結合了B100和Grace CPU的GB200產品，另外還有用於大型語言模型訓練的GB200 NVL。 ...

英偉達GeForce Game Ready 551.61 WHQL驅動：支持NVIDIA App測試版

英偉達發布GeForce Game Ready 551.62 WHQL驅動程序，可以為支持DLSS 3技術的最新遊戲提供最佳體驗，比如新遊戲《夜鶯傳說（Nightingale）》。此外，該版本還支持NVIDIA App測試版，統一了GeForce Experience和NVIDIA控制面板。 GeForce Experience優化設置新增了多款遊戲，包括《夜鶯傳說》、《碧藍幻想：Relink（Granblue Fantasy: Relink）》、《超自然車旅（Pacific Drive）》和《碧海黑帆（Skull and Bones）》。已修復的問題，包括：《彩虹六號：圍攻》- 運行 Vulkan API 時的穩定性問題。 RTX Video HDR - 在Windows中使用自定義HDR亮度值時，色調映射無法正常工作。。 Chrome/Edge瀏覽器 -...

NVIDIA App Beta版發布，全新Game Ready驅動藉助DLSS 3 和 Reflex 優化《夜鶯傳說》

解禁時間：2024年2月22日22:00 NVIDIAAppBeta版發布，全新GameReady驅動藉助DLSS3和Reflex優化《夜鶯傳說》(Nightingale) 最新的NVIDIAGameReady驅動與全新NVIDIAappBeta版同時發布，對玩家和創作者來說，NVIDIA app是搭載NVIDIA GPU的PC 台式機和筆記本電腦必備搭檔。NVIDIAappBeta版是實現NVIDIA控制面板和GeForceExperience統一與現代化升級的開始。最新GameReady驅動將支持《夜鶯傳說》(Nightingale) -- 一款支持DLSS3和Reflex的全新PVE開放世界生存建造類遊戲。 NVIDIAAppBeta版現已開放下載無論遊戲發燒友或內容創作者，NVIDIAapp都能讓您更輕松及時地將PC更新到最新的NVIDIA驅動，並能快速找到和安裝NVIDIABroadcast以及NVIDIAOmniverse等NVIDIA應用。 NVIDIA app 提供了一個統一的 GPU 控制中心，以便用戶在此進行遊戲調優設置和驅動設置。此外，它引入了經過重新設計的遊戲內浮窗，方便用戶調出強大的遊戲錄制工具、性能監控浮窗和遊戲增強濾鏡，包括面向 GeForce RTX 用戶、由 AI 增強的全新濾鏡。此次發布的初始Beta 版整合NVIDIA現有應用的諸多主要功能，優化用戶體驗，並引入全新的 RTX 功能來提升遊戲和創作體驗。NVIDIA App 允許用戶選擇是否登錄帳號用於兌換捆綁包和獎勵。 NVIDIAapp支持全新AI驅動的Freestyle濾鏡功能。RTX HDR 可為 SDR (標准動態范圍)...

英偉達公布2024財年第四財季及全財年財報：數據中心業務收入暴增創下新紀錄

英偉達公布了2024財年第四財季（截至2024年1月28日），以及2024財年全年的財報。英偉達創始人兼CEO黃仁勛先生表示，不到六年的時間，NVIDIA RTX已成為一個用於生成式AI的大型PC平台，受到1億遊戲玩家和內容創作者的喜愛，接下來的一年裡，將有重大的新產品周期和卓越的創新，以幫助推動行業向前發展。財報顯示，英偉達在2024財年第四財季中，收入為221億美元，同比增長265%，環比增長22%；淨利潤為122.85億美元，同比增長769%，環比增長33%；其中遊戲業務收入為29億美元，同比增長56%，和上一個季度基本持平；數據中心業務收入為184億美元，同比增長409%，環比增長27%；可視化業務收入為4.63億美元，同比增長105%，環比增長11%；汽車業務收入為2.81億美元，同比下降4%，環比增長8%。此外，英偉達的毛利率為76%，與上年同期的63.3%相比上升了12.7個百分點，與上一季度的74%相比上升了2個百分點。回顧2024財年全年，收入為609.22億美元，增長126%；淨利潤為297.6億美元，增長581%；其中遊戲業務收入為104億美元，增長15%；數據中心業務收入為創紀錄的475億美元，增長217%；可視化業務收入為16億美元，增長1%；汽車業務收入為11億美元，增長11%。另外利潤率為72.7%，與上年的56.9%相比上升了15.8個百分點。展望2025財年第一財季，英偉達預計收入會繼續攀升，將達到240億美元，正負浮動2%，另外毛利率在76.3%，上下浮動50個基點。 ...

AI推理速度提升超10倍、性價比超100倍 Groq LPU能否取代NVIDIA GPU

美國人工智慧初創公司Groq最新推出的面向雲端大模型的推理晶片引發了業內的廣泛關注。其最具特色之處在於，採用了全新的Tensor Streaming Architecture (TSA) 架構，以及擁有超高帶寬的SRAM，從而使得其對於大模型的推理速度提高了10倍以上，甚至超越了NVIDIA的GPU。推理速度比GPU快10倍，功耗僅1/10 據介紹，Groq的大模型推理晶片是全球首個LPU（Language Processing Unit）方案，是一款基於全新的TSA 架構的Tensor Streaming Processor (TSP) 晶片，旨在提高機器學習和人工智慧等計算密集型工作負載的性能。雖然Groq的LPU並沒有採用更本高昂的尖端製程工藝，而是選擇了14nm製程，但是憑借自研的TSA 架構，Groq LPU 晶片具有高度的並行處理能力，可以同時處理數百萬個數據流，並該晶片還集成了230MB容量的SRAM來替代DRAM，以保證內存帶寬，其片上內存帶寬高達80TB/。根據官方的數據顯示，Groq的LPU晶片的性能表現相當出色，可以提供高達1000 TOPS (Tera Operations Per Second) 的計算能力，並且在某些機器學習模型上的性能表現可以比常規的 GPU 和 TPU...

晶片大神Jim Keller痛斥NVIDIA CUDA：不是護城河是沼澤

對於x86、Arm、MISC 和 RISC-V 等處理器架構都有深入研究的傳奇處理器架構師Jim Keller批評了被外界認為是英偉達（NVIDIA）“護城河”的 CUDA架構和軟體堆棧，並將其比作x86，稱之為“沼澤”。他指出，就連英偉達本身也有多個專用軟體包，出於性能原因，這些軟體包依賴於開源框架。 “CUDA 是沼澤，而不是護城河，”凱勒在 X 帖子中寫道。“x86 也是一片沼澤。 CUDA 並不漂亮。它是通過一次堆積一件東西來構建的。” 確實，就像x86一樣，CUDA在保持軟體和硬體向後兼容性的同時逐漸增加了功能。這使得英偉達的平台完整且向後兼容，但它影響了性能並使程序開發變得更加困難。同時，很多開源軟體開發框架可以比CUDA更高效地使用。 “基本上沒有人編寫 CUDA，”Jim Keller在後續帖子中寫道。“如果你確實編寫 CUDA，它可能不會很快。 Triton、Tensor RT、Neon 和 Mojo 的存在是有充分理由的。” 甚至NVIDIA本身也有不完全依賴 CUDA 的工具。例如，Triton Inference Server...

英偉達RTX 4060/4060 Ti供應不足，或持續一個月

此前有報導稱，各個顯卡品牌反映RTX 4060和RTX 4060 Ti系列顯卡的整體貨源供應在今年1月份都不會特別充足。由於英偉達早已分發完貨源，所以廠商都是在賣庫存，供應取決於庫存情況。不過當時臨近傳統農歷新春假期，對玩家來說影響不算大。據博板堂透露，從英偉達及各個顯卡品牌處得到消息，RTX 4060和RTX 4060 Ti系列顯卡在2月18日到3月10日期間，貨源各方面都不會充足。在2月份，晶片貨源到貨較為緩慢，影響來自於GPU晶片的供應延遲，以及代工廠產能跟不上等因素影響。直到3月份中旬左右，各個顯卡品牌的供應量都不太夠。有消息稱，隨著人工智慧（AI）熱潮為數據中心業務帶來的高收益，過去一段時間里，英偉達改變了原有的策略，資源更多地向優先級更高的人工智慧晶片傾斜，減少了遊戲GPU的生產。從而導致進入2023年第四季度後，英偉達在消費市場的GPU供應量就出現了下降，不同地區都出現了供不應求的狀況。從這次得到的最新信息來看，近期主流玩家想購入一塊RTX 4060和RTX 4060 Ti系列顯卡似乎多少會受到影響，而且將持續一段時間。 ...

NVIDIA Maxwell架構已經整整10年了 28nm功耗不可思議

快科技2月19日消息，整整10年前的2013年2月19日，NVIDIA正式推出了新一代Maxwell GPU架構，它有著極高的能效，出場方式也非常特別。在整個顯卡歷史上，全新GPU架構的誕生，總是對應著全新一代的顯卡，但是Maxwell首發非常低調，首先用在了GTX 750 Ti、GTX 750兩款中低端顯卡上，首發價分別僅為999元、799元，GTX 700系列的其他型號則是上一代的Kepler架構。 Maxwell架構最大的變化就是首次引入了全新的SM流處理器結構設計，能效實現飛躍。 GTX 750系列所用的GM107製造工藝和Kepler系列一樣還是28nm，但集成了多達18.7億個電晶體，面積僅為148平方毫米。 GTX 750 Ti擁有640個流處理器，核心頻率1020-1085MHz，搭配128-bit 2GB 5.4GHz GDDR5顯存，整卡功耗僅為60W，不需要輔助供電，單插槽散熱就能搞定。 GTX 750 512個流處理器，功耗進一步降至55W。再往後，NVIDIA桌面顯卡命名跳過了GTX 800系列，Maxwell架構大放異彩則是GTX 900系列，而且是升級版的第二代。其中，GTX 970也是一款爭議非常大的產品，名義上是4GB顯存，但只有3.5GB是全速的，其餘0.5GB受核心限制而性能很差，NVIDIA還因此惹上了集體訴訟官司，不得不賠償每一位玩家30美元。 GTX Titan則是Maxwell架構的巔峰之作，3072個流處理器，12GB GDDR6顯存，999美元。另外，Maxwell架構還進入了任天堂Switch遊戲掌機，也就是Tegra X1/X1+處理器，集成256個流處理器。任天堂有望在2025年初發布新一代Switch，或許會升級到Ampere GPU架構。來源：快科技

Chat With RTX 為 NVIDIA RTX AI PC 信息定製聊天機器人

這個技術展示Demo讓任何擁有 RTX GPU 的人都能享受強大的個人定製化的 GPT 聊天機器人。 February 13， 2024byJesse Clayton 在基於 NVIDIA GPU 的雲端伺服器支持下，全球每天有數百萬人使用聊天機器人。現在這些開創性的工具將出現在搭載 NVIDIA RTX的 Windows PC 上，以實現本地、快速、信息定製的生成式AI。 Chat with RTX 技術演示版，現已開放免費下載，用戶可在搭載 NVIDIA GeForce RTX 30...

NVIDIA AI GPU交貨時間11個月變3個月：好事也是壞事

快科技2月17日消息，瑞銀分析師分享給投資者的備忘錄顯示，NVIDIA AI GPU的交貨速度已經大大加快，去年年底還需要等待8-11個月，如今只需3-4個月。瑞銀指出，這種情況是一把雙刃劍。一方面，這表明NVIDIA與台積電大大提高了產能，尤其是解決了CoWoS封裝的瓶頸問題，可以在短期內快速帶來更多收入。另一方面，在清理積壓訂單的同時，NVIDIA需要尋找更多新的訂單，否則會導致收入受損。還有一點，由於美國政府的出口管制，NVIDIA AI GPU無法大規模供應中國市場，也給其他訂單釋放了產能空間。瑞銀還認為，交貨周期的縮短，也暗示NVIDIA AI GPU的短期增長已經接近峰值，後續增長可能會出現乏力。即便如此，瑞銀還是將NVIDIA股價預期上調到了850美元——目前為725美元左右。來源：快科技

AMD顯卡可以原生跑NVIDIA CUDA應用了速度還挺快

快科技2月16日消息，NVIDIA CUDA通過多年耕耘，鑄就了牢不可破的生態壁壘，外人各種嘗試都無法進入，包括AMD ROCm開發平台，但其實也不是沒有辦法。開發者Andrzej Janik就憑借一己之力，藉助Intel oneAPI，開發了CUDA兼容方案“ZLUDA”，能夠在Intel硬體上原生運行CUDA應用，後來就被停了，原因你懂的。之後在AMD的支持下，ZLUDA重啟了該項目，能夠讓AMD顯卡原生運行CUDA應用，不需要任何轉移，也不需要調整代碼。唯一要做的，就是用ZLUDA庫替代CUDA。雖然它不能保證每一款CUDA應用都跑起來，但已經是以一個巨大的突破。非常可惜，AMD支持這一項目做了兩年，也給停了——不知道是不是受到了NVIDIA的壓力。幸運的是，ZLUDA項目並未徹底消散，已經免費開源，感興趣有能力的開發者都可以使用，而且確認可以在AMD ROCm平台上無縫運行CUDA應用。比如說，可以將CUDA作為Blender 4.0或者V-Ray的渲染API，尤其是Blender本來就有Radeon HIP計算渲染器，如今跑在ZLUDA上速度還會更快。 Andrzej Janik也在繼續研究ZLUDA，其中一個目標就是要讓AMD顯卡運行NVIDIA DLSS。內部測試表明，對比OpenCL方案，其性能大部分時候都更好，最多可以領先超過75％，但因為還在開發之中，部分時候效率反而更低。來源：快科技

六年前的RTX 2080 Ti改造22GB顯存：只要3600元

快科技2月16日消息，這幾年改造顯卡擴容顯存的事兒並不少見，如今一家美國企業又將2018年發布的Turing時代旗艦RTX 2080 Ti 11GB批量改造為22GB GDDR6顯存，並公開叫賣。這次被改造的是微星RTX 2080 Ti AERO版本，不但顯存容量翻番，還更換了新的渦輪風扇散熱器，號稱不需要任何特殊任何軟體支持，安裝官方驅動就行，打遊戲也毫無問題。不過它的主要目的不是玩遊戲，而是面向個人工作站，跑AI和深度學習，Stable Diffusion、LLAMA2都毫無問題，所以採用了渦輪風扇。這批顯卡或者GPU的來源值得玩味，不排除是一批礦卡。價格只要499美元，約合人民幣3600元——RTX 2080 Ti當年的首發價是999美元/9999元人民幣。另外，這並不是RTX 2080 Ti改造的極限，之前還有人做出過44GB顯存。來源：快科技

NVIDIA發布最低端專業顯卡RTX 2000 ADA：居然要4500元

快科技2月16日消息，NVIDIA近日發布了新款專業顯卡RTX 2000 ADA，屬於Ada Lovelace架構專業家族的入門級成員，但依然不便宜。 RTX 2000 ADA採用了和桌面顯卡最低端型號RTX 4060一樣的AD107小核心，但是CUDA核心數更少僅為2816個，同時有88個第四代Tensor核心、22個第三代RT核心。算力方面，單精度浮點性能12.0TFlops，RT核心性能27.7TFlops，Tensor核心性能191.9TFlops，號稱對比Ampere架構的上一代RTX 2000分別提升1.5倍、1.7倍、1.8倍，此外VR性能提升最多3倍。集成一個視頻編碼器、一個視頻解碼器，支持AV1編解碼，而輸出接口為四個miniDP 1.4a，可以連接四屏4K120或者四屏5K60或者雙屏8K60。顯存還是128-bit的位寬，容量為16GB GDDR6，帶寬224GB/，支持ECC。整卡功耗僅為70W，無需輔助供電，號稱能效提升2倍，當然依舊是渦輪風扇，而且要雙插槽體積。順帶一提，它的系統總線只有PCIe 4.0 x8。 RTX 2000 ADA要價為625美元，約合人民幣4500元，麗台、必恩威等品牌都會跟上，戴爾、惠普、聯想等也會從4月起推出相關工作站整機。另外，RTX ADA專業顯卡家族還沒有AD106核心(RTX 4060 Ti)的型號，因此在1250美元的RTX 4000 ADA之下應該還有更多產品，估計會叫做RTX 3000 ADA。來源：快科技

英偉達GeForce Game Ready 551.52 WHQL驅動：為新遊戲《碧海黑帆》優化

英偉達發布GeForce Game Ready 551.52 WHQL驅動程序，可以為支持DLSS技術的最新遊戲提供最佳體驗，其中針對《碧海黑帆（Skull and Bones）》進行了優化，另外修復了一些bug。英偉達在550版本驅動程序里新增了幾項功能，分別是：支持CUDA 12.4；添加了對RTX Video HDR功能的支持；添加了對RTX Video Super Resolution的「Auto」設置的支持；另外還支持針對DirectX 12遊戲的超低延遲模式；加入了最新的性能改進、錯誤修復和驅動程序增強功能。已修復的問題，包括：當啟用垂直同步時，某些用戶可能會在遊戲中遇到間歇性微卡頓。《荒野大鏢客2》- 在某些高級擎天柱筆記本上發現卡頓。《不朽者傳奇》- 解決長時間遊戲時的穩定性問題。已知的問題，包括：使用Edge瀏覽器播放視頻時會出現顯示問題，建議直接打開Windows Netflix應用程式使用。 GeForce GTX 10 / RTX 20系列 - 當Windows硬體加速GPU調度和NVIDIA...

英偉達發布RTX 2000 ADA工作站顯卡：配備16GB顯存，雙槽厚度

英偉達在2022年9月發布了Ada Lovelace架構GPU，除了更新了GeForce顯卡產品線，還推出了首款基於新架構的工作站顯卡RTX 6000 ADA工作站顯卡，開啟了將AI和模擬相結合的神經圖形新時代。現在英偉達帶來了RTX 2000 ADA工作站顯卡，提供了上一代RTX 2000 12GB約1.5倍的性能，為人工智慧（AI）加速的未來鋪平了道路。其為雙槽厚度，不需要外接供電，TDP僅為70W，搭載的AD107 GPU，採用了PCIe 4.0 x8接口，配備了2816個CUDA核心，88個Tensors和22個RT核心，單精度計算性能為12 TFLOPS，在Tensors測試中也可以提供191.9 TFLOPS的算力。搭配了16GB的GDDR6顯存，帶ECC，顯存位寬為128位，速率為14 Gbps，顯存帶寬為224 GB/s。 NVIDIA RTX Enterprise驅動程序提供了新功能，包括一系列增強圖形工作流程的功能，以及增加了對RTX 2000 ADA工作站顯卡的支持，目前已開放下載。此外，通過在NVIDIA NGX軟體開發套件中增加對Video Super Resolution和TrueHDR的支持，可以增強低解析度源的視頻質量，並且可以輕松將SDR內容轉換為HDR。 RTX 2000 ADA工作站顯卡已通過英偉達全球分銷合作夥伴發售，並從4月起在聯想、惠普和戴爾電腦處銷售。據了解，RTX...

首款GH200主機開賣：售價47500歐元起、專為AI而生

快科技2月12日消息，NVIDIA官方推出的新一代GH200 Grace Hopper超級晶片平台，全球首發採用HBM3e高帶寬內存，首次將CPU、GPU融合在一塊主板上，可滿足世界上最復雜的生成式AI負載需求。如今，首款搭載GH200 Grace Hopper的PC，在一家德國商店現身，外形尺寸在19英寸左右。在定位上，它顯然不合適為遊戲和傳統工作站而設計的，更准確點的定位，應該是主打本地運行大語言模型的AI工作站。這款主機配備了480GB LPDDR5X內存，算上GH200中的96GB HBM3內存（甚至144GB HBMe），做到了576GB-624GB。售價上，96GB HBM3內存版本售價為47500歐元（約37萬元人民幣），現已可購買，其中144GB HBMe版本在2024年預計第二季度推出，售價為59500歐元（約46萬人民幣）。這款AI工作站的具體配置，搭載的NVIDIA GH200 Grace Hopper處理器擁有72個ARM內核（也有144核的版本），配有專用的NVIDIA H100加速器，因此配備了雙2000W電源和超大容量存儲，支持各種連接擴展選項（包括 NVIDIA Bluefield / Connect-X）。這款PC的散熱系統使用的是貓頭鷹風扇，附加組件，可選Nvidia Bluefield-3和ConnectX-7網卡、8TB SSD、30TB HDD、滑鼠和鍵盤，甚至還有RTX 4060。在性能上，這家德國公司聲稱這台AI工作站可以提供67 teraFLOPS FP64、989...

英偉達正在組建新的業務部門，將為廣泛的應用設計定製晶片

目前幾乎所有的雲服務供應商都有采購英偉達的A100和H100計算卡，用於人工智慧（AI）和高性能計算（HPC）的工作負載。與此同時，包括亞馬遜、谷歌和微軟等在內的雲服務供應商也在部署自己設計的定製晶片，優化自身的性能和成本需求，這表明了市場需求的多樣化。據相關媒體報導，英偉達正在組建新的業務部門，將為廣泛的應用設計定製晶片，包括但不限於人工智慧晶片，可以幫助英偉達擴大未來業務。新部門由副總裁Dina McKinney領導，旨在滿足汽車、遊戲機、數據中心、電信和其他可能利用定製晶片的應用的需求。據了解，潛在客戶名單包括汽車製造商、大型雲服務提供商和電信公司等。有消息稱，英偉達已經與亞馬遜，Meta，微軟，谷歌和OpenAI在內的科技巨頭進行了初步談判，共同探索創建定製晶片的機會，這表明關注范圍超出了傳統的現成數據中心產品。雖然H100這樣的產品性能很強勁，但是客戶不能隨便根據自身需求添加自定義功能，在IP保護方面也有所欠缺，同時也不一定能完全適配自身任務，價格還很貴。英偉達希望藉助新部門，更好地滿足大客戶的晶片使用需求，而且還能在相對落後的細分市場上增強競爭力。像汽車市場，英偉達提供的解決方案在銷售方面遠不如數據中心、遊戲和專業可視化部分，出於成本、競爭關系和IP可控等原因考慮，一些汽車製造商寧願自己開發高度可定製平台。 ...

華擎在接受媒體訪問時表示：推出NVIDIA顯卡產品線目前仍具有一定挑戰性

2018年3月，作為台系主板四大廠中唯一家沒有顯卡產品線的「妖板」廠商華擎在社交平台上發布視頻，正式宣布進軍顯卡市場，聯手AMD推出了多款產品，並於2022年10月與Intel合作，成為Intel Arc顯卡的重要合作夥伴。目前華擎旗下顯卡擁有Phantom Gaming、Challenger、Steel Legend和Taichi等系列，覆蓋了各個主流價位段，在市場上擁有不小的影響力。其實不少玩家可能會感到疑惑，為什麼華擎一直以來沒有推出目前市場占主導地位的NVIDIA顯卡產品線呢？近日，華擎在接受QuasarZone訪問時就被問及此問題，並作出以下回復：這是一個相當具有挑戰性的問題。目前同時擁有NVIDIA和AMD顯卡產品線的知名品牌廠商有華碩、技嘉和微星，他們的運營時間比我們長，並且在更早的ATI和NVIDIA時期，還有Elsa和Voodoo，那是一個群雄並起的時代。然而到了現今，滄海桑田，NVIDIA的市場主導地位變得勢不可擋，其產品在全世界范圍內都極具影響力。但從目前擁有AMD和Intel顯卡產品線的我們的角度來看，立即推出NVIDIA顯卡產品線對我們來說仍然具有一定的挑戰性。雖然華擎方面並沒有直接否認推出NVIDIA顯卡的可能性，但目前對於雙方產生合作來說確實需要進行更深層的實質性評估與規劃。回看過往，由於某些問題，2022年9月美國最大的板卡公司之一、NVIDIA的核心合作夥伴的EVGA宣布退出顯卡市場，放棄了這個為自己帶來巨大收入的業務。因此，起步相較於老牌廠商要慢的華擎選擇在顯卡領域穩步前進，也不失為一個好的決策。 ...

NVIDIA推出新版hotfix驅動程序：解決開啟垂直同步後、部分筆記本微卡頓問題

快科技2月10日消息，用戶使用計算機設備時，可能經常碰到微卡頓的問題，不止是遊戲時，甚至瀏覽網頁也可能出現。這個問題比較復雜，但並不總是和GPU有關，有時候與CPU、內存有關，有時候軟體更新也能解決。 NVIDIA就定位到了至少一個潛在微卡頓問題，發布了551.46版本的熱修復驅動更新。這個新版驅動基於當前正式發布的551.23版本修補，解決了多個與垂直同步相關的卡頓/微卡頓問題，更新日誌如下：開啟垂直同步時，部分用戶可能會在遊戲中遇到間歇性微卡頓；部分特定系統配置的 PC，網絡瀏覽器在滾動時可能會出現卡頓；《荒野大鏢客：救贖 2》Vulkan，會在某些支持Advanced Optimus特性的筆記本上會出現卡頓；《不朽者傳奇》修復了長時間遊戲後可能會出現的穩定性問題。如果你已經安裝了551.23沒有遇到這些問題，可以靜等NVIDIA推出下一版本更新。來源：快科技

AMD RX 7900 XT次旗艦卡價格史低 RTX 4070 Ti SUPER瞬間不香了

快科技2月7日消息，RTX 40 SUPER登場以來，AMD顯卡不斷以降價應對，性價比越來越高，比如次旗艦的RX 7900 XT，又降價了。 RX 7900 XT已在此前將官方定價從7499元降至6149元，比即將發布的RTX 4070 Ti SUPER便宜350元，但實際售價已經低至5499元左右。如今，RX 7900 XT更是已經跌破了5000元大關，即便在官方渠道也是如此，比如瀚鎧的星空版只需4899元，藍寶石的超合金版也不過5088元。相比之下，RTX 4070 Ti SUPER還普遍堅持6499元起的定價，只有一兩款降到了6449元，聊勝於無。國外也是類似，比如藍寶石的RX 7900 XT PLUSE已經跌至699美元，比官方定價低50美元，而且在美亞、美蛋上可以隨便買。 RX 7900 XT的遊戲性能可以全面領先RTX 4070 Ti SUPER，不同解析度平均幅度大約6-9％，性價比自然高得多，因此除非你特別在意光追、DLSS、AI這些性能，只是單純地玩遊戲，它還是很香的。來源：快科技

用AMD技術魔改RTX20/30 成功開啟DLSS 3 性能飆升75％

快科技2月6日消息，RTX 40系列獨享的DLSS 3和幀生成技術效果顯著，RTX 20/30系列老卡玩家現在也有機會體驗了。無所不能的MOD大神們已經能夠讓RTX 20/30系列顯卡開啟DLSS 3，神奇的是居然利用了AMD的技術。改造的關鍵步驟之一是替換兩個帶有AMD FSR 3代碼的DLL動態連結庫文件，還需要修改Windows注冊表，讓遊戲認為顯卡支持DLSS 3。改造之後，RTX 20/30系列顯卡就能通過開啟AMD FSR 3超分縮放技術、AFMF幀生成技術的方式，最終在遊戲里打開DLSS選項。根據實際測試，效果還不錯，RTX 3080顯卡運行《賽博朋克2077》、《蜘蛛俠：邁爾斯·莫拉萊斯》、《瘟疫傳說：安魂曲》等遊戲的時候都能開啟DLSS 3，幀率可提升最多75％。不過畢竟不是正規方法，Bug也不少，尤其是容易出現畫質上的瑕疵，比如UI錯位，此外幀生成時間有時候也會隨機波動，導致偶爾卡頓。詭異的是，AMD老顯卡反而不能通過這種方法進行改造。這就很耐人尋味了。感興趣的玩家可以在上找到改造資源包，也可以在上看看外國網友的實測。來源：快科技

同德RTX 4080 SUPER暗藏小秘密：供電接口差點忤逆NVIDIA

快科技2月6日消息，根據NVIDIA的強制要求，RTX 40 SUPER系列非公版顯卡也不再使用傳統的PCIe 6/8針供電接口，而是一律標配12VHPWR 16針接口，迄今的188款設計幾乎無一例外…… 說是幾乎，因為有過一款RTX 4070 SUPER，仍然堅持使用雙8針供電，但很快就被下架了。如今又有一款RTX 4080 SUPER做出了異於常人之舉，來自同德的Gaming Pro版本，雖然也是16針接口，但是拆解後可以看到，PCB末端赫然預留了兩個8針接口的位置。只是，這兩個接口附近沒有任何電路和相關元件。我們知道，RTX 4080、RTX 4080 SUPER關系非常近，很多顯卡從PCB到散熱器都是重復利用，看起來同德這款更加直接，都沒有去掉原來的供電接口設計，直接增加了一個16針接口。事實上，RTX 4080 SUPER的TGP功耗也只有320W，實測4K遊戲中的平均功耗僅為274W，完全沒必要動用12VHPWR 16針接口，更別提RTX 4070 SUPER。 NVIDIA這麼做的唯一原因，無非是強行推廣，而說到16針接口的好處，最直接的也就是節省一些PCB面積了。來源：快科技

NVIDIA顯卡價值再+1 任意一款SDR遊戲秒變高亮HDR

快科技2月6日消息，發布之後，NVIDIA正在研究將SDR遊戲自動升級為HDR遊戲，並且已經有高手製作出了相應的MOD，取名為“NvTrueHDR”。 RTX Video HDR技術利用RTX 20/30/40系列顯卡的Tensor張量核心，結合AI技術，可以將Chrome、Edge瀏覽器內的網絡視頻升格為HDR，色彩、對比度、亮度更上一層樓。 NvTrueHDR的技術原理類似，也是利用了RTX GPU Tensor核心，改進SDR遊戲的色彩和亮度，尤其是較早期的DX11、DX12遊戲。事實上，該技術完全兼容任何一款DX9、DX10、DX11、DX12遊戲，甚至可以支持OpenGL、Vulkan遊戲，真正的通吃。來看看對比效果：根據網友實測，這一技術的效果確實比Windows系統自帶的AutoHDR好得多，有人甚至說可以媲美原生HDR畫面。當然了，性能不可避免地會有一些損失，但目前還沒有具體數字，具體要看不同的遊戲。該技術目前僅支持Windows作業系統，驅動程序版本不低於551.23，而且還處於測試階段，建議謹慎嘗試。來源：快科技

NVIDIA龍年紅包封面來了 AI創作霸氣青龍

新年到，發紅包。今年的紅包，不一樣。龍年新年即將到來之際，不少企業都紛紛亮出了各自的專屬紅包封面，NVIDIA的可以說是最特殊的一個。 “甲辰屬木萬物生，青龍得位百事成。” 這一枚GeForce 2024龍年限定版“青龍得位”紅包封面，是採用RTX GPU通過AI創作而成的。關注“英偉達GeForce”公眾號即可領取這個特殊的紅包封面，對話發送“青龍得位”還能免費領取開運符手機壁紙。眼下無疑是AI的新時代，尤其是得益於從硬體到軟體的性能飛躍，生成式AI(AIGC)越發火爆，大大提升了人們日常工作的效率。 RTX GPU憑借集成專用AI Tensor Core，可提供1300 AI TOPS的超高本地算力，能夠做到秒速出圖，再加上100多款基於AI的RTX加速應用，無疑是設計師們的頭號利器。來源：快科技

AMD MI300X AI加速卡價格超10萬元 NVIDIA至少四倍之

快科技2月4日消息，AI/HPC應用對於加速卡的需求空前高漲，不但NVIDIA A/H系列賣到天價和脫銷，AMD Instinct系列也搶到了不少甜頭。雖然他們從來不公布產品價格，部分是因為根據行情、客戶、規模等因素差異極大，但仍然可以發現蛛絲馬跡。微軟是AMD MI300X加速卡的頭號客戶，有估計認為微軟購買的單價是1萬美元左右(約合人民幣7.2萬元)，而其他客戶可能要1.5萬美元左右(約合人民幣10.8萬元)。 NVIDIA H100 80GB PCIe經常會賣到3-4萬美元乃至更貴，H100 80GB SXM樣式的必然更貴。 NVIDIA還有更高級、更先進的H200 141GB、H100NVL 188GB，但從內存容量上看它們更應該是AMD MI300X 192GB的競爭對手，價格更要上天了。 NVIDIA已經壟斷了AI加速卡超過80％的市場，AMD雖然無力追趕之，但依然能賺得盆滿缽滿。 AMD自己估計旗下數據中心GPU業務的年收入可超過35億美元，而第三方機構認為AMD太保守了，今年至少能入帳50億美元以上，明年更有望達到80億美元左右。來源：快科技

竟要1399元起 NVIDIA RTX 3050 6GB首測：性能縮水超20％

快科技2月4日消息，，也就是RTX 3050 8GB全面精簡的產物(感覺更應該叫做RTX 3040)，目前已有多家新品悄然上架，價格最低為1399元。比如七彩虹靈動版、盈通極速版(單風扇)/大地之神版、索泰萬圖師版都是這個價，技嘉獵鷹版、七彩虹戰斧版均為1499元，技嘉還有個半高式刀版賣1599元。 RTX 3050 6GB基於安培架構的GA107-325 GPU核心，配備2304個CUDA核心、16個光追核心，參考頻率1042-1470MHz，顯存只有96-bit 6GB GDDR6，整卡功耗70W。相比之下，RTX 3050 8GB還是GA106-150 GPU核心，擁有2560個CUDA核心、20個光追核心，參考頻率1552-1777MHz，顯存為128-bit 8GB GDDR6，整卡功耗120W。德國媒體ComputerBase測試了一款微星的萬圖師版本，發現在3DMark中它比RTX 3050 8GB慢了21-24％，《賽博朋克2077》遊戲中平均幀率、1％最低幀都慢了大約21％。實際加速頻率可以達到1620MHz，RTX 3050 8GB則可以跑到1912MHz。遊戲中的功耗為69W，降低了足足46％，表現不錯。另外，如果對比前代的入門卡GTX 1650、GT 1630，它分別可以提供大約2.5倍、4.5倍的性能。那麼，你會選擇RTX 3050 6GB，還是考慮RX 6600、Arc A580？來源：快科技

英偉達發布GeForce RTX 3050 6GB：搭載GA107，整卡功耗70W，無需外接供電

英偉達宣布，推出GeForce RTX 3050 6GB，搭載了GA107 GPU，這是一款面向入門級市場的新款獨立顯卡。英偉達早在2022年1月就推出了GeForce RTX 3050 8GB版本，而這次的新產品有很大不同，包括： CUDA核心數量從2560個減至2304個，減少10%。顯存容量從8GB減至6GB，減少25%。顯存位寬從128位減至96位，減少了25%，對應的帶寬也從224GB/s減至168GB/s。基礎/加速頻率從1552/1777MHz減至1042/1470MHz，分別減少32%/17%。整卡功耗從130W減至70W，減少46%。可以看到，這次6GB版本除了顯存容量減少外，其他方面的規格配置也會有所降低，包括CUDA核心數量、GPU頻率、顯存帶寬和整卡功耗。由於GPU頻率和整卡功耗大幅度降低，可以完全不需要配備外接供電接口，PCIe插槽的75W供電已足夠驅動GeForce RTX 3050 6GB，甚至會有廠商提供採用被動散熱設計的產品。英偉達沒有公布官方建議零售價（MSRP），傳聞定價為179美元（約合人民幣1285.26元），會與英特爾銳炫A580等顯卡競爭。隨著降級的RTX 3050 6GB出現，與RTX 4060 8GB之間存在較大的性能空隙，未來有可能放入新的RTX 40系列顯卡，比如RTX 4050，以滿足不同價格區間消費者的需求。現有的RTX 3060系列至少還會銷售兩個季度，直到2024年第二季度。 ...

比華為便宜 NVIDIA三款中國特供AI GPU來了：精準縮水美國放行

快科技2月2日消息，美國對中國半導體技術的封鎖越來越嚴格，但是在商言商，NVIDIA始終沒有放棄中國市場，一直想盡辦法打造符合美國出口管制的中國特供版本，尤其是AI GPU，第二波三款正在到來。最早針對美國禁售A100、H100，NVIDIA設計了特供版A800、H800，只是閹割傳輸帶寬，算力絲毫不減。但是很快，美國出台新規，算力也做了限制，A800、H800甚至是RTX 4090就都沒法賣了。為此，NVIDIA在遊戲卡市場設計了RTX 4090D，已經低調上市。而在AI加速領域，NVIDIA設計了H20、L20、L2，原計劃2023年就發布出貨，但為了完全符合出口管制，推遲了一段時間。 H20基於Hopper架構，是一款高性能的AI訓練卡，正是中國客戶亟需的，根據最新報導它已經開始小批量供貨給中國，第二季度上量。 H20的定價據稱僅為1.2-1.5萬美元，比華為昇騰910B 1.7萬美元要低不少，用心昭然若揭。 L20、L2均基於Ada Lovelace架構，均為AI推理卡，暫不清楚是否已經供貨，可能要稍等等，對於中國客戶而言也不是非常迫切的需要。目前，三款新卡的最終規格已經確定，和之前曝光的基本一致。 H20的規格還是比較強的，INT8/FP8 Tensor算力為296T，BF16/FP16 Tensor算力為148T，TF32 Tensor算力為74T，FP32算力為44T，FP64算力為1T，功耗400W。它具備60MB二級緩存、96GB HBM3內存，帶寬4TB/，支持7路NVDEC、7路NVJPEG視頻引擎，還有著PCIe 5.0 x16系統接口、900GB/ NVLink互聯帶寬，支持最多7個MIG。相比於H200，它少了45GB HBM3，算力更是閹割得七零八落，INT8/FP8、BF16/FP16、TF32都少了多達93％，FP64少了足足97％，只有FP32隻少了35％。但即便如此，H20 FP32性能依然不如華為昇騰910B，這也是後者最大的優勢。 H20還可以八卡並行，組成一套HGX伺服器，價格大約20萬美元，而之前八塊H800伺服器需要大約28萬美元。 L20是雙插槽全高全長PCIe擴展卡，搭載96MB二級緩存、48GB GDDR6 ECC內存，帶寬864GB/，INT8/FP8算力為239T，更高精度逐級減半，但不支持FP64，功耗275W。 L2則是單插槽半高卡，只有36MB二級緩存、24GB GDDR6 ECC，帶寬300GB/，算力進一步降低INT8/FP8 193T，FP32額外砍了一半隻有24.1T。來源：快科技

RTX 4080 SUPER便宜1400元的秘密找到了供電、散熱縮水

快科技2月2日消息，RTX 40 SUPER系列三款型號中，RTX 4080 SUPER是唯一提升規格還降低價格的，首發價8099元起，相比於RTX 4080首發價便宜了足足1400元，讓不少玩家直呼老黃良心了一次，但其實背後另有隱情。在快科技的公版首發評測中，我們就對比了RTX 4080 SUPER、RTX 4080 SUPER的設計，發現散熱器完全相同，但是RTX 4080 SUPER的供電電路有所精簡，從核心13相、顯存3相，縮水成了核心11相、顯存2相。僅此一點就可以節約不少成本，而且依然可以完全滿足RTX 4080 SUPER供電和性能的需要。根據實測，RTX 4080 SUPER公版烤機頻率2220MHz，3DMark測試中最高可達2790MHz，遠高於標稱加速頻率2550MHz。各家AIC也都提供了8099元或者略貴一點的基礎版本甚至超頻版本，但如果對比非SUPER版本，可以發現不少型號都在核心供電甚至散熱器上有所縮水，尤其是熱管少了一些。顯然，NVIDIA和AIC都找到了更好的平衡點，既能節省一些成本，也能保證性能發揮，這刀法沒誰了。來源：快科技

NVIDIA找上Intel代工：每月可產30萬顆AI晶片

快科技2月1日消息，NVIDIA AI GPU晶片持續火爆，占領全球絕大部分市場，但是台積電的晶片和封裝產能卻遭遇瓶頸，NVIDIA於是又找上了Intel，後者的IFS代工業務也迎來了大客戶。據報導，NVIDIA、Intel之間的代工合作將從2月份開始，規模達每月5000塊晶圓。如果全部切割成H100晶片，在理想情況下最多能得到30萬顆，可以大大緩解NVIDIA供應緊張的局面。作為對比，台積電在2023年年中已經可以每月生產最多8000塊CoWoS晶圓，當時計劃在年底提高到每月1.1萬塊，2024年底繼續提高到每月2萬塊。 NVIDIA旗下的幾乎所有AI晶片，包括A100、A800、A30、H100、H800、GH200，全都依賴台積電CoWoS-S封裝技術，基於65nm的矽中介層。與之最接近的就是Intel Foveros 3D封裝，基於22FFL工藝的中介層。有趣的是，就在日前，Intel宣布已經在美國新墨西哥州Fab 9工廠實現了業界領先的半導體封裝解決方案的大規模生產，其中就包括Foveros封裝。 Intel沒有透露具體的產品，看起來很可能就是NVIDIA GPU。來源：快科技

1 234...90 Page 3 of 90

Tag: NVIDIA