Home Tags NVIDIA

Tag: NVIDIA

NVIDIA:有了RTX顯卡才是真AI PC 性能飛躍10倍

快科技5月1日消息,對於什麼才是AI PC,Intel、AMD的觀點出奇的一致,都強調必須是CPU、GPU、NPU三位一體,尤其是大力推行新的NPU,NVIDIA作為顯卡廠商就不幹了,認為只有配備強大的RTX GPU顯卡才是真正的AI PC。 NVIDIA RTX GPU誕生於2018年,這些年來陸續進入各個行業領域,提供廣泛的應用加速,包括但不限於:遊戲、內容創作、影音、生產力、開發、日常生活等等。 在算力方面,NPU畢竟是用於持續性的AI低負載,比如說Windows視頻會議效果處理等,現階段只能做到10-45 TOPS。 RTX顯卡的算力至少也能超過100 TOPS,最高可超過1300 TOPS,對於任何AI負載都很輕松,比如對於本地大語言模型,RTX 4050都可以超越蘋果M3,RX 7900 XTX作為競品旗艦也還不如RTX 4070 SUPER。 在生態方面,NVIDIA更是非常自豪,RTX顯卡已經支持超過500款遊戲和應用的AI加速,還提供全面、強大的開發平台。 其中,RTX AI遊戲超過了370款,DLSS 3超解析度、RTX Remix遊戲改造、ACE數字人等都用到了RTX AI加速,尤其是DLSS最高可帶來4倍的性能提升。 RTX AI應用則超過125款,遍布圖像編輯、視頻編輯、3D設計、直播等領域,以及各種獨有的AI SDK,最高可帶來10倍的性能提升。 比如說Stable Diffusion生圖速度提升7倍,Autodesk Arnold渲染速度提升6倍、DaVinci Resove視頻編輯速度提升2.5倍、Adobe Premiere...

RTX 4070已經偷偷「變心」:AD103屏蔽近一半核心

快科技4月30日消息,有網友反應,他買到的一塊某品牌RTX 4070,使用GPU-Z軟體無法完全識別,核心編號、製造工藝、晶片面積、電晶體數量、發布時間都是未知,但明明就是正品。 TechPowerUp檢查提交數據後發現,RTX 4070已經偷偷換了核心,從原來的AD104-251,改成了AD103-175-KX。 其實在一個月前,就有消息稱,,後兩者分別從AD106、AD107改成AD104、AD106。 這麼做的代價就是需要屏蔽更多核心單元,才能達成相應的規格,但也很容易理解,良品率太低的瑕疵品再利用嘛。 比如說RTX 4070,之前使用的AD104是在7680個核心中屏蔽了1792個而來,只利用了76%。 換成AD103的話,則需要在10240個核心中屏蔽4352個,64MB二級緩存屏蔽28MB,實際利用率只有大約57%,顯存位寬也得從256-bit降低到192-bit。 TechPowerUP確認,GPU-Z的下一個版本就可以順利識別新版RTX 4070。 來源:快科技

搭載AD103的GeForce RTX 4070顯卡現身,英偉達禁用了近一半的SM

此前就有報導稱,英偉達會為部分GeForce RTX 40系列顯卡准備更新,提供新的晶片使用,包括了RTX 4070、RTX 4060 Ti和RTX 4060,覆蓋了主流至中高端的部分區域。其中RTX 4070會最先出現,新版不同於現有的AD104-251晶片,而是使用AD103-175-KX晶片。英偉達在今年3月初發布的GeForce Game Ready 551.86 WHQL驅動程序里,已經支持這些搭載新晶片的顯卡了。 據Techpowerup報導,有用戶向其提供了一款奇怪的型號,是名為「MSI RTX 4070 Ventus 3X E 12G OC」的顯卡,表示GPU-Z無法正確檢測。通過對用戶提交的數據和設備ID的研究,發現這張顯卡搭載的正是AD103晶片的新版RTX 4070產品。 Geforce RTX 4070搭載的AD104-251晶片裡,啟用了60個SM中的46個,也就是76.67%,換成AD103-175-KX晶片,也就是啟用了80個SM中的46個,可用的SM占比將降至57.5%,也就是接近一半被英偉達禁用了。由於AD103和AD104占用的PCB面積、引腳和封裝尺寸相似,英偉達的合作夥伴基本可以在現有的電路板設計上實現無縫集成。 未來英偉達還有可能將AD103用於Geforce RTX 4070...

RTX 4090焊點頻頻脫落 完全沒法修 暴力包裝運輸惹的禍

快科技4月29日消息,RTX 4090作為一款一萬大幾的旗艦顯卡,卻有些“嬌貴”,不但新的12VHPWR 16針供電接口時不時燒毀,包裝運輸的時候也必須小心對待,否則很容易遭到不可逆的傷害。 顯卡維修機構Northwest Repair最近就收到了一批特殊的RTX 4090故障卡,發現它們的GPU晶片底部焊點都有大量脫落,已經完全無法維修,除非更換整個PCB。 有些卡甚至不需要拆掉散熱器、卸下GPU晶片,就能感覺不對頭。 詢問得知,這些卡在包裝運輸時的安全措施都不到位,要麼沒有固定牢靠,要麼泡沫填充不夠,導致顯卡遇到明顯震動和撞擊。 要知道,RTX 4090顯卡加上包裝,動不動就會五六斤,很容易受傷。 不過奇怪的是,這些脫落焊點基本都位於左上角和左下角,具體原因暫時不詳。 來源:快科技

分析稱英偉達繼續主導2024年AI GPU市場:銷售額400億美元,遠超AMD和英特爾

過去一年多里,人工智慧(AI)、高性能計算(HPC)市場需求在迅速增長,以ChatGPT為首的人工智慧工具在全球范圍內掀起了一股熱潮,市場對高性能數據中心GPU的需求大幅度提升,也讓英偉達的營收實現了快速增長,同時股價飆升,成為了業界最耀眼的明星。 據相關媒體報導,有分析師對2024年人工智慧(AI)GPU市場的銷售進行了預測,表示英偉達將繼續主導該市場,銷售額將達到400億美元(約合人民幣2898.76億元)。作為對比,競爭對手AMD和英特爾的銷售額分別為35億美元(約合人民幣253.64億元)和5億美元(約合人民幣36.23億元)。 從該數據可以看到英偉達在業界的影響力,在用於人工智慧GPU的銷售上遠遠超過了競爭對手,剛剛推出的Blackwell架構GPU再次鞏固了其自身在人工智慧市場的主導地位。這樣巨大的差距或許超過了不少人的想像,某程度上參與人工智慧競賽的公司之間的距離可能越拉越大。 雖然AMD的同類產品性能不俗,近期Instinct MI300系列在銷售上也很給力,且35億美元甚至高於內部最初20億美元的預期,但是比起英偉達還差很多。AMD近期已經做了大量的工作,包括軟體方面,比如頻繁地更新ROCm,只是看起來還遠遠不夠。至於英特爾的差距就更大了,近期推出Gaudi 3加速器在銷售上也低於市場的預期,這也是其2024年第一季度財報公布後股價下跌的原因之一。 人工智慧市場未來前景廣闊,盡管英偉達占據了主導地位,但是其他晶片公司仍然表現得很樂觀,希望能從中分得一杯羹。不過AMD和英特爾要想在人工智慧GPU領域趕上英偉達,還有太多的工作需要完成。 ...

英偉達CEO黃仁勛將在Computex 2024前發表主題演講,分享AI推動新的工業革命

今年台北國際電腦展(COMPUTEX Taipei)的主題演講日常安排非常地緊湊,目前已經宣布了多個重要的主題演講,包括AMD、英特爾、聯發科、高通和Arm等業界大巨頭,預計都涉及產品陣容的重大調整。去年曾登台的英偉達創始人兼執行長黃仁勛,今年似乎沒了動靜。 事實證明,英偉達還是有自己的計劃安排的。英偉達已經宣布,黃仁勛將會在台北國際電腦展開幕前的6月2日晚上7點,在台灣大學綜合體育館發表主題演講,分享人工智慧(AI)時代如何在全球范圍內推動新的工業革命。這次演講會進行現場直播,可以通過網絡在線觀看。 值得注意的是,雖然有一些媒體將英偉達組織的這次主題演講標記為台北國際電腦展的活動,但其實並不是台北國際電腦展主題演講的正式部分,沒有被官方列入名單,同時英偉達也沒有提及這次展會,所以兩者是無關的。 今年的台北國際電腦展(COMPUTEX 2024)將會在2024年6月4日到7日之間,在中國台北南港展覽館1號館及2號館舉行,涵蓋了人工智慧運算、前瞻通訊、未來移動、沉浸現實、綠能永續及創新等六大領域。本屆展會以「AI串聯、共創未來(Connecting AI)」為主軸,聚焦全球AI最新技術與產業趨勢,吸引了1500家參展企業、使用了4500個攤位。 ...

NPU詳解:沒有就不能用AI了嗎

個人電腦經歷了近40年的發展歷程。從1970年代誕生,到20世紀80年代和90年代掀起的PC普及浪潮,再到新世紀後進入相對穩定的成熟期,PC行業一直是科技發展的重要推動力。 然而2020年以後,情況發生了變化。根據調研數據統計,2021年全球PC出貨量為3.45億台,較2020年下降了5%。2022年這一數字進一步下降至3.32億台,已連續兩年出現了負增長。這一趨勢表明,個人電腦產業正處於一個相對疲軟的階段。 就在這個關鍵時期,人工智慧技術的興起,為PC行業的未來發展帶來了新的機遇。英特爾、AMD等傳統個人電腦處理器巨頭,紛紛在近期加快推出搭載AI加速晶片的新一代PC產品。 他們希望憑借AI技術的加持,為個人電腦市場注入新的活力,搶占市場先機。同時高通這樣的移動晶片廠商,也在今年推出了面向PC市場的Snapdragon X Elite處理器,積極殺入個人電腦領域,與老牌品牌展開競爭。 面對這一新興的 AI PC 市場,不同廠商都提出了各自的定義和詮釋。對於普通用戶而言,究竟什麼樣的電腦才算是真正意義上的“AI PC”?這種新型計算設備又能為我們的日常生活和工作帶來哪些變革性的影響?接下來就跟大家一起嘮嘮AI PC那點事。 什麼是AI PC? Intel作為個人電腦行業中占據主導地位的處理器巨頭,英特爾在AI PC的定義上自然具有較強的話語權。英特爾對AI PC有三點比較核心的要求。 1、配備專門的神經處理單元(NPU)、中央處理器(CPU)和圖形處理器(GPU)?,這樣的硬體組合能夠為AI應用提供必要的計算資源。 2、支持微軟的Copilot功能,並且在鍵盤上設有專門的Copilot物理按鍵。 3、具備AI專用加速功能,這意味著CPU、GPU和NPU每一個部件都能針對AI任務進行優化,以提高效率和性能。 這里的關鍵在於集成了英特爾神經網絡處理單元(NPU)。這是英特爾專門針對AI和機器學習場景進行優化設計的硬體加速器,可以大幅提升PC在語音交互、圖像處理等人工智慧任務上的計算能力,在本地提供快速的響應時間,同時相較於雲計算服務更為節能,有助於延長設備的續航時間。 對於更復雜的AI任務,則可能需要用到GPU和CPU協同,因為NPU可能不足以處理這些高強度的工作負載。在某些情況下,CPU、NPU和GPU還能夠協同工作,以運行大型的語言處理模型。 AI模型對內存容量和速度也有很高的要求,因為更大的內存容量能夠讓模型更加復雜和精確,而更快的內存速度則能提升整體的性能。盡管目前微軟尚未設定具體的最低內存要求,但英特爾指出,某些工作負載可能需要至少16GB甚至32GB的內存。 英特爾搶先在筆記本電腦上推廣AI PC概念,發布了具有NPU的全新一代酷睿Ultra處理器,並計劃到2025年底交付超過1億台帶有AI加速器的PC,據報導Intel已經與100多家AI獨立軟體供應商(ISV)合作,預計到2024年底將推出300多款AI加速應用程式。 AMD對AI PC的定義體現在其對AI技術的整合和應用上,旨在將個人電腦轉變成為最智能和最個性化的設備。AMD認為AI PC應具備以下特點: 1、內嵌基於個人大模型的自然交互個人智能體,這允許設備理解和響應用戶的需求,提供更加個性化的用戶體驗。 2、內嵌個人知識庫,使得AI PC能夠存儲和管理用戶的數據和信息,以便提供更精準的服務。 3、具備CPU+GPU+NPU的本地異構算力,這種混合架構能夠充分利用不同類型的處理核心,以實現高效的AI計算。 4、連接開放的AI應用系統生態,意味著AI PC應支持與各種AI應用和服務無縫對接,形成一個互聯互通的環境。 5、保護個人隱私和數據安全,確保用戶在享受AI帶來的便利的同時,其數據和隱私得到妥善的保護。 從產品發布時間上看,AMD比Intel稍晚一些,除了針對筆記本電腦,集成NPU的銳龍8000系列處理器以外,首次將NPU晶片集成在台式機處理器中,其運算核心整合算力達到了39TOPS。 AMD同樣提供三種計算引擎以滿足AI PC的差異化需求,分別是Zen4架構CPU、RDNA 3架構GPU和XDNA架構的NPU。Zen4架構CPU主要用於通用處理和AI推理,RDNA 3架構GPU適用於遊戲和基於AI的內容創建,而XDNA則專注於低功耗的AI應用,可自適應數據流架構,能夠減少對外部內存的訪問,從而提高性能和能效。 高通通過Snapdragon X Elite處理器正式開啟了對PC市場的沖擊。該款處理器搭載了高通自主研發的AI加速引擎,能夠為筆記本電腦帶來出色的機器學習運算性能。 從高通公開發布信息總結下來,高通認為AI PC 應該具備以下幾個關鍵特點: 1. 搭載專門針對...

英偉達將與日本機構合作,打造「ABCI-Q」量子計算系統

據相關媒體報導,英偉達將與日本國立研究機構,也就是日本產業技術綜合研究所(AIST)合作,打造新的量子計算系統,專為與未來的量子硬體集成而設計。富士通也參與了該項目,預計2025年初部署,在2025年4月或稍晚時間起,向企業和研究人員提供有償服務。 這個名為「ABCI-Q」的新項目,將由英偉達加速和量子計算平台提供支持,旨在推進日本的量子計算計劃,將為跨行業的研究提供高效的量子模擬。其高性能、可擴展的系統集成了NVIDIA CUDA-Q,這是一個開源的混合量子計算平台,具有強大的仿真工具和對混合量子經典系統進行編程的能力,共部署了2000多塊H100計算卡分布在500多個節點里,再通過NVIDIA Quantum-2 InfiniBand互連,是世界上唯一完全可卸載的網絡內計算平台。 英偉達高性能計算和量子計算總監Tim Costa表示,研究人員需要高性能仿真來解決量子計算中最困難的問題,而CUDA-Q和H100能夠幫助ABCI-Q等先驅取得關鍵進展,加快量子集成超級計算機的發展。 此前英偉達的創始人兼執行長黃仁勛曾去日本,與政府高級官員會面,談到要加強多領域合作,為日本的需求提供穩定的人工智慧設備供應,這次的ABCI-Q項目至雙方建立廣泛合作關系的第一步。 ...

這才是本來面目 「GTX 2070」出現了 奇怪的殘缺版

快科技4月22日消息,我們知道,RTX 20系列正式發布之前,確實准備叫做“GTX 20”系列,最後時刻才改名開啟了RTX時代,我們也曾多次見到過“GTX 20”的樣品,現在又出現了一塊GTX 2070。 除了名字,這塊GTX 2070 FE公版和後來的RTX 20 FE公版幾乎完全一樣,整體色調、散熱器造型、8針供電接口、DVI/HDMI/DP/USB-C接口都在。 核心編號同為TU106-400A-A1,不過CUDA核心只有2176個,相比於RTX 2070少了足足128個(兩組SM單元),不知道這是最初的設定,還是樣品的問題。 和後來的RTX 2060 SUPER倒是一樣,但後者的核心編號是TU106-410-A1。 它可以成功刷入RTX 2070 400A BIOS,但是無法開啟更多核心,倒是解鎖了功耗限制,可以進一步超頻。 最終,它超頻提升了16%的性能,相比RTX 2070隻差大約5%。 來源:快科技

所有的NVIDIA、AMD顯卡都已破發 美國有一例外

快科技4月21日消息,經歷貨幣挖礦、疫情、AI等一系列風波之後,顯卡市場終於穩定下來,價格日漸走低,統計顯示至少在德國,RTX 40系列、RX 7000系列所有型號的售價都已經低於首發價,美國也只有一個例外。 3DCenter統計了歐洲比價網站Geizhals、美國電商巨頭新蛋上的顯卡價格,得出了上述結論。 在歐洲尤其是德國,PC硬體競爭一向非常慘烈的市場,顯卡價格相比首發價平均低了11.0%,最少也有6%,而降價最厲害的是作為次旗艦的RX 7900 XT,達到了驚人的26.4%(美國市場也有23.2%)。 其次是一直不怎麼受歡迎、溢價太高的RTX 4060 Ti 16GB,破發幅度達19.2%。 其他還有:RX 7900 XTX 15.1%、RTX 4060 Ti 8GB 15.0%、RX 7600 13.7%、RTX 4070 12.1%。 平均而言,RTX 40系列破發幅度為10%,RX 7000系列則是12%。 美國市場上的平均破發幅度僅為2.9%,有不少型號仍維持原價起步,最離譜的是旗艦RTX 4090,竟然比首發價還是貴了10.7%。 來源:快科技

英偉達承認AI市場「競爭激烈」,重申旗下業務包括硬體和軟體

過去一年多里,人工智慧(AI)成為了業界最熱門的詞匯。以ChatGPT為首的人工智慧工具在全球范圍內掀起了一股熱潮,對高性能數據中心GPU的需求大幅度提高,讓英偉達成為了半導體行業里最耀眼的明星,營收也實現了大幅度的增長。 隨著人工智慧市場規模快速增長,AMD和英特爾等其他晶片公司都想從中分得一杯羹,投入了大量的資源,希望能搶奪更多的市場份額。作為開發GPU加速軟體的通用並行計算架構,英偉達耗費多年構建的完整CUDA生態系統可以說是其最重要的護城河之一,鞏固了其作為領先GPU計算和人工智慧晶片製造商的地位。 競爭對手步步逼近也讓英偉達感到了前所未有的壓力,似乎開始意識到,想保持人工智慧晶片市場的壟斷地位不是一件輕松的事。近日,英偉達應用深度學習研究副總裁Bryan Catanzaro在其社交媒體帳戶上表示,現在人工智慧市場的競爭很激烈,而且越來越激烈,不過這是必然的,因為人工智慧是歷史上最大的計算問題。 Bryan Catanzaro的表態並不代表英偉達對競爭感到恐懼,而且還強調了另外一件事,即人們對英偉達的發展歷程以及其從以硬體為中心向以軟體為中心的轉變存在普遍的誤解。英偉達設計的GPU很強大,比如最新的Blackwell架構GPU,但通過軟體優化盡可能提升計算效能同樣關鍵,如果要有完善的管理計算能力,需要一個強大的軟體生態系統,將硬體性能推向極致。 AMD和英特爾一直試圖通過自己的開放API產品,包括ROCm和oneAPI進入計算領域。近期高通、英特爾和谷歌聯手還建立UXL基金會,這是以oneAPI構建的開源項目,為那些使用CUDA生態系統的用戶提供另外一種選擇,最終目標就是要推翻英偉達的統治。 目前人工智慧市場還處於起步階段,未來的情況還很難說,而真正的戰爭似乎才剛剛開始。 ...

「動」起來的圖片:NVIDIA Instant NeRF 將圖像變為 3D 場景

了解 AI 研究項目如何在數秒內幫助藝術家等用戶用 2D 圖像打造 3D 體驗。 編者註:本文屬於《解碼AI》系列欄目,該系列的目的是讓技術更加簡單易懂,從而解密AI,同時向RTX PC用戶展示全新硬體、軟體、工具和加速特性。 想像一幅風光旖旎的畫面,比如水畔的懸崖峭壁。即便只是 2D 圖像,如此美景依舊令人心馳神往。如果同一畫面能以 3D 效果展現,那麼無需跋涉就能身臨其境。 NVIDIA RTX技術驅動的 AI 恰恰能讓我們得償所願。創作者運用Instant NeRF便能在短短數秒之間將多組靜態圖像變為 3D 數字場景。 簡單好用的輻射場 AI 模型 NeRF 全稱為“神經輻射場”,可通過輸入表現某個場景的 2D 圖像並在其間執行插值,渲染完整的 3D...

四月AI晶片三連發 英偉達無懼競爭

四月我們迎來了AI晶片三連發! 4月9日Intel打頭陣,在Vision 2024活動中,發布了新一代Gaudi 3 AI晶片。同一天,Cloud Next 2024大會上,Google Cloud首度公開專為數據中心設計的首款Arm架構CPU──Google Axion。隔天,4月11日Meta官方發文,展示新款自研AI晶片MTIA。 在這三款產品中,Intel新一代Gaudi 3與NVIDIA H100展開直接競爭。在AI模型算力中,Gaudi3 AI晶片的模型訓練速度、推理速度都更出色,分別提升了40%和50%,平均性能提升達到了50%,能效更是提高了40%。更重要的是,Gaudi3 AI晶片的成本比H100更低,妥妥的性能更強,價格更低。 從官方公布的數據來看,Gaudi 3即使是面對NVIDIA的H200 GPU,表現也毫不遜色。在LLAMA-7B以及LLAMA-70B的部分場景與H200基本是伯仲之間,差距基本在10%以內。 Intel在Vision 2024上也同步介紹了這款晶片的生產節點,計劃在今年第三季度向客戶發貨Gaudi 3 AI晶片,包括聯想、惠普、Dell和Supermicro等OEM廠商都會使用這款新品構建系統。 但是Gaudi 3很難撼動NVIDIA在AI新領域的地位,即便加上AMD的Instinct MI300。 美銀分析師Vivek Arya發表研究報告指出,英偉達2024年AI加速器的占有率將超過75%,定製化晶片(如Google TPU、亞馬遜Trainium/Inferentia加速器、微軟Maia)的占有率為10~15%,而剩餘的10~15%才是AMD、英特爾及其他未上市企業的天下。 盡管目前定製化晶片市場占有率不高,但幾乎所有服務商都在加速開發各類晶片晶片產品,Google也不例外。 在9日舉行的Cloud Next 2024大會上,Google Cloud首度公開專為數據中心設計的首款Arm架構CPU──Google...

NVIDIA發布安培架構入門專業顯卡RTX A1000/A400:單插槽 功耗區區50W

快科技4月17日消息,NVIDIA今天發布了兩款新的專業顯卡RTX A1000、RTX A400,從編號就能看出來定位入門級,而且架構並非最新的Ada Lovelace,還是上一代的Ampere。 要知道,Ampere架構專業卡上次出新,還是兩年半之前的RTX A2000。 RTX A1000/A400都採用了單插槽、半高式設計,非常迷你,因為功耗只有區區50W,單風扇搞定,也不需要外接輔助供電。 它們倆都集成了第二代RT光追核心、第三代Tensor張量核心、第七代NVENC編碼器和第五代NVDEC解碼器(支持AV1)。 RTX A1000的核心應該和RTX A2000一樣都是GA106,只有2304個CUDA核心、72個張量核心、18個光追核心,核心加速頻率1463MHz,FP32浮點性能6.74TFlops,這甚至還不如RTX 3050。 顯存還是128-bit位寬的8GB GDDR6,帶寬192GB/。 RTX A400的核心應該是GA107,僅有768個CUDA核心、24個張量核心、6個光追核心,加速頻率1758MHz,浮點性能207TFlops,顯存也只有64-bit 4GB GDDR6,帶寬為96GB/。 RTX A1000現已出貨,RTX 400下月跟進。 來源:快科技

AMD和英偉達AI晶片發展迅猛,加速HBM3E今年下半年將成主流

在人工智慧(AI)和高性能計算(HPC)的影響下,近兩年HBM產品發展逐漸加速,也推動著存儲器廠商的收入增長,而新一代HBM3E也逐漸成為了各種新款晶片的搭配首選。今年英偉達帶來了基於Blackwell架構的新產品,首發的B200和GB200都選用了HBM3E。有消息稱,AMD今年將推出改用4nm工藝製造的Instinct MI350系列,搭配的顯存也將換成HBM3E。 據TrendForce報導,AMD和英偉達都加快了主力人工智慧(AI)應用晶片的開發步伐,而且都在規劃採用更高規格的HBM產品,以進一步提升性能。從目前情況來看,2024年將會有三大趨勢: HBM3將進階到HBM3E - 預計英偉達下半年開始擴大搭載HBM3E的H200齣貨,取代H100成為主流,B200和GB200也會採用HBM3E。AMD年底前會帶來Instinct MI350系列,在此之前還會有Instinct MI32x系列,均選定了HBM3E。 HBM容量持續增大 - 目前市場主流的H100搭載的是80GB的HBM3,至2024年底改用HBM3E的新品,容量將提升至192GB到288GB。 HBM3E將從8層往12層堆疊發展 - 英偉達首批Blackwell架構產品都採用了8層堆疊的HBM3E,到了明年將引入12層堆疊的HBM3E。AMD今年的Instinct MI350系列,以及明年的Instinct MI375系列,都將採用12層堆疊的HBM3E,將容量提升至288GB。 此前三星已官宣了業界首款擁有12層堆疊的HBM3E,傳聞SK海力士在今年2月已經向英偉達發送了新款12層堆疊HBM3E樣品,以進行產品驗證測試。另外有趣的是,報導中還提及了之前沒有出現的AMD Instinct MI375系列。 ...

英偉達Blackwell新平台產品需求看漲,或帶動台積電全年CoWoS產能提升逾150%

今年3月,在美國加州聖何塞會議中心舉行的GTC 2024大會上,英偉達創始人兼CEO黃仁勛帶來了Blackwell架構GPU,新款數據中心產品再次鞏固了自身在人工智慧市場的主導地位,開創了AI計算的新時代。 Blackwell平台產品包括了用於取代H100/H200的B200 GPU,另外還有與Grace CPU相結合的GB200。同時英偉達在去年末,還以現有的Hopper架構為基礎,推出了H200和GH200產品線,在Blackwell平台產品到來之前作為過渡,其中GH200占據了英偉達高端GPU約5%的出貨量。雖然距離發貨還有一段時間,但供應鏈對GB200寄予厚望,預計2025年出貨量可能上百萬級別,占據英偉達高端GPU約40%至50%的出貨量。 據TrendForce報導,Blackwell平台的產品將採用更復雜、更高精度的CoWoS-L封裝技術,驗證方面也耗費更多的時間,預計B100、B200和GB200等產品要到今年第四季度才會少量出貨,真正放量至少要等到2025年第一季度。 B100、B200和GB200等產品也需要消耗更多的CoWoS產能,這也迫使台積電(TSMC)在2024年需要全面提升封裝產能,預計年底每月產能將達到4萬片,相比於2023年提升至少150%。此外,台積電已經在規劃2025年的CoWoS產能計劃,很可能還要實現倍增,其中英偉達的需求占據了一半以上。 年初有報導稱,英偉達轉向英特爾尋求封裝服務。不過英特爾的技術仍然以CoWoS-S封裝為主,最多隻能滿足英偉達H系列產品的要求,短期內技術也難有突破,所以相應的產能擴張計劃也較為保守,除非未來能額外得到其他訂單。 ...

英偉達推出RTX A1000 / A400:單槽Ampere架構工作站顯卡,TDP僅50W

英偉達宣布,推出基於Ampere架構的新款工作站顯卡,分別為RTX A1000和RTX A400,兩者都採用了極簡的設計風格。 這是英偉達時隔兩年半以後,再次推出Ampere架構專業顯卡,此前最後一款產品是RTX A2000 12GB。從官方提供的渲染圖就能看到,RTX A1000和RTX A400都採用了簡潔的設計,厚度只有單槽,而且都不需要任何外接供電,TDP都控制在了50W,發熱量應該都不大。 與基於Ada Lovelace架構GPU的產品不同,RTX A1000和RTX A400缺乏AV1編碼支持,不過可以對包括H.264和H.265等其他視頻格式進行編解碼。英偉達尚未確定RTX A1000和RTX A400的定價,前者將很快上市,後者要等到下個月。 ...

英偉達GeForce Game Ready 552.22 WHQL驅動:修復了舊顯卡存在已久的問題

英偉達發布GeForce Game Ready 552.22 WHQL驅動程序,為遊戲《莊園領主(Manor Lords)》和《惡意不息(No Rest for the Wicked)》做好准備。對於4月26日的《莊園領主》,驅動程序不僅增加了day-zero優化,而且還支持DLSS 2。 已修復的問題,包括: 《絕地求生》 - 在英特爾第12代酷睿平台上擴展遊戲玩法的遊戲穩定性問題。 GeForce GTX 10 / RTX 20系列 - 當Windows硬體加速GPU調度和NVIDIA SLI同時啟用時,PC可能會隨機死機。 HTC Vive Pro 2...

Jim Keller大神建議NVIDIA放棄私有標准:可以省幾十億美元

快科技4月14日消息,Jim Keller不僅僅是晶片設計大神,技術了得,更是開放技術的忠實擁躉,對於那些封閉技術一直深惡痛絕。很自然的,NVIDIA就成了他的“仇人”。 最近,Jim Keller又提出,NVIDIA最新的Blackwell GPU在多晶片互連、網絡互連方面,不應該使用私有的NVLink標准協議,而應該換成開放的乙太網標准,這樣可以給NVIDIA節省幾十億美元。 他還認為,NVIDIA在數據中心網絡中,也不該使用自己的方案InfiniBand,也得換成乙太網。 NVIDIA Infiniband網絡雖然具備低延遲、高帶寬,最高可達200GbE,但是乙太網能做到400GbE乃至是800GbE。 AMD、博通、Intel、Meta、微軟、甲骨文等巨頭也正在合作開發下一代超高速乙太網(Utlra Ethernet),吞吐量更高,更適合AI、HPC應用。 此外,Jim Keller對於NVIDIA CUDA封閉生態也一直很不滿,曾經罵它是沼澤而非護城河。 Arm、Intel、高通、三星等也合作組建了統一加速基金會(UXL),目標之一就是取代NVIDIA的方案。 不過對於黃仁勛來說,不管NVLink還是CUDA,都是自己公司多少年砸了多少億美元的成果,更是維護自家利益的神器,怎麼能輕易放棄呢? 來源:快科技

RTX 4090供電接口過熱熔化問題依然嚴重?GPU維修機構稱每個月需維修200塊

英偉達基於Ada Lovelace架構的中高端GeForce RTX 40系列顯卡都配備了16Pin的12VHPWR接口,2022年末起,就頻繁有用戶報告顯卡供電接口處過熱熔化,線纜的插頭處也出現損壞,這種情況在RTX 4090這類高端高功耗顯卡上最為明顯。為此PCI-SIG在2023年准備了名為「12V-2×6」的連接器改良設計,出現在了CEM 5.1規范里,以減少此類事件的發生。 近日,GPU維修機構NorthridgeFix發布了一段視頻,表示RTX 4090供電接口過熱熔化問題依然嚴重,每個月大概需要維修200塊RTX 4090顯卡,並展示了一整箱燒熔的12VHPWR連接器。 同時NorthridgeFix還透露,其中不少RTX 4090顯卡使用了Cablemod的12VHPWR定製適配器,NorthridgeFix認為該設計本身是不錯的,可惜建立在不完善的標准之上。美國消費品安全委員會已在兩個月前發出通知,要求消費者立即停止使用,並聯系Cablemod召回這些12VHPWR定製適配器。 由於受到不同的電源、連接器、工作負載程度等因素影響,並非所有RTX 4090顯卡都遇到這類問題,或者出現問題的時間點不一樣,有些可能只是使用了幾個月,有些可能在一年多以後才出現損壞。此外,NorthridgeFix沒有說明這些出現問題的RTX 4090顯卡,基於新舊標準的連接器分別有多少。視頻的最後,NorthridgeFix還演示了更換連接器的過程。 ...

RTX 4090持續大量燒毀 中國玩家卻沒法修理

快科技4月13日消息,現在似乎很少再聽說RTX 4090因為新的12VHPWR 16針供電接口而燒毀的事情,但事實上它從未停止,而且一直不少。 顯卡維修店NorthridgeFix就披露說,他們每天都能接到來自世界各地的燒毀的RTX 4090的報修。 數量有多少呢?沒有精確統計,但是平均每個月都在200例,甚至更多。 作為證明,他們放出的一張照片裡,盒子裡裝滿了燒毀換下來的接頭: 好消息是,NVIDIA後期更換的升級版接口12V-2x6明顯發熱量更低,迄今還沒有發生過一次燒毀。 壞消息是,初版接口的RTX 4090使用量很大,它們都有可能隨時燒毀。 值得一提的是,不少燒毀的RTX 4090都使用了CableMod最初設計的轉接頭,本意是保護接口和電源線,結果卻很不理想,後來的升級版好了很多,但很多人還在用原版。 對於內地和港澳玩家而言,如果遇到RTX 4090燒毀,以及其他各種晶片相關故障,會更加麻煩,因為它已經被禁售,換新都不一定找得到。 對於台系品牌,一般是寄回台灣原廠處理,但是RTX 4090缺沒法再寄回來,所以大部分都會退款處理。 對於內地或香港品牌,返修情況一則看還有沒有RTX 4090晶片,二則時間也不好說,很多也只能退款,或者提供RTX 4090D的優惠價。 來源:快科技

英偉達與Google Cloud合作,將幫助初創企業加速AI開發

近日,英偉達與Google Cloud宣布了新的合作,將幫助全球各地的初創企業加速建立生成式人工智慧(AI)應用程式和服務。其結合了針對初創公司的NVIDIA初創加速計劃和Google for Startups Cloud計劃,以擴大獲得雲端積分、市場推廣支持和技術專業知識,協助初創公司更快地為客戶提供價值。 NVIDIA初創加速計劃是一項全球性計劃,支持了超過18000家初創企業,符合資格的會員可以加速使用Google Cloud基礎設施,並獲得Google Cloud的積分,而專注於人工智慧的企業最高可獲得350000美元的積分,並能用於NVIDIA DGX Cloud。 Google for Startups Cloud計劃的成員可以加入到NVIDIA初創加速計劃,獲得技術專業知識、英偉達的深度學習機構課程學分、英偉達軟硬體等。同時符合資格的會員能夠參與到英偉達其他的輔助計劃,比如讓那些對人工智慧領域感興趣的創投公司接觸初創企業。 上個月在美國加州聖何塞會議中心舉行的GTC 2024大會上,英偉達創始人兼CEO黃仁勛帶來了Blackwell架構GPU,並推出了針對數據中心的新產品。明年初,基於Blackwell架構構建的平台將入駐Google Cloud,並與Google Cloud第四代先進液冷散熱系統相結合,其中NVIDIA HGX B200將負責AI、資料分析和高效能運算等工作負載,而NVIDIA GB200 NVL72會用於下一代前沿、大規模訓練模型。 ...

英偉達AI GPU供應短缺即將結束,交付周期縮短到8到12周

從去年開始,負責英偉達AI晶片的製造及封裝的台積電(TSMC)在先進封裝方面的產能變得緊張,AI GPU的供應一直處於供不應求的狀態,也導致了較長的交付周期,比如基於H100構建的伺服器交付周期大概需要36周到52周不等。 據Wccftech報導,來自Dell相關負責人的消息,稱現在AI伺服器交付給客戶的時間已大大縮短,交付周期比過去減少了至少一半,從40周縮減到8到12周,對未來的供應表現得非常樂觀。Dell的情況具有相當代表性,根據市場統計數據,其占據了主流AI伺服器大概24.5%的出貨量,接近四分之一,而且市場份額還處於上升階段。 在Dell看來,這與英偉達過去幾個月里多方面的努力密不可分,包括增加新的合作夥伴,實現供應鏈的多元化,特別是在先進封裝方面,效果尤為明顯。目前台積電已大幅度提升了CoWoS封裝產能,計劃今年產能翻倍,同時近期英偉達還在三星下單,以滿足不斷增長的先進封裝產能需求。 上個月在美國加州聖何塞會議中心舉行的GTC 2024大會上,英偉達創始人兼CEO黃仁勛帶來了Blackwell架構GPU,包括用於取代H100/H200的B200 GPU,另外還有與Grace CPU相結合的GB200。業界擔心隨著新款產品的到來,會讓先進封裝產能更加緊張,不過從現在的供應情況來看,暫時可以打消這種顧慮。 ...

丐版RTX 4060性價比更高 原因揭開

遊戲玩家最關注的硬體莫過於顯卡了,畢竟顯卡在很大程度上決定了遊戲的幀數,不過在選擇顯卡時,又有很多萌新會陷入加預算升級顯卡的怪圈中,雖然說一分價錢一分貨,但為什麼我建議你買丐版顯卡呢? 首先要明確的是,同一個型號的顯卡採用的核心架構是一致的,舉例來說,不管是2199元的RTX4060,還是3199元的RTX 4060,搭載的都是AD107核心,也就是說這些顯卡理論上都具備相同的圖形處理能力。 除了核心之外,同型號顯卡的流處理器數量也是一樣的,除此之外,顯存位寬,顯存帶寬以及顯存容量也都一模一樣,意味著其顯存速度也都相同,到這里顯卡的性能上限和下限基本上就確定了。 那麼丐版顯卡和旗艦版顯卡的差異在哪呢?主要是核心頻率,散熱系統,外觀設計以及附加功能等方面,其中影響顯卡性能的就是核心頻率。 同樣以RTX 4060為例,公版Boost頻率設定為2460MHz,丐版的RTX 4060基本上也是這個頻率,而旗艦版顯卡的頻率可以提升至2640MHz,看起來提升了7%之多。 但實際上遊戲性能的提升卻只有3%甚至更低,體現在遊戲中可能就是幀數增加了個位數,遊戲體驗可能沒有差異。 也就是說,旗艦版顯卡的溢價主要在於更為豪華的散熱模塊,包括但不限於多熱管、大面積散熱鰭片、靜音風扇等,旨在提供更好的穩定性和更高的長期使用體驗,還有更加炫酷的光效以及自定義功能,但是價格也會隨之水漲船高。 換句話說,如果只是追求純粹的遊戲性能表現,而非極致的靜音效果、外觀設計或者額外功能,那就完全沒有必要加錢去買貴的顯卡。 所以結論就很簡單了,對於絕大多數用戶來說,選擇選擇2199元,性價比更高的RTX 4060顯卡才是最佳選擇,這樣可以避免不必要的支出,把多餘的預算升級到其他硬體上,可以最大程度上榨取預算的價值,帶來更好的體驗。 來源:快科技

英偉達Blackwell架構遊戲顯卡最快年底到來:首批提供RTX 5090/5080

此前有報導稱,英偉達希望通過更好的庫存管理,在保持GeForce RTX 40系列產品線定價的同時,為新一代顯卡逐步騰出空間。基於Blackwell架構的GeForce顯卡與數據中心產品一樣,將採用台積電(TSMC)4NP定製工藝製造,也就是現有4N工藝的改進型。 據UDN報導,英偉達的合作夥伴預計,GeForce RTX 50系列最快會在今年第四季度到來,與之前的Geforce RTX 30/40系列一樣,初期將專注於高端產品,首批提供RTX 5090和RTX 5080等。有分析師給出了較為樂觀的預期,認為英偉達每兩年一次的GPU架構重大升級將提升板卡廠商今年的出貨量,並推高顯卡的平均售價(ASP)。 雖然大家都能猜到型號,最後大機率也不會有什麼偏差,但是落實到具體規格就很難說了。傳聞英偉達還沒有最終敲定每款型號的規格,鑒於之前曾發生過Geforce RTX 4080 12GB未上市就被取消的事件,相信這次英偉達會更加地謹慎。 根據之前的說法,基於Blackwell架構的GeForce顯卡將會有GB202、GB203、GB205、 GB206和GB207五款晶片,對應的顯存位寬分別是512/384-bit、256-bit、192bit、128-bit和128-bit。新一代產品採用PCIe 5.0接口,支持DisplayPort 2.1顯示輸出,搭載16Gb(2GB)的GDDR7模塊,還可能支持24Gb(3GB)模塊,速率為28 Gbps。 ...

玩家心中第一神卡 RTX 3060/3050再賣一個季度

快科技4月8日消息,據最新說法,NVIDIA已經延緩了RTX 3060、RTX 3050兩款上代低端顯卡的停產時間,繼續供應至少一個季度,以滿足市場需求。 NVIDIA原計劃在2023年底停止生產RTX 3060 GPU,賣完為止,但後來決定推遲一段時間,畢竟這個卡太火爆了。 Steam最新硬體排行榜上,RTX 3060高居第一,份額超過了5%,而且比例還在不斷提升,排第二的RTX 2060也不過3.7%。 業界人士透露,NVIDIA已經確定在今年第二季度繼續供應RTX 3060、RTX 3050 GPU晶片,但是數量並不會太多,只是供給AIC廠商消化對應的市場需求,也避免最後時刻過多積壓。 至於下半年是否還會供應,暫不確定,估計要看後續市場需求的變化。 RTX 40系列最低端只做到RTX 4060,目前售價依然要2300多元,對於入門級玩家非常不友好,RTX 3060、RTX 3050也不是不能玩,自然不能輕易放它倆走。 RTX 3050不久前還增加了6GB版本,但不只是閹割顯存,還大幅降低了核心規格,但價格依然要1399元起。 只能說,AMD你還是得努力啊! 來源:快科技

三星獲得英偉達2.5D封裝訂單,將採用I-Cube封裝技術

目前英偉達的H100等數據中心GPU都是由台積電(TSMC)負責製造及封裝,SK海力士則供應HBM3晶片。不過人工智慧(AI)的火熱程度顯然超出了大家的預期,導致台積電的先進封裝產能吃緊。雖然台積電不斷擴大2.5D封裝產能,以滿足英偉達不斷增長的需求,但是英偉達在過去數個月里,與多個供應商就2.5D封裝產能和價格進行談判,希望能夠分擔部分工作量。 據The Elec報導,三星已經獲得了英偉達的2.5D封裝訂單。其高級封裝(AVP)團隊將向英偉達提供中間層,以及I-Cube封裝。 I-Cube屬於三星自己開發的2.5D封裝,是一種異構集成技術,可將一個或多個邏輯管芯(Logic Chip)和多個高帶寬內存晶片(HBM,High Bandwidth Memory)使用矽中介層,從而使多個晶片排列封裝在一個晶片裡。三星表示,從高性能計算(HPC)到人工智慧、5G、雲和大型數據中心等各種應用場景使用的晶片,都可以選擇I-Cube封裝,可帶來更高的效率。 三星在去年年底成立了先進封裝團隊,目的就是要擴大晶片封裝業務的收入。三星去年開啟談判後,曾向英偉達建議,可以從台積電拿到製造好的晶片,然後從三星的存儲器業務部門采購HBM3,並使用三星的I-Cube封裝來完成後續的工作。對三星來說稍微有點遺憾的是,這次並沒有同時拿到英偉達的HBM3訂單。 ...

DLSS 3.7/3.6/3.5三大版本對比:畫質有驚喜 鬼影依然在

快科技4月8日消息,,但沒有任何更新說明,只知道增加了一個新的默認畫質預設“E”。 有網友在《賽博朋克2077》里實測對比了DLSS 3.5.10、3.6.0、3.7.0三個版本,發現新版的畫面明顯更銳利一些,整體細節和穩定性都有提升。 還有玩家體驗了2K解析度的《地平線:西之絕境》,DLSS 3.7.0版本也有明顯進步。 不過也有人反應,鬼影仍會出現,比如遠處飛馳的汽車,比如汽車經過路燈陰影。 DLSS 3.7.0可以通過直接替換DLL文件來強制開啟支持,比如使用DLSS Tweaks這樣的工具,或者手動替換。 感興趣的可以下載新文件。 來源:快科技

英偉達RTX 4090 D和H20不受新禁令影響,將繼續在中國市場銷售

近日,美國政府修訂了最新的管制條例,4月4日開始實施APP禁令對「可調整峰值性能」超過70 Weighted TeraFLOPS(TW)的相關設備實行限制,進一步加強管控的力度。由於RTX 4090 D(73.5 TFLOPS)和H20(74 TFLOPS)都超過了對應的標准,加上英偉達此前曾被美國政府點名,從而傳出這兩款針對中國市場的合規版可能被禁的流言,鬧得沸沸揚揚。 據Benchlife報導,已經與英偉達的合作夥伴確認,說法與官方一致,RTX 4090 D和H20並不包含在這次實施的APP禁令裡面,同時系統集成商的出貨也不會受到相關管制條例的影響。 在去年版本的RIN 0694-AI94文檔里,其實已經有涉及Weighted TeraFLOPS的內容,提到「29 Weighted TeraFLOPS (WT)的限制快要被提高到70 WT」,而這段描述在最新的版本里是沒有的。認為RTX 4090 D和H20可能會受到限制,是由於理解上應該與FP16/FP32或TF32有關。事實上,今年在3月13日更新的Commerce Control List(CCL4)文檔中,裡面提到的APP禁令指出的是64位浮點操作,甚至提及了一個計算中的係數,「針對矢量處理器,Wi=0.9;針對非矢量處理器,Wi=0.3」。 如今市面上大家購買的Geforce顯卡,雙精度浮點幾乎都被砍掉,所以無論WT是29還是70,都不會有什麼影響。 此外,基於Blackwell架構的Geforce 50系列很大可能不會在2024年登場。傳聞英偉達內部正在思考如何合理運用「刀法」,才能避開相關的APP禁令,與合作夥伴一起滿足龐大的中國消費市場需求。 ...

英偉達發布Streamline 2.4.0 SDK和DLSS 3.7.0:新預設可提高圖像質量

近日,英偉達發布了Streamline 2.4.0 SDK和DLSS 3.7.0庫,支持DirectX 11和Vulkan 1.2或更高版本的GPU,有望進一步改善圖像質量。英偉達的Streamline是一種開源跨平台解決方案,旨在簡化其升級技術的集成,同時讓開發人員更簡單地對第三方升級解決方案進行整合。包括DLSS、DLAA、NVIDIA Real-Time Denoiser(NRD)技術等。 在之前的GDC 2024上,微軟公布了一項名為「Microsoft DirectSR」的新技術。遊戲開發者利用DirectSR API,可以一次性開發,兼容當前市場上的主流超解析度技術,包括了NVIDIA DLSS、AMD FSR、以及Intel XeSS等。即便如此,英偉達在未來一段時間內還是會致力於提供Streamline SDK,畢竟DirectSR還沒有具體的時間表。 新版本里,最顯著的新增功能是代號「eager_donkey」的質量「E」預設,與DLSS 3.5相比,引入了更清晰的圖像、普遍提高的細節穩定性、更少的重影、以及更好的時間穩定性。有試用過的用戶稱,《地平線:西之絕境》在1440P解析度下會有明顯的差異,也有用戶在《賽博朋克2077》里比較了DLSS 3.5.10、DLSS 3.6.0和DLSS 3.7.0的差異。 一般來說,DLSS 3.7.0可以直接替代舊版本的DLSS,用戶使用DLSS Tweaks,甚至手動修補最新的DLSS 3.7.0 DLL,並強制最初未發布或未更新的遊戲支持最新的DLSS 3.7.0...

FurMark更新2.2版本:增添NVIDIA顯卡熱點監控,支持摩爾線程S80

今年2月的時候,開發商Geeks3D更新了GPU壓力測試軟體FurMark的2.1.0版本,集成了一個完全不同的GUI與命令行工具,由GeeXLab和GeeXLab SDK構建,並且擁有全新功能測試界面,同時加入了FurMark Knot測試。近日,Geeks3D繼續更新了FurMark2.2.0版本,包含了4個主要更新內容。 首先是調整了GUI相關設置的文件,新版本的GUI相關設置將默認保存到settings.lua文件中,如果用戶想重置相關設置,刪除該文件即可。 其次是在軟體圖形界面添加BFC(BackFace Culling 的縮寫)的選項,這個選項允許改變圖形工作負載,並且根據所使用的GPU,增加壓力測試的負擔。在之前的版本中,壓力測試模式(RUN)下默認啟用BFC,而帶有預設的基準測試中則禁用;新版本中基準測試下仍然禁用BFC,但用戶可以在壓力測試模式下(RUN)選擇是否啟用。 第三是為NVIDIA顯卡添加熱點溫度監控選項,2.2.0版本針對多款GPU添加了GPU核心熱點溫度監控選項,可以方便檢測顯卡散熱器或散熱矽脂的問題。 最後是添加對摩爾線程S80和S70的監控支持,可以直接看到GPU溫度、顯存溫度等信息,同時優化了Linux版本的圖形用戶界面。 修復與更新: 修復了Vulkan渲染中的bug。 改善了Linux支持。 GUI設置現在保存在settings.lua文件中。 在GUI中添加了BFC的選項。 為NVIDIA GPU添加了核心熱點溫度監測。 (64位窗口)添加了對Moore Threads MTT S80 GPU的監控。 在預設按鈕被禁用時,添加了滑鼠懸停提示。 實用工具按鈕(cpu burner, gpu shark, gpu-z)如果不存在則被禁用。 添加了對NVIDIA GeForce RTX 4090 D的支持。 更新了對NVIDIA GeForce RTX 3050 6GB的檢測。 (windows)更新了GPU Shark2至2.2.0.1版本。 更新了GeeXLab庫至0.58.0版本。 新增兼容以下型號的顯卡: 華擎RX 7900...

英偉達GeForce Game Ready 552.12 WHQL驅動:為9款遊戲添加GFE

英偉達發布GeForce Game Ready 552.12 WHQL驅動程序,針對《使命召喚20:現代戰爭3(Call of Duty:Modern Warfare III)》第三季度和《使命召喚:戰區(Call of Duty Warzone)》第三季度做了優化,包括對DLSS 3幀生成和Reflex的支持。此外,還對《暗黑破壞神4(Diablo IV)》的光線追蹤進行了優化。 在該版本驅動程序中,還為9款遊戲添加了GeForce Experience和NVIDIA App的最佳設置,包括:《Desynced》《龍之信條2》《碧藍幻想:RELINK》《地平線:西之絕境》《帝國神話》《夜鶯》《超自然車旅》《碧海黑帆》《奇喚士》。 已修復的問題,包括: 《地平線:西之絕境》 - Resizable BAR配置文件。 已知的問題,包括: GeForce GTX 10 / RTX 20系列...

DLSS 3.7低調發布:不知道更新了些什麼

快科技4月3日消息,有開發者發現,NVIDIA已經低調放出了Streamline 2.4.0 SDK開發包,以及新版DLSS 3.7.0,但官方尚未給出任何說明。 Streamline使用來輔助DLSS技術開發的,大大簡化了第三方程序集成支持DLSS的流程和難度。 雖然微軟已經宣布了DirectSR,有望取而代之,但是考慮到微軟的拖延症,以及各種技術、非技術問題,Streamline仍然不會輕易被放棄。 Streamline新版本中就已經出現了DLSS 3.7.0相關庫文件,但目前僅限於光線重建、DLSS-D,顯然還沒有部署完畢。 另外可以看到一個新的配置文件sl::DLSSPresent::ePresetE,有開發者體驗後認為運動場景下清晰度有所提高,塗抹現象減輕了,但可能只是部分遊戲的情況,無法代表全部。 DLSS 3.7.0到底會有啥變化,只能等官宣了。 DLSS 3.5是去年8月發布的,主要變化就是加入了光線重建,但它和之前的DLSS 3.1並非取代關系,而是共存。 不知道這個DLSS 3.7又會是個什麼情況。 今年底有望看到下一代RTX 50系列,到時候會不會同步帶來DLSS 4? 來源:快科技

英偉達2023Q4銷售額飆升23%:成為全球最大的半導體供應商

得益於人工智慧(AI)和高性能計算(HPC)前所未有的需求水平,英偉達過去幾個財季的營收實現了大幅度的增長。其中數據中心業務成為了最大的亮點,以往並駕齊驅的遊戲業務在營收上被越拋越遠。 據TechInsights報導,2023年第四季度,英偉達半導體銷售額增長了23%,達到了198億美元。這樣的表現讓其超越了以往在半導體行業排名靠前的幾位巨頭,包括台積電(196億美元)、三星(164億美元)和英特爾(146億美元),成為全球最大的半導體供應商。 GPU最初是專門為遊戲和圖形行業製造半導體器,而英偉達是GPU開發的先驅。現在GPU除了用於電子遊戲,還非常適合用於人工智慧和機器學習等領域,提供了強大的計算性能,對於快速增長的數據中心市場也變得越來越重要。 毫無疑問,英偉達是過去一年多里人工智慧市場快速發展的主要受益者,在2023年第二季度的銷售額就幾乎翻了一番,到了第三季度繼續維持強勁的增長,到了第四季度,半導體銷售規模已經是2023年第一季度的三倍以上。 上個月,在美國加州聖何塞會議中心舉行的GTC 2024大會上,英偉達創始人兼CEO黃仁勛帶來了Blackwell架構GPU,包括用於取代H100/H200的B200 GPU,另外還有與Grace CPU相結合的GB200。可以預見,2024年裡英偉達的收入大機率會繼續攀升。 ...

GTX 1650即將正式成為歷史 庫存馬上賣完

快科技4月3日消息,,最後一根獨苗獨苗GTX 1650也將在本月內完成庫存清理,成為歷史,GTX也就此消失。 據業內人士,GTX 16全系列目前只剩下了GTX 1650尚有庫存,其他的都已經賣完。 如果AIC品牌廠商不刻意控制節奏,GTX 1650預計在4月中旬就能全部清空庫存,哪怕是廠商收緊出貨,也能在4月底完成庫存清理。 未來一段時間,GTX 1650還會在渠道市場內存活一段時間,但預計也需要2個月左右,就會徹底賣完。 GTX 16系列先後有六款不同型號,TX 1650是最特殊的,先後有四個不同版本,最初是TU117核心搭配GDDR5顯存,後續衍生出TU116、TU106核心版本,以及TU117核心搭配GDDR6顯存,都是896個流處理器、4GB顯存容量。 來源:快科技

顯卡又要漲價了 上至RTX 4060 Ti、下至GTX 1650

快科技4月2日消息,進入4月份,來自部分顯卡廠商的內部消息稱,部分型號已經確定將會再次漲價。 具體型號涉及廣泛,都是NVIDIA顯卡,包括這一代的RTX 4060系列,上一代的RTX 3050系列,以及入門級的GTX 1650系列。 不過“好消息”是,這次漲價幅度不會太大,具體幅度不詳,到時候要看各品牌的具體政策。 至於漲價原因,其他型號不清楚,RTX 4060 Ti是因為從上月底開始供貨量大幅減少,市場正常消耗速度超過了工廠分貨速度,上一波的囤貨庫存也基本消耗殆盡。 有鑒於此,各品牌的RTX 4060 Ti成本價已經上漲了幾次,整體行情看漲。 來源:快科技

中國特供RTX 4090D偷偷解鎖600W功耗 性能反超RTX 4090

快科技3月31日消息,作為一款中國特供版顯卡,RTX 4090D嚴格限制超頻,也不能解鎖功耗,之前任何嘗試都只能提升2-5%。 但是現在發現,某廠商的RTX 4090D已經偷偷解鎖,可以將最高功耗限制從425W提高到600W,然後就能大幅超頻了。 HKEPC測試發現,使用各種超頻工具,都可以輕松將ROG RTX 4090D STRIX的功耗設定在600W,相當於提高了41%,核心頻率能提升200MHz而達到2480MHz,顯存頻率則能從21GHz提高到24GHz。 經過超頻,3DMark Speed Way的跑分可以從9846提高到10818,幅度接近10%,Port Royal則可以從24523提高到26666,幅度為8.7%,都超過了RTX 4090! GPU-Z檢測顯示,跑分期間核心頻率最高實際可以達到3045MHz,最高功耗為558.4W。 希望其他RTX 4090D也都能解鎖,但一定要低調。 來源:快科技

RTX 50還早得很 RTX 4060、4070紛紛變「心」

Blackwell RTX 50系列顯卡預計得等到今年底甚至明年初,畢竟老黃一門心思撲在了AI GPU加速器之上,那麼在SUPER版本之後,RTX 40系列今年還會有什麼變化呢?有,但也不算有。 據可靠消息,RTX 4060、4070系列的三款型號將迎來一次特殊“升級”,沒有明顯的規格變化,但會變換“核心”。 RTX 4060:AD107-400核心變成AD106-255 RTX 4060 Ti:AD106-351核心變成AD104-150-KX RTX 4070:AD104-251核心變成AD103-175-KX 三款型號的變化都是同樣的風格,將GPU核心變成更高級的版本,但理論上CUDA核心數量不會變,甚至頻率可能都不會變。 那這種折騰是為了啥?難道是更充分地利用殘次晶片? 來源:快科技

NVIDIA Omniverse Cloud API 為自主系統開發提供超強助力

仿真對於自主系統的訓練、測試和部署至關重要,而實現現實世界級別保真度的難度極高。 這需要對自主系統傳感器和周圍環境的物理特性和行為進行精確建模。 在 NVIDIA GTC 上發布的Omniverse Cloud API(應用編程接口)旨在通過大規模、高保真的傳感器仿真應對這一挑戰,加速實現自主化。這些 API 匯集了一個由仿真工具、應用和傳感器組成的豐富生態系統。 視頻連結: 這些 API 滿足了高保真傳感器仿真的關鍵需求——以安全的方式探索自主系統將會遇到的無數現實場景。 另外,Omniverse Cloud 平台還為應用開發者提供了許多功能強大的通用場景描述(OpenUSD)、RTX 和支持生成式 AI 的服務級雲 API,為下一代工具帶來互操作性和符合物理學的渲染。 仿真是提升安全水平的關鍵 隨著對機器人、自動駕駛汽車和其他 AI 系統需求的增加,開發者正在尋求能夠加快其工作流的方法。傳感器數據為這些系統的感知能力提供助力,使它們能夠理解周圍環境並實時做出明智決策。 一直以來,開發者都在使用現實世界的數據進行訓練、測試和驗證。 但這種方法在涵蓋罕見場景或無法在現實世界中獲取的數據方面存在局限性。傳感器仿真提供了一種能夠有效測試無數“假設”場景和各種環境條件的完美方式。 藉助Omniverse Cloud API,開發者可使用高保真傳感器仿真改進他們所使用的工作流,以此應對開發全棧自主性的挑戰。 這不僅簡化並提高了開發流程的效率,還降低了各種公司開發自主機器的門檻。 生態系統優勢 Omniverse Cloud API通過將仿真器、驗證和確認(V&V)工具、內容以及傳感器開發者等匯聚成一個龐大的生態系統,創造了一個通用的 AI 系統開發環境。 CARLA、MathWorks、MITRE、Foretellix...

NVIDIA Omniverse 使用 Apple Vision Pro 拓展世界

全新 Omniverse Cloud API 使開發者能夠將交互式工業數字孿生流式傳輸到Apple Vision Pro中。 NVIDIA 將基於OpenUSD的 Omniverse 企業級數字孿生帶入 Apple Vision Pro。 NVIDIA 在 GTC 大會上宣布推出基於Omniverse Cloud API(應用編程接口)構建的全新軟體框架。開發者可以輕松地將其通用場景描述(OpenUSD)工業場景從他們的內容創建應用中發送到NVIDIA Graphics Delivery Network(GDN)。GDN 是一個由圖形就緒數據中心組成的全球網絡,可將先進的 3D 體驗流式傳輸至...