Home Tags GPU

Tag: GPU

Intel向NVIDIA發起進攻 搶奪雲和數據中心計算市場份額

Intel向NVIDIA發起進攻 搶奪雲和數據中心計算市場份額

雖說處理器上暫時落後AMD,但是Intel並不會很慌,他們也在砍掉一些邊緣化業務,准備重新聚焦處理器領域。 據外媒最新報道稱,Intel也開始對NVIDIA下手,前者公司旗下的Habana Labs業務周三表示,從NV手中奪取雲和數據中心計算市場份額尚需時日,但本周與亞馬遜網絡服務(AWS)的交易邁出了堅實的第一步。 去年12月,Intel斥資約20億美元收購了總部位於以色列的人工智能公司Habana,希望擴大其人工智能產品組合以支持數據中心業務。 Habana的首席業務官伊坦·麥迪納(Eitan Medina)說:「我們必須明白自己是從零開始,而NV是100%。」他說,AWS成為其第一個客戶是非常重要的事情。 在新冠疫情期間,亞馬遜的雲計算工具的需求不斷增長。Intel表示,上述這些芯片的性價比將比目前的圖形處理器高出40%。 作者:雪花來源:快科技

英偉達RTX 3000系列移動GPU產品線曝光 將於2021上半年上市

WCCFTech 率先曝光了英偉達 GeForce RTX 3000 系列移動 GPU 的路線圖,據說華碩和微星都會在 2021 上半年推出搭載 RTX 3080 / RTX 3070 / RTX 3060 GPU 的高端獨顯筆記本(其它廠商要等到 4 月),以取代當前的 RTX 2060...
M1處理器仍有可能支持eGPU顯卡擴展 就看蘋果態度了

M1處理器仍有可能支持eGPU顯卡擴展 就看蘋果態度了

最近一段時間,M1處理器的Mac電腦瘋狂刷屏,蘋果第一次做桌面級處理器足夠讓業界驚訝,M1在視頻編輯等方面強大,但在遊戲上顯然還欠點,而且不支持eGPU擴展顯卡了。 在原來的Intel處理器的Mac電腦上,eGPU是很多人提升遊戲甚至生產力的可選手段,這些擴展塢多數基於Thunderbolt 3(蘋果版的叫做雷靂),40Gbps的速度足夠保證多數顯卡的性能不受影響,方便MacBook這樣的筆記本擴展。 在M1版的Mac電腦中,蘋果依然支持了雷靂接口,但是eGPU擴展顯卡現在是不能用的,這讓不少人覺得遺憾。 准確來說,也不是完全不支持了,外媒驗證了下,M1處理器的Mac筆記本實際可以檢測到Blackmagic和Razer CoreX這樣的eGPU擴展塢,連接TB3顯示器的話可以正常使用,連接顯卡的才會停止工作。 從這一點來看,外媒認為蘋果M1版Mac不支持eGPU只是暫時的,主要是缺少驅動,而這是因為蘋果現在精力不夠,優先解決的問題還沒輪到eGPU支持上。 最終M1版Mac是否會如願重新支持eGPU擴展,還得看蘋果的心情,如果需求高了,蘋果應該會加入支持,不過蘋果的重點依然是提升M1處理器自己的GPU性能,這樣用戶以後就不需要考慮eGPU擴展了。 作者:憲瑞來源:快科技
為自研GPU鋪路?華為曬鳳凰引擎 手機也能實時光追

為自研GPU鋪路?華為曬鳳凰引擎 手機也能實時光追

對於華為來說,他們之前已經展示了鳳凰引擎,這是其下一代圖形關鍵技術。 現在,華為也是展示了更多鳳凰引擎的細節,其有渲染引擎、材質系統、動畫引擎、物理引擎、後處理系統、GT圖形加速層等等一整套的核心模塊。 合作夥伴可使用Scene Kit的光線追蹤、PBR、動畫等特性,打造獨特豐富的3D場景,帶給用戶沉浸式的體驗。 當前鳳凰引擎正在與網易、Unity、Cocos等合作夥伴推進技術落地,與廣大開發者一起將更美更快的圖形能力帶給更多的用戶。 值得一提的是,華為鳳凰引擎還提供有自研多層BVH加速結構、多叉樹Traversal算法,構築了高效、Unbias的RT-Core算法底座,通過基於華為硬件平台的自研混合渲染管線實現了實時光線追蹤技術在移動端的應用。 鳳凰引擎能給手機3D應用以及遊戲提供高性能、低功耗、高畫質的圖形體驗。華為鳳凰引擎的光線追蹤技術圍繞高真實感渲染,在離線與實時渲染領域實現了技術突破,把PC級別最先進頂級顯卡的實時光線追蹤效果帶到手機上。 華為並沒有給出鳳凰引擎實際應用在手機上的具體時間節點,不過有消息稱,此舉可能是為了自研GPU做准備?! 作者:雪花來源:快科技
到底有多強?蘋果M1 GPU性能首秀 GTX 1050 Ti瑟瑟發抖

到底有多強?蘋果M1 GPU性能首秀 GTX 1050 Ti瑟瑟發抖

雖說M1是蘋果進軍桌面PC的首秀,但是這顆芯片的實力真的不容小覷,畢竟打造A系列強大實力在那放着呢。 現在,GFXBench 5.0上出現了首個基於蘋果M1配置的測試成績,在GPU成績中,一同出現的還有GeForce GTX 1050 Ti(很可能是通過Thunderbolt 3端口連接到主機使用的),而這兩套系統都是在Mac OS X上運行Metal API。 從實際測試成績看,M1在Aztec Ruins場景中,Normal Tier模式離屏測試提高了22%,High Tier模式離屏測試提高了約21%,Car Chase場景和曼哈頓3.1中也有類似的情況,大概有20%的提高。 然後,M1的GPU真正提升的地方是曼哈頓和T-Rex的基準測試,它分別比GeForce GTX 1050 Ti快30%和25%。 對於這樣的表現,M1的GPU都顯示了極強的實力,畢竟上述成績已經擊敗了上一個版本的MacBook Air、MacBook Pro和Mac mini中的第10代和第11代Intel處理器里的IGP。 至於M1的CPU性能,之前的測試數據顯示,搭載M1的MacBook Air GeekBench 5跑分成績為單核1687,多核7433。其中,單核成績碾壓酷睿i9-10910(10核2.7GHz)加持的iMac(1252分),多核心比12核至強E5-2697還高,而且明顯勝過i9-9880HK加持的16寸MacBook Pro。 作者:雪花來源:快科技
《塵埃5》新補丁釋出 修復游戲GPU占用低的問題

《塵埃5》新修正檔釋出 修復遊戲GPU占用低的問題

Codemaster釋出了《塵埃5》的新修正檔。該修正檔將會自動應用到遊戲中,並修復了一些重要錯誤以及性能提升。 首先,此修正檔修復了遊戲過程中的GPU使用率較低的問題。現在,遊戲在每次比賽開始時都充分利用GPU,從而帶來更好的整體性能體驗。 此外,Codemasters表示此修正檔減少了崩潰和遊戲卡頓的情況。 除了這些改進之外,此修正檔還對使用車內視角時擋風玻璃上的雨水效果進行了視覺改進。它還添加了一個選項以禁用動態分辨率,另外還添加了垂直同步設置。 來源:3DMGAME
《星球大戰絕地:隕落的武士團》XSX上鎖60幀運行

《星球大戰絕地:隕落的武士團》確認於11月加入XGPU

9月,微軟宣布與EA合作,將EA旗下遊戲訂閱服務EA Play帶到Xbox Game Pass。今天(11月6日),EA方面宣布由重生娛樂開發製作的《星球大戰絕地:隕落的武士團》將在Xbox Series S|X發售當天加入Xbox Game Pass Ultimate,同日 EA Play 會員服務加入 Xbox Game Pass Ultimate ,無需額外付費。12月開始,XGPU或XGP PC用戶可在PC上下載和遊玩EA Play遊戲。 EA Play每月收費4.99美元,雖然相比而言,每月14.99美元的Xbox Game Pass Ultimate更貴一些,不過Xbox Game...
為自研GPU鋪路?華為鳳凰引擎 手機能實現1080p/60 fps實時光追

為自研GPU鋪路?華為鳳凰引擎 手機能實現1080p/60 fps實時光追

大家應該還記得,之前華為曾預告,將會公布鳳凰引擎,同時探討移動端圖形技術的趨勢。 據最新消息稱,華為在廈門的一場研討會上用一款神秘的機型展示了在1080p/60fps下的實時光線追蹤Demo,而從實際效果來看,畫面非常的逼真。 從現場展示的圖片看,車輛光源的反射基本和頂級PC顯卡渲染出來的沒有太大區別。華為表示鳳凰引擎有渲染引擎、材質系統、動畫引擎、物理引擎、後處理系統、GT圖形加速層等等一整套的核心模塊。 鳳凰引擎能給手機3D應用以及遊戲提供高性能、低功耗、高畫質的圖形體驗。華為鳳凰引擎的光線追蹤技術圍繞高真實感渲染,在離線與實時渲染領域實現了技術突破,把PC級別最先進頂級顯卡的實時光線追蹤效果帶到手機上。 華為並沒有給出鳳凰引擎實際應用在手機上的具體時間節點,不過有消息稱,此舉可能是為了自研GPU做准備?! - THE END - 轉載請註明出處:快科技 #華為#智能手機#GPU 責任編輯:雪花作者:雪花來源:快科技
《塵埃5》開發者:PS5和XSX的GPU差距對開發沒有太大影響

《塵埃5》開發者:PS5和XSX的GPU差距對開發沒有太大影響

對於次世代主機大戰,PS5和XSX各有各的優勢。PS5有着速度驚人的SSD,而XSX則有着更快的GPU:相比PS5 10.28TF的計算性能,XSX的12TF GPU可謂領先不少,至少僅從紙面數字上是這樣。 那麼問題來了,從開發的角度看,二者的GPU差距是否會導致巨大的差異呢?《塵埃5》首席設計師Mike Moreton並不這麼認為。 在接受Gamingbolt采訪時,Moreton表示:「從開發和玩法的角度說,GPU的差距沒有真正的影響。當涉及到一個遊戲在後期的調試,修改和優化,這可能意味着在一個平台上的工作量會稍微少一些。」 話說回來,需要指出的是,多平台開發商也需要留意Xbox Series S更加孱弱的GPU,這也讓PS5和XSX之間的性能差距變得無關緊要。 來源:3DMGAME
7nm延期半年 Intel CEO談芯片外包選擇 明年初最終決定

7nm延期半年 Intel CEO談芯片外包選擇 明年初最終決定

上上個季度的財報會上,Intel宣布7nm工藝要延期,推遲半年到一年時間,意味着至少2022年才能見到了。新工藝延期,Intel還有個選擇就是外包生產,CEO司睿博表態明年初會正式決定是否外包。 在先進工藝上,Intel在14nm節點之前都是遙遙領先三星、台積電的,不過這幾年來台積電進步很快,特別是10nm節點之後,今年更是量產了5nm工藝,3nm工藝也要在2022年量產了。 Intel以前是徹底的IDM垂直整合型半導體公司,雖然也外包了部分芯片給台積電等公司,但主要是低端的芯片組等產品,CPU處理器等核心芯片都是自產自銷的。 就在前不久,Intel還調整了旗下的芯片製造業務的高管,提升了原來負責Intel以色列工廠的高管Keyvan Esfarjani為公司副總裁、製造及運營業務總經理,主管Intel的晶圓製造計劃。 同時,,2020年Intel的資本開支將達到150億美元,上千億人民幣的投入就是為了確保先進工藝產能。 在加強自有芯片製造的同時,Intel也沒有完全排除外包代工的可能,此前Intel高管在采訪中表態,Intel的目標是尋找對產品競爭力最佳的解決方案,不論是內部還是外部,要全面評估成本、良率及生產彈性等問題。 在這次的財報會議上,Intel CEO司睿博再次回應了外包的問題,他表示Intel公司將在明年初決定是否委託第三方生產芯片。 雖然Intel外包芯片的可能性越來大,不過首次試水的產品不一定是自家的x86 CPU,Xe架構GPU倒是有可能外包,Intel最初就是打算用自家7nm率先生產GPU的,考慮到台積電生產GPU芯片的經驗豐富,選擇GPU外包生產是很合理的。 一切要等明年Q1季度來看了,如果Intel也選擇了芯片外包,這可是行業內的一次大變革,也是Intel 50多年來的首次重大轉變。 - THE END - 轉載請註明出處:快科技 #Intel#CPU處理器#台積電#GPU 責任編輯:憲瑞作者:憲瑞來源:快科技

SEMI表示矽晶圓出貨量在2020年穩步回升,並將在2021年超過歷史最高位

2020年10月13日(美國時間),國際半導體產業協會(SEMI)公布了其對於2020年半導體用矽晶圓總體出貨量的年度預測。報告稱,2020年的半導體用矽晶圓總出貨面積將比上年增長2.4%,達到119.57億平方英寸。 除此之外,SEMI還預測2021年總出貨面積將超過歷史最高位,達到125.54億平方英寸,並且此後仍將繼續增長至2023年。 矽晶片是半導體的基礎材料,而半導體又實際上是所有電子產品(包括計算機,電信產品和消費電子產品)的重要組成部分。上圖中列出的數據為總電子級矽晶片,例如原始測試晶片和由晶片製造商運送給最終用戶的外延矽晶片,但不包括未經拋光或回收的晶片。 SEMI市場研究和統計總監Clark Tseng表示:「 2020年矽晶片的出貨量將受到地緣政治緊張局勢、全球半導體供應鏈的轉移以及新型冠狀病毒傳播的影響。隨著大流行加速數位化進程,公司及其服務方式正在世界范圍內發生變化,半導體產業正在復蘇,我們預計在未來兩年內該產業將繼續增長。」 SEMI的統計數據顯示了半導體行業的全球復蘇,費城半導體股票指數(SOX指數)是半導體行業的經濟指標,也創下了日內新高,並且越來越多的觀點認為,蓬勃發展的半導體市場將使晶圓製造商受益。 ...
《看門狗:軍團》PC配置更新 CPU和GPU要求變高

《看門狗:軍團》PC配置更新 CPU和GPU要求變高

育碧官方發布了《看門狗:軍團》PC配置更新,主要針對CPU和GPU進行修改,通過對比發現,基本都有升高,尤其是對於光線追蹤選項中,CPU和GPU需求有着明顯的提升。 先前發布的配置要求 更新以後的配置要求 如果玩家想體驗1440P和光追高設置效果,需要i7-9700或AMD Ryzen 5 3600,以及一個RTX 3070。如果啟用光追和4K高設置,則需要i9-9900K或AMD Ryzen 7 3700X以及RTX 3080,這同之前發布了i9-9700K和RTX 2080TI相比,要求更高。 《看門狗:軍團》將於10月29日登陸XB1、PS4、PC和Google Stadia,11月10日登陸XSX/S,11月12日登陸PS5,支持光追和4K分辨率。 來源:3DMGAME
亞馬遜雲游戲Luna採用8TF英偉達GPU 完整首發游戲公布

亞馬遜雲遊戲Luna採用8TF英偉達GPU 完整首發遊戲公布

昨天亞馬遜公布了自家的雲遊戲服務Luna,但沒有公開訂閱該服務的玩家將會遠程訪問什麼樣的硬件。我們現在已經有了答案。根據外媒The Verge,Luna採用的是基於Windows的EC2 G4服務器,由Intel Cascade Lake CPU和NVIDIA T4 GPU驅動。 NVIDIA T4是服務器用GPU,但核心是圖靈架構,能提供8.1TF,性能媲美RTX 2070遊戲顯卡,當然也會支持光追。所以Luna服務器採用的硬件還是非常可以的,盡管並不是頂尖,但對於一些高畫質遊戲,4K就很難了。 由於Luna服務器是基於Windows系統和NVIDIA顯卡,對遊戲開發商們是一件好事,這會讓遊戲移植到該平台變得非常容易。相比來說,Google的Stadia則採用的是基於Linux的系統和AMD處理器。 也有鑒於此,Luna的首發遊戲陣容比Stadia多很多。以下是Luna完整首發遊戲列表: 《瘟疫傳說:無罪》 Abzu AO Tennis 2 Aragami Blasphemous 蒼翼默示錄:交叉組隊戰 熾熱合金 赤痕:夜之儀式 兄弟:雙子傳說 惡魔城周年合集 Contra Anniversary Collection 控制 CrossCode Deponia Doomsday 塵埃拉力賽2.0 永恆空間 Furi Ghost of a Tale Goodbye Deponia 超級房車賽 Hard Reset Redux Iconoclasts Indivisible Infinite Minigolf Ken Follett』s The Pillars of...
6nm GPU外包給台積電?Intel表態 不着急確定代工夥伴

6nm GPU外包給台積電?Intel表態 不着急確定代工夥伴

Intel CEO司睿博在之前的財報會議上提到,Intel考慮把部分芯片外包給晶圓代工廠,。不過Intel對外包這事並不着急,目前依然沒有確定合作夥伴。 日前Intel在台灣也舉行了架構日活動,新竹辦公室總經理謝承儒在接受采訪時也回應了有關外包的消息。 謝承儒提到,如果外包和Intel能有很好的互補性,Intel可以用外部解決方案來增加產品競爭優勢,與Intel自己的軟件、架構及安全性整合之後,給客戶提供最具競爭力的產品。 至於哪些芯片會外包,謝承儒依然在打啞謎,強調Intel的產品線很廣泛,也有很強的生產技術,很多產品都還是Intel工廠製造的,Intel的目標是尋找對產品競爭力最佳的解決方案,不論是內部還是外部,要全面評估成本、良率及生產彈性等問題。 有媒體追問Intel是否選擇台積電作為代工合作夥伴,謝承儒也沒有正面回應,只表示晶圓代工有很多廠商,Intel會考慮不同廠商的優勢。 總之,對芯片外包來說,雖然CEO表態考慮外包,但是Intel目前還是在觀望狀態,要評估不同廠商的優缺點,看看哪種方案對自己最有利,特別是要跟Intel自己製造的產品有互補優勢。 作者:憲瑞來源:快科技
7nm安培繼任者定了 NVIDIA確認正在開發Hopper顯卡 5nm?

7nm安培繼任者定了 NVIDIA確認正在開發Hopper顯卡 5nm?

9月2日,NVIDIA應該會正式推出安培GPU架構的RTX 30系列遊戲卡了,RTX 3090上位成為新旗艦,價格殺奔13999元。 NVIDIA今年5月份以在線GTC大會的形勢發布了Ampere安培GPU架構,7nm工藝、540億晶體管、826mm2面積,40GB HBM2顯存、6912個CUDA核心,各方面規格都是頂級水平的。 不過這是安培是面向數據中心市場的,遊戲卡的安培GPU可能有所不同,目前連製造工藝都沒有靠譜說法,可能是台積電7nm,也有可能是三星8nm LPP,或者兩者兼而有之。 對NVIDIA來說,不論是7nm還是8nm工藝,安培GPU只剩下最後的市場階段了,技術上已經完結,所以他們早就開始尋找下一個目標了。 NVIDIA CFO Colette Kress日前在參加BMO虛擬技術大會時透露,NVIDIA已經開始研發未來的GPU架構了,其中就有Hopper GPU。 ,但是NVIDIA首次證實安培繼任者的GPU代號,指的應該是Cobol語言之母、發明世界上第一個編譯器的Grace Hopper(格蕾絲·赫柏)。 現在談論Hopper GPU的具體規格還早,不過它面向的製造工藝應該是下個節點——5nm,不確定是三星或者台積電誰能代工,但是Colette Kress表示NVIDIA的產品會在兩家代工廠之間做最佳劃分。 不過變化依然很多,考慮到NVIDIA近年來在製程工藝上一直比較保守,採用7nm工藝的改良版工藝6nm也不是沒可能。 作者:憲瑞來源:快科技
7nm安培勢頭太猛 發布2個月就貢獻1/4服務器營收

7nm安培勢頭太猛 發布2個月就貢獻1/4服務器營收

NVIDIA今天發布了2021財年Q2財報,營收38.7億美元,大漲50%,淨利潤13.7億美元,大會79%,,大漲167%,首次超過了GeForce遊戲卡業務。 NVIDIA上季度中數據中心業務大漲有多個原因,其中很重要一點就是7nm安培顯卡,今年5月份正式發布A100加速卡,到7月底不過2個月時間,它就貢獻了數據中心業務1/4的營收了。 按照17.5億美元的營收來算,1/4大概就是4.4億美元,差不多是30億人民幣,雖然我們不知道A100加速卡的具體售價,但是超過1萬美元太容易了,估計差不多賣出4萬塊了。 當然,考慮到DGX A100的存在,實際數量可能會更少一些,這麼一算2個月時間出貨至少是3-4萬塊A100加速卡的樣子。 與上代Tesla V100發布之後期貨了大半年的情況不同,7nm安培這一代直截了當,NVIDIA發布的時候就已經開始出貨了,畢竟GTC大會原本是3月份召開的。 對NVIDIA來說,A100加速卡現在還是產品發售的初期,增長勢頭才剛剛開始,2個月時間就已經這麼猛了,後續前途無量。 NVIDIA的A100核心是台積電7N工藝,核心面積826mm2,542億晶體管,集成108組SM單元,SXM4架構,6912個CUDA核心。 Tensor Core減少到了432個,但是性能大幅增強,支持全新的TF32運算,浮點性能156TFLOPS,同時INT8性能624TOPS,FP16性能312TFLOPS。 顯存方面,A100配備的也是HBM2顯存,頻率從1.75Gbps提升到了2.4Gbps,位寬5120bit,相比V100的4096bit增加了1024bit,容量也從16/32GB增加到了40GB。 作者:憲瑞來源:快科技
22年後再戰高性能顯卡市場 Intel Xe GPU架構詳解 王之野望

22年後再戰高性能顯卡市場 Intel Xe GPU架構詳解 王之野望

作為CPU界的王者,Intel對高性能GPU市場一直沒有死心,1998年就推出了i740獨顯,12年後又推出Larrabee,22年後的今天又重燃戰鼓,推出了Xe GPU架構。 Intel重新殺入高性能GPU市場的傳聞已久,並挖來了AMD RTG部門前主管、首席架構師Raja Koduri坐鎮GPU業務,這次是否會不一樣呢? 今天的2020年架構日上,Intel終於詳細地解開了Xe GPU的面紗,這里我們就來管中窺豹一探Intel歷時多年重新打造的GPU架構。 對於Xe架構,我們之前的報道已經多次提到Intel對它的期望是希望用一種架構去滿足多種使用場景,從筆記本到遊戲卡再到高性能超算,都是Xe架構,推動GPU算力從萬億次(TFLOPS)向千萬億次(PFLOPS)邁進。 Intel Xe架構總覽:一種架構通殺四方、適應AI、雲時代 對於Xe GPU架構,官方的定義是「並行矢量矩陣架構」,已經突出了這個架構的特點,那就是高度並行,適合擴展多種場景。 Xe GPU架構有三大重點——軟件第一、並行第二,同時適應全新的工作負載,比如AI、視覺雲計算等等,這也是Intel作為GPU後來的一個優勢,研發GPU架構的時候可以不用照顧太多之前的積累,直接面向未來潛力巨大的場景,比如AI、雲計算等等。 Xe GPU希望用一個架構統一所有應用場景,不過實際情況還是很復雜的,不同場景對性能、功耗的要求不同,可以細分為集成+低能耗、中端、發燒級、數據中心/AI、HPC百億億次計算等等。 在這些細分場景中,Intel打造了三種不同的架構——Xe LP低功耗、Xe HP高性能、Xe HPC,不過實際上已經擴展到了四種,後面會再詳細說。 雖然有三四種不同的架構,不過Intel現在做的主要是兩種——適用於HPC的Xe HPC及低功耗的Xe LP,後者適合核顯、筆記本及低端獨顯,包括之前曝光最多的DG1顯卡。 Intel Xe GPU架構詳解:EU、存儲、AI、顯示、視頻單元全都改了 目前進度最好的還是Xe LP低功耗版,Xe GPU的結構介紹都是基於Xe LP的,具體如下: Xe LP架構簡單來說就是在提升FLOPS浮點性能的同時,還要考慮功耗,所以能效很重要,性能及能效兼顧。 提升性能就要提升計算規模,Xe架構在Gen11基礎上全面提升了執行單元的規模,EU單元從Ice Lake處理器上的Gen11核顯最多64個提升到了96個,每周期Texel紋理、Pixel像素渲染能力也從32、16提升到48、24,總體性能1.5倍於目前Gen11顯卡水平。 考慮到Gen11的規模實際上已經是目前Gen9.5的2倍多,理論上Tiger Lake上的Gen12核顯性能是現有核顯的至少3倍。 能效方面,在同樣的電壓下,Xe LP GPU的頻率大幅提升,從之前1.1GHz左右提升到了1.7GHz,還有其他手段一起降低了功耗,能效也全面改進了。 下面就是Gen11與Xe架構EU單元的具體對比了。 存儲單元方面,Xe...
走Zen2的老路 AMD下下代GPU架構RDNA3或用小芯片設計

走Zen2的老路 AMD下下代GPU架構RDNA3或用小芯片設計

從去年7月份開始,AMD的GPU開始全面轉向7nm RDNA架構,現在的Radeon 5000系列是第一代RDNA架構,今年還有big Navi/Navi 2X系列,會使用7nm+工藝的RDNA2架構,能效再次提升50%。 今年的顯卡旗艦big Naiv據悉最多有80組CU單元,也就是5120顆流處理器,比RX 5700多出122%,此前泄漏顯示其性能比RTX 2080 Ti會高出40-50%,。 再往後呢?AMD之前公布的路線圖顯示RDNA2之後是RDNA3架構GPU,但是除了代號之外,AMD不願意提及詳細情況,Zen3之後的Zen4 CPU都明確是5nm工藝了,可RDNA3隻用「高級節點」來代替。 為什麼官方這麼遮掩?可能是RDNA3進度有點慢,現在都沒確定具體工藝,不過這個說法在台積電5nn明確量產、AMD也確定採用5nm的情況下並不成立。 最新的爆料稱,AMD之所以不明確具體節點,很可能跟RDNA3架構的全新設計有關,那就是它也會採用小芯片的方式,將計算單元與IO單元分離,整個設計類似AMD在7nm Zen2處理器上設計的那樣。 小芯片設計的好處就是靈活,可以像搭積木那樣堆出所需的芯片,RNDNA3這樣設計的話堆CU計算單元就更容易了,方便擴充流處理器單元,比如計算核心就可以用5nm工藝製造,而IO核心很有可能跟Zen2那樣採用12/14nm工藝製造以降低成本。 當然,具體情況現在沒有定論,有關RDNA3的架構目前也只是猜測,只不過從技術趨勢上來說這條路最有可能。 考慮到big Navi顯卡最快也是今年11月份才上市,那RDNA3恐怕一年內都沒希望上市,要等到2022年才有戲了,AMD還有足夠的時間改良、優化RDNA3架構。 作者:憲瑞來源:快科技
疑似PS5 Pro專利曝光 將採用多GPU解決方案

疑似PS5 Pro專利曝光 將採用多GPU解決方案

關於索尼是否計劃在PS5生命周期中期的某個時候發布PS5 Pro或同等更強大的主機,已經有不少疑問。一項新的專利可能暗示索尼正計劃推出一款「高端」更強大的PS5,但事實並不僅僅是一台PS5 Pro這麼簡單,因為索尼的PS5 Pro還涉及PS Now的可擴展性和雲遊戲。 專利名是「可擴展遊戲主機的CPU/GPU 為家用主機和雲遊戲而設計」,專利描述總結是:「在一個多GPU模擬環境中,幀緩沖區管理可以通過多個GPU渲染各自的視頻幀,或渲染每個視頻幀的各自部分來實現。其中一個GPU憑借從其他GPU接收幀信息並通過物理連接的HDMI輸出端口讀出完整的幀來控制HDMI幀輸出。或者,GPU的輸出可以被復用在一起。」 該專利的一段寫道:"正如這里所述,SoC技術可以應用於遊戲主機等視頻模擬主機,特別是可以為'輕'版本的主機提供單個SoC,而多個SoC可以用於提供比'輕'版本具有更強處理和存儲能力的'高端'版本的主機。'高端'系統還可以包含更多的記憶體,如隨機存取記憶體(RAM)和其他功能,也可以用於使用相同遊戲機芯片的雲優化版本,性能更強。" 正是在這里,人們抓住了 "輕薄 "和 "高端 "版主機的話題,立即拋出了種種關於PS5 Pro的猜測。雖然這在本質上並不是錯誤的,但它是只見樹木不見森林。這項專利背後提出的最大理念是GPU的可擴展性,由於這里的SoCs使用的是復數,可以讓被稱為 "高端 "版本的遊戲機具備 "更強的處理和存儲能力"。該專利所說的並不一定是一個全新的主機,而是用另一個GPU來擴展現有系統的能力,而不是一個全新的系統。 提到雲遊戲,這使得在PS Now上運行遊戲的系統可以很容易地進行擴展和延伸,實現雲遊戲。但家用遊戲機也有潛力。索尼可以為你現有的PS5提供 "Pro "升級,讓你在不需要購買一整台PS5 Pro本體的情況下,就能獲得類似Pro的增強功能。我們最終可能會購買某種形式的 "Pro升級套件"。 值得一提的是,申請專利和公司會這麼做是兩碼事。它們只是對公司正在探索的想法的保障。我們已經看到無數的索尼專利沒有實現,或者也許與專利文本中暗示的實施方式不同。這項專利並不意味着PS5 Pro要來了,甚至也不意味着Pro式的升級要來了。它僅僅意味着索尼正在研究將GPU堆疊起來進行處理的想法,以擴展基礎GPU的功能。是否以及如何實現,還有待觀察。目前,索尼的PS5上市計劃只交代了同一台遊戲機的數字版和光盤版,兩者之間沒有其他的內部差異。報道還指出,PS5的生命周期只有5年,這可能與發布中期升級版的想法相衝突。 來源:3DMGAME
比安培GPU強70% AMD計算卡CDNA曝光 2GHz+頻率、32GB HBM2

比安培GPU強70% AMD計算卡CDNA曝光 2GHz+頻率、32GB HBM2

今年3月份的分析師大會上,AMD宣布GPU架構分家,遊戲GPU會繼續使用RDNA架構,而計算卡則會使用CDNA架構,專門針對深度學習、高性能計算優化,架構跟RDNA會有很多不同。 之前大家關注的多是RDNA2架構,也就是年底前big Navi家族的高端顯卡,其性能比RDNA提升50%,使用7nm+工藝,而第一代CDNA架構細節不詳,所知的主要是跟二代IF總線搭配,性能及規格欠奉。 不出意外的話,CDNA架構會應用下一代的Radeon Instinct MI100加速卡上,日前AdoredTV獲得了MI100加速卡的最新爆料,披露了一些性能數據,可以從中一窺CDNA架構的情況。 上面兩張圖的信息還是比較靠譜的,4路MI100加速卡提供了136TFLOPS的性能,128GB HBM記憶體及4.9TB/的帶寬,後者比較好算,意味着MI100單卡使用的是32GB HBM2顯存,帶寬1.2TB/,算下來就是單顆8GB、等效2.4Gbps頻率的HBM2顯存了。 至於性能,4路136T、8路272T算下來相當於單卡34TFLOPS性能,這個性能要比NVIDIA最新的7nm安培A100的19.5T性能要高得多,增加了70%以上,雖然夸張倒也不意外,不過AMD的顯卡架構在FP32紙面性能上一向比N卡高,現在的MI60加速卡的FP32性能都有14.75T。 根據這個性能來算的話,CDNA架構應該是至少8192個流處理器單元,是MI60的兩倍,同時頻率還要超過2GHz,達到2.1GHz以上。 2.1GHz的頻率也創造高性能GPU的頻率記錄了,不過索尼的PS5的GPU頻率可以加速到2.23GHz,所以CDNA使用7nm+工藝應該也不難做到,畢竟TDP空間更充足。 總的來說,CDNA架構是面向高性能計算的專用架構,8192個流處理器單元、2GHz+頻率、32GB HBM2顯存的規格很好很強大,34T的浮點性能也可以說是傲視群雄了,整體的規模很恐怖。 作者:憲瑞來源:快科技
一切為了玩家 雲游戲將於9月加入XGPU

一切為了玩家 雲遊戲將於9月加入XGPU

微軟Xbox大佬菲爾·斯賓塞今日發表了一封關於關於次世代的公開信,除了介紹Xbox關於次世代的承諾以外,其中重點提到了Xbox Game Pass Ultimate將於今年9月免費加入Project xCloud雲遊戲支持,此外微軟確認目標在Xbox Series X發售時,讓玩家在新主機上玩到Kinect以外的所有Xbox遊戲, 現有的控制器(例如精英手把等)也都支持XSX。 以下為具體內容: 官方原文: 遊戲是快樂、靈感以及社交的源泉。它們的力量讓我們匯聚在一起,互相理解,讓我們更加團結。在我們緊鑼密鼓地為新世代做准備時,我們也在為讓遊戲體驗更具包容性、更加沉浸、讓更多人互聯、更具社交性這些同樣重要的方面付出努力 Xbox團隊一直在努力傾聽廣大玩家、開發者、內容創作者和直播播主對於遊戲未來的期許。基於大家的反饋,我們正在打造能夠讓大家通過Xbox主機、PC以及移動平台都可以感受到沉浸感、交互性和深厚友誼的遊戲體驗。 在新世代即將到來之時,我們認為讓大家能夠清晰地了解Xbox的未來至關重要。 我們的願景圍繞着一個中心來逐步實現:您。 今天,我想與大家分享我們對大家的承諾: ·Xbox的大門永遠為您敞開: Xbox的遊戲體驗圍繞您而打造 —— 我們的玩家來自世界各地、各行各業。我們希望您所在的Xbox群體是安全、具有包容性,且能夠讓您暢享遊戲樂趣的。正如我們在社區行為准則中所提出:種族主義、以及所有形式的歧視和仇恨在Xbox沒有立足之地。如果您認為社區中其他玩家違反了相關的准則,我們的安全團隊將會根據您的報告進行嚴格的調查,並為您提供24/7/365的不間斷支持。同時,我們也在不斷加速推進新的技術,來減少仇恨言論的出現,為您提供打造安全遊戲環境的工具。 除了工具之外,我們承諾為您帶來更具多樣性的Xbox體驗。我們正在助力來自不同文化及社會背景的內容創作者來創作新的遊戲體驗,讓各類元素在遊戲中都能夠有真實、准確的體現,同時也在努力讓所有人都能夠暢享遊戲的樂趣。此外,有超過30萬的Xbox大使通過他們對遊戲的熱愛幫助Xbox群體成為最能夠讓玩家體驗遊戲樂趣的大家庭,在此我也誠摯地邀請所有玩家和我們一起實現這一願景。我們還有許多的工作要去完成並且在每一個玩家被歡迎、傾聽和珍視之前,不會止步。 ·Xbox Series X讓您的遊戲更加絢麗更加好玩。Xbox Series X專為更高標準且前所未有的逼真度、遊戲體驗、性能和精準度而打造。遊戲在Xbox Series X上將更加絢麗更加好玩 —— 無論它們來自15個Xbox Game Studios旗下工作室 (如 《光環:無限》)還是來自我們業界知名的開發商及發行商夥伴。Xbox...
蘋果對自研PC顯卡蜜汁自信 性能媲美AMD/NVIDIA GPU

蘋果對自研PC顯卡蜜汁自信 性能媲美AMD/NVIDIA GPU

Mac產品線的去x86化讓Intel被邊緣化,而蘋果同時也打算自研GPU,老伙計AMD顯卡恐怕也是好景不長。 在WWDC的開發者子論壇中,蘋果展示了ARM Mac運行《古墓奇兵:暗影》的遊戲畫面。我們知道本作並未對ARM平台做適配,所以平台藉助的是Rosetta 2編譯完成。要知道在Windows平台,《暗影》最低要求i3-3220+GTX 1050的配置。 按照蘋果的說法,其Apple Silicon採用了TBDR(Tile Based Deferred Rendering)圖形渲染架構,也就是塊狀延遲渲染,這與當前N卡、A卡的實時渲染(IMR)截然不同。 據悉,TBDR在開始渲染前捕獲整個場景,然後將其分割成多個小區域或塊,這些小區域或塊被分開處理,因此處理信息速度相當快,且不需要太多記憶體帶寬。IMR則是在丟棄像素前渲染整塊場景,這種辦法需要極高的帶寬,相較而言效率低。 另外,蘋果也強調打造基於Metal API的生態,就像Win10 DX12、跨平台Vulkan那樣。 耐人尋味的是,蘋果在開發者支持文檔中寫道,不要先入為主地認為獨顯就當然具備更好的性能。 優惠商品信息>>作者:萬南來源:快科技
開發者:大多數開發商不會充分利用PS5和XSX的GPU

開發者:大多數開發商不會充分利用PS5和XSX的GPU

兩大次世代主機PS5和Xbox Series X即將到來,二者的GPU相比前任主機都有着巨大的性能提升,但在恐怖遊戲《有一天你會歸來》開發商CBE Software的CEO Jan Kavan看來,大多數遊戲開發商並不能充分利用這兩大主機的GPU性能。 在接受GamingBolt采訪時,Kavan表示,盡管這兩款主機的更快硬件將是3A工作室(比如頑皮狗)會充分利用的,但業內大多數開發商很可能不會像第一方工作室那樣將硬件推向極限。 當被問到PS5和XSX更快的GPU對遊戲開發有什麼影響時,他回復說:「除了3A級工作室,並不多。在看了各種發布會後,我甚至沒有看到很多遊戲使用我們都已經用過的資源。所以會有一些邊界推動的公司,比如頑皮狗,但絕大多數都只會享受非常快的系統。」 遊戲開發商,尤其是第三方,在主機推出的初期很少會充分利用新主機的硬件,這在業內很常見。實際上很多發行商和開發商選擇在新舊主機上同時推出他們的遊戲,也可能會導致這種情況發生。 來源:3DMGAME
什麼是硬件加速GPU計劃?用處真的大嗎?實測驚訝

什麼是硬件加速GPU計劃?用處真的大嗎?實測驚訝

本文轉載自,其他媒體轉載需經超能網同意。 在Windows 10 Version 2004中,開發團隊給系統新增了一個名為「硬件加速GPU計劃「的選項,它隱藏在「顯示設置-圖形設置」中,作為一個實驗性的選項提供。對於這個選項,微軟官方在之前並沒有做太多的解釋,我們也就是道聽途說認為它可以減低顯示延遲什麼什麼的。 在上個月末,終於有官方人員對這個選項進行了完整的解釋,本文就根據官方的這篇博文,講講這個全新的硬件加速GPU計劃選項的具體工作原理和作用,並整合了多家媒體的測試數據,看看它起的作用大小。 「硬件加速GPU計劃「 官方把Hardware-accelerated GPU scheduling這個詞翻譯成了硬件加速GPU計劃,實際上在這里scheduling翻成「調度」能夠讓更多人明白它的意思,這也是比較有微軟風味的翻譯了。 回歸正題,要說到GPU調度管理,我們就先要了解一下WDDM GPU調度器是什麼。 WDDM GPU調度器與命令緩沖隊列 從NT 6開始,微軟給Windows引入了一套新的顯示驅動模型,也就是我們現在所熟知的Windows Display Driver Model,簡稱WDDM。在WDDM出現之前,應用程序可以直接把任務提交到GPU,當時系統只有一個全局的任務隊列,嚴格按照先到先執行的原則進行任務的調度。鑒於當時用到GPU的場景基本上就是全屏遊戲或者專業用途的渲染什麼的,這種方案也沒出什麼問題,被沿用了很多年。 現在很多程序都會調用GPU 到了應用程序開始普遍利用GPU加速的年代,比如說Windows要直接用GPU加速整個UI界面的渲染了,那麼再用這個全局任務隊列就會有問題,比如渲染系統界面的任務前面排了一個其他程序提交的任務,那麼GPU會先處理掉那個任務再回頭來處理系統的需求,這會造成整個系統UI的卡頓。為了妥善地安排GPU工作的優先級,勢必需要一個新的任務調度器,由它負責安排GPU任務的工作優先級。 那麼WDDM就引入了那麼一個任務調度器,它以高優先級線程的形式一直運行在CPU上,負責協調、優先處理和調度各種應用程序提交的工作。從Vista上面的WDDM 1.0到Windows 10 Version 2004的WDDM 2.7,官方一直都在加強這個調度器的功能。但這種管理方式存在有一定的限制,主要體現在提交會有額外開銷和任務達到GPU有一定的延遲時間,不過這些限制在實際中都被傳統圖形應用的渲染緩沖隊列給掩蓋了。 緩沖用來存放提前准備好的渲染命令等等內容,在GPU渲染當前幀的時候,CPU已經在准備下一幀、下下幀乃至之後的更多幀數了。這種方式能夠保證CPU與GPU之間的良好執行並行性,也可降低整體的性能開銷,是現在很常見的GPU調用方式。同時為了降低頻率提交渲染命令帶來的額外性能開銷,一般應用程序會提前准備好多幀的內容一起發送到隊列中。這里產生了問題,緩沖的幀數越多,用戶能夠感受到的延遲越高。 題外話,NVIDIA和AMD兩家在去年都已經在驅動層面提供了對緩沖隊列深度的控制,通過降低緩沖隊列的幀數來實現降低延遲這一目的。 但如果想減少緩沖隊列的深度來降低延遲,又會造成提交開銷增加,影響到性能。這兩者之間是一個權衡關系,程序可能以更高的頻率每次提交更少的幀數來降低延遲,又可能以較低的頻率每次提交更多的幀數來減少額外的調度、提交開銷。所以,微軟決定修改其顯示驅動模型的基礎架構,引入了「硬件加速GPU計劃「。 把任務調度交給專用硬件 Windows 10 Version 2004中引入的新選項就是允許系統將絕大多數的調度任務交由GPU專有的硬件調度器去做,Windows將繼續控製程序調用GPU的優先級,但高頻任務將會交由GPU的調度處理器進行管理,它負責各種GPU引擎的量子管理和上下文切換。 在NVIDIA的官方說法中,新的選項就是允許GPU直接管理它自有的記憶體,也就是顯存,在此之前,顯存是交給系統來管理的。 要啟用這個新調度方式有兩個先決條件,一個是需要硬件支持:它需要GPU自身有專有的處理調度任務的硬件模塊,另一個是驅動支持:系統需要一個符合WDDM 2.7標準的顯示驅動。當你的驅動和硬件都支持時,系統設置里才會出現這一選項。另外,引入新的調度方式對驅動模型有一個重大且根本性的改變,在某些時候、某些場景下它可能會產生不可知的效果,因此微軟將其作為一個實驗性的選項,默認情況下是關閉掉的。目前開發團隊還在比較兩種調度器之間的性能差異,同時也在監控新調度器的可靠性,未來這個選項可能會在支持的硬件上變為默認開啟狀態。 目前支持這一特性的GPU有NVIDIA的Pascal GPU和Turing GPU、AMD的RDNA GPU,Intel那邊的情況不明。 實際測試:對高端平台影響不大 好了,說了那麼多,我們還是來看看這項功能在實際中的表現吧,我們找來了Tom's...
AMD Navi 31核心現身 蘋果定製超級顯卡?

AMD Navi 31核心現身 蘋果定製超級顯卡?

AMD將在今年下半年發布基於RDNA 2升級版架構、Big Navi大核心的下一代高端顯卡,已知有Navi 21、Navi 22、Navi 23三個不同版本,數字越小代表對應的核心越龐大、越高端。 有趣的是,Navi 31又出現了! 單純看編號,它應該是更下一代產品,不過產品上市規劃應該沒這麼快,而且Navi 31的代號這次出現在了蘋果剛剛宣布的macOS Big Sur 11.0新版本的代碼中,很顯然是個蘋果定製版。 ,也將首次離開Intel x86架構、轉而支持蘋果自研ARM架構處理器,但是很顯然在GPU顯卡方面,蘋果、AMD將繼續深度合作。 AMD已經為蘋果定製過大量顯卡產品,而且很多在規格上都遠超Windows平台上的型號,比如,就首款也是迄今唯一一款基於Navi 14的顯卡,還搭配了HBM高帶寬顯存,其性能遠超Windows筆記本里的所有AMD獨立顯卡。 目前來看,Navi 31應該是Navi 21的蘋果定製版,甚至有大概率是定製加強版,不排除Navi 21是個不完全閹割版本,Navi 31則是滿血版本的可能。 有趣的是,這並不是Navi 31的名字第一次出現,早在去年12月就有人發現了它的蹤跡,而且當時寫作「NV31「,同樣暗示了它和Navi 20/系列的不同。 另外,在專業計算卡方面,Arcturus(大角星)已經傳聞太久,但一直沒有誕生,不過日前AMD終於確認了,將首次採用CDNA架構,而且最新發現了一款更高端的Radeon Instinct MI200,甚至有雙芯設計的可能。 另另外,AMD下一代銳龍APU代號為「Cezanne」(塞尚),CPU方面將會基於Zen 3架構,GPU方面原本希望能上RDNA Navi,但 macOS代碼里也出現了Cezann的名字,而且對應ID字符串為「CZN_Renoir」,也就是和現在的Renoir關聯密切,更進一步印證了二者的密切性,GPU幾乎已經可以完全確認還是Vega。 猜你喜歡的商品>>作者:上方文Q來源:快科技
低配版次世代Xbox配置泄露 7.5G可用記憶體+4TFGPU

低配版次世代Xbox配置泄露 7.5G可用記憶體+4TFGPU

代號為Lockhart的低配版次世代主機Xbox Series S尚未公布,但目前關於該機的一些細節已經在網絡上流傳。 據外媒The Verge報道,代號為「但丁」的XSX開發機配有一個特別的Lockhart文檔。該文檔對XSS主機的配置有明顯的暗示,透漏了其7.5GB可用記憶體,一個略微較慢的CPU以及大約4TF的GPU。在這些配置下,XSS主機瞄準的是1080P和1440P遊戲,而不像是XSX那樣瞄準的是4K分辨率。 The Verge報道說:「遊戲開發者們可以使用XSX的Lockhart模式在這一性能下測試他們的遊戲,做驗證檢查。微軟有望將其Lockhart主機定位在1080P/1440P遊戲,而這兩個分辨率也是當前PC遊戲顯示器最常用的分辨率。」 此外,The Verge記者Tom Warren還表示,盡管XSS將比XSX便宜,但並不意味着XSS就會非常便宜。 來源:3DMGAME
NVIDIA為80%全球最快超級計算機提供加速

NVIDIA為80%全球最快超級計算機提供加速

最新TOP500超級計算機榜單顯示,目前,全球排名前十的超級計算機中有8台採用了NVIDIA GPU、InfiniBand網絡技術,或同時採用了兩種技術。 其中包括美國、歐洲和中國最強大的超級計算機系統,在TOP500榜單的所有系統中,有三分之二的系統(333套)採用了NVIDIA(現已與Mellanox合並)為其賦力。 在能效方面,使用NVIDIA GPU的系統表現也都脫穎而出。與不使用NVIDIA GPU的系統相比,其能效(以gigaflops/watt為單位)平均高出2.8倍。 最能夠證明此能效表現的是NVIDIA內部研究集群的新成員——Selene。該系統在Linpack基準測試中以27.5 petaflops的性能表現,在最新Green500榜單中排名第二,在整個TOP500榜單中排名第七。Selene的功耗為20.5 gigaflops/watt,與Green500榜單上的第一名相差甚微,但排名第一的系統體積更小,其性能表現僅排在第394位。 特惠商品推薦>>來源:快科技
AMD GPU兩大新核心現身 銳龍APU終於有望升級Navi

AMD GPU兩大新核心現身 銳龍APU終於有望升級Navi

解讀AMD GPU芯片不是一件容易的事情,因為要面臨各種各樣復雜的編號、代號,又都面向不同的產品、應用領域,錯綜復雜。 架構方面,AMD近年來有Polaris(北極星)、Vega(織女星)、Navi(仙後座)三個時代,它們又都有各自的架構序列編號,分別對應gfx800系列、gfx900系列、gfx1000系列。 當然,每個架構都有不同規模的核心,它們也都有各自的編號、代號,而歷代AMD GPU核心編號、代號的數字部分,都是數字越小、核心規模越大,也就是倒序排列。 說了這麼多,是為了引入今天新發現和確認的幾個AMD GPU核心,一個是「Van Gogh Lite「(梵高精簡版),架構編號gfx1040,顯然屬於RDNA架構的Navi系列,而且應該是第二代RNDA架構。 之前曾經見到過「Van Gogh」(梵高),架構編號gfx1033,顯然規模更大一些,身份也是迷。 猜測它們可能都會用於未來的銳龍APU——要知道現在的銳龍APU集成的還是Vega GPU架構,雖然也有一些RDNA架構的顯示技術、多媒體技術,但畢竟架構有代差,也有點「落伍「了,如果能推進到Navi架構顯然將與獨立顯卡齊頭並進。 另一個新核心是「Navi 23」,架構編號gfx1032,略高於Van Gogh gfx1033,而在它之上此前已經知曉了Navi 22 gfx1032、Navi 21 gfx 1030。 它們肯定都是第二代的Big Navi核心,也就是RDNA 2架構,對應產品不出意外應該是Radeon RX 6000系列了。 另外提一句,目前Navi核心一代有三個版本Navi 10、Navi 12、Navi 14,架構編號分別為gfx1010、gfx1011、gfx1012,對應產品分別為RX 5700/5600系列、PRO...
NVIDIA揭秘 安培GPU開發了4年 826mm已達7nm極限

NVIDIA揭秘 安培GPU開發了4年 826mm已達7nm極限

NVIDIA的Ampere安培GPU發布就要1個月了,目前問世的主要是面向數據中心市場的A100核心,540億晶體管、826mm2核心面積的它絕對是怪獸級GPU。NVIDIA表示,安培GPU開發花了他們4年時間,這麼大的核心已經達到了台積電7nm極限了。 NVIDIA官方網站上今天發了一篇Blog網誌,GPU工程部門的聯席主管Jonah Alben談到了安培GPU的很多內幕信息。 根據Jonah Alben所說,在安培GPU的研發過程中,他需要團結硬件、軟件及系統團隊一切可能的力量,花費了4年時間才研發出這個怪獸,A100 GPU的性能是上一代GPU的20倍(註:只是AI性能,實際性能提升沒有這麼夸張。) A100 GPU使用了台積電的7nm工藝,集成了540億晶體管,核心面積826mm2,這幾乎是7nm工藝的極限水平了,Jonah Alben面臨的挑戰就是在這樣的核心中集成更多的功能單元,否則就要重新開發GPU架構。 為了充分利用這些條件,NVIDIA在A100 GPU上設計了不少冗餘單元,這也是現有的A100 GPU並非滿血版的原因,完整的128組SMX、8196個流處理器中目前只啟用了108組SMX單元、6912個CUDA核心,6組HBM2顯存也只啟用了5組HBM2,所以總容量為40GB,總位寬為5120-bit。 至於未來會不會解鎖完整版核心,NVIDIA倒是沒有表態,但從之前的情況來看,大概率會再推一波Super系列。 作者:憲瑞來源:快科技
AMD GPU七年累計出貨5.53億顆 一優勢讓Intel/NVIDIA羨慕不已

AMD GPU七年累計出貨5.53億顆 一優勢讓Intel/NVIDIA羨慕不已

市調機構Jon Peddie Research今天發布了一組有趣的數據,顯示了AMD 2013-2019年八年間GPU圖形處理器的出貨量,包括獨立顯卡、消費級APU、遊戲機APU三大類。 數據顯示,AMD GPU 2013年的出貨量僅為8700萬顆,此後一路穩步增長,到了2019年累計已經達到5.53億顆。 這其中,AMD同時贏得微軟、索尼遊戲主機訂單自然是功不可沒,再加上Zen架構銳龍處理器的強勢帶動,GPU部分也跟着水漲船高。 按照產品范圍劃分,AMD GPU的出貨量有29%來自微軟和索尼主機,兩家分別占9%、20%,合計達29%。 獨立顯卡占比為36%,其中桌面、筆記本都是18%,而消費級APU的總占比為35%,其中桌面12%、筆記本23%。 換一個維度,筆記本貢獻了AMD GPU總出貨量的39%,而桌面僅為30%。 有趣的是,如果單說集顯(APU),AMD遠遠打不過Intel,而如果只說獨顯,AMD又根本不是NVIDIA的對手,但是AMD就勝在兩手都抓着,加起來就沒有敵手了。 眼下,AMD GPU又同時出現在索尼PS5、微軟Xbox Series X,還進入了三星手機SoC,可以預料在2021年將會出現又一次的大爆發。 作者:上方文Q來源:快科技

據統計,AMD在七年間賣出了超過5億的GPU

相信不少人對AMD GPU的出貨量感到好奇,根據市場調查機構JPR的連續跟蹤統計數據,AMD GPU在PC市場上的占有率跟NVIDIA基本持平,上個季度的數據約為20%左右。那麼出貨量呢?JPR的最新統計顯示,從2013年開始的7年間,AMD GPU的出貨量不斷增長,至今已經突破5億大關,達5億5300萬之多。 統計的出貨量中不僅包括了獨立GPU,還包括了集成GPU。從2013年開始,AMD GPU的出貨量每年都有可觀的增長,前面的原因是那年新發售的家用遊戲主機使用了來自AMD的方案,集成了AMD的GPU,而後的原因是Ryzen CPU/APU的銷量增長帶動了AMD GPU出貨量的增加。 有趣的是,如果是用同樣的產品類型去對比的話,AMD的集成GPU出貨量不比Intel,獨立GPU出貨量不比NVIDIA,但他們是目前唯一一家有集成和獨立兩種形態GPU的廠商,加起來,就超過了其他兩家。 JPR也統計了出貨產品的類型,可以看到各項之間的差距並不大。出貨占比最大的兩種產品類型分別是筆記本APU和PS4的GPU,分別達23%、20%,獨立GPU的出貨占比加起來有36%,而最慘的是Xbox One部分,因為這代Xbox不太給力,出貨量也僅占到9%。 目前有消息稱,三星將會在下一代Exynos SoC中集成來自於AMD的RDNA GPU,如果消息成真,那麼將會讓AMD GPU的出貨量再次出現一個很大的增幅,畢竟移動端市場的需求之龐大,是目前PC市場所比不上的。 ...
NVIDIA 7nm安培是有史以來最強大的GPU

NVIDIA 7nm安培是有史以來最強大的GPU

在5月 14日的GTC演講中,NVIDIA CEO黃仁勛正式宣布了新一代GPU——Ampere安培,它使用了7nm工藝,號稱性能是上代Voltra的20倍。日前NVIDIA CFO Colette Kress表示這是他們三年來的傑作,是NVDIA有史以來最強大的GPU。 在摩根斯坦利的全球技術大會商,NVIDIA公司的CFO Colette Kress遠程出席了會議,並回答了分析師提問。 在談到安培GPU時,Colette Kress表示這是他們過去三年來努力工作的成果,安培GPU目前已經量產,並且納入了Q1財季(2-4月底)的營收中,她稱安培架構是NVIDIA GPU有史以來飛躍最大的一次,遠超其他GPU。 此外,Colette Kress還提到,安培GPU是7nm工藝中最大的,也就是性能最強的,沒有之一,他們利用這次獨特的機會推出了7nm安培GPU。 根據之前的報道,GA100芯片採用台積電第一代7nm(N7)工藝製造,核心面積達826平方毫米,相比上代12nm GV100僅增大了11平方毫米(0.13%),但晶體管數量從211億個猛增至542億個,多了接近1.6倍,同時功耗控制在400W(增加33%),可見新架構和新工藝的威力。 作者:憲瑞來源:快科技

GPU-Z 2.32.0更新支持N卡的新供電傳感器:可以直接看外部供電輸入情況了

GPU-Z最近更新的頻率又高起來了,在上個版本中它加入了對一系列新發布GPU的支持,主要是移動端的,而在近日發布的2.32.0版本中,它又擁有了全新的功能特性——查看N卡的外部供電輸入情況。 相信我站讀者對我們測試顯卡功耗使用的方法不會感到陌生,我們並不是從系統內部對顯卡功耗進行讀取記錄,而是直接通過在取電口上附加功耗記錄儀的形式來收集功耗數據,並且用了比較高的采樣頻率,使得這套辦法可以較為精準地記錄顯卡的瞬間峰值功耗。不過如果是想簡單地看看顯卡當前功耗情況的呢,GPU-Z也可滿足需求,不過老版本給出的功耗數據就太簡單了: 這是我日常用的GTX 1070 Ti的數據,可以看到它除了一個Power Consumption之外沒給出其他功耗相關的數據,要知道,現在的GDDR6顯存耗電量也不小,而GPU-Z之前沒辦法看到這些詳細數據,但其實,NVIDIA那邊是有做相關接口的,新版本就加上了: 可以看到,新版的GPU-Z在功耗顯示方面詳細了太多,給出了Board Power,也就是TGP,GPU晶片功耗,PCIe插槽和外部供電輸入的電壓和當前功率,對於具備USB-C接口的Turing顯卡,它還能查看USB-C口當前輸出功率的大小: 其他改進方面,現在GPU-Z在顯示Intel核顯時會順便顯示處理器的步進信息,另外還有針對Windows 10 Version 2004的支持和一批新卡信息。 下載地址:GPU-Z ...
GeForce顯卡將退居二線 NVIDIA未來要靠數據中心GPU了

GeForce顯卡將退居二線 NVIDIA未來要靠數據中心GPU了

自從1999年首先推出GPU這種產品以來,NVIDIA二十年來一直是最大的GPU廠商,遊戲GPU推動了NVIDIA的成長,直到2020財年Q1季度,GeForce系列產品都是NVIDIA營收的主力。 根據NVIDIA前不久發布的財報,截至今年4月26日,NVIDIA Q1季度營收為30.80億美元,同比增長39%;淨利潤為9.17億美元,同比增長133%,而遊戲顯卡就貢獻了13.4億美元的營收。 但是情況已經在變了,Q1財季中數據中心GPU業務貢獻了11.4億美元的營收,80%的增速遠高於遊戲GPU業務27%的增長,而一年前這部分業務營收不過6.34億美元,不到遊戲卡業務的一半。 NVIDIA在4月底正式斥資496億收購了Mellanox Technologies, Ltd.(邁絡思科技有限公司),進一步加強了數據中心市場的實力,而且後者的財報在Q3季度就會並入NVIDIA主業中。 考慮到遊戲、數據中心兩個業務的增速差異很大,再加上Mellanox公司的影響,快則Q2財季、慢則Q3財季,NVIDIA第一大營收來源就會變成數據中心市場,遊戲GPU業務20多年來首次會退居二線。 至於老黃為何改變,原因也沒什麼特別的,遊戲GPU市場價值每年價值不過200億美元左右,NVIDIA已經占了七八成,再漲也沒多少空間了,而隨着HPC、AI的發展,數據中心GPU市場價值在2024年預計能達到1000億美元,這才是一片藍海,而且NVIDIA在這個領域更沒有對手。 作者:憲瑞來源:快科技
Tesla A100果然割了一刀 7nm安培完整版128組SMX單元 再強20%

Tesla A100果然割了一刀 7nm安培完整版128組SMX單元 再強20%

今晚NVIDIA發布了7nm安培GPU,首發的是Tesla A100加速卡,工藝及架構全面升級,很好很強大。不過有一點大家可能猜到了,6912個CUDA核心的Tesla A100並不是完整版的,NVIDIA依然在首發產品了留了一刀。 之前的架構解析中,Tesla A100加速卡目前所用的核心有6912個CUDA核心,算下來是108組SMX單元,VC網站的結構對比更加清晰,如下所示: 盡管現在的6912個CUDA核心相比GV100的5120個CUDA核心已經提升了35%,但它依然不是GA100大核心的完整體,這差不多也是NVIDIA每次發布新卡的保留節目了,首發產品要割一刀。 從官方給出的結構來看,GA100核心完整版是128組SMX單元,也就是8192個CUDA核心,比現在差不多要多出15-20%的規模,後續的潛力很大。 至於為什麼首發的Tesla A100核心這麼保守,可能是NVIDIA希望後續再出更高端的產品,也有可能跟現在的產品功耗已經達到400W有關,為此頻率都降低到了1400MHz了,比GV100核心的1.5-1.6GHz還要低。 完整版的GA100大核心不知道什麼時候解鎖,後續優化了功耗之後,GA100大核心的性能恐怕要再上一層樓了,big Navi大核心不知道能不能追上了。 作者:憲瑞來源:快科技
7nm安培GPU詳解 400W功耗、40GB HBM2、826mm2怪獸出爐

7nm安培GPU詳解 400W功耗、40GB HBM2、826mm2怪獸出爐

等了很久,今晚NVIDIA正式發布了7nm安培GPU,號稱是8代GPU史上最大的性能飛躍。不過官方並沒有公布安培GPU的技術細節,Anandtech網站倒是給出了一份詳細的介紹。 這次的GTC 2020大會演講中,NVIDIA CEO黃仁勛主要談的就是HPC計算、AI人工智能等方面的內容,目前推出的A100大核心也是針對這個領域的,與之相比的是3年前發布的Volta架構V100核心,很多東西跟RTX 3080 Ti遊戲卡會不一樣,大家不用糾結。 首先來說大方面的,V100核心使用的是12nm Volta架構,211億晶體管,核心面積815mm2,而A100核心是台積電7N工藝,應該也是定製版的7nm工藝,826mm2,542億晶體管,同樣是核彈級別的。 V100核心擁有80組SM單元,5120個CUDA核心,SXM2/3架構,而A100核心是108組SM單元,SXM4架構,6912個CUDA核心。 AI方面是變化最大的,相比Volta架構的640個Tensor Core,A100核心的Tensor Core減少到了432個,但是性能大幅增強,支持全新的TF32運算,浮點性能156TFLOPS,同時INT8浮點性能624TOPS,FP16性能312TFLOPS。 常規的FP32、FP64性能提升倒是不算明顯,從V100核心的15.7.、7.8TFLOPS提升到了19.5、9.7TFLOPS。 頻率方面,A100核心實際上還倒退了,從V100的1530MHz降低到了1.41GHz左右,畢竟核心規模實在太大,功耗已經飆到了400W,比V100的300/350W功耗高出不少。 顯存方面,A100配備的也是HBM2顯存,頻率從1.75Gbps提升到了2.4Gbps,位寬5120bit,相比V100的4096bit增加了1024bit,容量也從16/32GB增加到了40GB。 不過HBM2的配置略顯奇怪,增加1024bit理論上應該多1組HBM2,但從核心圖上看又是6組HBM2顯存,或許是2組512bit的?保不准以後還會有完整版A100核心。 不過HBM2顯存位寬、頻率雙雙提升的後果就是,A100核心寸帶寬達到了1.6TB/s,遠高於V100的900GB/s,比AMD的Radeon VII顯卡的1TB/s帶寬還要高。 最後,NVLink技術也升級到了3.0版,帶寬從300GB/s提升到了600GB/s,適合服務器領域多卡互聯,不過未來應該還會有PCIe版的。 作者:憲瑞來源:快科技
NVIDIA發布7nm安培 540億晶體管核彈、GPU史上最大性能飛躍

NVIDIA發布7nm安培 540億晶體管核彈、GPU史上最大性能飛躍

5月14日晚,在GTC 2020線上發布會上,NVIDIA乾脆利落地在幾分鍾內就放出了老黃的演講視頻,正式推出了安培(Ampere)架構GPU,7nm工藝,540億晶體管,20倍AI算力,5大技術創新,總之新核彈來了。 目前NVIDIA還沒有正式公開安培GPU的詳細架構細節,但是跟上次的圖靈GPU一樣,黃仁勛表示這是NVIDIA八代GPU史上最大的一次性能飛躍。 首款基於安培GPU的產品是Tesla A100加速卡,根據NVIDIA所說,它帶來了5大技術創新: 1、 全新安培GPU架構,540億晶體管,世界上最大的7nm處理器。 2、 第三代Tensor Core AI核心,支持TF32運算,無需任何代碼改變就可以讓AI性能提升20倍,還支持FP64雙精度運算,與HPC應用相比帶來了2.5倍的性能。 3、 Multi-instance GPU多實例GPU:簡稱MIG,這是一項創新技術,可以將一個GPU劃分為七個獨立的GPU,針對不同的目標提供不同的運算,最大化提高計算效率。 4、 NVLink 3.0:新一代GPU總線的性能翻倍,可以在服務器應用中提供更有效的性能擴展。 5、 結構稀疏性:這項新技術利用了AI運算中固有的稀疏性實現了性能翻倍。 這5大技術創新使得Tesla A100加速卡成為苛刻工作負載的理想選擇,不僅可以用於AI推理、AI訓練,還可以用於科學仿真、AI對話、基因組、高性能數據分析、地震建模及財務計算等等。 與此同時,NVIDIA還宣布了基於Tesla A100的DGX A100超算,有8路Tesla A100加速卡,性能高達5PFLOPS,阿里雲、AWS雲、Google雲、微軟Azure、甲骨文及騰訊雲都將推出基於DGX A100的雲服務。 目前DGX A100發布之後就立即上市了,跟當年的Tesla V100完全不同,美國、德國的多個實驗室及超算中心已經開始使用Tesla A100作為超算解決方案了。 PS:今晚的視頻中,老黃的頭發已經白了一半,作為目前全球最強GPU的掌門人,7nm安培GPU顯然花費了NV公司不少心血,目前揭開的還只是計算方面的,RTX遊戲卡還沒公布多少信息。 作者:憲瑞來源:快科技
NV出品 世界最大顯卡被「拆了」 7nm安培核心玉照示人

NV出品 世界最大顯卡被「拆了」 7nm安培核心玉照示人

今晚21點,推遲許久的GTC大會將在線上盛大舉辦。前兩天,老黃已經迫不及待地從自家烤箱中端出DGX A100計算平台,並且強調里面搭載了可能是世界上最大的顯卡。 這里的顯卡應該指的是Tesla A100,實際上是用於高密度計算的加速卡。所謂最大,外界猜測指的是GPU的Die(裸片)面積。 趕在今晚的活動之前,VCZ偷跑了Tesla A100的玉照。藏在散熱器下面的果然是一顆碩大的GPU核心,周圍還封裝着6片HBM2/HBM2E顯存。不過,PCB板子上的黃色金屬部分看起來有些非凡,難道是屏蔽罩或其它? 報道稱,Tesla A100的插槽和Volta V100並不兼容,核心面積超過了後者的840平方毫米(台積電12nm、211億個晶體管)。如果安培(Ampere)是基於7nm打造,晶體管規模可想而知。 另外,計算卡就緒了,遊戲顯卡還會遠嗎? 作者:萬南來源:快科技
Win 10果然是Bug 10 GPU占用率原來是這麼算的

Win 10果然是Bug 10 GPU占用率原來是這麼算的

從總體上來說,Windows 10是一個好系統,雖然我們天天戲稱它為「Bug 10」,但不可否認的是,從立項以來,開發團隊就一直在努力為它加入新的功能,其中有不少是相當實用的。 比如說,他們在1709這個大版本中,為任務管理器加入了GPU性能監控單元,用戶可以通過任務管理器直觀地看到目前的GPU占用率,比以往要開GPU-Z等程序方便了不少。 但很多用戶在實際使用的時候也發現了,這個針對GPU的性能監控好像不太準,我顯卡在全力計算的時候,任務管理器里面的GPU占用率怎麼這麼低? 比如我開個挖礦程序,顯卡的占用其實是滿的,但左邊GPU窗格中顯示的占用率只有3% 為了找出答案,我們找到了當時引入這項新功能時,開發者的講解Blog,由於是與圖形相關的內容,這篇Blog被歸入DirectX Developer Blog中。 首先開發者給我們講述了任務管理器是怎麼得知GPU的占用情況的。在Windows 10上面,GPU通過Windows Display Driver Model(WDDM,Windows顯示驅動模型)抽象,它的核心——圖形內核——負責抽象、管理和在所有進程分配GPU資源。 它含有一個GPU事務器(VidSch)和一個視頻記憶體管理器(VidMem),前者負責將GPU的各種引擎分配給想要使用它們的進程,並對訪問進行仲裁和優先級排序,後者則是負責管理GPU可調用的記憶體——包括專用的顯存和共享的系統記憶體。 任務管理器就是通過VidSch和VidMem回報的數據來計算GPU的使用情況的,這樣一來,不管程序使用了什麼API(DX、OpenGL、OpenCL,甚至CUDA、Mantle這種專有API都可以監控),它都能准確地收集GPU的占用情況,另外由於兩者是實際負責分配GPU資源的,位於驅動層面,它們回報數據的精準度也要比很多第三方工具要高,使得任務管理器有很高的精度。 既然有很高的精度,那它為什麼還是報不准我的GPU占用率呢?這就牽扯到另一個問題,GPU引擎。 現代GPU上除了有主要用於圖形、通用計算的統一計算單元外,還會集成一些其他的電路,比如說,用於視頻編解碼的專用模塊。它們之間的關系一般是並行的,GPU可以同時運行圖形計算和視頻編碼任務,在驅動層面,這些不同的模塊就被抽象為不同的Engine,也就是引擎,比如說一個典型的GPU可以有以下這些引擎: 在具體執行任務的時候,不同的任務會在不同的引擎上面執行,比如說我打遊戲,就用到3D引擎;我用顯卡加速Premiere Pro,就用到CUDA引擎;我用NVENC編碼視頻,就用到視頻編碼引擎。 一張RTX 2060顯卡被系統抽象出的引擎 由於部分引擎之間有復用的關系,比如說3D引擎和CUDA引擎復用CUDA Cores進行計算,那麼如果通過簡單加法來計算占用率,那這個占用率就有可能會超過100%。 開發團隊也考慮過使用平均利用率來表示,但也不靠譜。那3D引擎不是被用的最多嗎,就用它怎麼樣?也不太行,比如在視頻引擎滿載而3D引擎空載的情況下,它將會顯示0%的占用率,也是不准確的。最終,開發團隊選擇將當前最為繁忙的引擎占用率作為GPU整體占用率的代表。 恩……博文說的很好,那麼到今天為止這個功能上線也有一段時間了,其具體表現是怎樣的呢?讓我們看回頂上的那張圖,在GPU的CUDA引擎滿載的情況下,其左邊的整體占用率仍然很低,顯然是沒有達到開發團隊所說的。 我們又測試了一下別的情況,這里使用NVENC對視頻進行編碼,此時可以看到左邊窗格中的GPU占用率又跑到了滿載。 而在跑典型的3D應用程序的時候,它也很正常。 最後,我們嘗試了OpenCL負載,這次任務管理器又能反映出CUDA引擎的占用率了。 如此看來,任務管理器GPU占用率的薛定諤情況可能是Windows 10的一個Bug所導致的,在大部分情況下,它都會反映負載最大引擎的占用率,但在某些情況下,它並不能夠正確地顯示當前最繁忙引擎的占用情況。 來源:快科技
「海飛絲」後繼有人AMD大力支持GPUOpen項目 天天有新內容上線

「海飛絲」後繼有人AMD大力支持GPUOpen項目 天天有新內容上線

時鍾撥回到2016年,AMD啟動了GPUOpen項目,它是NVIDIA Gameworks遊戲特效的直接競爭對手。與NV推崇的閉源不同,GPUOpen完全開放,甚至允許開發者直接修改AMD的技術以適配特殊硬件的需求。 GPUOpen運行至今,為大家熟知的成果包括TressFX(「海飛絲「頭發特效)、FidelityFX(智能降低分辨率提高幀率等),應用它們的遊戲也是非常多,包括《巫師3》《無主之地3》《古墓奇兵》《戰爭機器5》等。 現在,AMD正在重建GPUOpen官網,並承諾在下一周,每天都上線新內容,為開發者帶來豐富的新「玩具」。 考慮到由AMD CPU/GPU技術支撐的新一代主機(索尼PS5、微軟Xbox Series X)將在年底發售,提前獲悉AMD的新技術將是令人興奮的事情,不妨拭目以待。 作者:萬南來源:快科技