安培 | 搜資訊

NVIDIA發布安培架構入門專業顯卡RTX A1000/A400：單插槽功耗區區50W

快科技4月17日消息，NVIDIA今天發布了兩款新的專業顯卡RTX A1000、RTX A400，從編號就能看出來定位入門級，而且架構並非最新的Ada Lovelace，還是上一代的Ampere。要知道，Ampere架構專業卡上次出新，還是兩年半之前的RTX A2000。 RTX A1000/A400都採用了單插槽、半高式設計，非常迷你，因為功耗只有區區50W，單風扇搞定，也不需要外接輔助供電。它們倆都集成了第二代RT光追核心、第三代Tensor張量核心、第七代NVENC編碼器和第五代NVDEC解碼器(支持AV1)。 RTX A1000的核心應該和RTX A2000一樣都是GA106，只有2304個CUDA核心、72個張量核心、18個光追核心，核心加速頻率1463MHz，FP32浮點性能6.74TFlops，這甚至還不如RTX 3050。顯存還是128-bit位寬的8GB GDDR6，帶寬192GB/。 RTX A400的核心應該是GA107，僅有768個CUDA核心、24個張量核心、6個光追核心，加速頻率1758MHz，浮點性能207TFlops，顯存也只有64-bit 4GB GDDR6，帶寬為96GB/。 RTX A1000現已出貨，RTX 400下月跟進。來源：快科技

老黃又要割韭菜了？RTX 3060還有新版本 NV狂清安培庫存

為了請安培的庫存，NV還在不斷的玩花樣，現在RTX 3060的新版本出來了，有玩家也是吐槽，老黃這是又要割韭菜了。今天早些時候，有媒體曝光稱，NVIDIA的板卡合作夥伴可能正在開發一個全新的GeForce RTX 3060變體型號，該特殊型號具有完整的GA106 GPU和3840個核心。這款未知的NVIDIA GeForce RTX 3060 3840SP型號提供3840個核心，120個紋理映射單元，112個張量核心和48個ROPS。該卡的記憶體是6GB的GDDR6記憶體，總線寬度為192位，二級緩存為3MB。支持DirectX 12 Ultimate，提供基於硬體的光線追蹤（30個光線追蹤加速核心）和可變速率著色，支持大多數現代遊戲。支持的其他圖形選項有OpenGL、OpenCL、Vulkan和CUDA。按照供應鏈的說法，這張卡只是NVIDIA GeForce RTX 3060 SKU中的另一個，它的誕生主要是為了清除安培庫存。 GeForce RTX 3060 GA104使用的是舊版晶片組，搭配8GB GDDR6記憶體，而GeForce RTX 3060 GDDR6X在記憶體方面提供了更新、更高的性能。有玩家也是很直白的吐槽，老黃這割韭菜都不帶停的，都什麼年代了還在玩3060，不過想想也是，人家根本不靠這個賺錢，企業市場的GPU需求還是很強烈的，看看最近大火的ChatGPT。來源：快科技

Meta豪購25億元NV安培GPU 打造世界級AI超算：性能怪獸來了

日前，Meta（Facebook母公司）宣布建造全球最強大的AI超算，名為AI Research SuperCluster（RSC）。其目標是最終運算速度（Linpack）達到220 petaflops（每秒22億億次），實際上，RSC已經投入運行，但後續還會追加運算節點。圖為DGX A100 當前，RSC的配置是760套NVIDIA DGX A100 AI系統，也就是1520顆AMD 64核EPYC處理器（第二代，代號Rome）、6080顆NVIDIA A100 GPU，未來會再追加1240套DGX A100系統，單GPU規模就多達16000顆（單顆顯存40GB）。 I/O方面，網絡帶寬200Gbps、175PB FlashArray、10PB FlashBlade以及46PB緩存。經查，DGX A100發布於2020年，單套系統售價高達19.9萬美元。也就是說，RSC最終完工時，單采購DGX A100就需要花費3.98億美元（約合人民幣25億）。來源：快科技

RTX 3060顯卡偷偷換新GPU了：GA104屏蔽核心出現

今後入手的RTX 3060顯卡，內部可能並非GA106-300核心，而是GA104核心屏蔽而來。搭載GA104修改版核心的RTX 3060顯卡，最早由TPU顯卡資料庫的維護編輯Matthew Smith發現。從紙面來看，GA106集成3584個CUDA，GA104則有多個版本，以用在RTX 3070 Ti上的GA104-400為例，集成6144個CUDA，顯然RTX 3060用的話自然要屏蔽。原因也很明白，晶片生產都有良率一說，但GA104廢片並非全不能用，GA104-400隻要保證60%的電晶體安好就行。類似的做法對NVIDIA來說也並非第一次了，說遠點GTX 1650、說近點如EVGA的RTX 2060 KO Gaming，內部GPU都是這麼搞。雖然有些玩家可能會介意，但實際上，以EVGA RTX 2060 KO Gaming（TU104-500核心）為例，在Blender渲染中，性能比TU106核心的原版RTX 2060要明顯好。來源：快科技

RTX 30系Super顯卡來了：桌面/筆記本齊發、本季投產

RTX 30系顯卡當前的陣容已經基本齊整，看起來到了准備小幅升級或者換代的時候。爆料達人Kopite7kimi日前給出消息，稱NVIDIA的RTX 30系Super顯卡快要來了，本季度就會投產。 Super後綴曾用在RTX 20系列顯卡上，性能變化幅度通常不大。Kopite7kimi也表示，Super系列的GPU延續8nm製程工藝。此前，外界傳聞Super顯卡服務的是12代酷睿筆記本產品，但此次的消息強調，桌面同樣有份。另外，他特別提到，RTX 30 Super顯卡是老黃為平滑邁向Ada Lovelace（下一代GPU核心代號）的過渡。按照早先的爆料，RTX 30 Super陣容中可能會出現GA103、GA103S這樣的新核心，前者是320bit位寬、後者是256bit位寬。來源：快科技

它的表現會讓你滿意嗎 RTX 3070 Ti首發評測：史上功耗最高的70顯卡

一、前言：完整的GA104核心終於來了這個世界，有競爭力才會有進步！2020年9月，NVIDIA Ampere架構發布之後，面對擁有10496個流處理器的頂級旗艦RTX 3090，沒人相信AMD還有翻身的機會。不過有了錢的AMD也不會讓玩家一直失望下去！2020年11月，經過大幅改進的RDNA2構架正式面世，在能效比方面有超越Ampere的趨勢！ RX 6900 XT性能與RTX 3090相差不遠，但價格卻遠低於後者。在中高端市場，RX 6800的在價格與RTX 3070差不多的情況下，性能又有著絕對的領先優勢。是時候展示一下老黃精湛的刀工了！一周前，NVIDIA發布了RTX 3080 Ti，對RX 6900 XT進行了全方位的精準打擊，而RX 6800的對手，則是今晚9點正式解禁的RTX 3070 Ti。 RTX 3070採用的是GA104-400核心，也就是沒有任何閹割的完整的GA104核心。製程工藝依舊是三星的8nm。它擁有6組GPC，48組SM單元共計6144個流處理器、96個ROP、192個紋理單元、192個第三代Tensor Cores、48個第二代RT Cores。搭配8GB美光GDDR6X顯存，顯存頻率19GHz、位寬256Bit、帶寬608GB/。在參數方面，RTX 3070 Ti與RTX 3070沒有太大區別，流處理器略微增加了256個，Tensor Core、紋理單元以及RT Core都同樣也小幅增加了一些。最大的變化來自於顯存。RTX 3070...

它的使命就是幹掉RX 6900 XT NVIDA GeForce RTX 3080 Ti首發評測

一、前言：它的使命就是幹掉RX 6900 XT！ RTX 3080 Ti誕生所經歷的曲折可謂一言難盡！在NVIDIA最初的計劃中，RTX 3080 Ti擁有20GB的大容量GDDR6X顯存，顯存位寬和帶寬與RTX 3080相同。不過誰也不曾料到AMD的RDNA2構架的強悍遠超出NVIDIA以及所有完全的事先預料。特別是RX 6900 XT的性能與NVIDIA頂級的RTX 3090相差無幾，但是售價僅有7999元，而後者則是11999元。很顯然，按照原定計劃，顯存帶寬被大量閹割的RTX 3080 Ti對上RX 6900 XT時並無必勝的把握。為此，NVIDIA重新設計了RTX 3080 Ti核心，雖然顯存容量減少到了12GB，但是完整的384Bit位寬得到了保留，顯存帶寬遠超RTX 3080。 NVIDIA賦予RTX 3080 Ti的使命就是幹掉RX 6900 XT！ GA102-225-A1構架圖完整的GA102共有7組GPC，每組GPC有6組TPC加16組ROP單元，總計是42組TPC、共計10752個流處理器、112個ROP單元、同樣的完整的GA102核心的每個TPC有2組SM單元、2個RT Core、8個Tensor Core、8個紋理單元。而RTX...

NVIDIA下兩代顯卡曝光：性能可達安培3倍

考慮到RTX 30系列顯卡的拼圖還沒有完整，安培的繼任者恐怕還需要一年半載才能正式登場。日前，爆料人Kopite7kimi提前給出了NVIDIA和AMD下代GPU的細節，考慮到時間尚早，內容僅供參考，有機會的話我們等正式發布後再來回溯靠譜程度。先看N卡這邊，Ada Love和Hopper的名字恐怕大家並不陌生，用於消費級的旗艦核心分別對應AD102和GH202（為什麼不是1開頭？……）。性能方面，FP32單精度浮點有望摸上100TFLOPs以上，要知道RTX 3090不過37T左右。據稱，AD102相較於GA102，性能是後者的2.2倍，GH202更是可以到3倍。即便是有5nm加持，這樣的幅度也有些超乎常理，不知道是不是說的能效（單位功耗性能）。 AMD這邊，RDNA3（Navi3X）的表現將略載AD102之上，性能是GA102的2.5倍，但仍輸給GH202。來源：快科技

GPU延遲對比：AMD RDNA2完勝NVIDIA安培

CPU緩存與記憶體延遲測試，相信大家都有所耳聞，但是GPU同樣的測試卻幾乎沒人做過。Chips And Cheese就做了一次特別的測試，對比考察了AMD、NVIDIA GPU架構的緩存、顯存遲問題。首先是AMD RDNA2、NVIDIA Ampere兩家最新架構的比拼，代表是RX 6900 XT、RTX 3090，前者在幾乎所有階段都完勝。 RNDA2架構創新性地加入了Infinity Cache無限緩存，提升帶寬的同時，延遲也可圈可點，二級緩存命中率上只增加了大約20ns的延遲，明顯低於Ampere。更驚人的是，RDNA2顯存延遲和Ampere幾乎一模一樣，但是別忘了，Ampere只有兩個層級的緩存，RDNA2卻有四個。 Ampere的緩存架構更加傳統，SM陣列私有一級緩存到二級緩存要增加超過100ns的延遲，RDNA2從零級緩存到二級緩存則只增加了約66ns。看起來，GA102核心面積過大，也直接增加了延遲。這正好可以解釋AMD RDNA2架構在低解析度下性能、能效更優秀，因為二級緩存、三級緩存延遲很低，更適合執行較小的負載。Ampere則相反，高負載下優勢明顯，比如說4K解析度。說完了GPU之間的對比，那麼GPU、CPU放在一起怎麼樣呢？這里以RX 6900 XT、Intel四代酷睿i7-4770為例來看看。 CPU的緩存自然不是一個級別的，所以這里Y軸用了線性數據，可以看到全程大大低於RDNA2，搭配DDR3-1600 CL9記憶體延遲只有63ns，RX 6900 XT、GDDR6的組合則有226ns，另外末級緩存平均延遲分別是53.42ns、123.2ns。再看看前幾代的NVIDIA GPU，包括Maxwell架構的GTX 980 Ti、Pascal架構的GTX 1080、Turing架構的RTX 2060 Mobile。 Maxwell、Pascal其實差不多，前者整體略高一些，可能是受制於晶片面積較大、核心頻率較低。 Turing則已經有了Ampere的樣子，一級緩存延遲低得多，二級差不多，奇怪的是顯存延遲在32MB之後偏高，原因未知。 AMD考察了TeraScale架構的HD 5850/6950、GCN架構的HD 7970，再加上RX...

曝NVIDIA打算為RTX 30全系顯卡換用新GPU：徹底扼殺挖礦

昨日有DIY媒體報導稱，NVIDIA已經逐步停產RTX 3060原本使用的GA106-300-A1 GPU核心，轉入GA106-302-A1的生產，計劃5月份交付。此次對挖礦的限制是底層級的，由於無法對應PCI ID，導致可破解挖礦開發版驅動瞬間失效。看起來，NVIDIA的動作幅度遠超想像。爆料人Kopite7kimi挖掘到，GA104-202、GA104-302、GA102-202和GA102-302這些全新核心均已現身，預計分別對應新版的RTX 3060 Ti、RTX 3070、RTX 3080以及RTX 3090。這也意味著，很可能今後市場投放的新安培顯卡，均做了底層挖礦限制。不過，電腦的世界里沒有什麼不可能的事，就看NV還會不會放水，民間黑客們對破解積不積極了。另外，如果消息坐實，那麼已經入手老款RTX 30顯卡的用戶，其在二手市場的流通價格必然會水漲船高，起碼短期內會是這樣。來源：快科技

NV發布A10/A30 GPU：安培架構 AI性能提升20倍

在今天的GTC2021中，NVIDIA宣布了一系列新的系統，進一步擴展了NVIDIA認證的伺服器生態，這些系統包括用於主流AI和數據分析的NVIDIA A30 GPU和用於支持AI的圖形、虛擬工作站以及混合計算和圖形工作負載的NVIDIA A10 GPU。基於Ampere架構的A10/A30 Tensor Core GPU分別基於GA102/GA100 GPU核心，擁有24GB的GDDR6/HBM2顯存。 Nvidia A10 Tensor Core GPU採用單槽全長尺寸，被動式散熱設計，核心基於GA102-890 SKU，擁有72組SM單元，9216個CUDA核心，其基礎頻率為855MHz，可加速至1695MHz，384-bit位寬，24GB GDDR6顯存、帶寬600GB/s，兼容PCIe 4.0。顯卡的TDP為150W，單8-pin供電接口。企業級NVIDIA A10 Tensor Core GPU支持主流NVIDIA認證系統中的加速圖形、渲染、AI和計算工作負載。它通過最新的NVIDIA Ampere架構+24GB顯存，在助力設計師、工程師、藝術家和科學家的工作時表現出色。 Nvidia A30 Tensor Core...

供不應求 RTX 30系顯卡將缺貨到三季度

比特幣已經突破6.1萬美元，由此也帶動其它數字貨幣甚至區塊鏈周邊利好。本就因為顯存、基板等原材料供應緊張、代工商良率較低等因素產能有限的遊戲顯卡，變得更加一卡難求。據最新消息，產業鏈評估稱，GeForce RTX 30系列顯卡供應緊張的狀況，還將持續一段時間，至少到今年三季度。當前全球半導體領域供應緊張的狀況比較普遍，汽車芯片供應緊張的狀況就已持續了多月，通用、福特等眾多汽車場廠商的生產計劃，都受到了影響，目前芯片供應緊張的狀況也已擴大到了消費電子領域，高通智能手機處理器的供應，就比較緊張。另外，有傳言顯存正在漲價中，且獲取難度增加，勢必會進一步影響到顯卡的製造。聯繫到日本PC Watch確認RTX 3060對以太坊挖礦的限制已被破解，對於PC遊戲玩家來說，情況不容樂觀。作者：萬南來源：快科技

NVIDIA財務官：就算沒礦潮安培顯卡業績也相當喜人

WCCFTech 報道稱，英偉達首席財務官 Colette Kress，剛剛參加了 Raymond James 的機構投資者經紀人電話會議。昨日舉辦的這場會議，選擇了線上虛擬出席的形式，而非往常的佛羅里達州奧蘭多市。在觀眾最喜歡的互動問答環節，Colette Kress 也不出所料地分享了一些有趣的觀點，尤其是關於最新的 RTX 30 系列 Ampere GPU 產品。 Colette Kress 表示：「我司在去年發布了面向遊戲玩家的 RTX 30 系列 Ampere GPU 新品，並且取得了巨大的成功」。隨着第二代 RTX...

NVIDIA CFO 沒有挖礦熱安培顯卡照樣能賺那麼多

上月末，NVIDIA公布2021財年第四財季及全年財報，其中季度營收50億美元，同比大漲41%，淨利潤14.57億美元，同比增加68%。全年營收達到了166.75億美元，淨利潤43.32億美元。分類來看，遊戲業務依然是最大頭，四季度達到24.95億美元，同比增加56%，全年達到77.59億美元，其次是數據中心。按照CFO Colette Kress說法，在數字貨幣火爆的四季度，礦工貢獻的收入僅1~3億美元。日前做客Raymond James機構投資者經紀人座談會時，Kress再度強調，有沒有挖礦熱對他們的遊戲季度並無影響，因為供應有限。因為需求旺盛，他還預計公司2021年（2022財年）的業績增勢將的都保持。至於挖礦的問題，Kress寄望CMP芯片能夠一定程度上緩解。作者：萬南來源：快科技

NV CMP HX系列礦卡曝光：頂級卡獨享安培架構

Techpowerup消息，NVIDIA新出的礦卡CMP系列中，只有極少數的CMP 90HX顯卡採用安培架構，基於PG132板（與RTX 3080相同），配備GA102-100 GPU。此型號默認情況下擁有320W的額定功率與10GB顯存。目前尚不知曉該芯片例如CUDA內核數目等其他信息。另外，消息稱CMP 30HX，40HX和50HX均基於12nm的Turing架構，其中CMP 30HX與40HX分別基於TU116核心(GTX 1660系列)與TU106核心(RTX 2060系列)，50HX將採用與RTX 2080Ti相同的Turing TU102核心。通過更新驅動程序，可以看到NV對30HX與40HX這兩張采礦卡的支持，而CMP 50HX和90HX預計要等到第二季度才能發布，但如果加密幣市場持續利多，GPU的供應也可能會延後。來源：遊民星空

英偉達頂級礦卡延續RTX3080設計方案獨享安培架構

<p最近英偉達發布了CMNP HX系列專用礦卡，對於其規格細節卻只披露了一些挖礦相關的算力、顯存、功耗指標。CMNP HX系列礦卡有四款型號，3月份首先上市的是兩款低端型號30HX、40HX，官方驅動已證實它們分別基於TU116核心(GTX 1660系列)、TU106核心(RTX 2060系列)，也就是12nm Turing圖靈家族。 <p根據最新消息，較高端的50HX也是圖靈架構，核心編號TU102 GPU-100，電路板設計則是RTX 2080 Ti公版的定製版，編號PG150。最高端的90HX，則唯一基於8nm Ampere安培架構，而且用的是高端核心GA102-100，電路板則是基本延續RTX 3080 PG132方案，同樣搭載10GB GDDR6顯存，整卡功耗320W。50HX、90HX最快要到4月份才會出貨上市，具體時間待定。 <p不得不說，英偉達新礦卡的命名很特殊，難以和GPU聯系起來，而將近三年前出的礦卡P104-100、P106-100就非常直白了，直接用了核心編號。 P104-100 P106-100 <p英偉達CMP HX系列礦卡的規格並不是嚴格固定，尤其是核心頻率、電壓等，可能允許廠商自由定製。有猜測認為，這種礦卡用的GPU芯片存在較大缺陷，比如CUDA核心基本完好，但是Tensor張量單元、RT光追單元、TMU紋理單元、ROP光柵單元、視頻和顯示單元等存在較大缺陷，無法作為正常遊戲卡使用，卻不影響挖礦，做成礦卡正好物盡其用。來源：遊俠網

NVIDIA GeForce RTX 30系列筆記本電腦GPU解析：更強的性能，更強的AI

NVIDIA在CES 2021上除了公布了新一代甜點卡GeForce RTX 3060之外，重點產品其實是GeForce RTX 30系列筆記本電腦GPU。其實在桌面市場上我們早已經見識過了NVIDIA新一代GeForce RTX 30系GPU，那相比GeForce RTX 20系翻倍的性能提升幅度，這得益於全新NVIDIA Ampere架構帶來的跨躍式進步，而現在GeForce RTX 30系列筆記本電腦也會是一次性能全面大提速。 NVIDIA首批發布的GeForce RTX 30系列筆記本電腦GPU包括GeForce RTX 3080、RTX 3070與RTX 3060，在CES 2021的發布會上，NVIDIA表示GeForce RTX 3080與RTX 3070是定位1440p解析度遊戲的，前者可在開啟光線追蹤技術的情況下，提供100+的FPS幀數表現，而後者則可提供90FPS最高畫質表現，目前搭載這兩款筆記本電腦GPU的遊戲本已經開賣，而GeForce RTX 3060筆記本電腦GPU則是面向1080p解析度遊戲的，可在最高畫質達到平均90幀的畫面表現。目前NVIDIA GeForce RTX 3080/3070 Laptop GPU是遊戲本上1440p解析度遊戲的最佳選擇，可提供最高畫質的同時帶來流暢的幀數，並且現在NVIDIA...

RTX 3060所用的GA106 GPU曝光，尺寸比GTX 1660系列用的TU116還小

在採用GA102的RTX 3090/3080和用GA104的RTX 3070/3060 Ti相繼發布之後，接下來NVIDIA要發布的就是RTX 3060顯卡了，這款新顯卡將會採用新的GA106 GPU，算上GA100的話這已經是NVIDIA Ampere家族的第四位成員了。 videocardz現在放出了GA106 GPU的諜照，他們表示完整版的叫GA106-400，擁有3840個CUDA單元，但最終發布的RTX 3060顯卡將使用擁有3584個CUDA的GA106-300，上圖的GA106-400是早期的工程樣品。 NVIDIA GeForce RTX 3060用的是16Gbps的K4ZAF3258M-HC16 GDDR6顯存，在GPU四周只安裝了6顆顯存，畢竟GA106隻有192bit的顯存位寬，可配6GB或12GB的顯存，而從上圖來看旁邊還有兩個顯存的空焊位，這代表著GA106應該是和GA104有相同的針腳，這樣可以降低AIC的開發成本，甚至可以直接用RTX 3060 Ti的PCB來用。 GA106 GPU的晶片尺寸是276mm2，和旁邊392mm2的GA104比起來小得多，和上代Turing GPU相比的話，RTX 2070/2060所用的TU106是445mm2，與GTX 1660系列所用的TU116是284mm2，可見GA106和它們比起來都要小很多。 ...

安培旗艦面前眾生平等，華碩RTX3090 TUF全面體驗

前言： 1997年的時候， Nvidia的Riva128是當年第一批3D加速卡中的佼佼者；1999年，Nvidia又是第一個推出了支持硬體T&L引擎的Geforce256顯卡；2004年，nVidia推出了支持DX9的像素/頂點著色3.0技術的6800系列顯卡；2007年，Nvidia發佈了CUDA通用技術技術；2012年，Nvidia的開普勒架構讓GPU進入能耗比時代；2018年，Nvidia再一次推動了歷史的車輪，圖靈架構宣佈了光線追蹤與人工智慧時代的到來。 2020年，第二代光線追蹤與第三代TensorCore集於安培新架構顯卡之中，除了強勁的性能以外，還有更多的AI人工智慧應用。 GA102核心總計7組GPC單元，每組有12組SM單元，總計84組，RTX 30系列顯卡視乎規格不同啟用的SM單元總數不同，RTX 3090是82組，RTX 3080是68組，RTX 3070是46組。 CUDA核心的FP32翻倍，每個SM單元中有4個分區，每個分區除了第三代TensorCore核心之外，還有一組是16個FP32單元及16個FP32、16個IN32組成的單元，後者可以同時執行FP32或者INT32運算。上一代圖靈結構給GPU領域提供一個創新的思路，就是加入了RT Core光線追蹤單元以及Tensor Core單元。光線追蹤給我們帶來真實的光影世界，而後者Tensor Core單元就是AI人工智慧領域的處理單元，除了革命性的DLSS深度學習多重採樣技術以外還能給我們在直播、圖片編輯多方面的人工智慧應用。當然了，DLSS已經發展到了2.0版本，配合RTX 3090顯卡強大的性能，8K DLSS遊戲成為可能。除了GPU本體之外，顯存技術這一代也升級了，上代的圖靈GPU首發了GDDR6顯存，這一次NVIDIA又迅速商業化了GDDR6X顯存，其中RTX 3090不僅頻率飆上了19.5Gbps，還達到了24G超聲波大容量。從上面的表格我們可以感受到新一代旗艦顯卡規格上面的強悍。當然了，得益於8nm技術，GA102核心面積反而比起上一代的Tu102小，但是集成的電晶體卻多了近100億。10496個CUDA單元比起上一代的4354提高了一倍有餘，RT core提升反而不多，Tensor cores數量大幅度減少，TDP提高到了350W。簡單來說，安培架構的GA102集成度提高超過50%，TDP也提升了90W，可以說必然是功耗、溫度都有了新的需求。Nvidia僅僅提供晶片和公版參考方案，真正如何釋放RTX3090全部威力還是要看顯卡廠家的表現，那麼作為一線品牌的華碩，會給出怎樣的答案呢？下面就開始我們的評測體驗。外觀篇：全面評測的話，圖片自然非常多，為了節省大家時間，外包裝的部分直接跳過，我們還是來直接看主體吧。外觀而言。TUF電競特工走的是簡約硬派的風格，簡約不代表簡單，TUF Gaming沿用了ROG STRIX系列之前的專有軸流風扇，3個90 mm的風扇採用逆風設計，可減少氣流乾擾，提高散熱效率，並降低風噪，可以說下足本錢。華碩專利設計的軸流風扇，減小了風扇輪轂的尺寸，可放入更長的葉片，同時增加了一個密封圈，可以增加向下的風壓同時降低噪音。過往這種風扇是用在STRIX系列的，這次TUF也裝備上，看得出華碩誠意充足。 TUF RTX 3090和大多數其他非公RTX 3090有一些不同，為了更好地兼容大多數中塔機箱，採用了緊湊型設計，顯卡的長度只有29．9cm，不過將高度增加到了12cm，因此散熱器的規模是不減反增。 TUF Gaming RTX 3090採用雙8Pin供電接口，加上PCIe插槽的供電，一共可以提供375W的功率，比起TDP的要求有一定冗餘，更加安全。而TUF標誌是帶RGB背光，當然了，更支持AURA神光同步，一整套華碩板卡的話，效果更加炫酷。 TUF RTX...

NVIDIA專業圖形加速卡RTX A6000上市配48GB顯存、3.6萬元一張

日前，NVIDIA宣布，早在今年10月發布的RTX A6000，正式上市。 RTX A6000是一款面向專業領域的圖形加速卡，應用場景包括設計產品、打造建築、科學運算、沉浸式娛樂創作等。基本規格方面，A6000基於完整的GA102 GPU核心打造，內建10752個CUDA核心，單精度浮點性能達到了38.7TFLOPs，比RTX 3090多出3.1T。顯存容量48GB，類型是GDDR6（16Gbps，GDDR6X單芯片容量低故未被採納），支持ECC校驗。造型方面，A6000採用了傳統的渦輪直吹風扇設計，配有NVlink金手指，可搭建96GB顯存的雙卡系統，PCIe 4.0 x16插槽，提供4個DP 1.4接口（沒有HDMI）。另外，卡長接近27公分，最大功耗300瓦。 PNY在在已經開賣這款加速卡，定價5500美元（約合3.6萬元）。作者：萬南來源：快科技

安培大核心火了中國八大巨頭集體擁抱NVIDIA A100

NVIDIA今天在GTC大會上宣布，多家中國頂級雲服務提供商、系統製造商都部署了NVIDIA A100 Tensor Core GPU、NVIDIA技術，為各種AI應用提速。今年5月，NVIDIA推出了首款基於安培架構的A100 GPU，台積電7nm工藝製造，集成多達542億個晶體管，核心面積達826平方毫米，內置6912個FP32 CUDA核心，最高加速頻率1.4GHz，搭配512-bit 40GB HBM2顯存，帶寬達1.6TB/。相比上代伏特架構的V100核心，它的INT8推理、FP32訓練性能提升20倍，FP64計算性能提升2.5倍，是歷史上進步最大的一次。 A100 GPU還配備了精度更高的第三代Tensor Core張量核心、GPU間傳輸率高達600GB/的第三代NVIDIA NVLink、NVIDIA NVSwitch、PCIe 4.0、NVIDIA Magnum IO軟件SDK，可實現成千上萬個GPU集群的高效擴展。部署A100的中國雲服務商有：－阿里雲已發布gn7 GPU系列雲服務器，內置8塊A100，主要面向AI訓練和高性能計算應用，可提供新一代GPU計算實例，相比上一代平台AI性能提升最高20倍，高性能計算提升2.5倍。－百度智能雲即將推出lgn3 GPU系列雲服務器、vGPU雲服務器、百度太行裸金屬服務器。最多搭載8塊A100 GPU、8TB NVMe SSD、數百G帶寬，主要面向AI訓練/推理、高性能計算應用、科學計算等場景，計算能力20倍於上代V100。－滴滴雲 A100裸金屬服務器，配置8塊A100...

283億晶體管怪獸顯微鏡下看NVIDIA RTX 30核心

芯片顯微拍照大神Fritzchens Fritz終於對NVIDIA RTX 30系列下手了，拆開一塊RTX 3090，拍下了GA102核心的內核圖，而芯片分析大神Locuza藉此研究了GA102核心的內部模塊布局。 RTX 3090使用的GA102-300-A1 GPU核心。由於裸露在外而沒有散熱頂蓋，很容易觀察到。它採用三星8nm工藝製造，集成283億個晶體管，面積628.4平方毫米。這張高清圖上，可以一目瞭然地看到GA102核心的布局。對比NVIDIA官方公布的核心照渲染圖，可以發現實際照片與之符合得非常好。一般來說，這種展示芯片結構的渲染圖都會做很多修飾和調整，使之更加美觀，但是看起來NVIDIA對於GA102非常自信，基本原貌展示了出來，當然細節上還是有很多差異。從這兩張圖上，可以看到GA102核心的諸多模塊，RTX 3090使用的是閹割殘血版，而這里能看到所有單元。 GA102核心共有7組GPC(圖形處理集群)，每個GPC內包含6組TPC(紋理處理集群)，而每組TPC內包含兩組SM(流式多處理器)，最後每一組SM內包含128個流處理器，整個核心總計10752個流處理器(RTX 3090啟用了10496個)。當然，安培架構的流處理器已經不再那麼單純，細分的話包括FP32浮點核心、INT32整數核心，這里就不展開了。另外，從圖上還可以看到兩組NVLink互連控制器、12組共384-bit GDDR6X顯存控制器、24塊總計6MB二級緩存、指令前端、幾何處理器、光柵處理器、幾何引擎、光柵引擎、ROP光柵單元等等。不過仍有很多地方無法識別究竟何用，也不確認顯示控制器、PCIe 4.0控制器等等到底在哪里，另外RT光追單元、Tensor張量單元也無法直接看出來。作者：上方文Q來源：快科技

果然比RTX 2080s要強RTX 3060 Ti首發評測第一款買得起的安培甜點

一、前言：安培甜點正式到來也許有很多同學懷念10年前價格不到1500元的「甜點「顯卡，比如GTX 460。再往前回溯5年，ATi Radeon X1650 PRO更是只要699元就能買到，而它的確是一張擁有當年頂級顯卡6成性能的「甜點」。 15年前的「甜點「，擁有ATI X1950 PRO六成的性能很難想象RTX 3060 Ti如果只賣699元會怎樣，事實上這也是不現實的！當年賣699元的「甜點」，不論是做工還是功能方面都無法和當今的千元卡相比。時代在變，想要「甜點」回到當初千元以內的價位或許只能是存在於回憶中遙不可及的夢想了。不過這一次安培構架的發布多少給了玩家一些安慰，RTX 3080隻需一半的價格就提供了比上代RTX 2080 Ti多出30%的性能。可是即便如此，5499元也不是大多數玩家能夠承受的售價。沒有讓大家等太久，在RTX 3080上市僅僅2個月之後，RTX 3060 Ti也終於來到了大家面前。這也是安培構架第一款售價在3000元以下的甜點產品。 RTX 3060 Ti是在RTX 3070的GA104-300核心上閹割一刀後的產物，核心代號為GA104-300，晶體管規模達到了174億，芯片面積392平方毫米，擁有5組GPC，內建有4864個CUDA核心，同時有152個紋理單元、80個ROP單元、152個Tensor核心、38個RT核心。從上面的參數規格表可以看出，RTX 3060 Ti的規格與RTX 3070比起來，剛好就是拿掉了1組GPC，從原來的6組變為了5組，整體上的參數規格少了1/6。唯一沒有被閹割的就是顯存，依舊是4個帶寬為64bit的雙通道顯存控制器組成了總量為256bit的顯存控制單元，大小為8GB，帶寬448GB/。關於安培GPU流出器效能的說明：通常衡量GPU流處理器的指標為FP32的運算能力，Turing架構上採用的為FP32和INT32的對等數量設計，而由於當今的遊戲中對於FP32的需求越來越多，因此在Ampere架構上採用了更靈活的設計，原本只能計算INT32的流處理器中有一半可以更靈活的執行FP32或INT32。這樣的設計讓FP32的運算能力大幅加強，同時避免了INT32的算力浪費。從絕對的流處理器數量上來看雖然並沒有實際上看到的那麼多，但是架構的創新顯著提升了FP32的處理能力，同時避免了INT32閒置的性能浪費。對浮點運算越敏感的應用，在新的架構下獲得的性能收益就越大。大體上，RTX 30的流處理器數量除以1.5，就約等於RTX...

RTX 3060 Ti FE公版諜照曝光更便宜的安培顯卡

在傳言的12月2日發布時間到來前，VCZ搶曝了GeForce RTX 3060 Ti Founders Edition諜照。公版造型和RTX 3070類似，也就是兩把風扇都在正面，而非3080、3090的一正一反。背部卡身的末端為鏤空設計，這樣做首先是因為PCB很短，其次可以保證風扇吹透散熱鰭片。卡身並不長，恐怕等於甚至比RTX 3070 FE的24厘米更短些。外接供電雖然看不到，但爆料說仍是一組12Pin。那麼和RTX 3070如何區分呢？背部的產品名一目瞭然，另外，RTX 3060 Ti上的銀白色裝飾條顏色非常淺，3070則深了許多。其實，i姓、A姓、G姓等諸多AIC的非公RTX 3060 Ti也在網絡渠道偷跑了，新卡上市已經是板上釘釘的事情。回到直面參數，RTX 3060 Ti內建4864個CUDA，GA104-200核心，也就是較RTX 3070砍了1024個CUDA，80個光柵單元，38個光追核心，搭配8GB GDDR6顯存（256bit，14Gbps），GPU基礎頻率1410MHz，加速頻率1665MHz。性能方面，據說設計目標是完美取代RTX 2080 Super。首發零售價傳言399美元，按照這一代安培顯卡美版、國行價格的換算比例，預計落在2999~3199元左右。作者：萬南來源：快科技

RTX 3050曝光 90瓦的甜點卡也有光追

在RTX 3090/3080 Ti/3070後，據說NVIDIA的下一站是RTX 3060 Ti，大概率12月2日發布。不過，RTX 3060 Ti恐怕2000元打不住，如果預算有限，那麼不妨再等等RTX 3060。爆料好手Kopite給出的消息是，RTX 3050基於GA107-300核心打造，內建2304個CUDA核心，總卡功耗只有90瓦。從RTX的名號可知，即便是被精yan簡ge到如此程度，它依然保留了部分RT Core單元，可實現硬件級的光線追蹤效果，這也是x50系列第一次嘗鮮完整的硬件光追。至少在1080P或者1440P的畫面級別，配合NVIDIA強力的DLSS技術，開啟光追後的幀率不至於過於難堪。顯存方面就別奢望了，4GB起步？從RTX 3060 Ti的情況來看，RTX 3050以及傳言中的RTX 3050 Ti(3584個流處理器，GA106核心)恐怕要等到明年春季上市了。作者：萬南來源：快科技

啟用4K 120Hz後NVIDIA安培顯卡黑屏原因找到 HDMI 2.1芯片BUG導致

對於一些部署家庭影院的用戶來說，AV機或者功放基本上是必不可少。不過，日前有用戶反饋稱，連接在AV接收機上的NVIDIA安培顯卡或者Xbox Series X在開啟4K 120Hz後，會間歇性出現畫面黑屏。在Heise的一篇報道中確認了問題的源頭，原來是這些AV接收機採用的是松下提供的HDMI 2.1芯片，其存在BUG。目前歸納到被波及的品牌有天龍（Denon）、馬蘭士（Marantz）和雅馬哈。需要注意的是，索尼PS5等硬件同樣連接這些AV接收機，4K 120Hz則不會有問題。在官方未給出解決方案前，臨時的辦法是降低顯示刷新率或者切換到HDMI 2.0b接口。另外一個方式是使用電視的eARC HDMI連接受影響設備，這樣的缺點是，AV接收機只用於處理音頻信號。據稱松下已經開始生產沒有BUG的HDMI 2.1芯片，這意味着後續通過軟件升級恐怕不能屏蔽，需要硬件換新。 - THE END - 轉載請註明出處：快科技 #HDMI#天龍#雅馬哈#安培責任編輯：萬南作者：萬南來源：快科技

NVIDIA GeForce RTX30系列移動版曝光，四款晶片正在路上

據GiggleHD報導，NVIDIA的GeForce RTX 30系列移動版GPU目前正在開發中，針對安培架構的移動款，NVIDIA至少准備了四個版本。該高端移動產品系列的首份規格已經發送給了合作夥伴，預計我們可以在CES2021之前看到相關產品。目前NVIDIA開發進行中的四款RTX 30移動系列GPU，包括RTX 3080、RTX 3070和RTX 3060的MAX-Q/MAX-P雙版本。消息人士透露，NVIDIA已經確定初步規格，並正在向廠商交付首批訂單。GeForce RTX 30系列移動產品將取代基於Turing GPU架構的現款RTX 20移動系列產品，給消費者提供更強的遊戲或者設計性能。圖片來源：@ harukaze5719 目前的消息指出，NVIDIA GeForce RTX 3080移動版將僅具有Max-Q版本，因為Max-P版本對移動設備來說功耗過高。我們期望RTX 3080Q移動版的規格能夠接近RTX 3080台式機版本，但GPU頻率肯定會大大降低。另外NVIDIA還可能使用GDDR6而非GDDR6X作為RTX 3080 Max-Q的顯存。 NVIDIA GeForce RTX 3070移動版也將僅有Max-Q版本，GPU可能具有與桌面端相同的規格，但頻率和TDP將作出較大的變動。不久之前泄露的參數表明，其採用海力士的GDDR6顯存速率為12Gbps，而桌面版則為14Gbps。最後，NVIDIA GeForce RTX 3060移動版將基於精簡版的GA104或者GA106核心打造，並且提供Max-Q與Max-P兩個版本。我們將在明年的一系列的筆記本電腦中看到這些新的GPU。 ...

滿血安培RTX A6000專業卡性能首曝僅提升11％

日前，NVIDIA發布了基於安培架構的新一代工作站專業顯卡RTX A6000、數據中心計算卡A40，其中前者開啟了GA102核心的全部10752個CUDA核心——桌面遊戲卡RTX 3090隻有10496個。，此前已經放棄Tesla計算卡品牌。 RTX A6000還搭載了48GB GDDR6顯存，支持ECC錯誤校驗，四個DisplayPort 1.4輸出接口，PCIe 4.0 x16系統總線，整卡功耗300W。相比之下，上一代圖靈架構的RTX 6000擁有4608個CUDA核心、24GB GDDR6顯存，整卡功耗295W。 RTX A600 那麼，滿血的「安培」實力如何呢？外媒首次曝料了RTX A6000 SPECviewperf 2020的實際跑分，八個項目相比於RTX 6000提升最多21％、最少8％，平均約為11％。架構升級，CUDA核心增加1.3倍，顯存翻番，性能提升才這麼點？確實有點難堪，只希望是優化還不到位，後續仍有潛力可挖。 - THE END - 轉載請註明出處：快科技 #NVIDIA#顯卡#安培責任編輯：上方文Q作者：上方文Q來源：快科技

Blender資料庫走漏風聲，RTX 3090渲染性能比RTX 3080快20%左右

上星期NVIDIA的RTX 3080顯卡解禁了，雖然他的性能遠超上代的RTX 2080 Ti，但它並不是這代中性能最好的，這個星期RTX 3090就會解禁，不過它的定位其實更接近與上代的TITAN RTX，並不是一款單純的遊戲卡，24GB的顯存也讓它很適合用來當成一張創作卡，或者說，准專業卡。現在渲染引擎Blender上已經有RTX 3090的Benchmark成績了，從測試結果來看RTX 3090的渲染速度比RTX 3080快20%左右，這也正好符合他們兩個內核的規格對比，RTX 3090有10496個CUDA單元，而RTX 3080則是8704個，正好相差20%。不過這個數據是用CUDA測試的結果，如果使用Optix的話會更快，RTX 3090與RTX 3080在CUDA渲染的情況下運行Blender Open Date Benchmark結果如下：順帶一題RTX 3090的解禁時間是在9月24日晚上9點，它的售價是11999元，比5499元的RTX 3080貴多了，說真的NVIDIA也沒把它當作遊戲卡，它的定位更加傾向於專業卡，也就是類似TITAN RTX的定位。 ...

NVDIA安培Quadro顯卡曝光 CUDA規模超RTX 3090

有跡象顯示，NVIDIA正在准備基於安培架構的Quadro產品線專業顯卡，預計下月發布。國外爆料截圖顯示，至少有一款Quardo顯卡配置了多達10752顆CUDA核心，僅從CUDA規模來看，比RTX 3090還多257個CUDA。不過匹配的是48GB容量GDDR6顯存，而非GDDR6X。當然，16Gbps的GDDR6也是當前最高針腳速度了。算上384bit，總帶寬是768GB/，只比RTX 3080多8GB/。有傳言新一代Quadro顯卡將採用Ax000的命名，當然，遵照慣例推斷，直接從RTX 8000迭代為RTX 8100的可能性也還不能排除。考慮到10月5日有NVIDIA的GTC online活動，或許我們有機會一睹Quadro真容。作者：萬南來源：快科技

RTX 3060 Ti被曝將於10月下旬登場性能或看齊RTX 2080

RTX 30系顯卡已經發布了三款，最便宜的RTX 3070（公版建議零售價3899元）定於10月開售。來自VCZ的最新消息稱，NVIDIA已經通知AIC夥伴，准備10月下旬推出RTX 3060 Ti，進一步完善GeForce Ampere顯卡的家族陣容。看來，10月將是A、N新一代顯卡火星撞地球的時候，因為10月28日就是RDNA2的發布時間。NVIDIA此舉也可以看作築起一道更加牢不可破的堅門，把AMD RX 6000系列可能的突破點給堵死。回到顯卡本身，據說3060 Ti基於GA104-200核心打造，也就是從RTX 3070減yan配ge而來，內建多達4864個CUDA核心，最高8GB GDDR6顯存（14Gbps，448GB/帶寬），熱設計功耗180~200瓦。實際上，4864個CUDA的規模比RTX 2080 Ti(4352個CUDA)還要高，這可能也是RTX 3070號稱4K遊戲平均性能比RTX 2080 Ti還要優秀的原因。我們有理由相信，RTX 3060 Ti在部分遊戲或者測試中，可以比肩RTX 2080。作者：萬南來源：快科技

公版RTX 3060曝光 16公分短小精悍

安培架構的GeForce顯卡首發最終落定了三款，隨後，聯想的台式機配置單又搶跑了RTX 3070 Ti/uper。正如你所知道的，最便宜也得3899元。雖然RTX 3070號稱平均性能（4K遊戲）比RTX 2080 Ti還要強點，可並不是所有DIY用戶都願意投入這樣的花費或者有這麼高的遊戲需求。所以，RTX 3060同樣讓人期待。繼在EEC數據庫中現身後，Slashleaks曝光了所謂RTX 3060公版的造型。圖片來看，RTX 3060公版可謂短小精悍，恐怕長度只有16公分左右，單風扇設計。不過要說參考性有多大，其實從右側的所謂6GB GDDR6X就露餡了，「三哥」RTX 3070可都還沒染指G6X顯存呢。結合RTX 3070的首發價格，RTX 3060應該1999~2500元左右，希望年底前能見到，以甜點小鋼炮終極殺手的身份。作者：萬南來源：快科技

安培顯卡讓次世代主機一項技術在PC上實現

NVIDIA公布了RTX IO，這是NVIDIA新公布安培顯卡的其中一個新功能，承諾能利用顯卡處理來自高速SSD的數據，減輕玩家CPU的負載。這意味着NVIDIA將次世代主機（XSX/PS5）才有的功能帶到了PC上。 RTX 30系列顯卡光追DEMO： RTX IO是一個高吞吐量解壓縮加速方案，被應用在RTX 30系列顯卡上，NVIDIA表示RTX IO的吞吐量是傳統的CPU解壓縮技術的100倍，CPU使用率降低了20倍。 RTX IO支持微軟的Windows DirectStorage功能，也就是我們之前在Xbox Series X上看到的同一個技術。考慮到微軟此前在公布XSX硬體規格時就提到他們從一開始就為DirectStorage API技術鋪好了桌面計劃，所以該技術這麼快就登陸PC也不足為奇。實際上，該API和RTX30系列顯卡才有的GPU加速方案目標是加速數據解壓縮任務，這樣就能使渲染一個高精細度、高分辨率場景的渲染任務落到顯卡的身上，而不是CPU。雖然CPU速度很快，但位於GPU上的專用硬件單元肯定要快得多——這意味着玩家可以更快地加載廣闊而美麗的開放世界。 NVIDIA表示：「這提供了基於GPU的無損解壓縮，以及專為遊戲工作負載設計的低階超高效率API。正如我們在 RTX與DirectX Raytracing中所做的那樣，我們會與微軟密切合作，確保RTX IO在Windows API上的DirectStorage中運作順暢。使用DirectStorage，可讓新一代遊戲充分運用啟用RTX IO的硬體、加速載入時間，並提供更大的開放世界，並同時降低CPU負載。理論上RTX IO意味着將有更少的等待數據到達GPU，所以它可以繼續做它最擅長的：咀嚼多邊形和像素。這也意味着和次世代主機玩家一樣，我們將很快看到PC玩家對同類高帶寬SSD的需求也會猛然上漲。遊戲被傳統IO所限制非常需要壓縮的數據，但CPU速度跟不上 RTX IO公布 RTX 3080：來源：3DMGAME

NVIDIA RTX 30系列規格曝光，下個月三卡連發

9月份Intel和NVIDIA都有大動作，Intel會發布Tiger Lake處理器，而NVIDIA則會為大家帶來RTX 30系列顯卡，可以確定的是NVIDIA會在9月發布RTX 3090、RTX 3080和RTX 3070三款顯卡，其中RTX 3080會打頭陣在9月2日發布，另外兩款會稍後跟進，此後今年內還會有RTX 3060。 VideoCardz已經放出了RTX 30系列較為完整的規格，包裝盒也曝出來了，旗艦的RTX 3090會配備24GB的GDDR6X顯存，它採用GA102-300核心，採用7nm工藝生產，公版PCB是PG132 SKU 30，這顯卡擁有5248個CUDA單元，核心的Boost頻率是1695MHz，顯存位寬384-bit，顯存頻率19.5Gbps，總顯存帶寬936GB/s，TGP高達350W。而RTX 3080則採用GA102-200核心，公版PCB是PG132 SKU 10，CUDA單元數量減少到4352，核心Boost頻率1710MHz，同樣配備GDDR6X顯存，不過顯存容量只有10GB，顯存帶寬也減少到320bit，顯存頻率19Gbps，顯存帶寬760GB/s，TGP是320W，可見他和RTX 3090差距還是蠻大的，不過據說之後會推出20GB的RTX 3080。 RTX 3090與RTX 3080 Founders Edition顯卡都會採用新的12pin供電接口，不過各個廠家所產的顯卡都會沿用雙8pin供電口。 RTX 3070的推出時間大概會在9月底，GPU是GA104-300，暫時不清楚會用什麼工藝，公版PCB是PG142 SKU 10，CUDA單元數量未知，它會配備8GB GDDR6顯存，顯存位寬256-bit，顯存頻率16Gbps，顯存帶寬512GB/s，顯卡TGP是220W。 NVIDIA的安培架構會採用第二代RT光線追蹤核心，第三代Tensor張量單元，並且升級支持PCI-E 4.0，支持DP 1.4a和HDMI 2.1。 ...

7nm安培勢頭太猛發布2個月就貢獻1/4服務器營收

NVIDIA今天發布了2021財年Q2財報，營收38.7億美元，大漲50%，淨利潤13.7億美元，大會79%，，大漲167%，首次超過了GeForce遊戲卡業務。 NVIDIA上季度中數據中心業務大漲有多個原因，其中很重要一點就是7nm安培顯卡，今年5月份正式發布A100加速卡，到7月底不過2個月時間，它就貢獻了數據中心業務1/4的營收了。按照17.5億美元的營收來算，1/4大概就是4.4億美元，差不多是30億人民幣，雖然我們不知道A100加速卡的具體售價，但是超過1萬美元太容易了，估計差不多賣出4萬塊了。當然，考慮到DGX A100的存在，實際數量可能會更少一些，這麼一算2個月時間出貨至少是3-4萬塊A100加速卡的樣子。與上代Tesla V100發布之後期貨了大半年的情況不同，7nm安培這一代直截了當，NVIDIA發布的時候就已經開始出貨了，畢竟GTC大會原本是3月份召開的。對NVIDIA來說，A100加速卡現在還是產品發售的初期，增長勢頭才剛剛開始，2個月時間就已經這麼猛了，後續前途無量。 NVIDIA的A100核心是台積電7N工藝，核心面積826mm2，542億晶體管，集成108組SM單元，SXM4架構，6912個CUDA核心。 Tensor Core減少到了432個，但是性能大幅增強，支持全新的TF32運算，浮點性能156TFLOPS，同時INT8性能624TOPS，FP16性能312TFLOPS。顯存方面，A100配備的也是HBM2顯存，頻率從1.75Gbps提升到了2.4Gbps，位寬5120bit，相比V100的4096bit增加了1024bit，容量也從16/32GB增加到了40GB。作者：憲瑞來源：快科技

RTX 3090 PCB板泄露 3x8pin供電、NVLink金手指變樣了

黃仁勛已經確認，定於9月1日發布新一代GeForce RTX顯卡，採用Ampere安培架構，有望命名為RTX 30系列。本周，網上出現了疑似對應RTX 3090的PCB板，據說來自某三方廠商。先看GPU核心部分，周圍有11顆存儲芯片，排布異常緊湊，可能是GDDR6X，數量有些怪。注意看GPU部分，出於保密緣古用了一顆Intel處理器遮擋，泄密者稱雖然是背面，但的確有一顆新芯片鑲嵌在這里。接着看見右上角的金手指部分，和RTX 2080 Ti一比，區別很明顯，NVLink變樣了，恐怕是為傳輸更大帶寬做調整。供電方面看左上角，3x8 Pin，並未見到之前爆料過的12Pin。如果確定對應RTX 3090的話，那麼PCB版應該是GA102-300，內建5248個CUDA，PCIe 4.0接口。之前還有消息，公版RTX 30系顯卡不僅採用了正反雙面風扇，甚至PCB也是壓縮成了異形，至少非公依舊還正常着。作者：萬南來源：快科技

傳言NVIDIA會在9月9日發布安培，旗艦顯卡有24GB顯存

此前有許多消息都稱NVIDIA的下一代顯卡安培會在9月份發布，此前有傳聞說是9月17日，但現在GamersNexus說發布時間是在9月9日，比此前的發布時間提早了一個星期，現在離顯卡發布還有一個月左右，NVIDIA也有可能隨時調整發布時間，不過在發布前一個星期，NVIDIA應該會在社交媒體上放出預告。至於NVIDIA會發那些顯卡，根據Wccftech的消息，在9月份會發布三款產品，旗艦產品採用PG132-10 PCB，配備384bit/24GB顯存，會用於取代RTX 2080 Ti，此外還有用來取代RTX 2080 SPUER，使用PG132-30 PCB，配備320bit/10GB顯存，還有一款RTX 2070 SUPER的繼任者，採用PG142-10 PCB，配備256bit/8GB顯存。 10月份發布的則有採用PG132-20 PCB，配備320bit/20GB顯存的顯卡，基本上它就是上面那款採用PG132-30 PCB的產品顯存容量翻倍的產品。還有兩款未定發布時間，分別是採用PG142-0 PCB，配備16GB顯存，顯存位寬暫時未知，它同樣是用來取代RTX 2070 SUPER的，而RTX 2060 SUPER的繼任者將採用PG190-10 PCB，配備256bit/8GB顯存。以上產品的核心規格和顯存類型均沒有透露。 ...

NVIDIA安培打破16項世界紀錄一年半性能暴增4倍

NVIDIA宣布，根據最新發布的MLPerf基準測試結果，NVIDIA在全球市售商用產品中，具備全球最快的AI訓練性能，並創造了多達16項的世界紀錄。其中，在加速器的全部八項MLPerf基準測試中，NVIDIA A100都展現了最快的性能，同時基於2000多顆A100處理器、多個DGX A100系統互連的龐大集群DGX SuperPOD，也開創了八項全新的性能里程碑，而這一切都來自於NVIDIA最新打造的Ampere安培架構。集成2000多顆A100 GPU的全新DGX SuperPOD 行業基準測試組織MLPerf成立於2018年5月。這已經是NVIDIA在MLPerf訓練測試中連續第三次表現如此搶眼——2018年12月，NVIDIA第一次上陣就創下了六項紀錄，次年7月再次打破八項紀錄。最新的測試結果顯示，相較於首輪MLPerf訓練測試中使用的基於Volte伏特架構V100處理器的系統，如今的DGX A100系統能夠以相同的吞吐率，實現高達4倍的性能提升，這一切都是在僅僅一年半時間里做到的。同時得益於最新的軟件優化，基於NVIDIA V100的DGX-1系統還可以實現高達2倍的性能提升。更關鍵的是，NVIDIA是唯一一家在所有測試中，都採用市售商用產品的公司，而其他大多數提交測試的產品，要麼還是預覽階段，還得幾個月才會上市，要麼就是純研究類別的產品，很長時間內都不會面世。 NVIDIA A100是全新安培架構的首款產品，進入市場的速度比以往任何NVIDIA GPU都更快，比如發布僅僅六個星期就登陸Google Cloud，並得到了AWS、百度雲、微軟Azure、騰訊雲等雲巨頭，以及戴爾、慧與、浪潮、超微、聯想、華碩、技嘉、思科、富士通等數十服務器製造商的採納。迄今為止，，其中30多款在今年夏天上市，另外20多款前年底前推出。至於安培架構的遊戲顯卡，最新消息稱，，RTX 3070、RTX 3060 10月和11月陸續跟上。作者：上方文Q來源：快科技

碾壓圖靈43％NVIDIA安培第一個跑分震撼出爐

NVIDIA Ampere安培架構已經發布兩個多月了，相關服務器產品越來越多，但在此之前，我們從未見過它的實際性能數據。現在，全息渲染公司OTOY的CEO Jules Urbach終於滿足了我們的好奇心。 NVIDIA安培架構的第一個產品是A100計算加速器，7nm工藝製造，集成6912個CUDA核心、40GB HBM2顯存，支持PCIe 4.0。本次測試是用的工具是OctaneBench，用來衡量OctaneRender渲染性能，也是第一個商用的能夠完全利用GPU進行加速的光線追蹤渲染器，但因為依賴於CUDA技術，所以僅NVIDIA顯卡。 NVIDIA A100在此測試中拿到了446分，是迄今為止的最高紀錄，Jules Urbach宣稱它比圖靈產品快了43％！我們不知道他說的是哪一款圖靈產品，不過在OctaneBench測試中，圖靈家族最好的成績來自GRID RTX 8000，跑分為328，A100比之領先36％。 Volta伏特架構因為專攻加速計算，表現其實好於圖靈，Titan V、Tesla V100、Quadro GV100的最好成績分別是401、371、354，A100比之領先11-33％不等。至於安培架構的RTX 30系列遊戲卡，不出意外將在9月份到來，首發可能就有兩款，包括RTX 3080、RTX 3080 Ti。推薦商品信息作者：上方文Q來源：快科技

RTX 30系顯卡要上600瓦？單12Pin外接供電口被進一步證實

日前，fcpowerup曝光了可能用於NVIDIA安培顯卡的單12pin外接供電接口，盡管存在編纂之嫌，可沒想到TPU查證後發現，確有此事，而且的確是交給Ampere顯卡首發。相較於目前常見的6+6pin、8+6pin等外接供電，單12pin採用12V供電，6pin為12V，6pin為接地，據說單pin載流6~8.5A，也就是最大600瓦，少說也有400瓦。此前有消息GeForce Ampere核心頻率或高達2.2GHz，難道是相互印證了？除了可承載的功率更大，新的設計也會更簡潔，尤其是對機箱埋線或者對齊有強迫症的人群。當然，現有模組化電源的用戶買新卡可能稍輕鬆些，只要購置廠商推出的新電源線即可，而其它老式電源的用戶可能不得不使用轉接線，以便將2x8pin轉為1x12pin。另外，雖然爆料看起來有鼻子有眼，可在NVIDIA正式發布安培顯卡或者公布信息之前，還是建議大家保留點反轉預期。優惠商品信息>>作者：萬南來源：快科技

12 3 Page 1 of 3

Tag: 安培