NVIDIA | 搜資訊

高射炮打蚊子：麗台RTX 3050用上渦輪風扇

大家知道，顯卡散熱風扇有開放式、渦輪式兩種，前者隨處可見，後者一般只用於高端公版卡、專業卡，它散熱性能強，但是噪音偏高。那麼，你見過RTX 3050這種低端卡也用渦輪風扇的嗎？麗台就這麼幹了。麗台的這款RTX 3050 Classic，不同於常規RTX 3050的一個或兩個開放式風扇，尾部使用了一個渦輪風扇，整體設計很像GTX 900系列公版，長度253mm，高度111mm，厚度35mm，雙插槽體積。事實上，麗台此前就出過多款渦輪風扇散熱的顯卡，包括RTX 3060 Ti Classic、RTX 3060 Classic、RTX 3070 AI Blower。但是用在RTX 3050這種級別的卡上還真是頭一遭，真有點高射炮打蚊子、牛刀殺雞的感覺。規格上倒是和公版標準一致，2560個CUDA核心，核心頻率1552-1777MHz，128-bit 14GHz 8GB GDDR5顯存，單個8針供電接口，整卡功耗130W。幾個暫時不詳。來源：快科技

RTX 30 LHR挖礦限制倍破解網友：顯卡又要漲價了？

最近兩個月，AMD及NVIDIA的顯卡價格快速下跌，之前價格大漲主要是因為挖礦導致顯卡需求暴漲，礦工們購買了大量顯卡，然而一個意外的消息引發了新的動盪，，挖礦性能滿血了。 LHR本身就是Low Hash Rate低哈希速度，也就是認為降低了挖礦的性能，特別是ETH，NVIDIA降低了50%的性能，因此這一年多來經常有LHR被破解的消息，但影響並不大，算力也就恢復到70%左右。日前NiceHash開發者宣布，繼成功解鎖LHR顯卡70%的原始算力（去年8月實現）後，經過9個月的努力，幾乎RTX 30全系LHR顯卡已經被100%破解。這里說幾乎是因為有兩個例外，分別是RTX 3050和RTX 3080 12GB，黑客透露這哥倆需要的新算法還沒完工。這一破解已經得到證實，不過現在最關鍵的不是挖礦性能問題，而是網友擔心現在這個敏感時刻，LHR算法被破解，那顯卡挖礦的價值更高，有可能導致礦工重新去搶購顯卡，進而引發顯卡重新漲價。從多位網友的表態來看，對於RTX 30 LHR顯卡被破解一事都非常擔心，認為接下來顯卡市場的趨勢會被改變。來源：快科技

偷偷藏了一座「礦山」：NVIDIA被罰550萬美元

NVIDIA已經同意支付550萬美元的民事罰款，以了結美國證券交易委員會（SEC）對其沒有正確披露加密貨幣挖礦對其遊戲業務影響的民事指控。美國證券交易委員會在一份聲明中表示，在2018財年的連續幾個季度中，NVIDIA沒有披露加密貨幣挖礦是其GPU銷售額增長的「重要因素」。美國證券交易委員會表示，2018年，NVIDIA的GPU因為虛擬貨幣挖礦而變得流行。監管部門認為NVIDIA知道這一信息，但並未與投資者分享，這誤導了相關分析師和投資者。 NVIDIA沒有承認或否認SEC的調查結果，並同意支付550萬美元的民事罰款。NVIDIA發言人拒絕對此事置評。實際上，NVIDIA的GPU業務和加密貨幣挖礦之間，一直都有著千絲萬縷的聯系。加密貨幣「帶飛」顯卡 2018年5月，NVIDIA第一次披露了其與數字加密貨幣相關的銷售數據。根據NVIDIA的數據，其從數字加密貨幣的晶片中獲得了2.89億美元的銷售額，占其總收入的9%，大大超出分析師此前預計的2億美元。在2018年的早些時候，NVIDIAGPU的零售價曾大幅上漲。「相比本季度較早時供應緊張的情況，GPU目前情況正在緩和。」NVIDIA首席財務管理Kress在2018年的一次電話會議上曾經這樣告訴投資者。但實際情況是，GPU價格飛漲和供不應求的情況在此之後不僅沒有得到緩解，反而愈演愈烈。由於虛擬貨幣價格不斷走高，虛擬貨幣挖礦所能帶來的收益也愈加豐厚。這使得越來越多的人加入了「挖礦大軍」。「礦工」們對顯卡的需求一方面擠壓了市場上顯卡的數量，另一方面促使一些經銷商囤積居奇，最終使得顯卡的價格水漲船高。而2019年底出現的新冠疫情，則成為了這一切的催化劑。疫情到來後，顯卡產能下降，同時由於遠程辦公等需要，人們對GPU的需求變得更加強烈。此時正好趕上虛擬貨幣幾波漲價潮，使得顯卡價格高企不下，甚至出現了二手顯卡賣出的成交價比幾年前購買的全新價格更高的詭異現象。有人調侃道：「顯卡已經具有了金融屬性。」一塊原價4500元的NVIDIARTX 3070Ti顯卡，最高時甚至漲到了7000元，這讓普通消費者望而卻步。為了保住自己的基本盤遊戲玩家，NVIDIA也曾做過不少努力。 NVIDIA「鐵拳」難敵礦工早在2018年，NVIDIA就因為市面上「一卡難求」的問題向經銷商發布公告，要求經銷商優先向遊戲玩家而不是「礦工」供貨。NVIDIA希望通過此舉能夠使市面上的顯卡更多的流向遊戲玩家而不是「礦工」。同年，NVIDIA還推出了在這波「缺卡潮」中最受玩家關注的GTX1060顯卡的3g顯存版本。NVIDIA希望通過降低顯存配置的方式降低礦工在挖礦中取得的收益來減少礦工們對顯卡的興趣。 2021年2月，NVIDIA推出了挖礦專用的CMP產品。CMP產品與普通顯卡不同，它沒有顯示輸入，無法進行圖形處理，只能專用於「挖礦」。 NVIDIA發言人Wuebbling在談到CMP產品時表示，「通過CMP，我們可以幫助礦工建立最高效的數據中心，同時為遊戲玩家保留GeForce RTX GPU。」 2021年5月，面對玩家的憤怒，NVIDIA祭出「殺招」。NVIDIA通過性能鎖的方式對顯卡性能進行了部分限制，在不影響遊戲體驗的同時，最大限度的降低了顯卡用於虛擬貨幣相關計算的作用。「殺招」出動後，終於有所成效。在顯卡挖礦性能受限後，顯卡價格逐漸有平穩之勢，且虛擬貨幣主力軍以太坊宣布在其技術更新後將不再能使用GPU「挖礦」獲得。但NVIDIA的「鐵拳」也引來了報復。2022年2月28日，NVIDIA遭遇黑客攻擊，一度導致了電郵系統和開發平台下線。而後，黑客組織LAPSU$在NVIDIA發布公告後宣布對此事負責。黑客組織宣稱已經掌握了NVIDIA 1TB的機密資料，並以此要挾NVIDIA解除對顯卡的挖礦限制。雖然NVIDIA最終沒有答應黑客要求，但一部分機密資料，包括核心技術DLSS2.2的原始碼也因此被黑客泄露。在NVIDIA和「礦工」相愛相殺的過程中，玩家的怨氣愈發高漲。雖然針對NVIDIA「屁股坐在哪一邊」的爭論從未停止，但本次SEC的罰款，至少說明了NVIDIA對礦工們真金白銀的貢獻「心知肚明」。 NVIDIA「揣著明白裝糊塗」本次讓SEC開出罰單的NVIDIA報告中，NVIDIA強調了在「遊戲」領域獲得的大幅增長，但在報告中隱瞞了「遊戲增長」中多少營收實際上來源於加密貨幣挖礦市場。報告中，NVIDIA稱2018年第二財季遊戲收入同比增長52%，第三財季同比增長25%。但SEC的指出，所謂的「遊戲收入」實際上有一部分依賴於動盪的加密貨幣市場，但NVIDIA卻並未披露具體的比例。加密貨幣領域的投資往往伴隨著極大的風險。2018年，加密貨幣曾經發生「礦難」，比特幣等虛擬貨幣價值一度崩盤，這曾經導致NVIDIA將季度營收預計下調了5億美元，並最終引發了股東的訴訟。投資人對加密貨幣的不信任也體現在了NVIDIA的股票上，在NVIDIA 2018年首次公布加密貨幣的影響在營收中的占比後，NVIDIA股價應聲而落，在財報公布後下跌3.3%。根據SEC的說法，NVIDIA不僅清楚加密貨幣對其「遊戲」業務的影響，並且在刻意隱瞞，因此SEC認為NVIDIA構成了欺詐。在過去的幾年間，NVIDIA一方面站在玩家立場處處對礦工們「鐵拳相向」，另一方面又享受著加密貨幣帶來的收益，可謂是兩頭討好，左右逢源。而如今，代表礦工群體的黑客發難，代表投資人利益的SEC也開下罰單。隨著加密貨幣市場的萎靡，GPU的價格也在今年迎來了暴跌。並且，由於30系顯卡「礦卡」名聲之盛，消費者做出決定已經變得異常謹慎。 NVIDIA在玩家和礦工間左右搖擺的日子，可能真的離結束不遠了。來源：快科技

RTX 30全系突遭破解顯卡價格要重新漲回去了？

本周，NiceHash宣布，RTX 30全系LHR顯卡（RTX 3050/3080 12G除外），可以100%恢復原始算力了。擔心別是病毒圈套，TMHW等媒體下載這款專用軟體QuickMiner後測試發現，所言非虛。以RTX 3080 Ti為例（市面全是LHR），此前最高破解到原始算力70%，也就是85MH/，現在終於能恢復到110MH/左右了。盡管NiceHash稱RTX 3080 Ti實際最高能到120MH/，但前提就是提高「鍛鍊」強度，將顯存暴力超頻後才行（110度高溫打不住）。事件一出，有用戶開始擔心起囤卡挖礦這件事會否卷土重來，也就是告別顯卡降價的好日子，行情重新反彈？對此，TMHW認為不太可能。首先，即便是RTX 3080 Ti，現今跑滿一天的收益不過3.5美元，也就是1年才能回本。其次，以太坊預計6月份開始從PoW切換到PoS，屆時算力不再與收益綁定。再次，NVIDIA很可能會更新第三版LHR顯卡，再度激活這場破解與反破解的貓鼠遊戲。來源：快科技

隱瞞挖礦影響被罰3600多萬 NVIDIA依然贏了：賺了115億

今天凌晨，美國SEC證監會宣布NVIDIA公司同意繳納550萬美元（約合3666萬元）的罰金以便和解相關指控，NVIDIA被指在2017到2018年間故意誤導投資者關於加密貨幣市場如何影響其銷售。根據SEC的說法，盡管有信息顯示 NVIDIA遊戲銷售額的增長在一定程度上是由加密推動的，但NVIDIA未能披露加密是其2018財年連續幾個季度收入增長的「重要因素」。 NVIDIA在提交給監管部門的10-Q文件中承認了加密貨幣的影響，他們認為對該公司遊戲產品的需求增加，尤其是在中國，是由加密貨幣挖礦推動的，但NVIDIA未能向投資者披露這些信息。 SEC認為NVIDIA的遺漏有誤導性，發言人克里斯蒂娜·利特曼 (Kristina Littman) 表示：「NVIDIA的披露失敗剝奪了投資者評估公司在關鍵市場業務的關鍵信息。」在被調查之後，NVIDIA沒有承認但也沒有否認SEC的指控，在此條件下同意繳納550萬美元的罰款達成和解，這意味著他們無需為此承擔法律責任。 SEC這次指控的挖礦影響是在2017到2018年間的，並不是現在的RTX 30系列顯卡發售期間，那NVIDIA從顯卡挖礦中到底賺了多少呢？，前不久該公司成功推翻了一項集體訴訟，也是指控NVIDIA隱瞞了挖礦對顯卡的銷售影響，其中有專家測算，在2017年5月到2018年7月份中，NVIDIA從礦工的礦卡銷售中多賺了17.28億美元，約合115億元人民幣。如果這次的集體訴訟成功了，那麼NVIDIA被處罰的罰款顯然要遠遠高於550萬美元的和解金。來源：快科技

因未充分披露加密貨幣影響，英偉達被SEC罰款550萬美元

美國證券交易委員會（SEC）證實，對英偉達的指控達成了和解，由於英偉達沒有向股東提供足夠的信息，充分披露加密貨幣對公司遊戲業務的影響，需要支付550萬美元的罰款。美國證券交易委員會發現，在2018財年的連續幾個季度中，英偉達沒有說明加密貨幣是銷售旗下針對遊戲設計的GPU帶來實質性收入增長的重要因素。在2017年，隨著對加密貨幣的需求和興趣增加，英偉達的客戶越來越多地使用遊戲GPU進行相關業務。英偉達在當時的財報中，闡述了遊戲業務收入大幅度增長，不過這部分增長很大程度是由於加密貨幣推動的。經過調查，有信息確認英偉達內部有這方面的資料，知曉相關情況，然而未按要求在表格中披露這些與波動性業務相關的現金流波動和重大收益，以供投資者確定過去的業務是否能預示未來業績的可能性。美國證券交易委員會還發現，英偉達遺漏有關其遊戲業務增長的重要信息具有誤導性，當時曾對其他業務受到加密貨幣的需求推動專門作出了聲明，卻對遊戲業務是否受影響輕描淡寫地一筆帶過。美國證券交易委員會認為，英偉達違反了1933年證券法第17 (a)(2) 和 (3) 條以及1934年證券交易法的披露規定，認定英偉達未能保持及時、完整和准確地披露信息。在不承認或否認SEC調查結果的情況下，英偉達同意接受停終條令，並支付550萬美元的罰款。 ...

N卡價格跳水後 AMD最不願看到一幕出現：幾乎從銷量榜消失了

3月份以來，遊戲顯卡的行情出現了一波大跳水，曾經高高在上的熱門顯卡RTX 3080/3080 Ti、RX 6900 XT等已經紛紛破發。顯然，這時候遠離礦渣、妖卡的最好辦法無疑就是在渠道入手行貨，TMHW在美蛋（Newegg）上發現，N卡這波跳水後，幾乎壟斷了暢銷榜。簡單來說，TOP20中只有一張微星的RX 6600齣現在了15名的位置，其它全是老黃的家人們。而且這19款N卡中，RTX 30系列有18款，唯一的例外是華碩的RTX 2060。前5名方面，最熱的是華碩電競特工RTX 3070 Ti，目前賣911美元一張。就當下來看，顯卡緩慢下跌趨勢應該短期內不會改變，如果是剛需用戶的話，倒是可以趁機入手。畢竟下半年的RTX 40、RX 7000系列大機率都不會便宜。來源：快科技

NVIDIA H100 SXM實物曝光：核心面積814mm²，80GB HBM3顯存

在GTC 2022上，英偉達發布了新一代基於Hopper架構的H100，用於下一代加速計算平台。其擁有800億個電晶體，為CoWoS 2.5D晶圓級封裝，單晶片設計，採用了台積電（TSMC）為英偉達量身定製的4nm工藝製造。近日，ServeTheHome發布了NVIDIA H100 SXM的實物近照，可以看到SXM外形的新設計，PCB型號為PG520。據了解，搭載的GH100晶片面積大概為814 mm²，位於正中間，周圍排列了六顆HBM3顯存，容量為80GB。與上一代的A100相比，H100的連接布局也發生了變化，變得更短一些。NVIDIA H100 SXM的TDP高達700W，相比基於 Ampere和Volta架構的同類產品要高出250W到300W，不過H100的PCIe版則只有350W。完整的GH100晶片配置了8組GPC、72組TPC、144組SM、共18432個FP32 CUDA核心。其採用了第四代Tensor Core，共576個，並配有60MB的L2緩存。有不過實際產品中沒有全部打開，其中SXM版本中啟用了132組SM，共16896個FP32 CUDA核心，528個Tensor Core以及50MB的L2緩存，而PCIe 5.0版本則啟用了114組SM，FP32 CUDA核心數量只有14592個。此外，GH100支持英偉達第四代NVLink接口，可提供高達900 GB/s的帶寬。同時GH100是第一款支持PCIe 5.0標準的GPU，也是第一款採用HBM3的GPU，最多支持六顆HBM3，帶寬為3TB/s，是A100採用HBM2E的1.5倍。近期日本地區有零售商已列出了NVIDIA H100 PCIe，顯示價格為4745950日元（約合36567.5美元/人民幣241471.3元）。由於NVIDIA H100 SXM規格更高，擁有更多CUDA核心，價格有可能會更貴。 ...

NVIDIA RTX 3090 Ti釋放洪荒之力：功耗890W

NVIDIA RTX 3090 Ti卡皇的標準整卡功耗為450W，非公版可以接近甚至超過500W，但這顯然還不是它的全部「實力」。海外玩家MEGAsizeGPU最新發現，使用特殊的XOS BIOS，就可以將RTX 3090 Ti的功耗限制解鎖到驚人的890W，幾乎翻番。當然，這種特製BIOS一般是給極限破紀錄使用的，適合影馳名人堂、EVGA KINGPIN這種變態卡，它們都有兩個16針供電接口，理論上可以提供1200W的供電能力。一般的RTX 3090 Ti只有一個16針接口，最大供電600W，加上PCIe插槽本身也就675W，所以不可能達到890W的高度，但依然很嚇人。比如EVGA FTW3版本，實測可以解鎖到614W。華碩TUF GAMING版本則可以解鎖到615W，單單是GPU本身就消耗了496W。來源：快科技

24.2萬元 NVIDIA 4nm H100計算卡第一次露出真容：80GB顯存

3月底的GTC 2022大會上，NVIDIA正式發布了一個半月過去了，我們終於看到了這款新卡的真容。依然是傳統的SXM樣式規格，但整體布局相比上代Ampere A100有了很大變化，而正中間自然就是GH100核心，旁邊圍繞著六顆HBM3記憶體/顯存，總容量達80GB。 GH100核心採用台積電4nm製造工藝、CoWoS 2.5D封裝技術，集成800億個電晶體，核心面積814平方毫米。它擁有18432個CUDA核心、576個Tensor核心、60MB二級緩存，支持6144-bit位寬的六顆HBM3/HBM2e，支持PCIe 5.0，支持第四代NVLink總線。 H100計算卡有SXM、PCIe 5.0兩種樣式，其中SXM版本15872個CUDA核心、528個Tensor核心，PCIe 5.0版本14952個CUDA核心、456個Tensor核心，功耗最高達700W。上市時間未定，不過日本最近開啟了PCIe版本的預售，價格高達4745950日元，約合人民幣24.2萬元。 SXM版本的或許會更貴。來源：快科技

AMD考慮學習Intel和NVIDIA：CPU、顯卡軟體可能收費

相比兩位友商NVIDIA和Intel，AMD一直自詡是全球唯一一個同時擁有高性能CPU及GPU的公司，兩邊都如魚得水，硬體方面基礎強大，不過在軟體方面要比其他兩家弱勢一些，這也是AMD接下來加強的重點。日前在財報會議上，AMD提到將在2023年推出集成AI功能的處理器，今年2月底他們完成了對賽靈思的收購，花費3000多億買這家FPGA晶片廠商，AMD接下來就會推出整合FPGA加速AI的數據中心處理器。在開發新一代硬體的同時，AMD也在開發新一代軟體，將為開發者提供統一的CPU、GPU及FPGA等晶片平台開發框架，這是Intel及NVIDIA再做的事，三家在這方面殊途同歸。不過AMD的軟體未來可能會改變運營模式，CEO蘇姿豐表示將探索軟體收費的模式，畢竟NVIDIA及Intel已經從軟體中賺錢了，AMD也不會錯過這樣的商業模式。至於具體如何收費，現在AMD還沒公布詳情，有可能在6月初的分析師大會上公布。來源：快科技

AMD降低RDNA 3架構GPU規格，Navi 3x系列將減少20%流處理器

隨著Radeon RX 7000系列的臨近，更多有關RDNA 3架構GPU的消息流出。近日多個消息源均顯示，AMD降低了Navi 3x系列GPU的規格，伴隨核心規格的減小，相關的預期性能也將降低。有網友透露，Navi 31的WGP數量將從之前的60個減少到48個，對應的流處理器數量也從15360個減少到12288個，這意味著核心規模減少了20%；同樣採用使用MCM多晶片封裝的Navi 32也一樣，WGP數量將從之前的40個減少到32個，對應的流處理器數量也從15360個減少到12288個；單晶片的Navi 33也沒有逃脫被削減的命運，WGP數量將從之前的20個減少到16個，對應的流處理器數量也從5120個減少到4096個。相對應地，Navi 3x系列GPU的預期性能也會調低。此前曾有消息指，Navi 31在60個WGP及3GHz頻率下，FP32運算性能將達到92 TFLOPs，不過隨著流處理器數量的減少，FP32運算性能也降低到了73 TFLOPs。由於暫時還不清楚Navi 31具體的核心頻率，所以務必要對這種預期性能有所保留。近期還有網友表示，基於Ada Lovelace架構的GeForce RTX 4090或許能達到100 TFLOPs的FP32運算性能。要實現這樣的性能指標，配備18432個CUDA內核的AD102頻率至少要達到2.7 GHz。由於GeForce RTX 4090大機率採用的並非完整核心的AD102，那麼核心頻率將會更高。這些泄露的消息真實性到底有多少，目前還難以判斷，而且還涉及到光線追蹤、超解析度技術和其他功能的運用，不過英偉達和AMD下一代旗艦產品似乎都想以100 TFLOPs為目標。據稱，基於雙方新架構的顯卡在性能方面會有不小的提升幅度。 ...

RX 7900 XT、RTX 4090火山撞地球只差那麼一點點

隨著發布時間的日益臨近，AMD、NVIDIA下一代顯卡不但規格曝料越來越多，性能也逐漸明晰。據Greymon55，AMD下一代大核心Navi 31(無意外對應RX 7900 XT)預計擁有92TFlops FP32浮點計算性能，比之前爆料的75TFlops提高了28％，而相比現在的大核心Navi 21(RX 6900 XT)則增加了幾乎3倍。 Greymon55之前就透露，AMD預計會調整Navi 31的規格、性能，但沒想到變化這麼大。如果是60組WGP(工作組處理器)、15360個流處理器，要達到92TFlops FP32的計算性能，核心頻率必須高達2995MHz，當然也有大機率會引入一系列不同的32位指令集，來獲得更高浮點性能。另據@Kepler_L2，AMDGPU驅動信息顯示，RDNA3架構仍然會保留傳統的CU計算單元結構體系，而不會將其取消。 NVIDIA方面，kopite7kimi聲稱，AD102大核心預計可提供100TFlops的浮點性能，不但2.5倍於RTX 3090 Ti、2.8倍於RTX 3090，也再次略勝對手。如果是18432個CUDA核心，那麼核心頻率大約在2.7GHz，而且按慣例RTX 4090不會滿血，頻率還要更高。當然，浮點性能和遊戲性能不能劃等號，實際上孰強孰劣還有待進一步觀察，但它也能反映出GPU性能的相當一部分。看來這又是一次非常激烈的競爭。來源：快科技

RTX 4080/4070顯卡大曝光：性能怪獸

相信不少朋友正翹首以盼NVIDIA的下一代RTX遊戲顯卡吧。爆料好手kopite7kimi給出了RTX 4080和RTX 4070的部分詳細參數，至少從顯存來看，比RTX 3080慷慨太多。具體來說，RTX 4080基於AD103核心，配16GB GDDR6X顯存，顯存速度21Gbps，整卡功耗500W，FE公版配單16pin外接供電。 RTX 4070基於AD104核心打造，配12GB GDDR6顯存，整卡功耗300W，FE公版配16pin外接供電。僅從功耗就不難推測，RTX 40系的性能會非常可觀。上一代RTX 3080的TGP是320W，RTX 3070更是只有220W。雖然從節能環保的角度，RTX 40系不那麼友好，但在摩爾定律放緩的背景下，性能和功耗齊飛也是當前半導體產品不得不接受的現實，這一帶Ada Lovelace大核心的峰值單精度浮點（FP32）性能據說要摸到恐怖的100T。至於發布時間方面，最快三季度末、最晚四季度。來源：快科技

高通、NV都跑了？三星否認4nm、3nm良率不行：問題被誇大了

這幾年中高通及NVIDIA都使用了三星的工藝代工驍龍及GPU晶片，不過跟台積電相比，三星晶片工藝的負面新聞一直不斷，特別是最近一段時間來有多家消息報導稱三星的4nm甚至下一代的3nm良率不行，NVIDIA及高通等公司都要轉向台積電了，三星官方則表示這些情況被誇大了。日前三星公布了2022年Q1季度財報會議，三星官方也回應了近期的晶片良率問題，否認了傳聞中的良率不行的傳聞。三星表示，5nm工藝已經進入成熟階段，還在擴大服務，4nm工藝雖然良率提升過程出現了延遲，但已經進入了預定的良率曲線，未來的3nm工藝還在准備設立一條新的研發生產線。至於外界最為擔心的高通、NVIDIA等大客戶放棄三星轉向台積電的消息，三星表示這個情況被誇大了，三星主要客戶的代工訂單遠遠超過目前產能，隨著公司積極推進先進工藝，未來訂單數量還會進一步增加。來源：快科技

英偉達挖走英特爾CPU架構師，將負責未來Arm架構產品的研發

在2020年9月，英偉達宣布以400億美元的現金和股票從軟銀手中購入Arm。經過了與相關監管機構長時間的拉鋸戰，英偉達雄心勃勃的計劃受到了打擊，在今年2月8日，英偉達正式放棄收購Arm。事實上，英偉達在放棄收購Arm之前，已經開始在以色列創建一個CPU設計和工程團隊，計劃招募數百名工程師，包括硬體、軟體和架構方面的人才，與其他網絡和HPC技術相關的團隊一起進行研發工作。據Wccftech報導，近期英偉達挖走了英特爾的設計經理Rafi Marom，這位曾參與Tiger Lake和Alder lake開發工作的架構師將擔任英偉達的高級CPU總監。Rafi Marom會繼續留在以色列，成為未來英偉達Arm架構CPU研發的主要負責人之一。隨著半導體行業市場競爭加劇，同時又缺乏足夠的高水平技術人員，相互挖角成為了尋找人才常見的手段，不但能增強自己的實力，還能削弱對方的競爭力。為了降低員工的流失率並吸引新的人才，英特爾此前已批出24億美元（10億美元現金+14億美元股票）以激勵員工，包括但不限於薪酬結構、增加績效預算、為表現優異者提供差異化獎金、增加股票配給等。雖然英特爾已吸引了前AMD首席GPU架構師的Raja Koduri，以及曾負責DLSS技術開發工作的Anton Kaplanyan，不過這似乎未能完全阻止競爭對手的挖角。此前英偉達CEO黃仁勛先生表示，收購Arm失敗並不會影響英偉達的策略，未來仍將針對不同應用領域開發一系列基於Arm架構的CPU，並計劃將其加速計算平台的全部范圍帶到Arm架構CPU上，未來會持續推進CPU、GPU和DPU三晶片戰略。 ...

英偉達H100計算卡登陸日本市場，約合人民幣24萬元

在GTC 2022上，英偉達發布了新一代基於Hopper架構的H100，用於下一代加速計算平台。NVIDIA H100擁有800億個電晶體，為CoWoS 2.5D晶圓級封裝，單晶片設計，採用了台積電（TSMC）的4nm工藝製造，而且是為英偉達量身定製的版本。英偉達表示，預計今年第三季度開始供貨，不過並沒有給出H100計算卡的價格。近期日本地區有零售商已列出了H100，顯示價格為4745950日元（約合36567.5美元/人民幣241471.3元）。改價格包含了運費和稅費，若僅計算卡本身是4313000日元（約合33231.7美元/人民幣219443.1元）。 H100分別有SXM和PCIe兩種外形，以支持不同的伺服器設計要求，此次日本零售商放出的是基於PCIe的版本。完整的GH100晶片配置了8組GPC、72組TPC、144組SM、共18432個FP32 CUDA核心。其採用了第四代Tensor Core，共576個，並配有60MB的L2緩存。有不過實際產品中沒有全部打開，其中SXM5版本中啟用了132組SM，共16896個FP32 CUDA核心，528個Tensor Core以及50MB的L2緩存，而PCIe 5.0版本則啟用了114組SM，FP32 CUDA核心數量只有14592個。此外，前者的TDP達到了700W，後者則為350W。此外，H100支持英偉達第四代NVLink接口，可提供高達900 GB/s的帶寬。同時H100是第一款支持PCIe 5.0標準的GPU，也是第一款採用HBM3的GPU，最多支持六顆HBM3，帶寬為3TB/s，是A100採用HBM2E的1.5倍，默認顯存容量為80GB。 ...

配備80GB顯存 NVIDIA H100 Hopper加速計算卡上市：價格超24萬元

今天，Videocardz報導稱，日本一零售商以4745950日元（約合人民幣24.16萬元）的價格，掛出了NVIDIA最新的H100 Hopper加速計算卡。這款加速卡是NVDIA首款採用採用台積電4nm製程工藝的GPU，它採用CoWoS 2.5D晶圓級封裝，單晶片設計，集成高達800億個電晶體。完整版有8組GPC(圖形處理器集群)、72組TPC(紋理處理器集群)、144組SM(流式多處理器單元)，而每組SM有128個FP32 CUDA核心，總計18432個。此外，它還有著高達80GB的HBM2e顯存，擁有2TB/的帶寬，並是第一款採用PCIe Express 5.0的NVIDIA卡。根據此前消息，這款H100 Hopper預計要在今年的下半年才會正式上市。來源：快科技

1200W？RTX 40顯卡功耗越傳越離譜：老黃早說實話了

AMD及NVIDIA新一代顯卡不僅會同時使用台積電的5nm/4nm工藝代工，也會大幅提升核心規模及功耗，走功耗換性能的路子，RTX 40系列從目前最多1萬左右的CUDA核心提升到1.8萬核心。現在大家最關心的話題之一就是旗艦RTX 4090/Ti顯卡的功耗有多少了，這段時間以來各種說法有，從之前傳聞的500W、600W逐漸提升到了800W、900W甚至1200W，因為有消息稱NVIDIA正在測試雙路16針供電接口，理論供電能力1200W。 NVIDIA的顯卡功耗真的要飆到這麼高的水平嗎？實際上可能沒這麼夸張，有爆料稱所謂的1200W設計並不是功耗，而是散熱能力。那RTX 40系列顯卡的功耗到底是什麼水平？實際上NVIDIA之前發布H100加速卡的時候就給出過相關信息。 H100有SXM及PCIe 5.0兩種規格的，前者是1.7萬核心，功耗700W，後者是1.46萬核心，但功耗只有350W了。計算卡的Hopper架構及遊戲卡的AD架構當然不是完全一樣的，但是從NVIDIA的官方信息來看，RTX 4090/Ti級別的旗艦卡功耗也不會夸張到800W、900W甚至上千瓦，PCIe 5.0供電設計的上限是600W，RTX 40公版顯卡還會留有餘地，實際水平在350W到500W之間才是合理的。當然，在NVIDIA最終公布RTX 40系顯卡之前，這些功耗也只是分析結果，一切以官方為准，而且N卡功耗高不高，可能還要看AMD的RX 7000系列的表現，H100加速卡很多參數都沒最終確定，RTX 40顯卡同樣也會有很多調整。來源：快科技

顯卡價格暴跌不再缺芯了？

最近GPU顯卡價格的大幅下降使得一些機構作出了全球晶片危機結束在即的預測。這場持續了幾年的危機已經成為了智慧型手機行業和汽車製造業等相關行業頭上不散的陰雲。 Intel、高通和其他晶片製造公司不得不面對越來越多近對供應鏈到負面影響的因素：全球范圍內發生的通脹；疫情導致的封鎖；俄烏戰爭導致的供應鏈阻塞。而最近GPU價格下降則可能是打破籠罩在行業上空數年之久的「缺芯」烏雲的一縷陽光。金融機構Baird在最近GPU價格下跌後將GPU製造廠商NVIDIA的評級下調至「中性」。2022年以來，NVIDIA的股價已經下跌了31%，而同為GPU製造龍頭的AMD股價則下跌了約37%。雖然目前GPU仍然在加價出售，但是加價的幅度較之前而言已經下降不少。 Susquehanna 分析師克里斯多福羅蘭曾在本月早些時候表示，GPU的平均售價已經從之前比製造商建議零售價高出77%左右滑落至約高出約41%。在過去的兩年間，GPU經歷了從「買不著」到「買不起」的痛苦轉變。在這波「顯卡危機」中，NVIDIA旗下的RTX 30系顯卡可以說是命途多舛。在剛剛發布時，由於產能不足曾經被眾多遊戲玩家炮轟「空氣顯卡」，而在產能爬升後，又迎頭撞上2021這一「虛擬幣之年」。隨著這一年虛擬貨幣的價格瘋漲，能夠進行「挖礦」的GPU迅速在「礦工」們的炒作下價格起飛。 2021年5月，NVIDIA曾經祭出「殺招」，宣布限制了30系顯卡的一部分性能，以阻止「顯卡流入礦工之手」。此舉最終招來了黑客組織LAPSU$的報復。該組織在早些時候曾經以竊取的NVIDIA內部核心資料相要挾，要求NVIDIA解除對GPU挖礦性能的限制。而隨著虛擬貨幣的價格出現波動，加之加密貨幣以太坊預計在今年夏天後改變其運作模式以減少對當今用於挖掘加密貨幣的GPU需求，顯卡價格也出現了松動。但對於這波降價是否會蔓延到整個晶片行業目前仍然存在爭議。根據Summit Insights Group 分析師 Kinngai Chan 的說法，PC和智慧型手機市場的需求日漸疲軟也導致與之相關的CPU和一些記憶體晶片的價格下跌。根據他的估計，用於此前推出的舊機型的CPU等晶片的供應將在今年下半年面臨產能過剩問題。但美國銀行則表示，遊戲或加密貨幣挖礦領域的疲軟導致的下跌與數據中心對GPU越來越強勁的要求將會保持相對平衡。並且還重申了其對NVIDIA的「買入」評級。與此同時，包括Intel和台積電在內的主要晶片製造商正在持幣大舉擴張。根據統計，Intel和台積電在2022年的擴張計劃可能價值數十億。 TechInsights 的 Dan Hutcheson 表示：「在廠商們在晶圓廠的投資落地之前，我們可能看到晶片市場在2023年到2024年間出現供過於求的場面。」他大膽地基於GPU的現狀對整個晶片行業的未來做出了預測。來源：快科技

高質量顯卡驅動是怎樣煉成的？老司機NVIDIA揭秘：這三招瞧好了

遊戲玩家可能會注意到，每個月有那麼一兩次或者更多次，NVIDIA發布的遊戲驅動會有一波大幅性能提升，對新遊戲提供支持。與其他廠商的雞血驅動不同，NVIDIA的驅動更新通常穩定且准時，通常情況下它實際上是一款Game Ready Driver（簡稱GRD驅動），是專為遊戲優化而生的驅動。如今大部分PC設備都不需要頻繁更新驅動，遊戲玩家更新的驅動也主要是顯卡驅動了，Game Ready驅動是如何在大家頻繁更新驅動的情況下還能提升顯卡性能的呢？能讓驅動打雞血一樣提升性能的秘密可就多了，Driver（驅動）這事還是得讓老司機（Driver）才能說明白。 NVIDIA日前發布的Game Ready驅動是GeForce 512.59版，除了為遊戲《沙丘：香料戰爭》（Dune: Spice Wars）提供優化支持，還給《劍俠情緣網絡版叄》遊戲帶來更新版DLSS，新增了3款G-Sync兼容顯示器等等。伴隨這版驅動的發布，NVIDIA還發布了一個視頻，介紹了Game Ready驅動是怎樣煉成的，其中科普了GRD的製作流程、與遊戲開發團隊的協作優化，在多種不同平台設備的海量測試以及NVIDIA驅動及配套軟體都做了哪些優化確保GeForce玩家在遊戲發布當日就有以帶來最佳性能和可靠性，背後故事值得一看。單就Game Ready驅動遊戲優化而言，NVIDIA這方面的工作主要有三大秘笈，如下所示： NVIDIA遊戲驅動秘笈之與開發者合作進行調校和優化在介紹遊戲優化驅動之前，NVIDIA簡單科普了下遊戲是怎麼運行的，以及大家關心的遊戲性能具體是指什麼。簡單來說，遊戲從軟體到GPU的過程有四個環節，一個是DirectX Game，中間的是用戶層驅動、內核層驅動，最後到GPU，這里面每個環節都有可能導致遊戲性能表現不佳，NVIDIA Game Ready驅動的遊戲優化與之息息相關。至於遊戲玩家關心的遊戲性能，大家常說的性能指的是平均幀，但實際的性能參數還有很多，平均幀、最低幀、幀時間之外還有延遲，而延遲也要涉及多個方面。遊戲性能涉及的領域這麼多，那如何在遊戲首發時就能確保驅動對遊戲的支持是准備好了的？NVIDIA視頻中說了，他們首先要做的就是跟遊戲開發者合作，從遊戲開發初期就不斷進行調校優化。 NVIDIA現在跟大部分遊戲廠商都有很好的合作關系，與遊戲開發者協同建立定期交換預發行遊戲版本和驅動更新。 NVIDIA與遊戲開者共同尋找優化方案、解決問題，並相應地疊代驅動版本，以確保遊戲和Game Ready驅動在發布時提供最優質量和最強性能。 NVIDIA驅動對遊戲優化的持續時間甚至會超過遊戲廠商，因為後者在遊戲發布之後主要是發布修正檔及DLC資料片，而NVIDIA在Game Ready驅動之後還會持續推驅動優化，這點比遊戲廠商還要拼。 NVIDIA遊戲驅動秘笈之通過海量測試以實現出色性能和可靠性盡管NVIDIA會從遊戲開發初期就參與驅動優化工作，但對於NVIDIA來說為現實中的PC玩家進行驅動的優化就更為復雜，全球的PC平台數以億計，各個配置都有，甚至10年前的PC電腦都不會淘汰，要想確保驅動在這些平台上都有穩定出色的表現，那也要喊來他的測試。 NVIDIA的Game Ready驅動就是這樣積累起來的，內部有大量的團隊從事開發及測試工作，測試進程在一天之內就涉及超過1000個、橫跨大量已發布和即將發布遊戲的不同測試。僅在2021年就有超過180萬小時的測試，相當於214個日歷年的時間。從2014年首次推出Game Ready驅動以來，NVIDIA現已推出150多個Game Ready驅動，支持400多款遊戲；僅在2021年，就發布20個Game Ready驅動，支持75款遊戲。除了支持具體的遊戲之外，NVIDIA還有團隊專門針對虛幻引擎、Unity和其他領先開發引擎進行測試優化，這也確保了基於這些引擎的遊戲能夠運行得非常流暢、穩定。為了保證Game Ready驅動的質量，NVIDIA還有2個特別的要求，一個是絕不發布測試版的Game Ready驅動，不給用戶當小白鼠的機會，另外一個要求就是所有Game Ready驅動同時也是WHQL驅動，也就是通過了微軟的WHQL認證，確保與系統的兼容性。這兩點要求確保了Game Ready驅動的質量標準高於一般的驅動，所以大家看到Game Ready字樣，就可以放心大膽地升級。 NVIDIA遊戲驅動秘笈之為遊戲玩家提供更多附加值做到上面兩點之後，就可以保證Game...

傳英偉達正在測試搭載AD102的900W顯卡：兩個12VHPWR接口，配備48GB顯存

此前有報導指，英偉達已經開始測試AD102，這款Ada Lovelace架構GPU將用於GeForce RTX 4080/4090系列顯卡。今天有網友透露，英偉達為旗艦級的GeForce RTX 40系列顯卡准備了一款測試板，上面配備了兩個16Pin的12VHPWR接口。其TDP達到了900W，甚至比之前傳言里最高的850W還要高。雖然過去不同消息源傳出的具體功耗數值有所區別，但似乎頂級GeForce RTX 40系列顯卡在600W或以上的設計並沒有什麼懸念。據了解，這款搭載AD102的旗艦級GeForce RTX 40系列顯卡，除了功耗達到了900W，還採用了48GB的GDDR6X顯存，速率為24 Gbps，而且核心頻率應該會更高。暫時還不確定該測試版本最後是否會成為真正的產品，不過一切皆有可能。此外，該網友還確認了定位中高端的GeForce RTX 4070/4080顯卡的規格。其中GeForce RTX 4080會搭載AD103，採用了16GB的GDDR6X顯存，顯卡的功耗和搭載GA102的顯卡比較接近。GeForce RTX 4070搭載的是AD104，採用了12GB的GDDR6X顯存，功耗會在300W左右。據稱這兩款顯卡都只會配備一個16Pin的12VHPWR接口，暫時還沒有開始測試，不過很快就會提上日程。如果近期有關GeForce RTX 40系列顯卡的消息是准確的話，那麼英偉達應該會選擇在今年9月或10月發布新一代的Ada Lovelace架構GPU。預計首批會推出GeForce RTX 4070/4080/4090系列顯卡，然後晚一些再逐漸推出更多型號，且更貼近主流市場。 ...

NVIDIAStudio創意加速：4月版Studio驅動發布，推出全新設計本並特邀3D藝術家分享

首席 3D 環境藝術家 Andrew Averkin 通過 NVIDIA Omniverse 和 Autodesk 3ds Max 分享童年記憶。編輯註：本文是我們每周發布的 NVIDIA Studio 系列內容的一部分，旨在分享特邀藝術家作品及創作故事、提供創意啟發和技巧，並展示 NVIDIA Studio 技術如何加速創意工作流。在本周的 NVIDIA Studio創意加速中，我們將推出 4 月版 NVIDIA...

RTX 4090 Ti功耗高達900W 兩個16針供電鎮壓

RTX 3090 Ti的功耗已經高達450W，非公版更是紛紛逼近乃至超過500W，為此首發了全新的PCIe 5.0 16針輔助供電接口，理論供電能力高達600W。早就有種種跡象表明，下一代的RTX 40系列顯卡功耗會更夸張，即便用上新的台積電4nm工藝、Ada Lovelace架構也壓不住。硬體曝料好手@kopite7kimi 給出的最新情報顯示，RTX 4090的整卡功耗設計值依然是600W，但按照慣例它使用的將是殘血的AD102核心。滿血的AD102核心預計對應RTX 4090 Ti(或者Titan)，18432個CUDA核心，頻率更高，並搭配48GB 24GHz GDDR6X顯存，NVIDIA正在進行測試，整卡功耗達到驚人的900W。這和RTX 3090 Ti的套路如出一轍，但是功耗翻了整整一番！為此，RTX 4090 Ti將採用兩個16針供電接口，理論供電能力1200W，也就是和的做法如出一轍。不過，這樣的卡只是在測試論證，是否會真的發布，還未確定。 @kopite7kimi 還透露，RTX 4080將是AD103核心，16GB GDDR6X顯存，預計整卡功耗350W，大致和現在的GA102一個檔次(其實是越級了)。 RTX 4070則是AD104核心，12GB GDDR6核心，整卡功耗也有300W。對了，RTX 40系列將標配16針供電接口，至少公版如此，但據說都不支持PCIe 5.0。來源：快科技

10年輪回 AMD、NVIDIA新一代顯卡再次同時使用台積電代工

不出意外的話，2022年AMD及NVIDIA都要推出新一代顯卡了，AMD這邊是RDNA3架構的RX 7000系列，NVIDIA那邊是RTX 40系列，Ada Lovelace架構。 RX 7000及RTX 40系顯卡的具體性能未知，但是兩家這一代顯卡有很多共同點，那就是大幅提升計算規模及功耗來實現更高性能，RX 7000系列預計有多達1.5萬個核心，RTX 40系列預計也有1.8萬核心，兩邊的TDP功耗都要奔著500W甚至600W了。還有一點相同，那就是工藝，RX 7000是台積電5nm工藝，RTX 40系列跟計算卡H100一樣是台積電4N工藝，但後者本質上也是5nm改進版，兩邊都是跟台積電合作定製的，技術細節不同，但沒有代差。 AMD及NVIDIA上一次同時使用台積電工藝代工GPU還是HD 7000及GTX 600系列了，2011年底HD 7970首發台積電28nm工藝，2012年3月GTX 680跟進，當時台積電的28nm產能不足也讓AMD/NVIDIA在新卡初期吃了苦頭。在28nm工藝之後，AMD在14nm節點轉向了GF格芯的14/12nm工藝，NVIDIA繼續使用台積電的16/12nm工藝（期間也有使用三星14nm工藝），RTX 30系列又用了三星的8nm工藝，而AMD在14/12nm之後轉向了台積電的7nm工藝，這就是當前的局面了。現在兩家同時回歸台積電的5nm工藝，也讓外界有機會觀察AMD及NVIDIA的GPU架構在同代工藝下的性能及能效了，RX 7000及RTX 40之間的對決很有看點。來源：快科技

NVIDIA GeForce Game Ready 512.59 WHQL驅動：新增Reflex Stats支持

NVIDIA發布GeForce Game Ready 512.59 WHQL驅動程序，與上一版最大的分別在新增NVIDIA Reflex Stats這個功能，另外還新增了對多款遊戲的DLSS、光追支持或者NVIDIA Reflex支持。《午夜獵魂》（Midnight Ghost Hunt）將會支持NVIDIA Reflex，系統延遲最高可降低40%；《Chernobylite》將會新增支持的最新更新版支持光線追蹤反射、光線追蹤半透明反射、光線追蹤網狀浮雕和光線追蹤水浮雕；《劍俠情緣網絡版叄》（JX3 Online）將會支持新版的DLSS。此外亦新增對《Dune: Spice Wars》及《Vampire: The Masquerade–Bloodhunt》的支持。另外，新驅動亦加入了全新的NVIDIA Reflex Stats功能。使用新驅動後，玩家可以在支持Reflex SDK 1.6的遊戲中，直接測量系統延遲中的PC延遲，並不需要額外使用支持Reflex Analyzer的顯示器。首批更新至Reflex SDK 1.6並支持NVIDIA Reflex...

英偉達GeForce RTX 40系列GPU是4nm晶片？或使用Hopper架構同款工藝

英偉達將會在今年帶來Ada Lovelace架構，以取代現有的Ampere架構產品。近日有消息指出，英偉達新一代GeForce RTX 40系列GPU將採用4nm工藝製造，相比競爭對手AMD的RDNA 3架構，或許會帶來製造工藝方面的優勢。如果英偉達選擇這麼做，並不是一件奇怪的事情。在GTC 2022上，英偉達發布了新一代基於Hopper架構的H100，用於下一代加速計算平台。這款專門為超級計算機設計的GPU擁有800億個電晶體，採用了台積電（TSMC）的4nm工藝製造，使用了CoWoS 2.5D晶圓級封裝。H100採用的4nm工藝是台積電為英偉達量身定製的版本，與一般所說的N4工藝有所差別。傳言AMD RDNA 3架構的Navi 3x系列GPU里，Navi 31和Navi 32將採用MCM多晶片封裝，GCD（圖形計算晶片）和MCD（多緩存I/O晶片）會採用兩種不同的製程工藝，分別是台積電的5nm和6nm工藝。台積電的4nm工藝與5nm工藝屬於同一個製程節點，只是在後者的基礎上進行了相關的優化，在提供了更多的PPA（功率、性能、面積）優勢的同屬，保持了相同的設計規則、設計基礎設施、SPICE模擬程序和IP，還可以減少掩模數量、工藝步驟、風險和成本。這意味著AMD和英偉達在新一代GPU設計方向上有所不同，前者採用了被認為更好的設計方法，後者或許採用了更好的工藝，至於現階段哪個效率更高，實際運行效果更好，還要等雙方發布了新款顯卡後才能了解。 ...

不只是礦卡崩盤專家警告顯卡價格暴跌還有更大危機

最近兩個月來顯卡價格暴跌，AMD的RX 6000及NVIDIA的RTX 30系列之前因為挖礦大熱，價格翻倍上漲，如今正在迅速跌破發行價，預計會在618期間跌到底，Q2季度不會好了。這一波顯卡跌價被認為是礦卡崩盤的後果，特別是ETH以太坊即將轉向POS，挖礦不再可行，但這事說了很久，官方也一直推遲POS的時間點，所以顯卡價格跟著崩了的具體原因似乎並沒有找到。半導體調研機構TechInsights的分析師給出的觀點更悲觀，認為顯卡價格暴跌的原因是半導體產能的轉變，過去兩年全球晶片產能出現了緊張局面，但是廠商也在積極擴大投資、加速產能，2022年正好是產能開始爆發的階段，顯卡降價意味著市場飽和，這對顯卡廠商來說是更大的麻煩。當然，半導體市場的產能到底還缺不缺或者缺到什麼時候，TechInsights的觀點也只是一方面的，依然有人認為2023-2024年之前都不會有產能飽和的問題。來源：快科技

逆襲AMD？ NVIDIA豪橫：RTX 40系顯卡升級台積電4nm

RTX 30系顯卡停留在老邁的「8nm」工藝，說白了就是10nm改良版。雖然產品力依然夠強勁，但不免落友商「口實」。對於NV來說，肯定不是買不起這樣的工藝，更在乎的是產能和良率能不能達標。看起來，台積電的4nm得到老黃歡心了。爆料人MILD指出，Lovelace的確是4nm工藝。所謂Lovelace就是RTX 40系顯卡核心代號Ada Lovelace，歷史上是詩人拜倫的女兒。由於AMD RX 7000系列顯卡預計會是5nm工藝，看起來NVIDIA要在名義上占點便宜。另外，爆料稱，4nm針對NVIDIA的產品做了定製優化，估計和天璣9000用的那套略有不同。事實上，去年12月台積電曾官宣N4X製程，說是專門為高性能運算開發，可實現5nm家族的最高性能與最大頻率。指標方面，N4X的性能比N5提升15%。對比N4P，在1.2V下性能也提升了4%。不過，N4X當時說是2023年上半年才能試產，從這個角度來看，有點跟不上。來源：3DMGAME

逆襲AMD的節奏 NVIDIA豪橫：RTX 40系顯卡升級台積電4nm

英偉達AD102或不支持PCIe 5.0接口，新架構內核結構也會有變動

幾天前有報導指，英偉達已經開始測試Ada Lovelace架構的AD102。據稱該GPU最多會有144組SM，即18432個CUDA核心，搭配24GB的GDDR6X顯存，位寬為384位，速率為24 Gbps，採用台積電的5nm製程節點製造。新顯卡使用了12+4Pin新式12VHPWR供電接口，功耗將達到600W或以上。傳聞AD102擁有2.2 GHz的核心頻率，可以提供81 TFLOP的計算性能（FP32）。目前英特爾Alder Lake平台已支持PCIe 5.0，AMD即將推出基於Zen 4架構的Ryzen 7000系列，代號Raphael的新一代處理器將使用全新的AM5插座（LGA 1718），應該也是支持PCIe 5.0，而數據需求量巨大的顯卡採用新款接口也是順理成章的事情。不過有網友透露，用於高端GeForce RTX 40系列的AD102仍只支持PCIe 4.0，並不會支持PCIe 5.0。這樣的消息有點讓人感到意外，畢竟英偉達在上個月推出用於數據中心的Hopper架構GPU就已支持PCIe 5.0了。此外，傳聞Ada Lovelace架構的FP32內核結構可能不像Ampere架構那麼簡單，CUDA核心數量還有待確認。相信英偉達會將Ada Lovelace架構GPU的細節留到最後一刻，之前基於Ampere架構的GA102推出的時候，由於結構變動，導致英偉達許多合作夥伴都不確定FP32內核的准確數字，從而在產品描述中出現了錯誤的信息，過了一段時間才糾正。 ...

礦卡價格暴跌顯卡廠商無懼：下半年還有機會

最近2個月AMD及NVIDIA陣營的顯卡價格暴跌，主要原因是礦卡市場崩了，推動顯卡漲價、缺貨的動力沒了，帶動遊戲卡恢復正常，RTX 30系列及RX 6000系列顯卡大部分已經跌到原價甚至破發。對顯卡廠商來說，現在的市場跟之前礦卡漲價的好日子相比肯定會有所不如，不過3月份幾家廠商的業績並沒有太大影響，華碩當月營收沖高破了500億新台幣，微星3月份營收也有177.8億新台幣，環比2月增長20%，同比也增長了0.31%，Q1季度營收530億新台幣，同比增長10.5%，創下新紀錄。技嘉的顯卡業務占比達到了40%，所以3月份影響比其他兩家更高，合並營收95億新台幣，環比增加了6.8%，但同比下滑了13.7%，但也是歷年3月份第二高營收了，整個Q1季度326億營收依然增長15%。考慮到4月份顯卡價格下滑更多，預計Q2季度三個月，顯卡廠商的業績會是全年的低谷期。不過各大廠商對今年下半年的預期比較樂觀，預計AMD、Intel及NVIDIA會推出新一代平台，再加上顯卡價格跌到合理區間，預計帶來一波換機潮。來源：快科技

1.5萬元起的RTX 3090 Ti顯卡解鎖滿血狀態功耗飆到516W

在RTX 40系列顯卡沒發布之前，NVIDIA的RTX 3090 Ti顯卡就是現在的卡皇，而且這塊顯卡還提前演練了新一代顯卡供電，支持PCIe 5.0供電接口，配備了新的16針接口，供電可以達到600W，售價14999元起。這麼強大的供電能力也給高玩帶來了更多的超頻空間，相比默認的450W TDP，EVGA日前發布了新版BIOS，給RTX 3090 Ti FTW3 ULTRA顯卡解鎖了滿血的性能，功耗可提升到516W，相當於默認TDP的115%水平。 RTX 3090 Ti首次採用了滿血的GA102核心，打開全部10752個CUDA核心、84個光追核心，默認核心頻率提高到1560-1860MHz，搭配384-bit 24GB GDDR6X顯存，頻率提高到史無前例的21GHz，帶寬突破1TB/，整卡功耗450W。不過非公版中不少顯卡的TDP提升到了480W，現在516W TDP的水平是官方許可的滿血水平了，再往後提升就要廠商自己魔改電路和BIOS了，難度很大。當然，516W的顯卡功耗也不用擔心，廠商的供電電路是做了600W甚至有1200W供電准備的。來源：快科技

AMD、NV新卡現貨開賣一大波「妖卡」現原形：暴跌50%

過去兩年中，由於挖礦以及半導體晶片產能緊張，顯卡價格早就失控了，RTX 30及RX 6000系列發布一年多，價格漲了一兩倍，最近兩個月才算崩了，價格大幅回落，AMD及NVIDIA甚至用現貨價來吸引大家去買。過去兩年中，不僅是RTX 30及RX 6000這樣的新卡漲價，由於市場需求太高，導致一大堆舊卡也被炒到了天價，，甚至還有GT 730、RX 550這種亮機卡，價格都被炒作到了千元甚至更高，完全不可想像。現在顯卡價格大幅回落，新卡都跌破發行價了，這些妖魔鬼怪一樣的舊卡也被打回原形了，價格正在暴跌。比如美蛋上的GTX 1650顯卡，幾周前顯卡的價格還在400美元以上，現在只要229元，算上返現優惠，價格差不多就是跌了50%了。當然，現在的價格對這些舊卡來說還是有些夸張，如今顯卡市場不復昔日榮光，這些舊卡價格遲早是要回歸正常水平，現在沒必要購買了，等等黨永遠不會吃虧。來源：快科技

比AMD/NV光追更牛 Intel將開發全新3D遊戲技術

正如Intel自己所說的那樣，他們推出Arc遊戲顯卡之後，GPU顯卡市場的格局已經改變了，由原來的AMD、NVIDIA兩家爭霸變成了三國戰，Intel不僅要在遊戲顯卡硬體上跟AMD、Intel競爭，現在他們還准備開發全新的3D遊戲技術，比兩家現在的光線追蹤技術還要厲害。 Intel的這個項目由加速計算及圖形部門的副總裁Anton Kaplanyan領導，他也是一位GPU技術大牛，去年加入Intel，之前在Facebook的首席科學家，從事超級神經采樣方面的研究，多年來都是在研發計算機圖形學，涉及神經渲染、遊戲引擎等等。不過他最引人注目的從業經歷是在NVIDIA，2015年到2017年工作了2年2個月，主要研究的是光追、降噪及縮放方面的技術，期間發表過神經超級采樣的論文，奠定了NVIDIA的DLSS深度學習超級采樣的基礎。現在Intel公司了，他研究的遊戲技術重點之一就是全新的渲染技術——路徑追蹤，可以更真實地模擬光線的物理行為，比AMD及NVIDIA現在使用的光追技術更高級，遊戲畫質也要高得多。當然，代價也是有的，路徑追蹤技術需要更復雜的計算，對性能的要求也高，而且目前支持的遊戲很少，演示也是在《quake II》《我的世界》等遊戲中做的，通過軟體修正檔讓這些遊戲支持了新技術。除了全新的遊戲渲染技術，Anton Kaplanyan的團隊還在深度學習技術上取得了進展，可以用於提高圖形准確率及性能，Intel的XeSS超級采樣縮放技術也是這方面的，畢竟這個領域也是Anton Kaplanyan的老本行。當然，這些新技術肯定會支持Intel自家的Arc顯卡，只不過沒法預期什麼時候會升級，畢竟光追現在都沒普及，性能還是不夠看的。來源：快科技

印度高管立功 Intel：全球終於知道AMD/NV之外的GPU第三家了

前幾天Intel公司發布通告，，後者之前是AMD RTG顯卡業務的掌門人，2017年加入了Intel公司，帶領團隊做出了Xe架構GPU。加入Intel公司之後，Raja Kudori一直很受器重，實際上這五年來多次升職加薪，EVP副總的職務已經是整個Intel的高層了，而不是局限於GPU顯卡部門，可見Intel對Raja Kudori的認可。 Raja Kudori晉升副總是在Intel成功推出Arc遊戲顯卡之後進行的，3月30日Intel正式推出了Arc A系列移動顯卡，主要是3系列，首發兩款型號，高端的Arc A370M核心頻率1550MHz，64-bit 4GB顯存，功耗范圍35-50W。 Arc A350M精簡到6個Xe核心、6個光追單元，核心頻率降至1150MHz，顯存不變，功耗范圍則是25-35W。根據Intel的數據，Arc 3系列的GPU性能相比96單元的Xe核顯性能翻倍，但沒有對比友商AMD及NVIDIA的顯卡，之前測試數據顯示最低端的A350M性能基本上跟GTX 1650 Max-Q顯卡相當，開局表現還不錯。對於Raja Kudori及Arc顯卡的表現，Intel CEO還是挺滿意的，在公告中他直接明確了Raja Kudori及GPU業務的最大貢獻——讓全球注意到了在遊戲市場上有第三個GPU玩家了。總之，Intel Arc獨顯的意義也就是如此了，讓以往只有AMD及NVIDIDA才能玩的遊戲顯卡市場上出現第三個競爭者，或許開始不會改變顯卡市場格局，但未來可期。來源：快科技

曝RTX 4090整卡功耗高達驚人600W：性能凶殘

在硬體爆料達人Moore's Law is Dead的最新視頻中，他重申，RTX 4090的整卡功耗（TGP）將達到600W。對比RTX 3090，這增加了整整250W，對比3090 Ti，也多出150W。與此同時，MILD首次透露了Ada Lovelace核心的工作站顯卡，也就是專業卡，旗艦型號會叫作RTX L6000/L8000，相較而言，功耗溫和很多，只有375W。僅就功耗來判斷，RTX 4090最終可以實現的性能將非常可觀，50%完全可以期待，達成8K+光追特效全開+60FPS的巔峰級遊戲畫質或將帶領玩家進入新時代。不過，600W的TGP也意味著，RTX 4090裝機所配的電源至少得1000W起了，即便RTX 4090本身不漲價，DIYer的裝機成本包括升級成本都將有所提高。外界普遍預期，RTX 4090會在三季度末或者四季度初發布。來源：快科技

AMD的新算法竟是老舊N卡的救星

隨著科技的進步，AI的應用也越來越廣泛，以影視行業為例，不少人都喜歡在電腦上觀看電影、動漫等視頻資源，無論是在本地觀看還是在線觀看，高清晰度，高解析度的視頻才能帶來更好的觀看體驗。但對於那些懷舊黨來說，可能就沒那麼幸運了。在過去，受限於技術原因，很多老電影、老動漫的解析度可能都沒有達到720P的水平，這就導致觀看體驗大打折扣，畢竟在這個4K視頻都隨處可見的年代，低解析度的資源確實有點落伍了。好在AI的普及為我們帶來了超解析度算法，所謂是一種基於深度學習的圖像處理算法，可以對低解析度圖像進行倍數級的提升，將其轉化為高解析度圖像。圖像超解析度重建是在相同的環境中能夠利用很多不同的低解析度圖像共同作用從而再次構造出高解析度圖像，能夠讓圖像在放大的前提下不損失清晰度。而對於遊戲玩家來說，也同樣存在顯卡性能不足以至於無法以4K解析度暢玩遊戲的情況，尤其是在前幾年更換過顯卡，但去年因為顯卡市場波動還沒有採取行動的玩家，不過相信很多玩家都已經體驗過英偉達的DLSS（深度學習超采樣）技術。具體來說，DLSS就是一種通過AI將低清晰度圖片采樣重構的渲染技術，能夠使用深度學習和AI的強大功能來訓練GPU渲染清晰的遊戲圖像。顯卡性能不足以支持高解析度流暢運行的時候，我就可以利用DLSS技術來實現提高解析度的效果。然而，DLSS雖好，也存在著一定的局限性，那就是只支持RTX20系以上的新顯卡，10系顯卡玩家就只能乾瞪眼了，不過英偉達的競爭對手AMD卻為這部分玩家提供了一個新的解決方案：FidelityFX Super Resolution 2.0（FSR 2.0)。事實上，不少人會將DLSS和FSR歸類為類似的算法，但實際上FSR的實現方式反而更像傳統圖像視頻的超解析度算法。根據AMD的說法，FSR 2.0不需要特定的機器學習硬體，甚至連機器學習算法都沒有用，而是用了手工編碼的算法，因為手工編碼算法有更大的控制空間，去適應不同的遊戲場景。雖然FSR現在已經更新到了2.0版本，但實際上1.0推出的時候也是去年了，不過當時的FSR 1.0有一些很明顯的不足，例如FSR 1.0需要利用函數來提升輸入圖像的解析度，當源解析度非常低時，就沒有足夠的信息來重新生成細節，以至於出現畫面閃爍的負優化。相比FSR 1.0，FSR 2.0可接受不同的輸入，如果輸入一個鋸齒化的源圖像，FSR 2.0可利用抗鋸齒功能，優化輸出圖像質量；並提供了不同的圖像質量模式，且支持動態解析度縮放，用戶可以根據需要選擇。更重要的是，FSR 2.0不需要特定的機器學習硬體，只要遊戲支持，可以在幾乎任何顯卡上獲得性能提升，不但包括AMD自家歷代顯卡，也包括了NVIDIA的老舊顯卡型號。不過AMD也指出，在低端GPU上，FSR 2.0的加載和運行速度可能很長，AMD表示將會在下個季度向開發人員提供FSR 2.0，而且會繼續開源，隨後會在GPU Open網站提供示例、API和插件。當然，FSR 2.0是不是真的香，還是得看具體表現，再加上今年Intel也強勢入局顯卡市場，不僅要分硬體一杯羹，還推出了自家的Xess技術來和NVIDIA和AMD競爭，對於遊戲玩家來說，未來的選擇應該會更多。那麼螢幕前的你用過DLSS或者FSR技術嗎？體驗如何？歡迎在下方評論區討論。來源：快科技

英偉達使用ML和AI技術設計GPU，從各個方面加速和改進開發

Bill Dally是英偉達的首席科學家兼研究高級副總裁，領導著一個大約300人的團隊，在此前的GTC 2022上分享了一些英偉達研發方面的信息，其中涉及了使用機器學習（ML）和人工智慧（AI）技術，進行開發、改進和加速GPU設計。據HPC Wire報導，Bill Dally介紹了在GPU設計上有四個重要領域，分別是映射電壓降（Mapping Voltage Drop）、預測寄生（Predicting Parasitics）、布局和布線挑戰（Place and Routing Challenges）、自動化標準單元遷移（Automating Standard Cell Migration），機器學習和人工智慧技術都可以發揮巨大的作用。映射電壓降將向設計人員展示新GPU設計中使用的電源，傳統的CAD工具運行需要三個小時，而使用經過訓練的AI模型僅需要三秒鍾，目前提供了94%的准確度，是一個大幅加速的折中方案；Bill Dally認為AI工具對預測寄生的幫助相當大，可以減少傳統上繁瑣且冗長的過程，同時誤差也低；布局和布線對晶片設計來說非常重要，一旦出錯會導致重新規劃布局，AI技術在這方面的預測相當准確，即便不完美，也能指出存在問題的區域；Bill Dally表示將晶片設計從7nm轉向5nm需要相當大的功夫，而92%的單元庫可以藉助AI工具去實現，原來10個人要花費近一年時間完成的工作，現在GPU幾天就能做到，僅需要處理剩下的8%。英偉達研究的需求方試圖通過開發GPU運行的軟體系統和技術，來推動英偉達產品的需求。目前英偉達有三個不同的圖形研究小組，以推動計算機圖形方面的發展；還有五個不同的AI小組，因為GPU應用AI技術是一件大事，而且規模越來越大；此外還有負責機器人和自動駕駛汽車的小組，並有多個實驗室。 ...

傳英偉達已開始測試AD102，將用於GeForce RTX 4090

傳聞英偉達將會在今年年末發布Ada Lovelace架構的GPU，其中旗艦型號產品將採用AD102，包括GeForce RTX 4080/4090系列顯卡。據稱GeForce RTX 4090最多會有144組SM，即18432個CUDA核心，搭配24GB的GDDR6X顯存，位寬是384位，採用12+4Pin新式12VHPWR供電接口，功耗將達到600W或以上。傳聞其擁有2.2 GHz的核心頻率，提供81 TFLOP的計算性能（FP32）。近日有網友透露，英偉達已經開始測試AD102，使用的是速率為24 Gbps的顯存晶片。雖然無法印證內容是否准確，不過按照一般GPU生產測試的流程和時間來看，如果英偉達真的打算在今年秋天左右發布GeForce RTX 40系列顯卡，這個信息是合乎邏輯的。前一段時間曾有流言稱，英偉達可能會跳過GeForce RTX 40系列，採用GeForce RTX 50系列的命名方案，不過該網友似乎非常確信英偉達不會這麼做。與目前基於Ampere架構的GeForce RTX 30系列GPU不同，英偉達在Ada Lovelace架構GPU上選擇了台積電的5nm製程節點，取代三星成為新一代晶片的晶圓代工廠。有報導指，英偉達在2021年第三季度已向台積電預付了16.4億美元，並在2022年第一季度再支付了17.9億美元，整個長期訂單預付款項將達到69億美元，以此保證晶片的生產。此前GTC 2022上，英偉達發布了新一代基於Hopper架構的H100，採用了台積電的4nm工藝製造，而且是為英偉達量身定製的版本。可見在工藝和產能上，英偉達也是下足了功夫。 ...

1...383940...90 Page 39 of 90

Tag: NVIDIA