ASUS GTX 680 評測顯卡

序言

在AMD HD7970發佈三個月之後，NVIDIA終於拿出了自己基於TSMC 28nm工藝製程的首款桌面新GPU GK104 (研發代號)，對於用戶而言，HD7970幅度並不大的性能提升以及上市後高高在上零售價格讓絕大部分的用戶並沒有立刻想要更新自己產品的沖動，更何況正在關注GPU發展的用戶也很清楚NVIDIA不可能坐等AMD一家霸占高端市場，GK104的問世除了對於用戶來說多一個選購餘地之外，更多的意義在於兩家GPU研發廠商能夠重新回到起跑線為大家提供更為良性的市場發展.本次評測使用的GTX 680源自ASUS，實為NVIDIA原廠卡.

GK104架構解析

GTX680的心髒採用了開普勒架構，其設計目標自然是要在前代費米架構的基礎上提升性能和性耗比.開普勒架構或多或少的保持了費米架構的基本組件階層體系，強調快速與並行化的組件負載.如果把這個階層體系比喻成一個弁當飯盒的話，那麼在最上層的則是PCI-E 3.0接口，256-bit位寬的顯存接口及一個高度優化的NVIDIA GigaThread引擎

GK104規格圖:

GK104芯片圖:

這個GigaThread引擎下面有四個圖形處理簇(GPC).每一個GPC都是一個自成體系的GPU次級單位，包含了幾乎一切作為一個GPU獨立運作所需的組件.每個GPC擁有一個共享資源和兩個專有資源.其共享資源是一個光柵引擎，用來處理諸如邊緣設置，Z消隱一類的光柵操作;而其專有資源則是兩個得到了高度優化的”新一代流處理器X”(SMX)，這就是GPU用來做數字運算的資源了，其高度並行化的設計用以滿足現今各種大型3D應用的高負荷

GK104架構圖:

GPC規模圖:

“SMX”規模圖:

每一個SMX也進一步擁有自己的共享資源和專有資源.其共享資源「新一代PolyMorph 2.0引擎「用於處理諸如頂點獲取，曲面細分，視角變換，屬性設置之類的底層光柵操作.而專有資源則是進行數字運算的地方.四個Warp調度程序用來在192個CUDA核心之間調度指令和數據.每個SMX含有16個被緩存的紋理記憶體單元.Warp調度程序採用了更為高效的軟件預解碼算法而提升了發佈指令的速度.在着色器的編譯階段，NVIDIA驅動里的着色點編譯器就會評估指令流，按需求對指令進行重新排序，並且為硬件提供附加信息

NVIDIA這次亦帶來了另一個創新概念——無綁定紋理.在經典GPU模型里，對於紋理的引用，GPU必須在一個固定尺寸的映射表里面為其分配空間，所以每個着色器在同一時間所能訪問的紋理數是有限的，例如在前代費米架構中每個着色器只能同時訪問128個紋理.而開普勒架構則是去掉了這個綁定步驟，現在着色器可以直接在記憶體中引用紋理了，不再需要傳統的映射表，因此理論上來說能引用的紋理數不再受限.這樣一來，渲染如上圖所示的精緻場景也成為輕而易舉的事情

NVIDIA這次還引入了一個新的抗鋸齒算法叫做TXAA.過去的幾年里誕生的一些較新的抗鋸齒算法諸如FXAA，SMAA，SRAA之流，都是在提升畫質的同時力圖降低對性能造成的損耗.這次的TXAA則是更進一步——超越8X MSAA的畫質，優於4X MSAA的性能損耗.TXAA結合了硬件多重取樣，臨時抗鋸齒以及定製化抗鋸齒.TXAA一共分為兩檔:TXAA 1擁有8X MSAA的畫質和2X MSAA的性能損耗，而TXAA 2則擁有超越了8X MSAA的畫質，其性能損耗可比肩4X MSAA.由於低級別的MSAA對於現今的GPU而言已經比較便當，並不會帶來太大的性能損失，今次的TXAA可以說是在畫質上輕松勝出.不過應用程序和遊戲也必須要做專門的優化才能夠從TXAA獲益，所以NVIDIA的公關部請繼續給力吧.我們期待未來的遊戲越來越多的支持TXAA

NVIDIA亦在其驅動控製麵板里加入了FXAA的選項，可以在所有遊戲中啟用，而無需依賴遊戲開發者去集成它

開普勒三大特色的最後一項則是「適應性垂直同步」.此項新功能可以動態的調整幀率上限的鎖定，用來保證更加平滑流暢的遊戲體驗.傳統的垂直同步僅僅是在屏幕每次刷新後把每一幀的數據傳輸過去，這麼一來如果GPU對某一幀的渲染耗時超過了屏幕兩次刷新時間，那麼之前的那一幀畫面則會連續停留在屏幕上，相當於瞬時幀率降減半甚至更多，造成所謂的「卡頓」現象.而適應性垂直同步的做法則是動態的調節幀率上線的鎖定，用於平滑幀率，減緩卡頓現象

架構解析翻譯自”www.techpowerup.com”基於GTX 680的評測文章，感謝版主voidshatter提供翻譯工作.

產品規格

在產品評測之前還是要先瞭解一下目前GTX 680原廠的公版規格.首先GTX 680的研發代號為GK104，隸屬於整個開普勒系列之下，製造工藝為TSMC 28nm，核心面積為294mm2，這要明顯小於AMD的Tahiti，然後是所集成的晶體管數量為35億個.如果大家仔細推算Tahiti和GK104的DIE面積與晶體管數量之比的話，會發現兩者相差甚小.Shader數量上GK104為1536個，核心頻率為1006MHz，顯存頻率達到了破歷史的6008MHz，總線帶寬為256bit，帶寬為192.3GB/s，顯存為2GB，外接供電為6+6pin.當我們都瞭解完GK104的規格，再去回眸NVIDIA上一代GTX 500系列的規格，絕對會認為GK104隻能算是當年的中端產品，事實也的確如此，今年NVIDIA還會拿出真正的旗艦GK110，對於GK104而言，顯存和顯存頻率的確在性能上給予了強大的後盾，而規格上更接近當年AMD在HD4000系列時玩的那套”小核心”戰術，不同的是，AMD從來沒有把自己的”小核心”將競爭對手NVIDIA的旗艦產品給拉下馬，只是在性能/功耗/價格比上更優於對方而已.

GTX 680的GPU-Z截圖:

產品解析

ASUS送測的GTX 680原廠卡外包裝.

GTX 680原廠卡長度約為25cm，採用OTES一體外排式散熱器

背部為**露的黑色的PCB

視頻輸出接口為DP+HDMI+雙DVI.可支持4屏輸出

離心風扇

散熱解析

可單獨拆卸的散熱器外殼，我們可以看到外殼內部的風道結構.

GTX 680因為PCB較短的緣故，這樣的好處是散熱塊本身長度就短，隨後離心扇到PCI擋板之間的距離也相應縮短，低風阻+低距離風道使得散熱的效能得到了提升，實際使用當中GTX 680的確算是OTEX散熱器中靜音效果非常理想的一款

為PCB發熱元件提供散熱的金屬支架同時也能保護PCB受重而彎曲，所以一般情況上OTES散熱器無需背板，除非PCB背部有顯存需要幫助散熱

體積很小的散熱塊，內部集成了3根壓扁的熱管作為導熱用

外露的銅底便是與GPU核心接觸的地方

PCB解析

從用料上來看，GTX 680也印證了”中端卡”的身價，當然用戶在使用中不會介意自己的顯卡用料是否奢華，我也只是站在廠商成本角度來分析一些客觀事實.

當我第一次看到這個雙DVI接口的時候，我不得不認為以前所有的雙DVI，哪怕是有防磁EMI金屬屏蔽罩的，也都只能被稱為”普通DVI接口”了，因為GTX 680這個傾斜的角度實在讓人看着很”文藝”

GK104的核心特寫，步進為A2，可以看得出GK104經過了A0和A1兩次的試水

顯存顆粒來自Hynix

為了滿足6008MHz超高頻率的顯存頻率和可擴展到4GB的顯存容量，GTX 680的顯存供電採用了2相

核心4相供電，我能吐槽一下為何這一代AMD和NVIDIA高端顯卡都空喊着1相供電呢?是給第三方廠商做超公版預留了PCB解決方案麼?

PWM芯片位於PCB的背部，型號是RT8802A，支持2~5相供電

又一個讓我覺得GTX 680非常”文藝”的地方，雙6pin外接供電

測試平台

處理器

Intel Core i7-3960X 3.30GHz (100×33)

散熱器

Thermalright Archon

主板

ASUS Rampage IV Extreme X79

記憶體

Corsair CMZ16GX3M4X1600C9 DDR3 1600 4Gx4 (9-9-9-24) 1.50v

硬盤

Intel SSD 320 120G SSD

顯卡

AMD HD7970 GDDR5 3GB (925/5500MHz)

NVIDIA GTX 680 GDDR5 2GB (1006/1059/6008MHz)

電源

Seasonic X-1250

顯示器

DELL UltraSharp 3008WFP 30″

機箱

Antec P280

系統

Microsoft Windows 7 64bit SP1

驅動

AMD 12.2 for HD7970

NVIDIA 301.10 for GTX 680

修正檔

DirectX End-User Runtimes (2011.4)

測試軟件

3DMark 11 [老牌顯卡權威評測軟件最新之作]

Unigine : Heaven (Demo) v2.0 [強化曲面細分的DX 11 Demo]

Battlefield 3 [DX11人氣FPS遊戲，最新一代Frostbite Engine(寒霜引擎)]

Crysis 2 [公認DX11目前畫質最好的FPS遊戲，最新一代CryEngine]

Total War: SHOGUN 2 [帝國全戰最新作品，人氣很高的RTS類遊戲，採用了Warscape引擎]

Metro 2033 [畫面直逼電影級別，部分場景還是用了曲面細分技術]

S.T.A.L.K.E.R. : Call of Pripyat v1.0 [支援DX 11的高負載遊戲引擎]

其它

GPU-Z 0.6.0 [GPU權威檢測軟件]

FurMark 1.9.2 [測試功耗與溫度的權威烤機軟件]

室內溫度:20℃

AMD在驅動中將”Power Control settings”設置為+20%;NVIDIA在驅動中關閉物理加速

散熱性能解析

待機下核心頻率大大超於我的想象，居然有324MHz，但是實測待機功耗並不高，看來主要影響待機的還是核心電壓(VDDC)而非頻率.散熱方面待機核心溫度為31℃，風扇轉速為1080RPM.

滿載下核心溫度為82℃，但風扇轉速為2460RPM，看得出NVIDIA更趨向靜音的使用感受

這一代GTX 680 NVIDIA加入了核心頻率動態提升功能，當GPU負載達到滿載時，核心頻率會自動提高，例如下圖中為3DMark 11的頻率監控圖，我們可以看到核心頻率最高為1124MHz，這要比默認1006MHz多出了118MHz，並且這個頻率也並不是一直恆定不變

當使用Furmark測試滿載溫度與功耗的時候，我又發現GTX 680的核心頻率並不會提升，始終被限制在了1006MHz，測試期間也有會員給我提供了他的Furmark截圖，他手上的卡在跑Furmark的時候會將核心頻率自動提高，總之NVIDIA未給媒體解釋動態頻率工作原理之前我們也無法給大家一個准確的相關解釋

性能測試

在分析性能測試之前，必須先要告知大家一些注意事項:

數據體現的功耗並非實際GTX 680的TDP，一來NVIDIA有功耗保護裝置，目前還未有破解的方法，二來Furmark全程核心頻率為1006MHz，並非動態頻率最高的1124MHz;
目前還未有公開的破解NVIDIA GTX 680核心頻率動態提升的方式，所以實際性能測試中的數據並非1006MHz核心頻率的實際表現.

我知道用戶很關心HD7970和GTX 680的性能表現，所以此次測試中的HD7970更新了之前的測試數據，新數據基於最新正式版的12.2驅動，而GTX 680也採用了目前NVIDIA官網的301.10正式版驅動

GTX 680的頻率動態調整在3DMark 11這類跑分測試很大程度上提高了GTX 680對於HD7970的壓制，至少從數據來看，可以用
“壓倒性”戰勝來總結;
曲面細分性能依然NVIDIA保持領先，雖然AMD的HD7900替換了架構增加了對於曲面細分的性能提升，但似乎單純這一方面永遠無法趕超NVIDIA同級別的產品;
作為一款2GB顯存，256bit總線帶寬的產品，2560×1600顯然有點勉強，雖然並未出現以前GTX 580 1.5GB顯存在高分辨率在爆顯存的現象，但從一些原本低分辨率勝出但高分辨率反而落後的結果可以看得出這樣的規格不適合高分辨率(包括多屏)用戶;
面對Metro 2033此類引擎優化並不理想極其考驗GPU暴力運算的遊戲，GTX 680也出現了無法超越HD7970的問題，恐怕此類遊戲NVIDIA只能依託未來GK110了.
Total War現階段驅動存在Bug，跑Benchmark得分很不正常(1680×1050分辨率只要不開AA+AF有160多幀，開啟之後只有40多幀)，故暫不計分，並且取消綜合得分計算，等新驅動出現後重跑我再更新.

總結

因為功耗限制與頻率動態提升的原因，事實上我們很難從產品本身真實的表現面來為大家呈現GTX 680的眾多真實數據，但從使用面來分析，GTX 680擁有更低的功耗，擁有絕大部分遊戲的性能優勢，同時還擁有更為安靜的散熱效果，拋開產品性能的丁點差異，選購面上一定是GTX 680更具備誘惑力，更別提在成本面上，NVIDIA更是擁有DIE更小，產品成品等更低的成本優勢，想當年AMD的”小核心”硬生生地把HD2900XT之後慘烈的市場占有率提升到在民用桌面市場幾乎和NVIDIA平分秋色的境地，如今反而是NVIDIA將”小核心”戰術貫徹地的更加徹底.如果AMD今年不再拿出任何可以還擊GK104甚至是未來GK110的話，相信下一次AMD的裁員就不只是10%的全球市場部那麼簡單了.

作者：nApoleon
來源：Chiphell