超能課堂(290):處理器是如何從單核演化到64核的

自Intel在1978年推出第一顆x86處理器8086之後,CPU的發展方向一直都是更寬,整合更多的指令集與外部控制器,以及更高的主頻,但這些東西都會受到當時的製程工藝限制,CPU內核架構沒個三五年其實是沒法弄個全新的出來的,而頻率這東西則得同時看CPU架構與製程工藝,當CPU的單核效能與頻率都到瓶頸之後,Intel與AMD都得出了一個答案,向多核發展,到了2005年,雙核時代到來,就此之後CPU的內核數量越堆越多,直到現在16核能出現在主流平台上,而HEDT平台甚至能達到64核之多。

今天我們就來回顧一下多核處理器是如何發展到現在這個樣子的。

首個雙核處理器:Intel Pentium D

其實Intel與AMD的雙核處理器發布時間都在2005年5月,但Intel的Pentium
D要早一點,所以它就成了第一個雙核處理器了,首發的包括Pentium D 820/830/840,採用90nm工藝核心代號Smithfield,每核心擁有1MB
L2緩存,均是800MHz的FSB,隨後還推出了帶超線程技術的Pentium Extreme Edition
840處理器,雙核四線程,FSB也提升到了1066MHz,頻率也更高。

超能課堂(290):處理器是如何從單核演化到64核的

在次年一月份Intel推出了升級65nm工藝的Presler,也就是Pentium D
900系列,更先進的工藝帶來了更高的頻率以及更好的功耗控制,L2緩存也升級到每核心2MB,但FSB沒變,至尊版則包括955和965兩個型號,他們均解除了倍頻鎖,同時他們還推出了Pentium
D 805處理器,頻率比Pentium D 820更低,而且FSB降低到533MHz,但價格低得多,它的存在確實為普及雙核處理器有不少貢獻。

當然了Pentium D也是一款爭議很大的產品,畢竟他里面是兩顆以高頻低能著稱的Pentium 4處理器,而且不是兩個Pentium
4內核,而是真的是兩顆Pentium 4處理器(Smithfield是兩個Prescott,而Presler則是兩個Cedar
Mill),他們被封裝到一塊PCB上,而且他們之間是沒有直接互聯的,數據交換需要通過FSB,但FSB本來就不夠用,這導致雙核效能季度低下,性能完全不是AMD
Athlon 64 X2的對手,再加上Pentium 4本來就熱,把兩個封在一齊只會更熱,在很長一段時間里Pentium D都被人叫作大火爐。

現在來看Pentium D系列處理器只是Intel的一個緩兵之計,要第一款雙核處理器的頭銜,還得找產品對抗AMD的雙核,但自己的真雙核Core 2
Due要等新工藝,所以就把Pentium D搬了出來。

首款原生雙核:AMD Athlon 64 X2

AMD的雙核處理器Athlon 64 X2也是在2005年5月份出的,但比Intel要晚,沒搶到首款雙核的頭銜,但與Pentium
D不同,AMD的Athlon 64 X2是在同一塊晶片內整合了兩個K8核心,兩個核心之間可透過System Request
Queue實現數據互通,執行效率比Pentium D好多了,所以有了當年聲勢浩大的真假雙核討論。

超能課堂(290):處理器是如何從單核演化到64核的

最初Athlon 64 X2隻出在Socket
939平台上,採用90nm工藝,型號從3600+到4600+,頻率從2GHz到2.4GHz,L2緩存有256KB*2、512KB*2以及1MB*2三種。在2006年5月推出AM2平台後就轉移到了那邊,這次頻率范圍是2GHz到3.2GHz,型號則是從3600+到6400+,L2緩存依然是那三種容量。

在2006年12月,AMD推出了升級65nm工藝的Athlon 64
X2處理器,L2緩存統一成512KB*2,頻率從1.9GHz到3.1GHz,型號是3600+到6000+,此外還有45W的低功耗衍生版本Athlon X2 BE
45w系列。

K8時代可以說是AMD當年的頂峰,基本上K8架構是要遠優於對手Intel Pentium4所用的NetBusrt架構的,與後來這Core
2 Due相比雖然說處於劣勢但至少還可打得有來有回,而K8之後的K10以及推土機架構的表現就真的一言難盡。

首款四核處理器:Core 2 Quad

Intel的Pentium D處理器的繼任者是非常經典的Core 2 Duo處理器,而且他們還用當年炮製首款雙核處理器的手法造出了首款四核處理器Core
2 Quad。

超能課堂(290):處理器是如何從單核演化到64核的

首款桌面級的四核處理器誕生於2006年11月2日,首發的只有Core 2 Extreme Edition QX6700,最後陸續推出了Core 2
Quad Q6600、Core 2 Extreme Edition QX6800、Core 2 Quad Q6700、Core 2 Extreme
Edition QX6850。

這些處理器的核心代號是Kentsfield,其實就是由兩個Conroe的Core 2
Due封裝而成,跨晶片通信同樣需要通過FSB,不過FSB頻率和Core 2
Due一同提升到了1066MHz,至尊版的QX6850則直接提到1333MHz的FSB,主頻則是從2.4GHz到3GHz,均配備4MB*2的L2緩存。

這次Intel比AMD足足早了一年拿出了四核處理器,也就是說Core 2
Quad在一年的時間內根本沒有對手,即使AMD在一年後拿出了K10這個原生四核,並再一次挑起了真假四核之爭,但K10早期存在TLB
bug大幅影響性能,再加上Core架構實在太強了,即使是膠水四核也能把AMD的原生四核打趴下。

更重要的是,AMD在推出K10的時候,Intel這邊已經拿出了45nm製程升級版的Yorkfield,更先進的工藝帶來了更高的頻率,FSB也全部提升到1333MHz,而且產品線也進行了細分,根據L2的容量來進行劃分,有2MB*2的Q8x00系列,3MB*2的Q9x00系列,還有6MB*2的Q9x50系列,最高端的當然還是至尊版,Core
2 Extreme QX9770可以說LGA 775平台的絕唱,FSB達到了1600MHz,頻率3.2GHz,不過呢,實際上Core
2處理器的超頻能力都非常好,很多45nm的Core 2 Quad動手超下都能達到它的水平。

首款三核處理器:AMD Phenom X3

AMD的K10架構四核是2007年11月11日發布的,它確實是首款的原生四核處理器,並且首次把L3緩存引入到消費級市場,但它上來就碰到TLB
bug,雖然可以通過bios升級修復問題,但會導致5%到20%的性能損失,直到次年4月推出的B3步進產品才修復了問題,但整體效能還是不如對手的Core 2
Quad。

超能課堂(290):處理器是如何從單核演化到64核的

不過原生四核倒是能比Intel的膠水四核玩出更多的花樣,比如屏蔽一個核心就可以當成三核處理器拿去賣了,這就有了Phenom
X3,在市場上銷售的盒裝Phenom
X3其實都是B3步進的,第一代產品由於還是採用65nm工藝,所以頻率較低,從1.9GHz起步,最高2.5GHz,每個核心獨享512KB
L2緩存,所有核心共享2MB L3緩存。

Phenom
X3的目標對手自然不會是對手的四核,而是他們的雙核處理器,想憑借多一個核心來戰勝對手,但當時系統與軟體對多線程優化遠沒有現在那麼好,再加上到了2007年Intel的產品已經升級到了45nm工藝,頻率以及超頻能力都要比AMD好不少,多一個核心其實沒給AMD帶來多大優勢,而且較低的頻率讓Phenom
X3在當時的遊戲表現還不如自己的高頻K8雙核。

但這些三核處理器帶來了開核玩法,就是把原本屏蔽了的殘缺核心通過BIOS里面的ACC選項重新開啟,這就讓當時AMD的處理器充滿話題性,當然開出來的是原本殘缺核心,多少有些問題,所以頻率可能要降一點,電壓也要加一點,但這對玩家來說不算什麼,開核的玩法後來也擴展到後來的Athlon
II和Phenom II處理器上。

在45nm版K10處理器推出後AMD還推出了Phenom II X3以及屏蔽L3緩存的Athlon II
X3處理器,後續的第一代採用K10內核的APU也有A6-3500這個三核的型號,基本上三核處理器伴隨了K10架構的整個生命周期。

首款六核處理器:Core i7-980X

2010年3月16日推出的Core i7-980X是首款6核處理器,核心代號Gulftown,它基於Westmere架構
,也就是Nehalem的32nm版本,所以也繼承了整合三通道記憶體控制器、QPI總線、Turbo Boost以及重新啟用的超線程技術,處理器每核心擁有256KB
L2緩存,共享12MB L3緩存,主頻是3.33GHz,最高睿頻3.6GHz。

超能課堂(290):處理器是如何從單核演化到64核的

由於X58屬於HEDT平台,所以Gulftown六核其實也沒幾款,前後一共才出了四顆,售價也高高在上,對市場影響有限,但它的存在是給對手六核Phenom
II
X6的一個降維打擊,性能遠超對手,發布也比你早一個月,用的工藝也比你先進一代,在當時,從CPU技術上講,AMD徹底失去了「話語權」,當然了如果說對市場的影響,便宜的Phenom
II X6比高價的Core i7-980X要大多了。

首款八核處理器:AMD FX-8100系列

其實說2011年AMD推出的Bulldozer推土機是首款八核處理器估計會有很大爭議,因為它是一個模塊化的CPU,每個模塊內有2個整數單元和1個高度共享的浮點單元,AMD的FX系列處理器最多擁有4個這樣的模組,而AMD將每個整數單元都視為一個核心,所以FX-8100系列也成為世界上首款原生8核桌面CPU。

超能課堂(290):處理器是如何從單核演化到64核的

當然了,推土機處理器的性能有多糟糕我已經不想再提了,當年關於AMD
FX系列處理器是否是「真8核」很多玩家與AMD之間出現爭議,一些玩家甚至認為AMD涉嫌非法宣傳,將AMD告上了法庭,最後這官司還贏了,AMD因此而吃了罰單。

首發的FX-8100系列有五個型號,最高加速頻率是4.5GHz,每個模組共享2MB L2緩存,所有核心共享8MB
L3緩存,TDP有95W和125W兩種。一年後推出的Piledriver打樁機處理器則是推土機的改良版本,不過性能其實也沒高多少,FX-8300系列一共有7個型號,最高加速頻率降至4.3GHz,TDP同樣是95W或125W,不過嘛,還有FX-9590和FX-9370兩個標配一體式水冷散熱器的奇特產品,他們的TDP高達220W,前者最高加速頻率達到了5GHz,後者也有4.7GHz,當年是AMD追高頻追得比較瘋狂。

其實推土機一共有四代架構,除了上面已經提到的推土機和打樁機之外,還有Steamroller壓路機以及Excavator挖掘機,但AMD在推出打樁機後就放棄了與Intel在高端平台上的爭奪市場,後面兩種架構只出現在APU上。

而桌面市場的第一顆真八核處理器是Intel在2014年推出Core i7-5960X,屬於22nm的Haswell-E架構
,基礎頻率3GHz,最高睿頻3.5GHz,擁有20MB L3緩存,是用HEDT的X99平台上的,999美元的高昂售價也讓許多玩家望而卻步。

至於主流平台的八核處理器,則是2017年AMD Zen架構的第一代Ryzen 7系列處理器,是它正式引發了Intel與AMD在處理器市場上的核心數量大戰。

首款十核處理器:Core i7-6950X

Intel在2016年5月發布的Core i7-6950X是首款桌面的十核處理器,它所用的Broadwell-E架構其實就是Haswell-E的製程升級版,生產工藝從22nm升級到14nm,核心數量從上代Core
i7-5960X的8核增加到10核,電晶體數量也從26億增加到32億,但因為更先進的製程工藝,晶片面積從355.52mm2縮減到246mm2

除了核心數量與製程之外,Core i7-6950X與Core
i7-5960X的區別其實不算大,L3緩存容量增加到25MB,基礎頻率依然是3.0GHz,最大睿頻2.0頻率3.5GHz,但在這一代處理器Intel引入了Turbo
Boost Max 3.0技術,最高單核睿頻能到4.0GHz,此外支持DDR4的頻率也從2133MHz提升到2400MHz,但這個對於X99主板來說意義不大。

超能課堂(290):處理器是如何從單核演化到64核的

而主流市場的10核處理器直到2020年5月才到來,它就是Core i9-10900K,目前市場上就Comet
Lake這一代有10核的產品,最新一代的Rocket Lake最多就只有8核,AMD的Zen 2因為架構問題8核以上只能出12核或16核的產品,而Zen
3理論上是能出10核或者14核的,但AMD可能覺得沒必要所以沒出。

Intel Skylake-X:12/14/16/18核一同到來

在2017年6月份,Intel推出了第七代Core
X系列處理器,不過這代產品有點奇葩,有Skylake-X與Kabylake-X兩種不同架構的處理器,當中Kabylake-X可以說是非常坑,所以後續也沒有類似的產品了,而Skylake-X則與以往HEDT產品一樣源於伺服器處理器。

與上一代X99平台的Broadwell-E處理器相比,Skylake-X處理器多了12核、14核、16核、18核的產品,並且用Core i9取代Core
i7成為Intel消費級市場上最強處理器的代名詞。

超能課堂(290):處理器是如何從單核演化到64核的

Skylake-X與主流級的Skylake相比,緩存結構有了明顯的調整,L2緩存從每核心256KB提升到1MB,L3則從每核心共享2MB變成了1.375MB,這樣做可以提升L2的命中率降低訪問延遲,提升IPC。此外網狀總線取代了環形總線,這樣有利於拓撲更多核心數量,AVX-512指令集也是從這代架構開始引入的。Turbo
Boost MAX 3.0從Broadwell-E的只能提升單核頻率變成最多可以提升兩個核心的頻率,但頻率提升幅度沒以前那麼大。

第7、9、10代Core X處理器都是用Skylake-X架構的,雖然第10代的代號改成了Cascade
Lake,但本質上就是Skylake-X,就多了4條PCI-E通道並且強化了AI性能。

不過實際上第一個上市的12核和16核處理器是AMD的銳龍Threadripper
1920X和1950X,他們在2017年8月份就上市了,而Intel只是在6月份紙面發布了第七代Core
X系列處理器,7月份首批上市的只有10核及以下的產品,12和到18核的產品要等到10月份才上市。

在2019年,AMD推出了Zen 2架構的銳龍3000系列處理器,把12核與16核處理器推向了主流市場。

Ryzen Threadripper系列:24/32甚至64核

實際上這些年挑起核心數量大戰的不是Intel,而是AMD,他們在第一代EPYC上玩起MCM之後就一發不可收拾,而基於EPYC的銳龍Threadripper自然也這樣,第一代銳龍Threadripper處理器最大核心數量只有16,而到了2018年發布的第二代銳龍Threadripper,最大核心數量直接翻倍到32。

超能課堂(290):處理器是如何從單核演化到64核的
銳龍Threadripper 2990WX

銳龍Threadripper 2000系列處理器採用12nm
Zen+內核,分為WX系列和X系列,X系列和第一代是一樣的,只有兩個內核可工作的內部雙路系統,最大核心數16個,而WX系列則是四個內核都可工作的,和伺服器的EPYC一樣內部是四路互聯,最大核心數32個。

核心之間採用25GBps的Infinity Fabric總線互聯,只有核心0和核心2提供記憶體控制器和PCI-E控制器,
於核心1和核心3是沒有直接連接記憶體和PCI-E的,銳龍Threadripper
2970WX/2990WX只能工作在NUMA模式,這核心1/3的通信延遲明顯高於核心0/2,所以會限制這兩個核心的性能。

超能課堂(290):處理器是如何從單核演化到64核的
銳龍Threadripper 3990X

到了Zen 2架構的銳龍Threadripper
3000,CPU被拆分成CCD計算核心和IOD輸入輸出核心,所有的記憶體、PCI-E、USB、SATA控制器轉移到了IOD上,CCD與IOD之間採用第二代Infinity
Fabric總線連接,這樣延遲雖然會有所增加,但是很好的解決了每個核心之間訪問記憶體和PCI-E時延遲不一的問題,並且每個IOD最多可連接8個CCD,於是就有了64核的銳龍Threadripper
3990X。

Intel Lakefield:開啟混合架構新時代的五核處理器

Intel的Lakefield項目其實在2019年就正式公開了,而產品正式上市是2020年,這款產品的實驗性質很重,它是首款採用Intel Foveros
3D堆疊工藝的產品,也是首款採用混合架構的x86處理器。

超能課堂(290):處理器是如何從單核演化到64核的

Lakefield SoC至少包含四個層,頂部兩層是由PoP封裝的DRAM記憶體所組成,由兩塊BGA
DRAM堆疊在一起,第三層則是由10nm工藝打造的CPU與GPU,最底層則是由22nm工藝打造的I/O與緩存層。

10nm工藝的計算晶片包含一個Sunny Cove大核,獨享512KB L2緩存,四個Tremont小核,它們共享1.5M
L2緩存,所有核心共享4MB的L3緩存,記憶體控制器是4*16位的,支持LPDDR4,整合了Gen 11核顯,有64個EU單元,Gen
11.5顯示控制器還有新的IPU,支持DP 1.4。

Lakefield家族只有Core i5-L16G7和Core
i3-L13G4兩款產品,兩者的主要區別的是頻率以及核顯的EU數量,只有少數輕薄本用了這款處理器,性能表現其實還不錯,5W的Core
i5-L16G7甚至可以與15W的Core i5-10210U叫板。

在經過Lakefield的小規模實驗後,Intel的混合架構將會在這個月底發布的Alder
Lake處理器上開花結果,大家可以期待桌面滿血的混合架構x86處理器到底會怎麼樣的表現,而Foveros 3D堆疊工藝也會用在未來的Xe-HPC伺服器計算卡上。

展望未來

在可預見的將來,桌面市場的最大核心數量依然會維持在64核,因為Intel和AMD的新一代HEDT處理器完全沒有消息,但從兩家最新的伺服器處理器來看,Intel的最多不會超過40核,而AMD最多也是64核,Intel把雙芯Xeon下放到HEDT平台可能性非常小,主要看點還是AMD未來的Zen
4,有消息說Zen 4架構的EPYC處理器最多能到96核,但是否會下放到HEDT平台這就不太確定了。

主流平台方面,目前的消息是代號為Raphael的Zen 4處理器最高配置依然為16核,Intel方面下一代的Raptor
Lake則最多24核,但是由16個E-Core加8個P-Core所組成的,也就是說最多32線程,線程數和Zen
4的16核保持一致,但這些都不是實錘的消息,還有很大不確定性。

來源:超能網