MCM | 搜資訊

AMD Instinct MI300或採用3D晶片堆疊：8個計算模塊，支持PCIe 5.0和HBM3

AMD去年推出了基於CDNA 2架構的Instinct MI200系列計算卡，這是第一款採用MCM多晶片封裝的GPU，是首款百億億級的GPU加速器。事實上，在Instinct MI200系列還沒有發布之前，就已經傳出了Instinct MI300系列的消息了，近期還出現在了Linux修正檔里。據VideoCardz報導，Instinct MI300系列GPU可能會提供多種規格，配備的HBM3顯存堆棧可能分別會從兩個到八個。值得注意的是，Instinct MI300系列GPU可能會採用3D晶片堆疊，在小晶片的下方會有一個帶I/O接口的基礎模塊。據稱，每個基礎模塊可以連接兩個HBM3顯存堆棧，採用6nm工藝製造，而計算模塊則採用5nm工藝製造。集成了計算模塊和基礎模塊的單一小晶片的尺寸大概在110mm² 左右，擁有四個小晶片的頂級型號的中介層將有約20000個信號引腳，相比M1 Ultra多出了一倍。功耗方面，一個小晶片大概是150W，最高端的型號的功耗將達到600W左右，與目前OAM規格的Instinct MI250X的560W相近。 ...

Instinct MI300系列或首次出現在Linux修正檔，AMD下一代怪獸級計算卡

AMD在去年年末，推出了基於CDNA 2架構的Instinct MI200系列計算卡，這是第一款採用MCM多晶片封裝的GPU，是首款百億億級的GPU加速器。在Instinct MI200系列還沒有發布之前，其實已經有報導指出，Instinct MI300系列已經在路上了。近日有網友指出，最新的Linux修正檔里包含了一個AMD未發布的產品，名為GFX940，支持所有針對數據中心的功能，與Instinct MI200系列GPU的型號（GFX90a）非常相似。盡管型號上相似，但與代號Aldebaran的CDNA 2架構GPU相比存在一些差異，推測很可能是下一代基於CDNA 3架構的Instinct MI300系列。傳聞Instinct MI300系列GPU會有四個計算模塊（GCD），如果按照Instinct MI200系列GPU的規模計算，將會有440個CU，28160個內核，並沿用MCM封裝技術。據稱CDNA 3架構並不是從CDNA 2架構遷移後做細微的修正，而是修改過的新架構，GPU最終布局與RDNA 3架構類似，但是會針對HPC細分市場做優化。 ...

英特爾專利探討新的圖像渲染解決方案，預示未來遊戲GPU也將採用多晶片設計

AMD將會在今年推出Radeon RX 7000系列顯卡，搭載基於RDNA 3架構的Navi 3x系列GPU。其中Navi 31和Navi 32將採用MCM多晶片封裝，GCD（圖形計算晶片）和MCD（多緩存I/O晶片）會採用兩種不同的製程工藝。近期英特爾的一項新專利，描述了多個計算模塊如何協同工作進行圖像渲染，預示著未來英特爾GPU也將採用MCM多晶片封裝。英特爾在面向數據中心和超級計算機的Ponte Vecchio已使用了多晶片設計，對類似MCM的技術並不陌生。在這項專利中，英特爾提出了一種GPU圖像渲染解決方案，將多個晶片集成在同一單元內，以解決製造和功耗等問題，同時針對可擴展性和互聯性做相關優化，以提供最佳性能。目前這類圖像渲染問題會通過AFR（交替幀渲染）和SFR（分幀渲染）這些算法來解決，不過英特爾討論的是整合了計算模塊的棋盤格渲染，同時還有分布式的運算，以便在多晶片設計的GPU上有更高的運算效率。在專利文件中，英特爾沒有對架構層面的細節進行過多的描述，但可以預期，Intel Arc（銳炫）品牌顯卡搭載MCM多晶片封裝的GPU只是時間問題。此前英偉達的研究人員也發表了一篇文章，詳細介紹了英偉達正在探索如何為未來產品部署多晶片設計方案。隨著異架構計算的興起，英偉達正在尋找一種方法，增加其半導體設計的靈活性，以根據工作負載的不同，靈活匹配各種模塊，這也是MCM多晶片封裝的用武之地。 AMD已率先在消費級產品上使用MCM多晶片封裝技術，相信英特爾和英偉達最終也會選擇這麼做。未來AMD、英特爾和英偉達很可能會選擇台積電相同的工藝，每一個技術上的細微優勢都可能對最終產品產生巨大的影響。 ...

AMD公布Instinct MI250X與NVIDIA A100對比測試數據，有絕對性能優勢

幾天前，AMD宣布推出基於CDNA 2架構的Instinct MI200系列計算卡，這是第一款採用MCM多晶片封裝的GPU，是首款百億億級的GPU加速器。更出人意料的是，AMD現在還公布了與競爭對手英偉達A100計算卡之間的對比測試數據。雖然硬體公司在一些活動上展示性能優勢的PPT並不少見，但官網上公開詳實的實際對比測試數據卻不多，這說明了AMD對自己的這款產品在性能方面非常有信心。 AMD Instinct MI200系列計算卡搭載了代號Aldebaran的GPU，擁有580億個電晶體，採用台積電6nm工藝製造，搭配了128GB的HBM2e顯存（總帶寬3.2 TB/s），TDP為560W。該系列有Instinct MI250和Instinct MI250X兩款產品，分別有208個CU（13312個流處理器）和220個CU（14080個流處理器）。其GPU中的小晶片輔以XGMI內部互聯設計，均具有VCN 2.6控制器，還使用了2.5D Elevated Fanout Bridge（EFB）封裝技術。此外，GPU里的兩個小晶片通過AMD Infinity Fabric技術連接，提供高達100 GB/s的雙向帶寬。這屬於第三代nfinity Fabric技術，可管理多達8條Infinity Fabric鏈路，將Instinct MI200系列計算卡和第三代EPYC處理器相連，實現CPU和GPU記憶體一致性，最大限度提高系統吞吐量。對比上一代基於CDNA架構的Instinct MI100，基於CDNA 2架構的Instinct MI200系列計算卡在性能上提升幅度非常大。顯然，AMD Instinct MI200系列計算卡是主要針對HPC和AI工作負載設計的。AMD官方公布的對比測試里，涉及了處理代數、物理學、宇宙學、分子動力學和粒子相互作用等項目，許多是被廣泛使用並具有行業認可的測試，例如LAMMPS和OpenMM。不過值得留意的是，AMD缺乏關於AI基準測試的項目。在紙面上，AMD Instinct...

AMD發布Instinct MI200系列計算卡，CDNA 2架構登場

AMD宣布推出基於CDNA 2架構的Instinct MI200系列計算卡，這是第一款採用MCM多晶片封裝的GPU，是首款百億億級的GPU加速器，其中AMD Instinct MI250X是世界上最快的高性能計算機（HPC）和人工智慧（AI）加速卡。 AMD Instinct MI250X搭載了代號Aldebaran的GPU，擁有580億個電晶體，採用台積電6nm工藝製造，搭配了128GB的HBM2e顯存（總帶寬3.2 TB/s），共有220個CU（14080個流處理器），TDP為560W。GPU中的小晶片輔以XGMI內部互聯設計，均具有VCN 2.6控制器。通過2.5D Elevated Fanout Bridge（EFB）封裝技術，讓GPU的核心數量達到了上一代的1.8倍，記憶體帶寬也達到了2.7倍。 GPU里的兩個小晶片通過AMD Infinity Fabric技術連接，提供高達100 GB/s的雙向帶寬。這屬於第三代nfinity Fabric技術，可管理多達8條Infinity Fabric鏈路，將Instinct MI200系列計算卡和第三代EPYC處理器相連，實現CPU和GPU記憶體一致性，最大限度提高系統吞吐量。AMD表示，新架構的GPU可加速FP64和FP32矩陣運算，FP64理論峰值性能最高可達上一代的4倍。 Instinct MI200系列計算卡有三種配置，分別是OAM規格的Instinct MI250（208個CU）和Instinct MI250X（220個CU），以及雙槽PCIe規格的Instinct MI210。首批應用Instinct MI200系列計算卡的超級計算機有三台，分別是美國的Frontier、歐盟的pre-exascale LUMI、以及澳大利亞的Setonix。2022年第一季度的企業市場中，將會有OEM和ODM合作夥伴採用Instinct...

RDNA 3架構GPU或採用3D Infinity Cache，AMD將全線布局3D堆棧設計

AMD似乎在CPU和GPU上都大力投資堆棧緩存和小晶片技術，CPU方面，代號Milan-X、基於Zen 3架構和配備3D垂直緩存（3D V-Cache）技術的EPYC處理器已正式發布，而GPU方面，基於CDNA 2架構、採用MCM多晶片封裝的Instinct MI200系列也隨之推出。 AMD在RDNA 2架構GPU上引入了Infinity Cache（無限緩存）技術，GPU實現了更高的訪問效率和帶寬。現有的緩存設計最大達到128MB，提供2 TB/s的帶寬。到了RDNA 3架構上，緩存容量將翻倍，預計Navi 33為256MB，Navi 31為512MB。由於Navi 31採用了MCM多晶片封裝，共有兩個用於計算的小晶片，所以每個計算模塊仍為256MB。據推特用戶@greymon55透露，Infinity Cache也將轉向3D堆棧的設計，基於RDNA 3架構的GPU很可能就會採用這項技術。這意味著，未來AMD的整個產品線，包括Ryzen、EPYC和Radeon的晶片都將配備3D垂直緩存技術。目前基於CDNA 2架構的GPU是第一個採用MCM多晶片封裝的產品，不過並沒有資料顯示在緩存上有配備3D垂直緩存技術。隨著GPU對帶寬需求的增加，Instinct系列或許也會這麼做。一直有傳言AMD的RDNA 3架構GPU在性能上會有相當大的飛躍，搭載Navi 3x核心的Radeon RX系列顯卡在性能上比現有產品提高3倍。AMD也會進一步打磨光線追蹤和FidelityFX Super Resolution（FSR）技術，預計AMD Radeon RX 7000系列顯卡將會在2022年年末推出，相信下一代GPU之間的競爭會更加激烈。 ...

AMD執行長為新一代伺服器產品預熱，還與騰訊合作推出一系列產品

AMD執行長蘇姿豐博士將在即將到來的「AMD Accelerated Data Center Premier」活動中展示新款的EPYC處理器和Instinct計算卡，預計亮相的是代號為Milan-X、基於Zen 3架構和配備3D垂直緩存（3D V-Cache）技術的EPYC處理器，以及基於CDNA 2架構的Instinct MI200系列計算卡，將用於新一代伺服器平台。近日，蘇姿豐博士在其推特帳戶上做了預熱。代號Aldebaran的CDNA 2架構是首款採用MCM封裝技術的GPU，將採用7nm工藝製造，其中Instinct MI250X會配備110個CU和128GB的HBM2E顯存。新一代產品還會採用下一代Infinity Fabric總線技術，以及支持第三代AMD Infinity架構，允許多達8路的同款GPU連接擴展到Exascale。有消息指，該款GPU還會有採用OAM規格，與目前的Instinct系列產品的PCI-Express規格並不一樣。此外，在近期舉行的騰訊數字生態大會上，騰訊公開了三款名為是紫霄、滄海和玄靈的晶片，以應對AI、視頻和網絡處理三個不同方向的需要。除此以外，騰訊還與AMD合作，共同發布了全新的騰訊雲星星海炙熱火系異構伺服器AG251，以及星星海智慧木系GA01 GPU卡。據稱，騰訊的星星海將按照「金、木、水、火、土」元素劃分為五個系列，提供對應的產品。騰訊和AMD這款合作的星星海智慧木系GA01 GPU卡，根據AMD官方的介紹，搭載的就是最新發布的Radeon Pro V620。AMD表示，該GPU可以同時向多個用戶提供高效、低延遲的內容流，重新定義雲遊戲。 ...

AMD將於11月8日舉辦HPC新品發布會，或涉及X3D封裝的EPYC處理器

AMD宣布將於2021年11月8日，美國東部時間上午11點，舉辦加速數據中心新品發布會，展示即將推出的EPYC系列處理器，以及Instinct系列計算卡。AMD執行長蘇姿豐博士、數據中心和嵌入式解決方案業務部高級副總裁兼總經理Forrest Norrod、以及伺服器業務部高級副總裁兼總經理Dan McNamara將在這次虛擬活動中發表演講。據推特用戶@ExecuFix透露，這次活動上AMD可能會展示代號「Milan-X」的EPYC系列處理器，也就是採用3D垂直緩存（3D V-Cache）技術的產品。之前曝光的旗艦級新品EPYC 7773Ｘ處理器，擁有64核心和128線程，L3緩存除了本身的256MB以外，還有堆疊的512MB，總容量達到了768MB，TDP為280W，價格高達10746.99美元。此外，還可能會有代號「Trento」的EPYC處理器，據稱這是代號「Milan」的EPYC處理器的修改版，針對HPC做了優化，將會應用於Frontier超級計算機。至於Instinct系列計算卡應該也沒什麼懸念，將搭載代號Aldebaran的CDNA 2架構GPU，這是AMD第一個基於多晶片模塊設計（MCM封裝）的產品，比英特爾Xe HPC架構的Ponte Vecchio和英偉達Hopper架構的GH100更早到來。 AMD的這次活動在英偉達GTC 2021前一天舉行，會在其官方上進行直播活動，結束後可以也可以看重播。 ...

傳AMD Instinct MI250X計算卡FP64性能大幅度提高，仍採用7nm工藝

早在今年5月份摩根大通舉行的第49屆全球技術、媒體和通信大會上，AMD執行長蘇姿豐博士已確認，已確認代號Aldebaran的CDNA 2架構GPU將會在年內推出。AMD為美國能源部的橡樹嶺國家實驗室（ORNL）打造的百億億級超級計算機Frontier，就會使用這款Instinct計算卡。近日，推特用戶@ExecuFix透露，基於CDNA 2架構的新款GPU將採用7nm工藝製造，而且傳聞中的Instinct MI200系列計算卡會有兩款產品，分別是Instinct MI250和Instinct MI250X。其中Instinct MI250X將會配備110個CU和128GB的HBM2E顯存，頻率為1.7 GHz，TDP為500W。由於這款GPU會採用MCM封裝技術，不確定110個CU是指單個計算模塊，還是兩個計算模塊的總和。新一代產品還會採用下一代Infinity Fabric總線技術，以及支持第三代AMD Infinity架構，允許多達8路的同款GPU連接擴展到Exascale。此外還提供了部分數據，Instinct MI250X計算卡的單精度（FP32）/雙精度（FP64）計算性能為47.9 TFLOPs，半精度（FP16/BF16）計算性能為383 TFLOPs，其中FP64計算性能是Instinct MI100計算卡的4.16倍。作為參照，英偉達A100 80GB版的FP64、FP32和FP16計算性能分別為19.5 TFLOPs、156 TFLOPs和312 TFLOPs，相信雙方很快又會有新一輪的交鋒。 ...

AMD Instinct MI300仍將採用MCM封裝技術，或具有4個計算模塊

此前Coelacanth's Dream通過Github上提交的信息，根據代碼推算出代號Aldebaran的CDNA 2架構GPU可能的配置規格。結合更早之前的信息，Instinct MI200計算卡每個計算模塊的CU數量應該是128個，其中會開啟110個，再通過MCM（Multi-Chip-Module）封裝技術，那麼一塊Instinct MI200計算卡將配置220個CU。當然，也有可能採用全新的架構設計，每個計算模塊的開啟的CU數量為55個，整塊計算卡配置110個CU。無論如何，根據AMD執行長蘇姿豐博士在今年5月份摩根大通舉行的第49屆全球技術、媒體和通信大會上的發言，基於CDNA 2架構的新產品會在今年內推出。除了MCM封裝技術，新一代產品還會採用下一代Infinity Fabric總線技術，以及支持第三代AMD Infinity架構，允許多達8路的同款GPU連接擴展到Exascale。 Instinct MI200計算卡尚未露面，但Instinct MI300計算卡已經在路上。據推特用戶@Kepler_L2透露，Instinct MI300計算卡GPU的規模將在Instinct MI200計算卡基礎上翻倍。AMD仍然會沿用MCM封裝技術，並會集成更多的計算模塊，CDNA 3架構的GPU或許會有四個計算模塊。暫時還不清楚Instinct MI300計算卡的GPU代號，應該也會採用巨型星球的名字。 ...

AMD Instinct MI200計算卡或會配置220個CU，將用於美國新一代超算

在今年5月份摩根大通舉行的第49屆全球技術、媒體和通信大會上，AMD執行長蘇姿豐博士已確認，已確認代號Aldebaran的CDNA 2架構GPU將會在年內推出。據Coelacanth's Dream報導，近期Github上提交的信息泄露了CDNA 2架構GPU可能的配置規格。代碼里列出了GFX906_60、GFX908_120和GFX90A_110，這應該是AMD Instinct系列計算卡的產品線。其中GFX906_60和GFX908_120對應的應該是Instinct MI60和Instinct MI100兩款產品，尾部的數字標示的是GPU提供的CU數量。此前傳言CDNA 2架構GPU的內部代號為GFX90A，所以代碼里GFX90A_110對應的就是CDNA 2架構的晶片，提供了110個CU。由於新一代產品會採用MCM（Multi-Chip-Module）封裝技術，Instinct MI200計算卡將會有兩個「計算單元」，完整解決方案會提供220個CU。這些代碼里標示的CU數量不代表GPU的完整配置，為了有更好的良品率，以確保供應數量，AMD會禁用部分的CU。據了解，Instinct MI200計算卡每個「計算單元」的CU數量應該是128個。假設Instinct MI200計算卡配置了220個CU，核心頻率為1500 MHz，那麼單精度計算性能就為42.2 TFLOPS，是目前Instinct MI100計算卡的1.82倍。傳聞Instinct MI200計算卡增加了對全速率FP64計算能力支持，對應的性能可能是Instinct MI100計算卡的兩到四倍，這意味著在一些HPC工作負載中會有更好的表現。除了MCM封裝技術，新一代產品還會採用下一代Infinity Fabric總線技術，以及支持第三代AMD Infinity架構，允許多達8路的同款GPU連接擴展到Exascale。Instinct MI200計算卡將會用於美國新一代超級計算機，比如橡樹嶺國家實驗室的Frontier，以及勞倫斯利弗莫爾國家實驗室的El Capitan。 ...

AMD Instinct MI200將會配備256個CU和128GB HBM2e

AMD執行長蘇姿豐博士在上個月摩根大通舉辦的第49屆全球技術、媒體和通信大會上，已確認代號為Aldebaran的CDNA 2架構GPU將會在年內推出。這款很可能名為Instinct MI200的計算卡，是專門為計算密集型和HPC工作負載而設計。今年即將交付的美國能源部Frontier E級超級計算機將會使用這款計算卡，傳聞Instinct MI200計算卡擁有128GB的HBM2e顯存。此前通過AMD64 EDAC驅動的Linux更新修正檔，已確認Instinct MI200計算卡會採用MCM（Multi-Chip-Module）封裝技術，在單晶片封裝里使用了兩顆計算晶片，並通過下一代Infinity Fabric總線技術互連。近日，推特用戶@Locuza_介紹了相關的細節，Instinct MI200計算卡的每個計算晶片支持全速率FP64/FP32和第二代矩陣引擎（用於矩陣乘法的硬體，加速DNN構建、訓練和AI推理），擁有128個CU即8192個流處理器，那麼一張計算卡就有256個CU即16384個流處理器。不過Instinct MI200計算卡會將部分CU屏蔽，實際上只會用到224個CU即14336個流處理器，數量相比完整核心少了14%左右。同時每個計算晶片都會支持VCN 2.6和SDMA（系統直接記憶體訪問），配備獨立的PCIe接口和XGMI，並配置了4096位的HBM2e顯存接口，對應64GB顯存。假設AMD使用SK海力士速率為3.6Gbps的最新款HBM2e顆粒，將為GPU提供3.64 TB/s的帶寬。由於使用的是帶ECC的顯存，因此部分帶寬和容量會被用於糾錯，實際容量並沒有128 GB那麼多。 ...

AMD確認搭載CDNA 2架構GPU會有兩個晶片，基本確認採用MCM封裝

在此前摩根大通舉行的第49屆全球技術、媒體和通信大會上，AMD執行長蘇姿豐博士簡要地提到了CDNA 2架構及其產品，表示會在年內推出。據之前的傳言，CDNA 2架構GPU的代號為Aldebaran，搭載該GPU的產品很可能是傳聞已久的Instinct MI200計算卡，專門為計算密集型和HPC工作負載而設計。在最近的Linux內核更新中，AMD工程師確認即將到來的CDNA 2架構GPU將會有兩個晶片。很早就有消息指，CDNA 2架構GPU將採用MCM（Multi-Chip-Module）封裝技術和下一代Infinity Fabric總線技術。其競爭對手，英偉達Hopper架構以及英特爾Xe-HP架構的GPU，大機率都會採用MCM封裝技術。據VideoCardz報導，代號為Aldebaran的GPU有兩個計算晶片，在Linux更新中被稱為die 0和die 1，而AMD工程部門表示只有主晶片會處理電源的數據，不會通過副晶片去設置，這也最終證實了會有兩個晶片。這意味著主晶片會調節整個計算部分的功耗和相關限制，暫時不清楚顯存是否也是由這個晶片調控，或者加入新的I/O模塊去調節。代號Aldebaran的GPU如何利用MCM封裝技術目前也不清楚，但肯定和以往有很大的不同。雙晶片配置會需要一個互聯晶片，這也會增加封裝的尺寸，AMD可能會在全面邁向多計算晶片前做不同的嘗試。事實上AMD從來沒有公開確認過CDNA 2架構GPU會採用MCM封裝技術，然而會通過很多側面介紹和稱呼以表明其技術特徵。 AMD Instinct MI200計算卡預計會在今年第四季度推出，可能會採用5nm工藝製造。 ...

AMD提交全新的GPU設計專利：RDNA 3架構很有可能採用MCM設計

AMD曾經在RDNA 2架構顯卡發布會上表示RDNA 3架構已經在設計之中了，這表明AMD將會把他們在CPU領域的輝煌與經驗帶到GPU市場，更快的研發速度讓GPU架構疊代，A卡終於可以擺脫一個架構吃多年的尷尬境遇了。並且最令人振奮的是，AMD在已經連續兩代大幅度提升能耗比之後，高管曾放出話在RDNA 3上很有可能實現同樣的能耗比提升。如果AMD能實現這一點的話，那將是GPU歷史上偉大的三連大提升，近年來從沒有人可以做到GPU產品連續三代以50%+的能耗比提升的偉大壯舉。但要想實現這個目標談何容易，如果還靠著老套路去研發下一代GPU架構肯定是行不通的。就在去年年底的最後一天，AMD提交了一份全新的GPU設計專利，這份專利顯示AMD將會製作基於MCM設計的全新架構GPU，這也印證了之前廣泛流傳的蘋果以及AMD合力投資台積電研發MCM技術的傳聞，也許MCM顯卡的時代真的要來了。從這個專利圖中就能很明顯的看到，AMD將會採用MCM多晶片封裝技術，由於AMD在銳龍身上已經擁有了諸如IF總線等技術，實現GPU的多晶片封裝應該不是一個難以逾越的鴻溝。在GPU部門多次拯救CPU部門於水火之後，AMD的GPU部門終於可以吃到一次CPU紅利了。此外，在我之前采訪RTG Leader王啟尚先生的時候他曾透漏GPU部門已經向Ryzen團隊借到了一位架構大神，幫助GPU團隊進行架構設計。這樣的話對於AMD GPU實現MCM來說，應該是如魚得水。而NVIDIA這邊最近也傳出了「Hopper」架構也將採取這種MCM多晶片封裝設計的消息，由此可見MCM未來將會成為晶片設計的主流方向。 ...

NVIDIA或放棄大核心GPU戰略，16nm 36模塊「膠水」GPU來了

從Kpler時代開始，NVIDIA為了兼顧GPU計算及遊戲兩個市場採取了不同的市場戰略——GX100/102大核心主要面向GPU計算市場，GX104/106主流核心則面向遊戲GPU，砍掉了對遊戲無大用的雙精度運算，降低復雜性，減少芯片面積以節省成本、降低功耗。大核心的好處及代價都是非常明顯的，但是隨着摩爾定律終結，製造大核心芯片的工藝越來越復雜，成本也越來越貴，NVIDIA對7nm工藝就表示了明顯的牴觸，那他們有什麼殺招嗎？NVIDIA未來有可能放棄單一大核心GPU戰略，他們已經研究了RC18超小核——基於台積電16nm工藝，晶體管數量只有8700萬個，但一個GPU芯片內可以堆疊36個這樣的小核心，換句話說NVIDIA未來也要走AMD、英特爾那樣的膠水多模芯片路線了。膠水多模這個說法並不嚴謹，只是網友的調侃，實際上這是目前半導體業界都在研究的Chiplets技術，簡單來說就是在一個芯片內堆疊不同的核心單元，不同的核心可以是不同架構的，也可以是不同工藝的，而這樣做的原因就是半導體製造工藝越來越復雜，製造大核心的難度及成本都居高不下，而且還會有浪費，因為並不是所有核心單元都需要最先進的工藝。 AMD的7nm 64核羅馬處理器就是這樣的代表，CPU核心是7nm工藝的，一個芯片內最多可以堆疊8組CPU單元，總計64核心，而IO核心則是14nm工藝的。英特爾這邊也有類似的戰略，除了48核膠水封裝的Cascade Lake-AP處理器之外，英特爾還有真正的Chiplets設計——Foreros 3D封裝，也可以將不同架構、不同工藝的核心封裝在一起。 AMD、NVIDIA現在是在CPU處理器上應用了Chiplets設計，而NVIDIA則是准備在GPU芯片上研究MCM多模封裝技術。來自日本PCWatch網站的報導，NVIDIA研究部門主管、首席科學家、高級研究副總裁William J. Dally日前就公開了一個名為RC 18的芯片項目，這是一款適用於深度學習的加速器芯片，基於台積電16nm FinFET工藝，晶體管數量只有8700萬個，相比現在動輒數十億乃至上百億的GPU芯片來說絕對是輕量級的芯片了。但是RC18芯片只是基礎，NVIDIA研究的目標是在芯片上集成多個基於RC18的MCM模塊，目前已經做到了36模塊堆棧，詳細的技術細節可以參考PCWatch的原文。值得一提的是，RC18不僅是GPU，NVIDIA還在其中集成了RISC-V指令集的CPU核心，雖然只有5級流水線、單發射順序指令架構。結合這里的情況來看，現在大家應該可以理解NVIDIA對7nm工藝為何如此冷淡了。來源：超能網

Tag: MCM