Home Tags MCM

Tag: MCM

AMD Instinct MI300或採用3D晶片堆疊:8個計算模塊,支持PCIe 5.0和HBM3

AMD去年推出了基於CDNA 2架構的Instinct MI200系列計算卡,這是第一款採用MCM多晶片封裝的GPU,是首款百億億級的GPU加速器。事實上,在Instinct MI200系列還沒有發布之前,就已經傳出了Instinct MI300系列的消息了,近期還出現在了Linux修正檔里。 據VideoCardz報導,Instinct MI300系列GPU可能會提供多種規格,配備的HBM3顯存堆棧可能分別會從兩個到八個。值得注意的是,Instinct MI300系列GPU可能會採用3D晶片堆疊,在小晶片的下方會有一個帶I/O接口的基礎模塊。據稱,每個基礎模塊可以連接兩個HBM3顯存堆棧,採用6nm工藝製造,而計算模塊則採用5nm工藝製造。 集成了計算模塊和基礎模塊的單一小晶片的尺寸大概在110mm² 左右,擁有四個小晶片的頂級型號的中介層將有約20000個信號引腳,相比M1 Ultra多出了一倍。功耗方面,一個小晶片大概是150W,最高端的型號的功耗將達到600W左右,與目前OAM規格的Instinct MI250X的560W相近。 ...

Instinct MI300系列或首次出現在Linux修正檔,AMD下一代怪獸級計算卡

AMD在去年年末,推出了基於CDNA 2架構的Instinct MI200系列計算卡,這是第一款採用MCM多晶片封裝的GPU,是首款百億億級的GPU加速器。在Instinct MI200系列還沒有發布之前,其實已經有報導指出,Instinct MI300系列已經在路上了。 近日有網友指出,最新的Linux修正檔里包含了一個AMD未發布的產品,名為GFX940,支持所有針對數據中心的功能,與Instinct MI200系列GPU的型號(GFX90a)非常相似。盡管型號上相似,但與代號Aldebaran的CDNA 2架構GPU相比存在一些差異,推測很可能是下一代基於CDNA 3架構的Instinct MI300系列。 傳聞Instinct MI300系列GPU會有四個計算模塊(GCD),如果按照Instinct MI200系列GPU的規模計算,將會有440個CU,28160個內核,並沿用MCM封裝技術。據稱CDNA 3架構並不是從CDNA 2架構遷移後做細微的修正,而是修改過的新架構,GPU最終布局與RDNA 3架構類似,但是會針對HPC細分市場做優化。 ...

英特爾專利探討新的圖像渲染解決方案,預示未來遊戲GPU也將採用多晶片設計

AMD將會在今年推出Radeon RX 7000系列顯卡,搭載基於RDNA 3架構的Navi 3x系列GPU。其中Navi 31和Navi 32將採用MCM多晶片封裝,GCD(圖形計算晶片)和MCD(多緩存I/O晶片)會採用兩種不同的製程工藝。 近期英特爾的一項新專利,描述了多個計算模塊如何協同工作進行圖像渲染,預示著未來英特爾GPU也將採用MCM多晶片封裝。英特爾在面向數據中心和超級計算機的Ponte Vecchio已使用了多晶片設計,對類似MCM的技術並不陌生。在這項專利中,英特爾提出了一種GPU圖像渲染解決方案,將多個晶片集成在同一單元內,以解決製造和功耗等問題,同時針對可擴展性和互聯性做相關優化,以提供最佳性能。 目前這類圖像渲染問題會通過AFR(交替幀渲染)和SFR(分幀渲染)這些算法來解決,不過英特爾討論的是整合了計算模塊的棋盤格渲染,同時還有分布式的運算,以便在多晶片設計的GPU上有更高的運算效率。在專利文件中,英特爾沒有對架構層面的細節進行過多的描述,但可以預期,Intel Arc(銳炫)品牌顯卡搭載MCM多晶片封裝的GPU只是時間問題。 此前英偉達的研究人員也發表了一篇文章,詳細介紹了英偉達正在探索如何為未來產品部署多晶片設計方案。隨著異架構計算的興起,英偉達正在尋找一種方法,增加其半導體設計的靈活性,以根據工作負載的不同,靈活匹配各種模塊,這也是MCM多晶片封裝的用武之地。 AMD已率先在消費級產品上使用MCM多晶片封裝技術,相信英特爾和英偉達最終也會選擇這麼做。未來AMD、英特爾和英偉達很可能會選擇台積電相同的工藝,每一個技術上的細微優勢都可能對最終產品產生巨大的影響。 ...

AMD公布Instinct MI250X與NVIDIA A100對比測試數據,有絕對性能優勢

幾天前,AMD宣布推出基於CDNA 2架構的Instinct MI200系列計算卡,這是第一款採用MCM多晶片封裝的GPU,是首款百億億級的GPU加速器。更出人意料的是,AMD現在還公布了與競爭對手英偉達A100計算卡之間的對比測試數據。雖然硬體公司在一些活動上展示性能優勢的PPT並不少見,但官網上公開詳實的實際對比測試數據卻不多,這說明了AMD對自己的這款產品在性能方面非常有信心。 AMD Instinct MI200系列計算卡搭載了代號Aldebaran的GPU,擁有580億個電晶體,採用台積電6nm工藝製造,搭配了128GB的HBM2e顯存(總帶寬3.2 TB/s),TDP為560W。該系列有Instinct MI250和Instinct MI250X兩款產品,分別有208個CU(13312個流處理器)和220個CU(14080個流處理器)。 其GPU中的小晶片輔以XGMI內部互聯設計,均具有VCN 2.6控制器,還使用了2.5D Elevated Fanout Bridge(EFB)封裝技術。此外,GPU里的兩個小晶片通過AMD Infinity Fabric技術連接,提供高達100 GB/s的雙向帶寬。這屬於第三代nfinity Fabric技術,可管理多達8條Infinity Fabric鏈路,將Instinct MI200系列計算卡和第三代EPYC處理器相連,實現CPU和GPU記憶體一致性,最大限度提高系統吞吐量。對比上一代基於CDNA架構的Instinct MI100,基於CDNA 2架構的Instinct MI200系列計算卡在性能上提升幅度非常大。 顯然,AMD Instinct MI200系列計算卡是主要針對HPC和AI工作負載設計的。AMD官方公布的對比測試里,涉及了處理代數、物理學、宇宙學、分子動力學和粒子相互作用等項目,許多是被廣泛使用並具有行業認可的測試,例如LAMMPS和OpenMM。 不過值得留意的是,AMD缺乏關於AI基準測試的項目。在紙面上,AMD Instinct...

AMD發布Instinct MI200系列計算卡,CDNA 2架構登場

AMD宣布推出基於CDNA 2架構的Instinct MI200系列計算卡,這是第一款採用MCM多晶片封裝的GPU,是首款百億億級的GPU加速器,其中AMD Instinct MI250X是世界上最快的高性能計算機(HPC)和人工智慧(AI)加速卡。 AMD Instinct MI250X搭載了代號Aldebaran的GPU,擁有580億個電晶體,採用台積電6nm工藝製造,搭配了128GB的HBM2e顯存(總帶寬3.2 TB/s),共有220個CU(14080個流處理器),TDP為560W。GPU中的小晶片輔以XGMI內部互聯設計,均具有VCN 2.6控制器。通過2.5D Elevated Fanout Bridge(EFB)封裝技術,讓GPU的核心數量達到了上一代的1.8倍,記憶體帶寬也達到了2.7倍。 GPU里的兩個小晶片通過AMD Infinity Fabric技術連接,提供高達100 GB/s的雙向帶寬。這屬於第三代nfinity Fabric技術,可管理多達8條Infinity Fabric鏈路,將Instinct MI200系列計算卡和第三代EPYC處理器相連,實現CPU和GPU記憶體一致性,最大限度提高系統吞吐量。AMD表示,新架構的GPU可加速FP64和FP32矩陣運算,FP64理論峰值性能最高可達上一代的4倍。 Instinct MI200系列計算卡有三種配置,分別是OAM規格的Instinct MI250(208個CU)和Instinct MI250X(220個CU),以及雙槽PCIe規格的Instinct MI210。首批應用Instinct MI200系列計算卡的超級計算機有三台,分別是美國的Frontier、歐盟的pre-exascale LUMI、以及澳大利亞的Setonix。2022年第一季度的企業市場中,將會有OEM和ODM合作夥伴採用Instinct...

RDNA 3架構GPU或採用3D Infinity Cache,AMD將全線布局3D堆棧設計

AMD似乎在CPU和GPU上都大力投資堆棧緩存和小晶片技術,CPU方面,代號Milan-X、基於Zen 3架構和配備3D垂直緩存(3D V-Cache)技術的EPYC處理器已正式發布,而GPU方面,基於CDNA 2架構、採用MCM多晶片封裝的Instinct MI200系列也隨之推出。 AMD在RDNA 2架構GPU上引入了Infinity Cache(無限緩存)技術,GPU實現了更高的訪問效率和帶寬。現有的緩存設計最大達到128MB,提供2 TB/s的帶寬。到了RDNA 3架構上,緩存容量將翻倍,預計Navi 33為256MB,Navi 31為512MB。由於Navi 31採用了MCM多晶片封裝,共有兩個用於計算的小晶片,所以每個計算模塊仍為256MB。 據推特用戶@greymon55透露,Infinity Cache也將轉向3D堆棧的設計,基於RDNA 3架構的GPU很可能就會採用這項技術。這意味著,未來AMD的整個產品線,包括Ryzen、EPYC和Radeon的晶片都將配備3D垂直緩存技術。目前基於CDNA 2架構的GPU是第一個採用MCM多晶片封裝的產品,不過並沒有資料顯示在緩存上有配備3D垂直緩存技術。隨著GPU對帶寬需求的增加,Instinct系列或許也會這麼做。 一直有傳言AMD的RDNA 3架構GPU在性能上會有相當大的飛躍,搭載Navi 3x核心的Radeon RX系列顯卡在性能上比現有產品提高3倍。AMD也會進一步打磨光線追蹤和FidelityFX Super Resolution(FSR)技術,預計AMD Radeon RX 7000系列顯卡將會在2022年年末推出,相信下一代GPU之間的競爭會更加激烈。 ...

AMD執行長為新一代伺服器產品預熱,還與騰訊合作推出一系列產品

AMD執行長蘇姿豐博士將在即將到來的「AMD Accelerated Data Center Premier」活動中展示新款的EPYC處理器和Instinct計算卡,預計亮相的是代號為Milan-X、基於Zen 3架構和配備3D垂直緩存(3D V-Cache)技術的EPYC處理器,以及基於CDNA 2架構的Instinct MI200系列計算卡,將用於新一代伺服器平台。 近日,蘇姿豐博士在其推特帳戶上做了預熱。代號Aldebaran的CDNA 2架構是首款採用MCM封裝技術的GPU,將採用7nm工藝製造,其中Instinct MI250X會配備110個CU和128GB的HBM2E顯存。新一代產品還會採用下一代Infinity Fabric總線技術,以及支持第三代AMD Infinity架構,允許多達8路的同款GPU連接擴展到Exascale。有消息指,該款GPU還會有採用OAM規格,與目前的Instinct系列產品的PCI-Express規格並不一樣。 此外,在近期舉行的騰訊數字生態大會上,騰訊公開了三款名為是紫霄、滄海和玄靈的晶片,以應對AI、視頻和網絡處理三個不同方向的需要。除此以外,騰訊還與AMD合作,共同發布了全新的騰訊雲星星海炙熱火系異構伺服器AG251,以及星星海智慧木系GA01 GPU卡。據稱,騰訊的星星海將按照「金、木、水、火、土」元素劃分為五個系列,提供對應的產品。 騰訊和AMD這款合作的星星海智慧木系GA01 GPU卡,根據AMD官方的介紹,搭載的就是最新發布的Radeon Pro V620。AMD表示,該GPU可以同時向多個用戶提供高效、低延遲的內容流,重新定義雲遊戲。 ...

AMD將於11月8日舉辦HPC新品發布會,或涉及X3D封裝的EPYC處理器

AMD宣布將於2021年11月8日,美國東部時間上午11點,舉辦加速數據中心新品發布會,展示即將推出的EPYC系列處理器,以及Instinct系列計算卡。AMD執行長蘇姿豐博士、數據中心和嵌入式解決方案業務部高級副總裁兼總經理Forrest Norrod、以及伺服器業務部高級副總裁兼總經理Dan McNamara將在這次虛擬活動中發表演講。 據推特用戶@ExecuFix透露,這次活動上AMD可能會展示代號「Milan-X」的EPYC系列處理器,也就是採用3D垂直緩存(3D V-Cache)技術的產品。之前曝光的旗艦級新品EPYC 7773X處理器,擁有64核心和128線程,L3緩存除了本身的256MB以外,還有堆疊的512MB,總容量達到了768MB,TDP為280W,價格高達10746.99美元。 此外,還可能會有代號「Trento」的EPYC處理器,據稱這是代號「Milan」的EPYC處理器的修改版,針對HPC做了優化,將會應用於Frontier超級計算機。至於Instinct系列計算卡應該也沒什麼懸念,將搭載代號Aldebaran的CDNA 2架構GPU,這是AMD第一個基於多晶片模塊設計(MCM封裝)的產品,比英特爾Xe HPC架構的Ponte Vecchio和英偉達Hopper架構的GH100更早到來。 AMD的這次活動在英偉達GTC 2021前一天舉行,會在其官方上進行直播活動,結束後可以也可以看重播。 ...

傳AMD Instinct MI250X計算卡FP64性能大幅度提高,仍採用7nm工藝

早在今年5月份摩根大通舉行的第49屆全球技術、媒體和通信大會上,AMD執行長蘇姿豐博士已確認,已確認代號Aldebaran的CDNA 2架構GPU將會在年內推出。AMD為美國能源部的橡樹嶺國家實驗室(ORNL)打造的百億億級超級計算機Frontier,就會使用這款Instinct計算卡。 近日,推特用戶@ExecuFix透露,基於CDNA 2架構的新款GPU將採用7nm工藝製造,而且傳聞中的Instinct MI200系列計算卡會有兩款產品,分別是Instinct MI250和Instinct MI250X。其中Instinct MI250X將會配備110個CU和128GB的HBM2E顯存,頻率為1.7 GHz,TDP為500W。由於這款GPU會採用MCM封裝技術,不確定110個CU是指單個計算模塊,還是兩個計算模塊的總和。新一代產品還會採用下一代Infinity Fabric總線技術,以及支持第三代AMD Infinity架構,允許多達8路的同款GPU連接擴展到Exascale。 此外還提供了部分數據,Instinct MI250X計算卡的單精度(FP32)/雙精度(FP64)計算性能為47.9 TFLOPs,半精度(FP16/BF16)計算性能為383 TFLOPs,其中FP64計算性能是Instinct MI100計算卡的4.16倍。作為參照,英偉達A100 80GB版的FP64、FP32和FP16計算性能分別為19.5 TFLOPs、156 TFLOPs和312 TFLOPs,相信雙方很快又會有新一輪的交鋒。 ...

AMD Instinct MI300仍將採用MCM封裝技術,或具有4個計算模塊

此前Coelacanth's Dream通過Github上提交的信息,根據代碼推算出代號Aldebaran的CDNA 2架構GPU可能的配置規格。結合更早之前的信息,Instinct MI200計算卡每個計算模塊的CU數量應該是128個,其中會開啟110個,再通過MCM(Multi-Chip-Module)封裝技術,那麼一塊Instinct MI200計算卡將配置220個CU。當然,也有可能採用全新的架構設計,每個計算模塊的開啟的CU數量為55個,整塊計算卡配置110個CU。 無論如何,根據AMD執行長蘇姿豐博士在今年5月份摩根大通舉行的第49屆全球技術、媒體和通信大會上的發言,基於CDNA 2架構的新產品會在今年內推出。除了MCM封裝技術,新一代產品還會採用下一代Infinity Fabric總線技術,以及支持第三代AMD Infinity架構,允許多達8路的同款GPU連接擴展到Exascale。 Instinct MI200計算卡尚未露面,但Instinct MI300計算卡已經在路上。據推特用戶@Kepler_L2透露,Instinct MI300計算卡GPU的規模將在Instinct MI200計算卡基礎上翻倍。AMD仍然會沿用MCM封裝技術,並會集成更多的計算模塊,CDNA 3架構的GPU或許會有四個計算模塊。暫時還不清楚Instinct MI300計算卡的GPU代號,應該也會採用巨型星球的名字。 ...

AMD Instinct MI200計算卡或會配置220個CU,將用於美國新一代超算

在今年5月份摩根大通舉行的第49屆全球技術、媒體和通信大會上,AMD執行長蘇姿豐博士已確認,已確認代號Aldebaran的CDNA 2架構GPU將會在年內推出。據Coelacanth's Dream報導,近期Github上提交的信息泄露了CDNA 2架構GPU可能的配置規格。 代碼里列出了GFX906_60、GFX908_120和GFX90A_110,這應該是AMD Instinct系列計算卡的產品線。其中GFX906_60和GFX908_120對應的應該是Instinct MI60和Instinct MI100兩款產品,尾部的數字標示的是GPU提供的CU數量。此前傳言CDNA 2架構GPU的內部代號為GFX90A,所以代碼里GFX90A_110對應的就是CDNA 2架構的晶片,提供了110個CU。由於新一代產品會採用MCM(Multi-Chip-Module)封裝技術,Instinct MI200計算卡將會有兩個「計算單元」,完整解決方案會提供220個CU。 這些代碼里標示的CU數量不代表GPU的完整配置,為了有更好的良品率,以確保供應數量,AMD會禁用部分的CU。據了解,Instinct MI200計算卡每個「計算單元」的CU數量應該是128個。假設Instinct MI200計算卡配置了220個CU,核心頻率為1500 MHz,那麼單精度計算性能就為42.2 TFLOPS,是目前Instinct MI100計算卡的1.82倍。傳聞Instinct MI200計算卡增加了對全速率FP64計算能力支持,對應的性能可能是Instinct MI100計算卡的兩到四倍,這意味著在一些HPC工作負載中會有更好的表現。 除了MCM封裝技術,新一代產品還會採用下一代Infinity Fabric總線技術,以及支持第三代AMD Infinity架構,允許多達8路的同款GPU連接擴展到Exascale。Instinct MI200計算卡將會用於美國新一代超級計算機,比如橡樹嶺國家實驗室的Frontier,以及勞倫斯利弗莫爾國家實驗室的El Capitan。 ...

AMD Instinct MI200將會配備256個CU和128GB HBM2e

AMD執行長蘇姿豐博士在上個月摩根大通舉辦的第49屆全球技術、媒體和通信大會上,已確認代號為Aldebaran的CDNA 2架構GPU將會在年內推出。這款很可能名為Instinct MI200的計算卡,是專門為計算密集型和HPC工作負載而設計。 今年即將交付的美國能源部Frontier E級超級計算機將會使用這款計算卡,傳聞Instinct MI200計算卡擁有128GB的HBM2e顯存。此前通過AMD64 EDAC驅動的Linux更新修正檔,已確認Instinct MI200計算卡會採用MCM(Multi-Chip-Module)封裝技術,在單晶片封裝里使用了兩顆計算晶片,並通過下一代Infinity Fabric總線技術互連。 近日,推特用戶@Locuza_介紹了相關的細節,Instinct MI200計算卡的每個計算晶片支持全速率FP64/FP32和第二代矩陣引擎(用於矩陣乘法的硬體,加速DNN構建、訓練和AI推理),擁有128個CU即8192個流處理器,那麼一張計算卡就有256個CU即16384個流處理器。不過Instinct MI200計算卡會將部分CU屏蔽,實際上只會用到224個CU即14336個流處理器,數量相比完整核心少了14%左右。 同時每個計算晶片都會支持VCN 2.6和SDMA(系統直接記憶體訪問),配備獨立的PCIe接口和XGMI,並配置了4096位的HBM2e顯存接口,對應64GB顯存。假設AMD使用SK海力士速率為3.6Gbps的最新款HBM2e顆粒,將為GPU提供3.64 TB/s的帶寬。由於使用的是帶ECC的顯存,因此部分帶寬和容量會被用於糾錯,實際容量並沒有128 GB那麼多。 ...

AMD確認搭載CDNA 2架構GPU會有兩個晶片,基本確認採用MCM封裝

在此前摩根大通舉行的第49屆全球技術、媒體和通信大會上,AMD執行長蘇姿豐博士簡要地提到了CDNA 2架構及其產品,表示會在年內推出。據之前的傳言,CDNA 2架構GPU的代號為Aldebaran,搭載該GPU的產品很可能是傳聞已久的Instinct MI200計算卡,專門為計算密集型和HPC工作負載而設計。 在最近的Linux內核更新中,AMD工程師確認即將到來的CDNA 2架構GPU將會有兩個晶片。很早就有消息指,CDNA 2架構GPU將採用MCM(Multi-Chip-Module)封裝技術和下一代Infinity Fabric總線技術。其競爭對手,英偉達Hopper架構以及英特爾Xe-HP架構的GPU,大機率都會採用MCM封裝技術。 據VideoCardz報導,代號為Aldebaran的GPU有兩個計算晶片,在Linux更新中被稱為die 0和die 1,而AMD工程部門表示只有主晶片會處理電源的數據,不會通過副晶片去設置,這也最終證實了會有兩個晶片。這意味著主晶片會調節整個計算部分的功耗和相關限制,暫時不清楚顯存是否也是由這個晶片調控,或者加入新的I/O模塊去調節。 代號Aldebaran的GPU如何利用MCM封裝技術目前也不清楚,但肯定和以往有很大的不同。雙晶片配置會需要一個互聯晶片,這也會增加封裝的尺寸,AMD可能會在全面邁向多計算晶片前做不同的嘗試。事實上AMD從來沒有公開確認過CDNA 2架構GPU會採用MCM封裝技術,然而會通過很多側面介紹和稱呼以表明其技術特徵。 AMD Instinct MI200計算卡預計會在今年第四季度推出,可能會採用5nm工藝製造。 ...

AMD提交全新的GPU設計專利:RDNA 3架構很有可能採用MCM設計

AMD曾經在RDNA 2架構顯卡發布會上表示RDNA 3架構已經在設計之中了,這表明AMD將會把他們在CPU領域的輝煌與經驗帶到GPU市場,更快的研發速度讓GPU架構疊代,A卡終於可以擺脫一個架構吃多年的尷尬境遇了。並且最令人振奮的是,AMD在已經連續兩代大幅度提升能耗比之後,高管曾放出話在RDNA 3上很有可能實現同樣的能耗比提升。如果AMD能實現這一點的話,那將是GPU歷史上偉大的三連大提升,近年來從沒有人可以做到GPU產品連續三代以50%+的能耗比提升的偉大壯舉。 但要想實現這個目標談何容易,如果還靠著老套路去研發下一代GPU架構肯定是行不通的。就在去年年底的最後一天,AMD提交了一份全新的GPU設計專利,這份專利顯示AMD將會製作基於MCM設計的全新架構GPU,這也印證了之前廣泛流傳的蘋果以及AMD合力投資台積電研發MCM技術的傳聞,也許MCM顯卡的時代真的要來了。 從這個專利圖中就能很明顯的看到,AMD將會採用MCM多晶片封裝技術,由於AMD在銳龍身上已經擁有了諸如IF總線等技術,實現GPU的多晶片封裝應該不是一個難以逾越的鴻溝。在GPU部門多次拯救CPU部門於水火之後,AMD的GPU部門終於可以吃到一次CPU紅利了。此外,在我之前采訪RTG Leader王啟尚先生的時候他曾透漏GPU部門已經向Ryzen團隊借到了一位架構大神,幫助GPU團隊進行架構設計。這樣的話對於AMD GPU實現MCM來說,應該是如魚得水。而NVIDIA這邊最近也傳出了「Hopper」架構也將採取這種MCM多晶片封裝設計的消息,由此可見MCM未來將會成為晶片設計的主流方向。 ...

NVIDIA或放棄大核心GPU戰略,16nm 36模塊「膠水」GPU來了

從Kpler時代開始,NVIDIA為了兼顧GPU計算及遊戲兩個市場採取了不同的市場戰略——GX100/102大核心主要面向GPU計算市場,GX104/106主流核心則面向遊戲GPU,砍掉了對遊戲無大用的雙精度運算,降低復雜性,減少芯片面積以節省成本、降低功耗。大核心的好處及代價都是非常明顯的,但是隨着摩爾定律終結,製造大核心芯片的工藝越來越復雜,成本也越來越貴,NVIDIA對7nm工藝就表示了明顯的牴觸,那他們有什麼殺招嗎?NVIDIA未來有可能放棄單一大核心GPU戰略,他們已經研究了RC18超小核——基於台積電16nm工藝,晶體管數量只有8700萬個,但一個GPU芯片內可以堆疊36個這樣的小核心,換句話說NVIDIA未來也要走AMD、英特爾那樣的膠水多模芯片路線了。 膠水多模這個說法並不嚴謹,只是網友的調侃,實際上這是目前半導體業界都在研究的Chiplets技術,簡單來說就是在一個芯片內堆疊不同的核心單元,不同的核心可以是不同架構的,也可以是不同工藝的,而這樣做的原因就是半導體製造工藝越來越復雜,製造大核心的難度及成本都居高不下,而且還會有浪費,因為並不是所有核心單元都需要最先進的工藝。 AMD的7nm 64核羅馬處理器就是這樣的代表,CPU核心是7nm工藝的,一個芯片內最多可以堆疊8組CPU單元,總計64核心,而IO核心則是14nm工藝的。 英特爾這邊也有類似的戰略,除了48核膠水封裝的Cascade Lake-AP處理器之外,英特爾還有真正的Chiplets設計——Foreros 3D封裝,也可以將不同架構、不同工藝的核心封裝在一起。 AMD、NVIDIA現在是在CPU處理器上應用了Chiplets設計,而NVIDIA則是准備在GPU芯片上研究MCM多模封裝技術。來自日本PCWatch網站的報導,NVIDIA研究部門主管、首席科學家、高級研究副總裁William J. Dally日前就公開了一個名為RC 18的芯片項目,這是一款適用於深度學習的加速器芯片,基於台積電16nm FinFET工藝,晶體管數量只有8700萬個,相比現在動輒數十億乃至上百億的GPU芯片來說絕對是輕量級的芯片了。 但是RC18芯片只是基礎,NVIDIA研究的目標是在芯片上集成多個基於RC18的MCM模塊,目前已經做到了36模塊堆棧,詳細的技術細節可以參考PCWatch的原文。值得一提的是,RC18不僅是GPU,NVIDIA還在其中集成了RISC-V指令集的CPU核心,雖然只有5級流水線、單發射順序指令架構。 結合這里的情況來看,現在大家應該可以理解NVIDIA對7nm工藝為何如此冷淡了。 來源:超能網