數(shù)據(jù)爆炸式增長(zhǎng)將芯片要求推至高點(diǎn),如何設(shè)計(jì)出更符合需求的半導(dǎo)體?
過(guò)去,大多數(shù)芯片都包含一到兩項(xiàng)前沿技術(shù),主要是為了跟上每隔幾年每個(gè)新工藝節(jié)點(diǎn)的光刻技術(shù)的預(yù)期改進(jìn)。這些改進(jìn)是基于行業(yè)路線(xiàn)圖,該路線(xiàn)圖要求隨著時(shí)間的推移取得可預(yù)測(cè)但不顯著的收益?,F(xiàn)在,隨著大型語(yǔ)言模型和更多傳感器推動(dòng)的數(shù)據(jù)爆炸式增長(zhǎng),以及設(shè)計(jì)自己芯片的系統(tǒng)公司之間的競(jìng)爭(zhēng)加劇,以及涉及人工智能的國(guó)際競(jìng)爭(zhēng)日益激烈,芯片設(shè)計(jì)前沿的規(guī)則正在發(fā)生相當(dāng)大的變化。
現(xiàn)在,漸進(jìn)式改進(jìn)與處理性能的巨大飛躍相結(jié)合,雖然這些改進(jìn)使計(jì)算能力和分析達(dá)到了一個(gè)全新的水平,但它們也需要一套全新的權(quán)衡。
這些轉(zhuǎn)變的核心是高度定制的芯片架構(gòu),其中一些涉及在最先進(jìn)的工藝節(jié)點(diǎn)開(kāi)發(fā)的小芯片。并行處理幾乎是必然的,針對(duì)特定數(shù)據(jù)類(lèi)型和操作的加速器也是如此。在某些情況下,這些微型系統(tǒng)不會(huì)進(jìn)行商業(yè)銷(xiāo)售,因?yàn)樗鼈優(yōu)閿?shù)據(jù)中心提供了競(jìng)爭(zhēng)優(yōu)勢(shì)。但它們也可能包括其他商用技術(shù),例如處理核心或加速器或用于減少延遲的內(nèi)存內(nèi)或近內(nèi)存計(jì)算技術(shù),以及不同的緩存方案、共同封裝的光學(xué)器件和更快的互連。其中許多進(jìn)展多年來(lái)一直處于研究或擱置狀態(tài),現(xiàn)在正在全面部署。
谷歌研究院工程研究員兼機(jī)器學(xué)習(xí)系統(tǒng)副總裁 Amin Vahdat 在最近的 Hot Chips 2023 會(huì)議上的演講中指出,今天的芯片可以解決十年前無(wú)法想象的問(wèn)題,而機(jī)器學(xué)習(xí)將承擔(dān)計(jì)算周期“越來(lái)越多的任務(wù)”。
我們?cè)谶^(guò)去 50 或 60 年間開(kāi)發(fā)的傳統(tǒng)計(jì)算智慧已被拋棄。
芯片設(shè)計(jì)發(fā)生了變化
傳統(tǒng)芯片公司、汽車(chē)原始設(shè)備制造商、無(wú)晶圓廠(chǎng)和非無(wú)晶圓廠(chǎng)IDM以及大型系統(tǒng)公司,現(xiàn)在在為特定應(yīng)用尋求最佳解決方案時(shí),不僅面臨著不同的工藝節(jié)點(diǎn),而且面臨著更多的選擇和更獨(dú)特的挑戰(zhàn)。他們都對(duì)EDA生態(tài)系統(tǒng)提出了更高的要求,EDA生態(tài)系統(tǒng)正在競(jìng)相跟上這些變化,包括各種類(lèi)型的先進(jìn)封裝,小芯片以及對(duì)集成和定制硬件和軟件的需求。
Cadence
Cadence 研發(fā)總裁Saugat Sen 說(shuō):“雖然在這個(gè)時(shí)代存在許多架構(gòu)和設(shè)計(jì)挑戰(zhàn),但解決熱問(wèn)題已成為重中之重。一段時(shí)間以來(lái),設(shè)計(jì)和實(shí)施的效率與多物理場(chǎng)分析的閉環(huán)集成有著錯(cuò)綜復(fù)雜的聯(lián)系。”定義系統(tǒng)處理器的功率和能量要求也變得越來(lái)越困難。
IBM
IBM 研究員兼 IBM Z系統(tǒng)架構(gòu)和設(shè)計(jì)首席技術(shù)官 Christian Jacobi 表示,計(jì)算的功耗和總能源使用是一個(gè)巨大的問(wèn)題,并且由于地緣政治的發(fā)展、能源成本的上升和環(huán)境問(wèn)題,目前它變得越來(lái)越大的系統(tǒng)問(wèn)題?!芭c此同時(shí),由于摩爾定律基本上已經(jīng)結(jié)束,作為架構(gòu)師,我們希望不斷為每個(gè)芯片添加特性、功能、性能和更多內(nèi)核,而不會(huì)增加能源足跡。因此,我們必須更明智地管理芯片中的能源,從如何在任何時(shí)間點(diǎn)優(yōu)化功耗與性能,如何利用并非所有計(jì)算資源都被充分利用的活動(dòng)較少的時(shí)段,到減少芯片組件的功耗。”
IBM 針對(duì)其 Z Systems 的解決方案是將 AI 集成到處理器芯片中?!拔覀兛梢栽L(fǎng)問(wèn)它已經(jīng)存在的數(shù)據(jù),”Jacobi 說(shuō)。如果數(shù)據(jù)在處理器芯片中,并且在處理器芯片的緩存中——因?yàn)檫@是任何其他業(yè)務(wù)流程對(duì)這些數(shù)據(jù)進(jìn)行計(jì)算的地方,例如銀行交易或信用卡交易——我不需要采取該數(shù)據(jù)并將其移動(dòng)到其他地方,移動(dòng)到不同的設(shè)備或通過(guò)網(wǎng)絡(luò)或通過(guò) PCI 接口移動(dòng)到連接 I/O 的適配器。相反,我們有本地化的 AI 引擎,我可以在那里訪(fǎng)問(wèn)這些數(shù)據(jù)。我不必將它轉(zhuǎn)到不同的設(shè)備。這顯然大大減少了執(zhí)行 AI 的能源足跡。實(shí)際的計(jì)算本身,加法和乘法,它們?nèi)匀幌墓β省?/span>
是德科技
這對(duì)生態(tài)系統(tǒng)的其他部分意味著會(huì)變得更加復(fù)雜,因?yàn)椴⒎敲總€(gè)芯片或封裝都會(huì)以相同的方式做事。是德科技新市場(chǎng)高級(jí)經(jīng)理兼數(shù)字孿生項(xiàng)目經(jīng)理 Chris Mueth 表示:“為了支持生態(tài)系統(tǒng)和產(chǎn)品復(fù)雜性,仍然需要做出許多改變。產(chǎn)品復(fù)雜性是主要驅(qū)動(dòng)力,因?yàn)槊總€(gè)人都想要更多的小型化。每個(gè)人都希望他們擁有的產(chǎn)品具有更多功能。所以需要更多的集成。雖然看起來(lái)我們正在接近漸近條件,但我認(rèn)為我們還有解決辦法?!?/span>
事實(shí)上,摩爾定律路線(xiàn)圖上至少還有幾個(gè)工藝節(jié)點(diǎn),所有這三個(gè)領(lǐng)先的代工廠(chǎng)——三星、臺(tái)積電和英特爾——都有延伸到 1.x 納米范圍的路線(xiàn)圖?!斑@非常重要,因?yàn)槲覀儽仨毷咕w管更小,原因有兩個(gè),”Mueth 說(shuō)?!耙粋€(gè)是速度,另一個(gè)是熱量。當(dāng)您在芯片上為無(wú)數(shù)晶體管計(jì)時(shí),您會(huì)產(chǎn)生大量熱量。解決這個(gè)問(wèn)題的方法是縮小所有內(nèi)容,但在某個(gè)時(shí)候我們會(huì)達(dá)到一個(gè)漸近峰值。”
Rambus
Rambus 的杰出發(fā)明家 Steven Woo 對(duì)此表示贊同?!艾F(xiàn)在 Dennard 縮放已經(jīng)基本停止,你真的無(wú)法再可靠地降低功率了,”他說(shuō)?!耙虼?,如果你想繼續(xù)獲得性能,并且想繼續(xù)增加計(jì)算密度,你將不得不想辦法吸走熱量?!?/span>
例如,在電動(dòng)汽車(chē)中,這意味著 ECU 必須在整個(gè)電氣系統(tǒng)中電源非常有限的情況下進(jìn)行設(shè)計(jì)。傳統(tǒng)上,硬件設(shè)計(jì)人員通過(guò)添加多種模式來(lái)解決此類(lèi)問(wèn)題,這些模式可以被關(guān)閉和監(jiān)控,以衡量系統(tǒng)正在做什么,例如放慢速度。
“我們?cè)谌斯ぶ悄苤锌吹降母嗫赡軙?huì)在所有領(lǐng)域發(fā)揮作用的是,軟件工程師真正了解系統(tǒng)性能和系統(tǒng)精度之間的權(quán)衡,”Woo 說(shuō)?!叭绻麄?cè)趲?、能量或其他方面受到某種限制,他們就會(huì)把它變成一個(gè)軟件問(wèn)題。如果他們需要更多帶寬,他們可以降低數(shù)字的精度,并且專(zhuān)門(mén)針對(duì)降低精度或稀疏性進(jìn)行訓(xùn)練。在人工智能領(lǐng)域,系統(tǒng)的軟件端和硬件端之間有一個(gè)整體的集成視圖。在過(guò)去的 20 年中,以同樣的方式,考慮到緩存大小和處理器架構(gòu),程序員被迫變得更加了解架構(gòu)。未來(lái),程序員必須更加了解系統(tǒng)中的功率限制等問(wèn)題,并嘗試使用工具和 API,讓他們以性能換取功耗。”
在汽車(chē)領(lǐng)域尤其如此,芯片需要隨著時(shí)間的推移可靠運(yùn)行,并且需要隨著算法和通信協(xié)議的變化而更新。
Fraunhofer
“我們看到的一大趨勢(shì)是對(duì)健康狀況的監(jiān)測(cè),”Fraunhofer IIS 自適應(yīng)系統(tǒng)部工程設(shè)計(jì)方法負(fù)責(zé)人 Roland Jancke 說(shuō)?!叭绻谠O(shè)計(jì)時(shí)不再能夠控制芯片,那么您需要在運(yùn)行期間進(jìn)行監(jiān)控并切換到備件或其他一些備份。對(duì)于汽車(chē)電子,您需要考慮操作過(guò)程中可能發(fā)生的一切。但如果你說(shuō),'讓我們根據(jù)零件故障的可能性來(lái)開(kāi)發(fā)這個(gè),'然后你投入了一些備件,那么你將超出你的貨幣預(yù)算?!?/span>
Jancke 說(shuō),關(guān)鍵是能夠在緊急情況下故障轉(zhuǎn)移到另一個(gè)系統(tǒng),但這可能是一個(gè)非常復(fù)雜的過(guò)程。與芯片設(shè)計(jì)中正在進(jìn)行的許多變化一樣,它需要打破一些傳統(tǒng)的孤島,在這些孤島中,系統(tǒng)、半導(dǎo)體、封裝和軟件工程師在異構(gòu)架構(gòu)上協(xié)同工作。
Movellus
“異構(gòu)架構(gòu)并不是一個(gè)新概念,”Movellus 產(chǎn)品、營(yíng)銷(xiāo)和規(guī)劃高級(jí)副總裁 Vik Karvat 說(shuō)?!八谠S多垂直領(lǐng)域得到了發(fā)展和擴(kuò)展,包括移動(dòng)、汽車(chē)和人工智能?,F(xiàn)在的不同之處在于異構(gòu)計(jì)算元素更大、更強(qiáng)大。英偉達(dá)的 Hopper + Grace 解決方案、英特爾的 Sapphire Rapids 和 Falcon Shore 平臺(tái)就是例證。然而,隨著這些元素變得越來(lái)越大,并且數(shù)據(jù)中心計(jì)算需求和密度目標(biāo)繼續(xù)保持其幾何級(jí)增長(zhǎng)曲線(xiàn),異構(gòu)單片機(jī)將過(guò)渡到異構(gòu)小芯片方法以繼續(xù)擴(kuò)展。這需要系統(tǒng)、半成品和包裝公司齊心協(xié)力。”
中科院利用AI技術(shù)開(kāi)發(fā)出芯片設(shè)計(jì)技術(shù),開(kāi)發(fā)出全球首款無(wú)需人工干預(yù),完全由AI人工智能設(shè)計(jì)的芯片,由此將繞開(kāi)美國(guó)控制的EDA工具,在芯片設(shè)計(jì)方面將不再受美國(guó)的限制。
為了確保芯片自主權(quán),芯片采用了RISC-V架構(gòu),以純國(guó)產(chǎn)的65納米工藝生產(chǎn),而性能方面已與Intel的486相當(dāng),雖然性能與當(dāng)下的差距較大,但是勝在這款芯片從芯片架構(gòu)、芯片設(shè)計(jì)到芯片制造都實(shí)現(xiàn)了全國(guó)產(chǎn)化。
人工智能引入芯片行業(yè)已成風(fēng)潮
據(jù)了解中科院發(fā)布的用AI人工智能設(shè)計(jì)的芯片可以大幅提升芯片設(shè)計(jì)速度,芯片設(shè)計(jì)時(shí)間只有現(xiàn)有EDA工具開(kāi)發(fā)時(shí)間的千分之一,這將為國(guó)產(chǎn)芯片的設(shè)計(jì)提供許多可能性,中科院將人工智能引入芯片設(shè)計(jì)可謂開(kāi)辟了芯片技術(shù)研發(fā)的先河,這套技術(shù)預(yù)計(jì)未來(lái)將可以應(yīng)用于14納米乃至7納米、5納米芯片,而完全舍棄美國(guó)的EDA工具。
將人工智能技術(shù)引入芯片行業(yè)其實(shí)已在業(yè)內(nèi)風(fēng)行,最先將AI技術(shù)引入芯片行業(yè)的是臺(tái)積電,臺(tái)積電與NVIDIA合作,由NVIDIA為臺(tái)積電開(kāi)發(fā)了人工智能技術(shù)cuLitho,如此可以大幅提升芯片光刻的效率,同時(shí)大幅降低了光刻的錯(cuò)誤,這還為臺(tái)積電節(jié)省了大量電力,降低了成本。
芯片行業(yè)引入人工智能輔助,在于如今的芯片異常復(fù)雜,以人工設(shè)計(jì)或制造芯片的難度越來(lái)越大,畢竟一枚芯片動(dòng)輒就是數(shù)百億顆晶體管,而引入人工智能可以更快地處理芯片內(nèi)部的結(jié)構(gòu),同時(shí)通過(guò)計(jì)算機(jī)模擬可以從中發(fā)現(xiàn)問(wèn)題,而不是如之前那樣只能等到流片之后再找出問(wèn)題,那樣不僅浪費(fèi)時(shí)間,還會(huì)造成巨額的成本。
如今中科院在芯片設(shè)計(jì)環(huán)節(jié)引入人工智能技術(shù),臺(tái)積電則在芯片制造環(huán)節(jié)引入人工智能,如此在芯片設(shè)計(jì)和生產(chǎn)整條鏈條中就形成了以人工智能處理芯片的閉環(huán),加快芯片量產(chǎn)進(jìn)程,對(duì)于芯片行業(yè)無(wú)疑是巨大的利好。
