計(jì)算光刻究竟是個啥?和光刻是什么關(guān)系?
關(guān)鍵詞: 臺積電 ASML 計(jì)算機(jī)光刻
2023春季GTC上,NVIDIA與TSMC(臺積電)、ASML 和Synopsys聯(lián)合宣布,完成全新的 AI 加速計(jì)算光刻技術(shù) cuLitho。cuLitho可以將下一代芯片計(jì)算光刻度提高 40 倍以上,極大降低了光掩膜版開發(fā)的時間和成本。
cuLitho的成功,幫助摩爾定律前進(jìn)到2nm掃平了一些外在障礙,同時也證明在傳統(tǒng)CPU占據(jù)的領(lǐng)域,GPU完全可以依靠其并行計(jì)算的價值,將生產(chǎn)力提升至新高度。
NVIDIA CEO黃仁勛表示,“芯片行業(yè)是世界上幾乎所有其他行業(yè)的基礎(chǔ),隨著光刻技術(shù)達(dá)到物理極限,NVIDIA 推出 cuLitho 并與我們的合作伙伴 TSMC、ASML 和 Synopsys 合作,使晶圓廠能夠提高產(chǎn)量、減少碳足跡并為 2nm 及更高工藝奠定基礎(chǔ)?!?br style="white-space: normal; color: rgb(102, 102, 102); font-family: 宋體; font-size: 12px;"/>
實(shí)際上,盡管OPC是個非常小眾的市場,但是正如光刻機(jī)一樣,可以影響到未來摩爾定律的演進(jìn)。同時,計(jì)算光刻也是芯片設(shè)計(jì)和制造過程中的最大計(jì)算工作負(fù)載。黃仁勛表示,計(jì)算光刻每年消耗數(shù)百億CPU工作,這項(xiàng)投入占了芯片制造總投入的相當(dāng)大的比重。
光刻與計(jì)算光刻
對于光刻其實(shí)不必花太多筆墨做介紹了。這是芯片制造過程中最重要的一個步驟,就像是用“光刀”在晶圓上“雕刻”一樣。“雕刻”當(dāng)然是要“刻”出特定的圖案的。這個圖案首先要呈現(xiàn)在光掩膜(photomask)上。掩膜板就像是漏字板,激光一照,通過鏡頭,“漏字板”上的圖案也就落到了硅片上,如下圖。
晶體管、器件、互聯(lián)線路都需要經(jīng)過這樣的光刻步驟。實(shí)操當(dāng)然比這三兩句話的形容要復(fù)雜得多,比如現(xiàn)在的芯片上上下下那么多層,不同的層就需要不同的光刻和掩膜板;而且某些層如果器件間距很小,就可能需要多次光刻。
這里面還有個很反常識的事,就是在我們的認(rèn)知里,比如要光刻上面這個圖案,幾個長方形——那么掩膜板要做成圖中左邊鏤空的樣子,則光源照射以后,落在硅片上就變成了圖中右側(cè)的樣子。但實(shí)際情況卻并不是這樣的。光掩膜其實(shí)要做成下面這樣:
這掩膜板復(fù)雜成這樣,是不是挺反直覺的?光一照,刻到晶圓上會變成下面這樣?英偉達(dá)先進(jìn)技術(shù)副總裁Vivek Singh解釋說,半導(dǎo)體發(fā)展的過去幾十年,晶體管和互聯(lián)間距變得越來越小——原本一切發(fā)展都還算順利。但“大概30年前,晶體管的尺寸變得比(光刻機(jī)所用的)激光波長還要小,于是衍射效應(yīng)就產(chǎn)生了,晶體管成像就會變得模糊”。
對光學(xué)或者攝影有了解的同學(xué),對衍射效應(yīng)這個詞應(yīng)該不會陌生。對于相機(jī)而言,當(dāng)光圈小到某種程度以后,照片受到衍射效應(yīng)的影響就會顯著增大,導(dǎo)致畫面解析力的大幅下降;實(shí)際上,超高像素(或小像素)也受制于衍射效應(yīng)。這一點(diǎn)體現(xiàn)在比相機(jī)精密很多的光刻機(jī)上,也是類似的。Vivek就把光刻機(jī)稱作是“fancy camera”。
當(dāng)然,我們知道光刻機(jī)所用光源也有過幾次大的迭代,到現(xiàn)在談?wù)撟疃嗟木褪荄UV和EUV。尤其EUV極紫外光刻是波長顯著變小的一代光源了。不過即便是昂貴的EUV,其波長與器件間距之間的差異,也變得比過去更小。換句話說,光刻圖案未來將一步步走向模糊——或者說沒有很高的保真度。
這就是計(jì)算光刻切入的契機(jī)——至少藉由計(jì)算光刻要緩解這方面的像差,對于芯片制造產(chǎn)生的不良影響。
此前我們探訪ASML中國,就聽ASML聊起過計(jì)算光刻。計(jì)算光刻是ASML的“鐵三角”業(yè)務(wù)之一。ASML告訴我們,計(jì)算光刻是通過軟件,對整個光刻過程來做建模和仿真,對工藝流程做優(yōu)化;比如說形貌優(yōu)化、掩膜板修正等。舉個例子,比如ASML有個“自由形狀照明(freeform illumination)”,就是通過改變照明形態(tài)來提高成像的解析力。
這就是上面那張圖,光掩膜看起來如此奇怪的原因。即為消除光刻過程中,小尺寸器件“模糊”的問題,就需要對光路上的組成部分做修改。這就好像:在要求得到某個結(jié)果(這一例也就是幾個長方形的圖案)時,算出光源、光掩膜需要做哪些調(diào)整。這個過程就是計(jì)算光刻。
問題來了,計(jì)算光刻越來越難
但是現(xiàn)在問題來了,據(jù)NVIDIA先進(jìn)技術(shù)集團(tuán)副總裁Vivek K Singh的說法:“我在1993年加入光刻工作時,如果你想在晶圓上印一個十字,你只需要在掩模上印一個十字就行。但是很快情況就變了,光的擴(kuò)散會影響分辨率,導(dǎo)致模糊或失真 ,這意味著可能會遺漏芯片的重要元素。如下圖所示,一些可愛的狗耳朵和雙髻鯊開始出現(xiàn)在掩膜上,以此來彌補(bǔ)光學(xué)衍射。但這還遠(yuǎn)遠(yuǎn)不夠,我們不得不采用完全成熟的基于光學(xué)接近校正(OPC)的模型,后來又開始通過基于規(guī)則的輔助功能來增強(qiáng)它。從最簡單的一些粉飾到逐漸扭曲的掩膜,最終的結(jié)果還是要在晶圓上印下那個十字,只不過是在很小的晶圓尺寸上?!?/span>
由此可以看出,當(dāng)芯片的關(guān)鍵尺寸小于光源波長的時候,所需要的掩模版越來越復(fù)雜。幾十年來,為芯片在制造過程中制作掩膜一直是半導(dǎo)體制造中的關(guān)鍵環(huán)節(jié)。
尤其是芯片逐漸來到3nm及以下,不僅需要更加精準(zhǔn)的光刻計(jì)算,光刻計(jì)算所需的時間也越來越長。計(jì)算光刻是涉及電磁物理、光化學(xué)、計(jì)算幾何、迭代優(yōu)化和分布式計(jì)算的復(fù)雜計(jì)算,沒有更強(qiáng)大的計(jì)算光刻很難實(shí)現(xiàn)這樣復(fù)雜的掩模版設(shè)計(jì)。
像臺積電這樣的代工廠需要有大量的數(shù)據(jù)中心來處理相關(guān)計(jì)算和仿真運(yùn)行,代工廠的數(shù)據(jù)中心通常是以CPU為核心。下圖是Vivek Singh估算的每年CPU工作的小時數(shù),左側(cè)y軸顯示了隨著工藝節(jié)點(diǎn)不斷微縮,光學(xué)鄰近修正(OPC)在2nm、1nm差不多需要CPU來計(jì)算幾百萬小時。右側(cè)Y軸上是不同工藝節(jié)點(diǎn)所用的數(shù)據(jù)中心的數(shù)量,5nm節(jié)點(diǎn)差不多需要3個大的數(shù)據(jù)中心,每個數(shù)據(jù)中心需要處理10個掩膜。3nm節(jié)點(diǎn)的時候需要6個數(shù)據(jù)中心,如果繼續(xù)這樣下去,到1nm則很有可能需要100個數(shù)據(jù)中心。“你不能一直增加數(shù)據(jù)中心,有些東西必須舍棄,洛杉磯已經(jīng)開始下雪了?!盫ivek Singh如是說道。再者,現(xiàn)在的計(jì)算能力在未來很可能不夠。
所以,在半導(dǎo)體制造中的超大型工作負(fù)載所需的計(jì)算時間成本,已經(jīng)使得摩爾定律不再具有經(jīng)濟(jì)性。計(jì)算光刻這一步驟也成為將新的納米技術(shù)節(jié)點(diǎn)和計(jì)算機(jī)架構(gòu)推向市場的瓶頸。
2020年臺積電在一次會議上提到,采用GPU可以將反向光刻(ILT)仿真時間減少10倍以上。ppt的最后臺積電提了一個很重要的問題,GPU庫可以用于多邊形操作嗎?
英偉達(dá)改變了游戲規(guī)則
今天英偉達(dá)證明了,可以。為什么GPU可以用于計(jì)算光刻,因?yàn)橛?jì)算光刻技術(shù)中至少一半的OPC和ILT是由前成像組成的,而且它幾乎完全是由卷積運(yùn)算組成的,這些正是GPU擅長的。
在近日的GTC大會上,英偉達(dá)在GPU之上構(gòu)建了cuLitho計(jì)算光刻技術(shù)軟件庫,這是英偉達(dá)四年秘密研發(fā)的成果。在cuLitho計(jì)算光刻軟件庫中有多項(xiàng)技術(shù),如下圖所示,cuDOP用于衍射光學(xué),cuCompGeo用于計(jì)算幾何,cuOASIS用于優(yōu)化,cuHierarchy用于AI。
cuLitho已被EDA工具廠商新思采用,cuLitho已集成到新思科技Proteus全芯片掩模合成解決方案和Proteus ILT逆光刻技術(shù)。一般情況下,晶圓廠在改變工藝時需要修改OPC,因此會遇到瓶頸。cuLitho不僅可以幫助突破這些瓶頸,還可以提供曲線式光掩模、High-NA EUV光刻、亞原子光刻膠建模等新技術(shù)節(jié)點(diǎn)所需的新型解決方案和創(chuàng)新技術(shù)。
cuLitho的核心是一組并行算法,由英偉達(dá)科學(xué)家發(fā)明,計(jì)算光刻工藝的所有部分都可以并行運(yùn)行,原來需要4萬個CPU系統(tǒng)才能完成的工作,現(xiàn)在僅需用500個NVIDIA DGX H100系統(tǒng)即可完成,這不僅大大加速了目前每年消耗數(shù)百億CPU小時的大規(guī)模計(jì)算工作負(fù)載,而且降低了耗電和對環(huán)境的影響。
cuLitho在組件級別上平均加速了一次連續(xù)的CPU操作,基于Ampere組件上提升了138倍,在Hopper結(jié)構(gòu)上提高了254倍。在端到端的OPC項(xiàng)目中,結(jié)合Ampere提升了23倍,在Hopper上提升了42倍。
使用cuLitho的晶圓廠每天的光掩模產(chǎn)量可增加3-5倍,而耗電量可以比當(dāng)前配置降低9倍。英偉達(dá)表示,基于GPU的cuLitho計(jì)算光刻技術(shù),其性能比當(dāng)前光刻技術(shù)工藝提高了40倍,原本需要兩周時間才能完成的光掩?,F(xiàn)在可以在一夜之間完成。例如英偉達(dá)H100 GPU需要89塊掩膜板,在CPU上運(yùn)行時,處理單個掩膜板需要兩周時間,而在GPU上運(yùn)行cuLitho只需8小時。
從長遠(yuǎn)來看,cuLitho將帶來更好的設(shè)計(jì)規(guī)則、更高的密度和產(chǎn)量以及AI驅(qū)動的光刻技術(shù),使晶圓廠能夠提高產(chǎn)量、減少碳足跡并為2納米及更高工藝奠定基礎(chǔ)。
cuLitho計(jì)算光刻技術(shù)軟件庫,目前已得到了臺積電、ASML的合作。cuLitho將于6月在臺積電開始使用,臺積電用其來部署反演光刻技術(shù)、深度學(xué)習(xí)等;ASML計(jì)劃在所有計(jì)算光刻軟件產(chǎn)品中加入對GPU的支持,cuLitho的優(yōu)勢在High-NA EUV光刻時代將變得尤為明顯;EDA工具供應(yīng)商Synopsys OPC軟件將在cuLitho平臺上運(yùn)行。
下圖是一個chromeless face shift掩膜,如果把它放進(jìn)ASML最新的光刻機(jī)中,會出來怎樣一個圖案呢?
答案是,NVIDIA cuLitho。
目前的cuLitho計(jì)算光刻技術(shù)還只是一個于麥克斯韋方程組的數(shù)學(xué)工具,但英偉達(dá)表示,基于人工智能的計(jì)算光刻技術(shù)“正在開發(fā)中”。想象一些如果AI技術(shù)引入計(jì)算光刻又將如何?
寫在最后
沒有計(jì)算光刻技術(shù)的支撐,芯片制造商就不可能制造出最新的技術(shù)節(jié)點(diǎn)。cuLitho計(jì)算光刻庫軟件的發(fā)布,不僅為芯片的繼續(xù)演進(jìn)提供了一項(xiàng)革新技術(shù),也再次發(fā)揮了GPU的潛力——從最初的圖形處理到AI芯片、再到數(shù)據(jù)中心、乃至芯片的未來,老黃贏麻了。
借用《軟硬件融合》圖書和公眾號作者,上海矩向科技創(chuàng)始人兼CEO黃朝波對該發(fā)布的點(diǎn)評:“老黃是非常成功的,但其實(shí)本質(zhì)上老黃就只做了一件事情(并行計(jì)算)和兩個方面(GPU是并行計(jì)算平臺,CUDA是為了更好的并行計(jì)算編程)?!?/span>
每次當(dāng)芯片演變出現(xiàn)瓶頸,總會有新技術(shù)出現(xiàn),例如FinFET晶體管技術(shù)的發(fā)明給摩爾定律續(xù)命了十幾年?,F(xiàn)在,為了讓芯片繼續(xù)微縮下去,各種新材料、新架構(gòu)、新封裝、新互聯(lián)等技術(shù)層出不窮。
