計(jì)算光刻究竟是個啥？和光刻是什么關(guān)系？

2023-03-28 來源：半導(dǎo)體行業(yè)觀察

4614

2023春季GTC上，NVIDIA與TSMC（臺積電）、ASML 和Synopsys聯(lián)合宣布，完成全新的 AI 加速計(jì)算光刻技術(shù) cuLitho。cuLitho可以將下一代芯片計(jì)算光刻度提高 40 倍以上，極大降低了光掩膜版開發(fā)的時間和成本。

cuLitho的成功，幫助摩爾定律前進(jìn)到2nm掃平了一些外在障礙，同時也證明在傳統(tǒng)CPU占據(jù)的領(lǐng)域，GPU完全可以依靠其并行計(jì)算的價值，將生產(chǎn)力提升至新高度。

NVIDIA CEO黃仁勛表示，“芯片行業(yè)是世界上幾乎所有其他行業(yè)的基礎(chǔ)，隨著光刻技術(shù)達(dá)到物理極限，NVIDIA 推出 cuLitho 并與我們的合作伙伴 TSMC、ASML 和 Synopsys 合作，使晶圓廠能夠提高產(chǎn)量、減少碳足跡并為 2nm 及更高工藝奠定基礎(chǔ)?！?br style="white-space: normal; color: rgb(102, 102, 102); font-family: 宋體; font-size: 12px;"/>
實(shí)際上，盡管OPC是個非常小眾的市場，但是正如光刻機(jī)一樣，可以影響到未來摩爾定律的演進(jìn)。同時，計(jì)算光刻也是芯片設(shè)計(jì)和制造過程中的最大計(jì)算工作負(fù)載。黃仁勛表示，計(jì)算光刻每年消耗數(shù)百億CPU工作，這項(xiàng)投入占了芯片制造總投入的相當(dāng)大的比重。

光刻與計(jì)算光刻

對于光刻其實(shí)不必花太多筆墨做介紹了。這是芯片制造過程中最重要的一個步驟，就像是用“光刀”在晶圓上“雕刻”一樣。“雕刻”當(dāng)然是要“刻”出特定的圖案的。這個圖案首先要呈現(xiàn)在光掩膜（photomask）上。掩膜板就像是漏字板，激光一照，通過鏡頭，“漏字板”上的圖案也就落到了硅片上，如下圖。

晶體管、器件、互聯(lián)線路都需要經(jīng)過這樣的光刻步驟。實(shí)操當(dāng)然比這三兩句話的形容要復(fù)雜得多，比如現(xiàn)在的芯片上上下下那么多層，不同的層就需要不同的光刻和掩膜板；而且某些層如果器件間距很小，就可能需要多次光刻。

這里面還有個很反常識的事，就是在我們的認(rèn)知里，比如要光刻上面這個圖案，幾個長方形——那么掩膜板要做成圖中左邊鏤空的樣子，則光源照射以后，落在硅片上就變成了圖中右側(cè)的樣子。但實(shí)際情況卻并不是這樣的。光掩膜其實(shí)要做成下面這樣：

這掩膜板復(fù)雜成這樣，是不是挺反直覺的？光一照，刻到晶圓上會變成下面這樣？英偉達(dá)先進(jìn)技術(shù)副總裁Vivek Singh解釋說，半導(dǎo)體發(fā)展的過去幾十年，晶體管和互聯(lián)間距變得越來越小——原本一切發(fā)展都還算順利。但“大概30年前，晶體管的尺寸變得比（光刻機(jī)所用的）激光波長還要小，于是衍射效應(yīng)就產(chǎn)生了，晶體管成像就會變得模糊”。

對光學(xué)或者攝影有了解的同學(xué)，對衍射效應(yīng)這個詞應(yīng)該不會陌生。對于相機(jī)而言，當(dāng)光圈小到某種程度以后，照片受到衍射效應(yīng)的影響就會顯著增大，導(dǎo)致畫面解析力的大幅下降；實(shí)際上，超高像素（或小像素）也受制于衍射效應(yīng)。這一點(diǎn)體現(xiàn)在比相機(jī)精密很多的光刻機(jī)上，也是類似的。Vivek就把光刻機(jī)稱作是“fancy camera”。

當(dāng)然，我們知道光刻機(jī)所用光源也有過幾次大的迭代，到現(xiàn)在談?wù)撟疃嗟木褪荄UV和EUV。尤其EUV極紫外光刻是波長顯著變小的一代光源了。不過即便是昂貴的EUV，其波長與器件間距之間的差異，也變得比過去更小。換句話說，光刻圖案未來將一步步走向模糊——或者說沒有很高的保真度。

這就是計(jì)算光刻切入的契機(jī)——至少藉由計(jì)算光刻要緩解這方面的像差，對于芯片制造產(chǎn)生的不良影響。

此前我們探訪ASML中國，就聽ASML聊起過計(jì)算光刻。計(jì)算光刻是ASML的“鐵三角”業(yè)務(wù)之一。ASML告訴我們，計(jì)算光刻是通過軟件，對整個光刻過程來做建模和仿真，對工藝流程做優(yōu)化；比如說形貌優(yōu)化、掩膜板修正等。舉個例子，比如ASML有個“自由形狀照明（freeform illumination）”，就是通過改變照明形態(tài)來提高成像的解析力。

這就是上面那張圖，光掩膜看起來如此奇怪的原因。即為消除光刻過程中，小尺寸器件“模糊”的問題，就需要對光路上的組成部分做修改。這就好像：在要求得到某個結(jié)果（這一例也就是幾個長方形的圖案）時，算出光源、光掩膜需要做哪些調(diào)整。這個過程就是計(jì)算光刻。

問題來了，計(jì)算光刻越來越難

但是現(xiàn)在問題來了，據(jù)NVIDIA先進(jìn)技術(shù)集團(tuán)副總裁Vivek K Singh的說法：“我在1993年加入光刻工作時，如果你想在晶圓上印一個十字，你只需要在掩模上印一個十字就行。但是很快情況就變了，光的擴(kuò)散會影響分辨率，導(dǎo)致模糊或失真，這意味著可能會遺漏芯片的重要元素。如下圖所示，一些可愛的狗耳朵和雙髻鯊開始出現(xiàn)在掩膜上，以此來彌補(bǔ)光學(xué)衍射。但這還遠(yuǎn)遠(yuǎn)不夠，我們不得不采用完全成熟的基于光學(xué)接近校正（OPC）的模型，后來又開始通過基于規(guī)則的輔助功能來增強(qiáng)它。從最簡單的一些粉飾到逐漸扭曲的掩膜，最終的結(jié)果還是要在晶圓上印下那個十字，只不過是在很小的晶圓尺寸上?！?/span>

由此可以看出，當(dāng)芯片的關(guān)鍵尺寸小于光源波長的時候，所需要的掩模版越來越復(fù)雜。幾十年來，為芯片在制造過程中制作掩膜一直是半導(dǎo)體制造中的關(guān)鍵環(huán)節(jié)。

尤其是芯片逐漸來到3nm及以下，不僅需要更加精準(zhǔn)的光刻計(jì)算，光刻計(jì)算所需的時間也越來越長。計(jì)算光刻是涉及電磁物理、光化學(xué)、計(jì)算幾何、迭代優(yōu)化和分布式計(jì)算的復(fù)雜計(jì)算，沒有更強(qiáng)大的計(jì)算光刻很難實(shí)現(xiàn)這樣復(fù)雜的掩模版設(shè)計(jì)。

像臺積電這樣的代工廠需要有大量的數(shù)據(jù)中心來處理相關(guān)計(jì)算和仿真運(yùn)行，代工廠的數(shù)據(jù)中心通常是以CPU為核心。下圖是Vivek Singh估算的每年CPU工作的小時數(shù)，左側(cè)y軸顯示了隨著工藝節(jié)點(diǎn)不斷微縮，光學(xué)鄰近修正（OPC）在2nm、1nm差不多需要CPU來計(jì)算幾百萬小時。右側(cè)Y軸上是不同工藝節(jié)點(diǎn)所用的數(shù)據(jù)中心的數(shù)量，5nm節(jié)點(diǎn)差不多需要3個大的數(shù)據(jù)中心，每個數(shù)據(jù)中心需要處理10個掩膜。3nm節(jié)點(diǎn)的時候需要6個數(shù)據(jù)中心，如果繼續(xù)這樣下去，到1nm則很有可能需要100個數(shù)據(jù)中心。“你不能一直增加數(shù)據(jù)中心，有些東西必須舍棄，洛杉磯已經(jīng)開始下雪了?！盫ivek Singh如是說道。再者，現(xiàn)在的計(jì)算能力在未來很可能不夠。

所以，在半導(dǎo)體制造中的超大型工作負(fù)載所需的計(jì)算時間成本，已經(jīng)使得摩爾定律不再具有經(jīng)濟(jì)性。計(jì)算光刻這一步驟也成為將新的納米技術(shù)節(jié)點(diǎn)和計(jì)算機(jī)架構(gòu)推向市場的瓶頸。

2020年臺積電在一次會議上提到，采用GPU可以將反向光刻（ILT）仿真時間減少10倍以上。ppt的最后臺積電提了一個很重要的問題，GPU庫可以用于多邊形操作嗎？

英偉達(dá)改變了游戲規(guī)則

今天英偉達(dá)證明了，可以。為什么GPU可以用于計(jì)算光刻，因?yàn)橛?jì)算光刻技術(shù)中至少一半的OPC和ILT是由前成像組成的，而且它幾乎完全是由卷積運(yùn)算組成的，這些正是GPU擅長的。

在近日的GTC大會上，英偉達(dá)在GPU之上構(gòu)建了cuLitho計(jì)算光刻技術(shù)軟件庫，這是英偉達(dá)四年秘密研發(fā)的成果。在cuLitho計(jì)算光刻軟件庫中有多項(xiàng)技術(shù)，如下圖所示，cuDOP用于衍射光學(xué)，cuCompGeo用于計(jì)算幾何，cuOASIS用于優(yōu)化，cuHierarchy用于AI。

cuLitho已被EDA工具廠商新思采用，cuLitho已集成到新思科技Proteus全芯片掩模合成解決方案和Proteus ILT逆光刻技術(shù)。一般情況下，晶圓廠在改變工藝時需要修改OPC，因此會遇到瓶頸。cuLitho不僅可以幫助突破這些瓶頸，還可以提供曲線式光掩模、High-NA EUV光刻、亞原子光刻膠建模等新技術(shù)節(jié)點(diǎn)所需的新型解決方案和創(chuàng)新技術(shù)。

cuLitho的核心是一組并行算法，由英偉達(dá)科學(xué)家發(fā)明，計(jì)算光刻工藝的所有部分都可以并行運(yùn)行，原來需要4萬個CPU系統(tǒng)才能完成的工作，現(xiàn)在僅需用500個NVIDIA DGX H100系統(tǒng)即可完成，這不僅大大加速了目前每年消耗數(shù)百億CPU小時的大規(guī)模計(jì)算工作負(fù)載，而且降低了耗電和對環(huán)境的影響。

cuLitho在組件級別上平均加速了一次連續(xù)的CPU操作，基于Ampere組件上提升了138倍，在Hopper結(jié)構(gòu)上提高了254倍。在端到端的OPC項(xiàng)目中，結(jié)合Ampere提升了23倍，在Hopper上提升了42倍。

使用cuLitho的晶圓廠每天的光掩模產(chǎn)量可增加3-5倍，而耗電量可以比當(dāng)前配置降低9倍。英偉達(dá)表示，基于GPU的cuLitho計(jì)算光刻技術(shù)，其性能比當(dāng)前光刻技術(shù)工藝提高了40倍，原本需要兩周時間才能完成的光掩?，F(xiàn)在可以在一夜之間完成。例如英偉達(dá)H100 GPU需要89塊掩膜板，在CPU上運(yùn)行時，處理單個掩膜板需要兩周時間，而在GPU上運(yùn)行cuLitho只需8小時。

從長遠(yuǎn)來看，cuLitho將帶來更好的設(shè)計(jì)規(guī)則、更高的密度和產(chǎn)量以及AI驅(qū)動的光刻技術(shù)，使晶圓廠能夠提高產(chǎn)量、減少碳足跡并為2納米及更高工藝奠定基礎(chǔ)。

cuLitho計(jì)算光刻技術(shù)軟件庫，目前已得到了臺積電、ASML的合作。cuLitho將于6月在臺積電開始使用，臺積電用其來部署反演光刻技術(shù)、深度學(xué)習(xí)等；ASML計(jì)劃在所有計(jì)算光刻軟件產(chǎn)品中加入對GPU的支持，cuLitho的優(yōu)勢在High-NA EUV光刻時代將變得尤為明顯；EDA工具供應(yīng)商Synopsys OPC軟件將在cuLitho平臺上運(yùn)行。

下圖是一個chromeless face shift掩膜，如果把它放進(jìn)ASML最新的光刻機(jī)中，會出來怎樣一個圖案呢？

答案是，NVIDIA cuLitho。

目前的cuLitho計(jì)算光刻技術(shù)還只是一個于麥克斯韋方程組的數(shù)學(xué)工具，但英偉達(dá)表示，基于人工智能的計(jì)算光刻技術(shù)“正在開發(fā)中”。想象一些如果AI技術(shù)引入計(jì)算光刻又將如何？

寫在最后

沒有計(jì)算光刻技術(shù)的支撐，芯片制造商就不可能制造出最新的技術(shù)節(jié)點(diǎn)。cuLitho計(jì)算光刻庫軟件的發(fā)布，不僅為芯片的繼續(xù)演進(jìn)提供了一項(xiàng)革新技術(shù)，也再次發(fā)揮了GPU的潛力——從最初的圖形處理到AI芯片、再到數(shù)據(jù)中心、乃至芯片的未來，老黃贏麻了。

借用《軟硬件融合》圖書和公眾號作者，上海矩向科技創(chuàng)始人兼CEO黃朝波對該發(fā)布的點(diǎn)評：“老黃是非常成功的，但其實(shí)本質(zhì)上老黃就只做了一件事情（并行計(jì)算）和兩個方面（GPU是并行計(jì)算平臺，CUDA是為了更好的并行計(jì)算編程）?！?/span>

每次當(dāng)芯片演變出現(xiàn)瓶頸，總會有新技術(shù)出現(xiàn)，例如FinFET晶體管技術(shù)的發(fā)明給摩爾定律續(xù)命了十幾年?，F(xiàn)在，為了讓芯片繼續(xù)微縮下去，各種新材料、新架構(gòu)、新封裝、新互聯(lián)等技術(shù)層出不窮。