IBM 發(fā)布新一代光電共封裝工藝,有望提高 AI 模型訓(xùn)練速度
關(guān)鍵詞: IBM 光電共封裝 數(shù)據(jù)中心 生成式AI 聚合物光波導(dǎo)
近日,IBM發(fā)布了其在光學(xué)技術(shù)方面的最新進(jìn)展,有望提升數(shù)據(jù)中心訓(xùn)練和運(yùn)行生成式 AI 模型的效率。IBM研究人員開(kāi)發(fā)的新一代光電共封裝 (co-packaged optics,CPO) 工藝,通過(guò)光學(xué)技術(shù)實(shí)現(xiàn)數(shù)據(jù)中心內(nèi)部的光速連接,為現(xiàn)有的短距離光纜提供補(bǔ)充。通過(guò)設(shè)計(jì)和組裝首個(gè)宣布成功的聚合物光波導(dǎo) (PWG),IBM 研究人員展示了光電共封裝技術(shù)將如何重新定義計(jì)算行業(yè)在芯片、電路板和服務(wù)器之間的高帶寬數(shù)據(jù)傳輸。
如今,光纖技術(shù)已經(jīng)被廣泛用于遠(yuǎn)距離的高速數(shù)據(jù)傳輸,實(shí)現(xiàn)了“以光代電”來(lái)管理全球幾乎所有的商業(yè)和通信傳輸。雖然數(shù)據(jù)中心的外部通信網(wǎng)絡(luò)已經(jīng)采用光纖,但其內(nèi)部的機(jī)架仍然主要使用銅質(zhì)電線進(jìn)行通信。通過(guò)電線連接的 GPU 加速器可能有一半以上的時(shí)間處于閑置狀態(tài),在大型分布式訓(xùn)練過(guò)程中需要等待來(lái)自其他設(shè)備的數(shù)據(jù),導(dǎo)致高昂的成本和能源浪費(fèi)。
IBM 研究人員發(fā)現(xiàn)了一種將光學(xué)的速度和容量引入數(shù)據(jù)中心的新方法。在其最新發(fā)表的一篇論文中,IBM 展示了其全球首發(fā)、可實(shí)現(xiàn)高速光學(xué)連接的光電共封裝原型。這項(xiàng)技術(shù)可大幅提高數(shù)據(jù)中心的通信帶寬,最大限度地減少 GPU 停機(jī)時(shí)間,同時(shí)大幅加快 AI 工作速度。
該創(chuàng)新將實(shí)現(xiàn)三方面的突破。
一是降低規(guī)?;瘧?yīng)用生成式 AI 的成本。與中距電氣互連裝置相比,能耗降低 5 倍以上,同時(shí)將數(shù)據(jù)中心互連電纜的長(zhǎng)度從 1 米延長(zhǎng)至數(shù)百米。
二是提高 AI 模型訓(xùn)練速度。與傳統(tǒng)的電線相比,使用光電共封裝技術(shù)訓(xùn)練大型語(yǔ)言模型的速度快近五倍,從而將標(biāo)準(zhǔn)大語(yǔ)言模型的訓(xùn)練時(shí)間從三個(gè)月縮短到三周;用于更大的模型和更多的 GPU,性能將獲得更大提升。
三是提高數(shù)據(jù)中心能效。在最新光電共封裝技術(shù)的加持下,每訓(xùn)練一個(gè) AI 模型所節(jié)省的電量,相當(dāng)于 5000 個(gè)美國(guó)家庭的年耗電量總和。
IBM 高級(jí)副總裁、IBM研究院院長(zhǎng) Dario Gil 表示:“生成式AI需要越來(lái)越多的能源和處理能力,數(shù)據(jù)中心必須隨之升級(jí)換代,而光電共封裝技術(shù)可以幫助數(shù)據(jù)中心從容面向未來(lái)。隨著光電共封裝技術(shù)取得突破,光纖電纜將大幅提升數(shù)據(jù)中心的數(shù)據(jù)傳輸效率,芯片之間的通信、AI工作負(fù)載的處理也會(huì)更高效,我們將進(jìn)入一個(gè)更高速、更可持續(xù)的新通信時(shí)代?!?/p>
同時(shí),光電共封裝技術(shù)能夠擴(kuò)大加速器之間的互連密度,幫助芯片制造商在電子模組上添加連接芯片的光通路,從而超越現(xiàn)有電子通路的限制。IBM 的論文所述的新型高帶寬密度光學(xué)結(jié)構(gòu)和其他創(chuàng)新成果,比如,通過(guò)每個(gè)光通道傳輸多個(gè)波長(zhǎng),有望將芯片間的通信帶寬提高至電線連接的 80 倍。
與目前最先進(jìn)的光電共封裝技術(shù)相比,IBM 的創(chuàng)新成果可以使芯片制造商在硅光子芯片邊緣增加六倍數(shù)量的光纖,即所謂的“鬢發(fā)密度 (beachfront density)”。每根光纖的寬度約為頭發(fā)絲的三倍,長(zhǎng)度從幾厘米到幾百米不等,可傳輸每秒萬(wàn)億比特級(jí)別的數(shù)據(jù)。IBM 團(tuán)隊(duì)采用標(biāo)準(zhǔn)封裝工藝,在 50 微米間距的光通道上封裝高密度的聚合物光波導(dǎo) (PWG),并與硅光子波導(dǎo)絕熱耦合。
論文還指出,上述光電共封裝模塊采用50微米間距的聚合物光波導(dǎo),首次通過(guò)了制造所需的所有壓力測(cè)試。這些模組需要經(jīng)受高濕度環(huán)境、-40°C 至 125°C 的溫度以及機(jī)械耐久性測(cè)試,以確保光互連裝置即使彎曲,也不會(huì)斷裂或丟失數(shù)據(jù)。此外,研究人員還展示了 18 微米間距的聚合物光波導(dǎo)技術(shù):將四個(gè)聚合物光波導(dǎo)設(shè)備堆疊在一起,可以實(shí)現(xiàn)多達(dá) 128 個(gè)通道的連接。
