英偉達(dá)“殺瘋了”!首推服務(wù)器CPU,RTX顯卡也要支持Arm?
今天凌晨,NVIDIA創(chuàng)始人黃仁勛頂著一頭凌亂的白發(fā),穿著標(biāo)志性的黑色皮衣,出現(xiàn)在自家廚房舉辦的線上發(fā)布會(huì)畫(huà)面中。面容透出一絲疲倦的老黃,難免讓人猜測(cè)是因?yàn)轱@卡缺貨問(wèn)題,受到的交貨壓力加大。
按照慣例,一年一度的NVIDIA GTC開(kāi)發(fā)者大會(huì)都是NVIDIA大秀肌肉的時(shí)刻。特別是去年首次在線上舉行的GTC2020中,老黃從烤箱中取出A100 GPU、RTX30系GPU以及一系列服務(wù)器集群等產(chǎn)品,性能數(shù)據(jù)提升帶來(lái)的震撼程度令人印象深刻。
但這次的GTC 2021老黃并沒(méi)有按套路出牌,直接跳過(guò)GPU發(fā)布了3款自研的Arm芯片,包括NVIDIA首款數(shù)據(jù)中心CPU——Grace 、算力超過(guò)1000 TOPS的自動(dòng)駕駛處理器DRIVE Atlan SoC、坐擁220億晶體管的Bluefield-3 DPU。
不過(guò),這并不是NVIDIA第一次進(jìn)軍CPU領(lǐng)域,也并不是第一次在自家產(chǎn)品中采用Arm架構(gòu)了。早在2008年NVIDIA就推出了第一代Tegra移動(dòng)芯片,借助ARM11內(nèi)核,打進(jìn)移動(dòng)SoC領(lǐng)域。雖然現(xiàn)在NVIDIA淡化了Tegra品牌,官網(wǎng)上的Tegra產(chǎn)品線也早已消失,但近年大火的switch掌機(jī)上依然在用Tegra X1芯片。
Tegra作為NVIDIA在移動(dòng)領(lǐng)域的嘗試,談不上成功,但近10年的積累,卻為如今NVIDIA進(jìn)軍服務(wù)器CPU領(lǐng)域埋下了伏筆。
有意思的是,在觀察近幾年英特爾、AMD、NVIDIA這三家芯片巨頭的業(yè)務(wù)領(lǐng)域變化我們可以發(fā)現(xiàn),三家巨頭的業(yè)務(wù)似乎在往同一個(gè)方向發(fā)展:AMD重啟服務(wù)器CPU業(yè)務(wù),收購(gòu)FPGA公司賽靈思;英特爾收購(gòu)收購(gòu)FPGA公司Altera,發(fā)力AI芯片、獨(dú)立GPU;NVIDIA收購(gòu)Arm,推出Arm架構(gòu)服務(wù)器CPU。
今天凌晨的發(fā)布會(huì)上,老黃也將NVIDIA的數(shù)據(jù)中心產(chǎn)品路線圖升級(jí)為GPU+CPU+DPU。黃仁勛表示:“我們每年都會(huì)發(fā)布激動(dòng)人心的新品。三類芯片,逐年飛躍,一個(gè)架構(gòu)。而 Grace 和 BlueField 是其中必不可少的關(guān)鍵組成部分。每個(gè)芯片架構(gòu)歷經(jīng)兩年的打磨周期(周期內(nèi)可能出現(xiàn)轉(zhuǎn)變),一年專注于 x86 平臺(tái),另一年專注于 Arm 平臺(tái)?!?/p>
多年以來(lái),全球服務(wù)器芯片市場(chǎng)都由英特爾所壟斷,常年占據(jù)90%以上的市場(chǎng)份額。Arm也并不是沒(méi)有努力過(guò),他們?cè)?jīng)宣稱要在2021年拿到服務(wù)器芯片市場(chǎng)25%的份額,但隨著高通退出,其他Arm陣營(yíng)的合作產(chǎn)商進(jìn)展緩慢,要達(dá)到這一目標(biāo)根本就是白日做夢(mèng)。即便同是x86陣營(yíng)的AMD發(fā)展勢(shì)頭迅猛,也僅僅在2020年Q4達(dá)到了7.1的市場(chǎng)份額。
其實(shí)像華為、亞馬遜AWS等在過(guò)去幾年間推出基于Arm架構(gòu)的服務(wù)器芯片也在特定領(lǐng)域有不錯(cuò)表現(xiàn)。憑借英偉達(dá)在GPU領(lǐng)域的優(yōu)勢(shì),結(jié)合Arm CPU以及軟件生態(tài)組合拳,或許能夠帶領(lǐng)Arm在服務(wù)器芯片領(lǐng)域取得突破。
這次英偉達(dá)發(fā)布的這款A(yù)rm芯片Grace面向超大型AI模型和高性能計(jì)算等細(xì)分市場(chǎng),老黃稱其為“世界第一款terabyte(萬(wàn)億字節(jié))級(jí)別計(jì)算設(shè)計(jì)的CPU”。在數(shù)據(jù)量和AI模型規(guī)模呈指數(shù)級(jí)增長(zhǎng)的今天,傳統(tǒng)x86處理器和GPU之間的數(shù)據(jù)互通,往往依靠PCIe總線,兩種不同架構(gòu)的硬件間存在傳輸速度瓶頸。
而Grace采用了英偉達(dá)自家的NVLink 4與GPU進(jìn)行連接,從 CPU 到 GPU 連接速度超過(guò) 900GB/s,比AMD EPYC 2+NVIDIA A100的搭配快14倍;從CPU 到CPU的速度也能夠達(dá)到600GB/s以上。
預(yù)計(jì)在2023年正式發(fā)布的Grace已經(jīng)有兩個(gè)項(xiàng)目即將落地,其中瑞士國(guó)家計(jì)算中心(CSCS)正在打造一個(gè)算力達(dá) 20 Exaflops 的系統(tǒng),美國(guó)洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室也在準(zhǔn)備配置新的AI超算。
雖然老黃強(qiáng)調(diào)Grace芯片面對(duì)特定細(xì)分市場(chǎng),未來(lái),英偉達(dá)GPU將會(huì)為x86和Arm CPU均提供支持。不過(guò)除了服務(wù)器之外,英偉達(dá)似乎還是堅(jiān)定貫徹落實(shí)Arm戰(zhàn)略不動(dòng)搖,發(fā)布會(huì)上還透露,未來(lái)RTX筆記本顯卡將支持Arm架構(gòu)CPU,將光追和AI技術(shù)帶到Arm平臺(tái)上。
不過(guò)移動(dòng)端Arm CPU在經(jīng)歷過(guò)Tegra的失敗后,似乎英偉達(dá)也對(duì)此不感興趣了。因此英偉達(dá)與聯(lián)發(fā)科合作開(kāi)發(fā)支持Chromium、Linux兩種開(kāi)源系統(tǒng)的SDK參考平臺(tái),或許我們還可以期未來(lái)Arm Windows PC也能用上英偉達(dá)獨(dú)顯。
融合Arm的英偉達(dá)到底能有多強(qiáng)?能否撼動(dòng)英特爾在服務(wù)器市場(chǎng)的壟斷地位?事實(shí)上,對(duì)于剛剛宣布推出首款服務(wù)器 CPU的英偉達(dá)來(lái)說(shuō),今天只是剛剛開(kāi)始,能否順利完成對(duì)Arm的收購(gòu)將是影響未來(lái)其戰(zhàn)略發(fā)展方向的不確定因素。
