英偉達(dá)背后的“諸神之爭”
2024年剛開局,AI“王炸”頻現(xiàn)。蘋果放棄長達(dá)十年的造車計劃轉(zhuǎn)投生成式AI,OpenAI首個文生視頻模型Sora驚艷亮相,號稱比GPT-4快18倍的大模型Groq橫空出世,華為發(fā)布首個通信行業(yè)大模型……
AI浪潮已經(jīng)勢不可擋,AI芯片作為其發(fā)展的底層基石也迎來了前所未有的機遇。據(jù)Gartner最新預(yù)測,到2024年AI芯片市場規(guī)模將較上一年增長25.6%,達(dá)671億美元。預(yù)計到2027年,AI芯片市場規(guī)模將是2023年規(guī)模的兩倍以上,達(dá)到1194億美元。
在這樣的背景下,“算力霸主”英偉達(dá)被捧上神壇,以高達(dá)80%的占有率幾乎壟斷了市場,賺得盆滿缽滿。英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)的營收再創(chuàng)新高,帶動2024年財年Q4季度總營收狂漲265%。由于這份遠(yuǎn)超預(yù)期的財報數(shù)據(jù),英偉達(dá)一夜?jié)q出2770億美金市值,相當(dāng)于:一夜?jié)q出阿里巴巴+百度+京東。
英偉達(dá)的“狂飆”也引來了眾多挑戰(zhàn)者。亞馬遜、谷歌、微軟、華為、百度等巨頭積極推動自研芯片,寒武紀(jì)、摩爾線程、燧原科技等新銳力量崛起。據(jù)外媒報道,英偉達(dá)在提交給美國證券交易委員會的文件中,其中包含AI芯片等多個類別里,首度將華為認(rèn)定為“最大競爭對手”。
理想與狂熱交織下,人們不免好奇:英偉達(dá)的“鐵王座”還能坐多久?為什么華為被其列為最大競爭對手?其他國產(chǎn)AI芯片發(fā)展如何?
Part.1
英偉達(dá)“外患”大于“內(nèi)憂”
與英偉達(dá)不斷刷新預(yù)期的業(yè)績相伴相隨的是,越來越多的挑戰(zhàn)。
正如英偉達(dá)CEO黃仁勛在一次演講中所說:“我們并不需要假裝公司處于危險之中,因為我們能感覺到公司確實一直處于危險之中?!?/span>
英偉達(dá)目前最顯著的問題是產(chǎn)能。從去年開始,臺積電在先進(jìn)封裝方面的產(chǎn)能變得緊張,而英偉達(dá)芯片依賴于臺積電的CoWoS封裝技術(shù)以及基于65nm硅中介層的工藝。雖然臺積電已計劃將CoWoS封裝產(chǎn)能提高一倍,但需到2024年下旬產(chǎn)能才能紓解。
為緩解產(chǎn)能緊張的局面,英偉達(dá)與英特爾達(dá)成了代工合作意向,初步估算英特爾每月生產(chǎn)5000片晶圓,如果全部用于生產(chǎn)H100芯片,在理想情況下最多可以得到30萬顆芯片,這也意味著英偉達(dá)高性能GPU的交貨周期將有望縮短更多。
內(nèi)憂好解,外患卻不容忽視。去年12月,AMD發(fā)布了MI300系列芯片產(chǎn)品。AMD首席執(zhí)行官蘇姿豐稱,MI300X在訓(xùn)練大語言模型方面與英偉達(dá)的H100芯片相當(dāng),但推理能力更為出色。目前,MI300系列產(chǎn)品已開始量產(chǎn)出貨,上個季度推動AMD數(shù)據(jù)中心GPU總收入超過4億美元。
英特爾也在發(fā)力謀求在市場中更大的話語權(quán)。新一代的Gaudi 3將采用先進(jìn)的5nm制程工藝,配備最高達(dá)128GB的HBM3e內(nèi)存,大幅提升AI的學(xué)習(xí)和訓(xùn)練性能,可對標(biāo)英偉達(dá)的H200芯片。
除了上述兩個直接競爭對手的“步步緊逼”,英偉達(dá)還面臨多家科技大廠的挑戰(zhàn)。微軟發(fā)布了其首款定制化Maia 100 GPU和Azure Cobalt CPU100,以降低AI服務(wù)成本。亞馬遜和谷歌已經(jīng)使用了自研芯片,并部分產(chǎn)品向客戶提供。OpenAI的7萬億芯片計劃和孫正義的1000億“豪賭”也在試圖分一杯羹。此外,MLIR、谷歌等都在轉(zhuǎn)向“以Python語言為基礎(chǔ)的編程層”,以使AI訓(xùn)練更加開放,逐漸擺脫對英偉達(dá)CUDA生態(tài)的依賴,建立起自己的護(hù)城河。
與此同時,受出口管制影響,英偉達(dá)在中國市場的收入暴跌。根據(jù)英偉達(dá)最新的財報數(shù)據(jù),中國區(qū)2023年第四季度的營收下滑到個位數(shù)比例。如何在美國政府管制、中國客戶需求間保持平衡成為英偉達(dá)的一道關(guān)鍵課題。
在專門為中國市場特供的A800和H800也被禁售后,英偉達(dá)推出了新款H20,但該產(chǎn)品性價比并不高,性能縮水為H100的四分之一,阿里巴巴、騰訊、百度等中國企業(yè)明確表示今年會大砍訂單量,英偉達(dá)在中國的營收恐不樂觀。
Part.2
華為AI芯片的自研苦旅
英偉達(dá)在曾提交給美國證券交易委員會的文件中,把華為列為最大競爭對手。近日在接受美國科技雜志《連線》采訪時,英偉達(dá)CEO黃仁勛再次表達(dá)了對華為的重視,點贊“華為盡管受到現(xiàn)有半導(dǎo)體處理技術(shù)的限制,仍然可以通過將許多芯片聚集在一起來構(gòu)建非常強大的系統(tǒng)?!?/span>
這不僅是對華為技術(shù)實力的認(rèn)可,更是對整個AI芯片行業(yè)競爭格局的一次重新評估。申萬宏源的研究報告顯示,從2023年上半年的數(shù)據(jù)看,華為AI服務(wù)器出貨量已成為國產(chǎn)品牌第一,僅次于英偉達(dá),且仍在快速增長。
華為的崛起并非是“忽如一夜春風(fēng)來”。2017年,華為發(fā)布全球首款移動端AI芯片麒麟970,內(nèi)置獨立NPU,相比CPU獲得了約50倍能效和25倍性能優(yōu)勢。這意味著,麒麟970芯片可以用更少的能耗更快地完成AI計算任務(wù)。
一年后,華為又發(fā)布麒麟980,憑借7nm制程工藝、雙核NPU加持等特性,麒麟980打破了多項世界第一。但是,沒有一蹴而就的成果。麒麟980歷經(jīng)了36個月的研發(fā),才完成定制特殊基礎(chǔ)單元構(gòu)建高可靠性IP論證,再加上Soc工程化驗證的時間,留給量產(chǎn)的周期僅半年左右。
根據(jù)這個時間表,麒麟研發(fā)團(tuán)隊實際上只能允許一次投片修正,否則就會影響芯片的正常流片、量產(chǎn)和終端適配,造成產(chǎn)品延期上市甚至是項目失敗。經(jīng)過2個大版本的迭代,5000多次的工程驗證,花費了數(shù)億美元,最終麒麟980成功量產(chǎn)。
麒麟980成為華為在手機端AI芯片布局的一個重要里程碑。在此基礎(chǔ)上,華為試圖覆蓋云、邊、端各種場景,形成從應(yīng)用到系統(tǒng)到芯片的閉環(huán)。
2018年10月,華為在其全聯(lián)接大會上首次提出全棧全場景AI解決方案,并“祭”出了兩顆AI芯片:華為昇騰(Ascend)910和310。從算力上看,昇騰910表現(xiàn)非常出色,半精度(FP16)算力可達(dá)256TFLOPS,整數(shù)精度(INT8)算力可達(dá)612TOPS。2023年最新發(fā)布的昇騰910B是昇騰910的升級款,算力已達(dá)到英偉達(dá)A100的性能水平。
由于其卓越的性能表現(xiàn),加上美國對英偉達(dá)芯片的出口禁令限制,國內(nèi)企業(yè)紛紛轉(zhuǎn)投昇騰系列的懷抱。據(jù)悉,2023年華為從中國主要互聯(lián)網(wǎng)公司獲得了至少5000顆昇騰910B芯片的訂單,這對英偉達(dá)在AI芯片市場的主導(dǎo)地位構(gòu)成了嚴(yán)峻的威脅。
算力比拼僅是一方面,生態(tài)建設(shè)方面,英偉達(dá)最寬的護(hù)城河CUDA也正遭猛烈進(jìn)攻。CUDA最大的特點就是,軟硬結(jié)合大幅提升了GPU的并行計算效率,具備低成本、低門檻、廣生態(tài)等優(yōu)勢,兼容CUDA生態(tài)對于開發(fā)者與客戶來說更友好。但同時,兼容也會成為限制產(chǎn)品發(fā)展的“天花板”,追隨英偉達(dá)生態(tài)難以實現(xiàn)突圍,自研生態(tài)才有望實現(xiàn)自主可控破局。
華為以自研CANN框架對標(biāo)CUDA,要直面英偉達(dá)用戶粘性的巨大挑戰(zhàn)。CUDA推出至今,擁有超400萬開發(fā)人員和超過3000個應(yīng)用程序,建立起了龐大的用戶群體與開發(fā)者社區(qū)。
雖然CANN起步較晚,離CUDA還有很大差距,但華為也在努力追趕。目前華為CANN平臺已經(jīng)到了7.0版本,支持50+主流大模型,同時兼容主流加速庫及開發(fā)套件。此外已經(jīng)支持Pytorch、Tensorflow等主流框架,PyTorch 2.1版本已同步昇騰NPU,意味著開發(fā)者可直接在PyTorch 2.1上基于昇騰進(jìn)行模型開發(fā)。
伴隨著“日拱一卒”的演進(jìn),華為AI芯片終于實現(xiàn)“從0到1”的突破,走向了巨頭的談判桌。但“從1到100”仍需企業(yè)和產(chǎn)業(yè)鏈上下游共同完善生態(tài),剩下就交給時間。
Part.3
國產(chǎn)AI芯片的“繁花”時代
目前國產(chǎn)AI芯片主要可以分為三類:其一是華為、阿里等大型科技企業(yè)自研的AI芯片,二是海光信息等國資背景的科技公司,三是寒武紀(jì)、壁仞科技、摩爾線程、燧原科技等創(chuàng)業(yè)型芯片公司。
