NVIDIA市值再創(chuàng)歷史新高,老黃是如何打出一手“好牌”的?
伴隨著2024財(cái)年第二季度財(cái)報(bào)的發(fā)布,NVIDIA的市值再創(chuàng)歷史新高,盤中一度逼近1.2萬億美元,最新報(bào)收1.16萬億美元,相當(dāng)于8個(gè)Intel、7個(gè)AMD。
NVIDIA日前宣布,截至2023年7月30日的第二季度收入為135.1億美元,較上一季度增長88%,較去年同期增長101%。季度GAAP攤薄每股收益為2.48美元,較去年同期增長854%,較上一季度增長202%。季度非GAAP攤薄每股收益為2.70美元,較上一季度增長148%,較去年同期增長429%。
在傳統(tǒng)計(jì)算機(jī)時(shí)代里,CPU作為整個(gè)計(jì)算大腦的中樞,擁有無可取代的核心地位,而GPU更多的只是“輔助”角色。但如今,雙方的角色和地位已經(jīng)發(fā)生了轉(zhuǎn)變。而讓GPU取代CPU歷史地位的引爆點(diǎn),正是AIGC——生成式人工智能。
NVIDIA創(chuàng)始人兼CEO黃仁勛表示:“一個(gè)全新的計(jì)算時(shí)代已經(jīng)來臨。全球各地的企業(yè)正在從通用計(jì)算轉(zhuǎn)型為加速計(jì)算和生成式AI。我們的網(wǎng)絡(luò)和交換機(jī)技術(shù)能夠?qū)⒍鄠€(gè)NVIDIAGPU連接起來,同時(shí)運(yùn)行CUDAAI軟件棧,通過這種方式即可創(chuàng)建生成式AI的計(jì)算基礎(chǔ)架構(gòu)?!?/span>
他表示:“在本季度,各大云服務(wù)提供商發(fā)布了大型NVIDI AH100 AI基礎(chǔ)架構(gòu)。領(lǐng)先的企業(yè)IT系統(tǒng)和軟件提供商宣布與我們合作,將NVIDIA的AI技術(shù)引入各行各業(yè)。采用生成式AI的比賽已經(jīng)開始。”
此前,英偉達(dá)CEO黃仁勛接受采訪時(shí)也表示,計(jì)算機(jī)制造方式已明顯轉(zhuǎn)變了,數(shù)據(jù)中心將需要少得多的CPU,而不是傳統(tǒng)上數(shù)百萬個(gè)CPU,反而它們會(huì)需要數(shù)百萬個(gè)GPU。數(shù)據(jù)中心GPU芯片需求可能會(huì)變成一個(gè)1萬億美元的巨型市場(chǎng)。
核心原因在于,過去的數(shù)據(jù)中心主要由用于文件檢索的CPU構(gòu)成,而未來將以生成式數(shù)據(jù)為主導(dǎo),你只需要檢索一部分?jǐn)?shù)據(jù),但必須使用人工智能生成剩余的大部分?jǐn)?shù)據(jù)。
英偉達(dá)是如何搶先一步達(dá)到人工智能芯片拐點(diǎn)的?
黃仁勛領(lǐng)導(dǎo)的英偉達(dá)始終處于發(fā)展的邊緣——先是游戲,然后是機(jī)器學(xué)習(xí),然后是加密貨幣挖掘、數(shù)據(jù)中心,現(xiàn)在是人工智能。在過去的十年中,這家芯片巨頭開發(fā)了獨(dú)特的硬件和軟件產(chǎn)品組合,旨在實(shí)現(xiàn)人工智能的民主化,使該公司能夠從采用人工智能工作負(fù)載中受益。
但真正的轉(zhuǎn)折點(diǎn)是 2017 年,當(dāng)時(shí) Nvidia 開始調(diào)整 GPU 以處理特定的人工智能計(jì)算。同年,通常為其他公司的系統(tǒng)銷售芯片或電路板的英偉達(dá)也開始銷售完整的計(jì)算機(jī),以更有效地執(zhí)行人工智能任務(wù)。
它的一些系統(tǒng)現(xiàn)在已經(jīng)達(dá)到 超級(jí)計(jì)算機(jī)的大小,使用專有的網(wǎng)絡(luò)技術(shù)和數(shù)千個(gè) GPU 來組裝和運(yùn)行。此類硬件可能會(huì)運(yùn)行數(shù)周來訓(xùn)練最新的人工智能模型。對(duì)于一些競(jìng)爭對(duì)手來說,與銷售計(jì)算機(jī)、軟件、云服務(wù)、訓(xùn)練有素的人工智能模型和處理器的公司競(jìng)爭非常困難。
到 2017 年,谷歌、微軟、Facebook 和亞馬遜等科技巨頭已經(jīng)為其數(shù)據(jù)中心購買了更多 Nvidia 芯片。麻省總醫(yī)院等機(jī)構(gòu)使用 Nvidia 芯片來發(fā)現(xiàn) CT 掃描等醫(yī)學(xué)圖像中的異常情況。
那時(shí),特斯拉已經(jīng)宣布將在其所有汽車中安裝 Nvidia GPU 以實(shí)現(xiàn)自動(dòng)駕駛。Nvidia 芯片為虛擬現(xiàn)實(shí)耳機(jī)提供了強(qiáng)大的基礎(chǔ)能力,就像 Facebook 和 HTC 推向市場(chǎng)的耳機(jī)一樣。英偉達(dá)因每隔幾年持續(xù)提供更快的芯片而享有盛譽(yù)。
回顧過去,可以肯定地說,十多年來,Nvidia 在生產(chǎn)芯片方面已經(jīng)建立了幾乎堅(jiān)不可摧的領(lǐng)先地位,這些芯片可以執(zhí)行復(fù)雜的人工智能任務(wù),如圖像、面部和語音識(shí)別,以及為 OpenAI 的 ChatGPT 等聊天機(jī)器人生成文本。
最大的好處是什么?英偉達(dá)通過及早認(rèn)識(shí)到人工智能趨勢(shì)、根據(jù)這些任務(wù)定制芯片、然后開發(fā)有助于人工智能開發(fā)的關(guān)鍵軟件來實(shí)現(xiàn)其主導(dǎo)地位。正如 《紐約時(shí)報(bào)》(NYT)所言,英偉達(dá)已逐漸轉(zhuǎn)變?yōu)槿斯ぶ悄荛_發(fā)的一站式商店。
據(jù)研究公司 Omdia 稱,雖然谷歌、亞馬遜、Meta、IBM 等也生產(chǎn)了 AI 芯片,但 Nvidia 目前占據(jù)了全球 AI 芯片銷量的 70% 以上。它在訓(xùn)練生成式人工智能模型方面占有更加突出的地位。 僅微軟就花費(fèi)了數(shù)億 美元購買了數(shù)萬個(gè) Nvidia A100 芯片來幫助 構(gòu)建 ChatGPT。
紐約時(shí)報(bào)的 唐·克拉克 (Don Clark) 在文章中表示 :“到今年 5 月,該公司作為人工智能革命最明顯贏家的地位已經(jīng)變得清晰起來,該公司預(yù)計(jì)季度收入將增長 64%,遠(yuǎn)遠(yuǎn)超出華爾街的預(yù)期。”
英偉達(dá)的AI GPU強(qiáng)在何處?
英特爾已不再是當(dāng)年那家占據(jù)統(tǒng)治地位的科技公司。
原本CPU是PC或服務(wù)器最重要的核心部件。但是現(xiàn)在,加速計(jì)算芯片通過殺手級(jí)應(yīng)用ChatGPT正在加速取代CPU的地位。算力成為以IDC為基礎(chǔ)條件的AI應(yīng)用發(fā)展核心驅(qū)動(dòng)力,GPU成為關(guān)鍵部件。
“生成式人工智能將是(英偉達(dá)業(yè)績)引爆點(diǎn)?!秉S仁勛說,“與CPU相比,未來IDC更需要GPU,因?yàn)閿?shù)據(jù)都將通過生成式LLM自動(dòng)生成,而非主要用于數(shù)據(jù)檢索。”生成數(shù)據(jù)需要更多的GPU,而檢索數(shù)據(jù),只需要CPU。
目前,性能愈發(fā)強(qiáng)悍的PC系統(tǒng)配置了超過8個(gè)服務(wù)器GPU和1個(gè)CPU的算力硬件,英偉達(dá)占據(jù)了全球超過八成(84%)的服務(wù)器(IDC:數(shù)據(jù)中心)GPU市場(chǎng)份額。
比如,英偉達(dá)DGX系統(tǒng),這是用于數(shù)據(jù)訓(xùn)練的IDC核心算力來源,搭載了8顆英偉達(dá)高端H100 GPU,還有兩顆CPU;谷歌的A3超級(jí)計(jì)算機(jī),同樣用了8顆英偉達(dá)H100 GPU,但只用了1顆英特爾制造的高端至強(qiáng)處理器。
據(jù)英偉達(dá)公示的技術(shù)資料顯示,H100于2022年三季度發(fā)布,訓(xùn)練速度比A100快9倍,推理速度比上代產(chǎn)品A100快30倍。5月29日,黃仁勛發(fā)布了GH200超級(jí)芯片,這是英偉達(dá)開發(fā)的基于Arm架構(gòu)的CPU+GPU集成方案,用于開發(fā)聊天機(jī)器人、互聯(lián)網(wǎng)推薦系統(tǒng)算法等大模型AI應(yīng)用。
這個(gè)趨勢(shì)隨著AGI在產(chǎn)業(yè)的持續(xù)落地,產(chǎn)生的影響日益顯著。英偉達(dá)IDC業(yè)務(wù)在第一季度增長了14%,但英特爾的AI和IDC業(yè)務(wù)部門業(yè)績下降了39%。
另一項(xiàng)因素也在加強(qiáng)英偉達(dá)超越英特爾的優(yōu)勢(shì)。英偉達(dá)服務(wù)器GPU售價(jià)極高,單顆英偉達(dá)H100售價(jià)高達(dá)4萬美元(eBay平臺(tái)加急售價(jià)),而英特爾最新一代至強(qiáng)CPU的單顆標(biāo)價(jià)雖然也很高,但“只有”1.7萬美元。
當(dāng)然英偉達(dá)也不是全無對(duì)手,當(dāng)年英特爾的上游合作伙伴AMD,也在發(fā)力服務(wù)器GPU,包括高通、蘋果、谷歌和亞馬遜在內(nèi)的眾多巨頭,都在設(shè)計(jì)開發(fā)移動(dòng)AI算力芯片,而非服務(wù)器GPU;甚至是英特爾,在游戲領(lǐng)域的GPU技術(shù)實(shí)力,同樣不容小覷。
但是在眼下,英偉達(dá)確實(shí)一家獨(dú)大。但凡提及AGI算力,無不將英偉達(dá)服務(wù)器GPU列為首選。這主要是因?yàn)锳GI目前對(duì)算力極為渴求,要處理處理TB級(jí)數(shù)據(jù),訓(xùn)練性能要求極高,而在需要“推理”的過程中使用模型生成文本、圖像或預(yù)測(cè),也不是移動(dòng)AI GPU能達(dá)成的。
更重要的還不在于英偉達(dá)的GPU硬件性能,而是——英偉達(dá)的AI軟件系統(tǒng):英偉達(dá)的AI專有軟件,能輕松聚合GPU的硬件功能用于AI應(yīng)用程序。
黃仁勛在英偉達(dá)財(cái)報(bào)電話會(huì)議上也說,“我們的軟件不易復(fù)制,(競(jìng)對(duì))必須設(shè)計(jì)所有的軟件、庫和算法,將它們集成到框架中并做持續(xù)優(yōu)化;同時(shí),軟件架構(gòu)也同樣需要優(yōu)化迭代。”
也就是說,要做到和英偉達(dá)一樣,實(shí)現(xiàn)GPU與AI應(yīng)用的無縫銜接,要做的不僅僅是優(yōu)化芯片的設(shè)計(jì)和性能,還需要對(duì)軟硬件的技術(shù)架構(gòu)和整體框架做同步優(yōu)化,這是一項(xiàng)系統(tǒng)工程。要超越單品性能雖然不易,但并非全無可能,但面對(duì)系統(tǒng)級(jí)能力,談超越,難度不言而喻。
英偉達(dá)也在持續(xù)增加對(duì)IDC的資本投入。據(jù)英偉達(dá)最新財(cái)報(bào)顯示,其整體收入中,IDC資本支出的份額占比已增至8.4%,而之前根據(jù)其上一年的固定比率預(yù)測(cè)為6.5%。
初創(chuàng)公司和巨頭的現(xiàn)實(shí)威脅
看上去似乎無人能阻擋英偉達(dá)在AI技術(shù)領(lǐng)域的統(tǒng)治地位,但AI前景的無限空間,仍在吸引無數(shù)挑戰(zhàn)者。
除了上文提及的多家巨頭,初創(chuàng)AI公司成為英偉達(dá)AI挑戰(zhàn)者大軍不容忽視的一部分。當(dāng)然,這種技術(shù)要求的初創(chuàng)公司很難出自無名之輩。
有一則極具戲劇性的傳聞,出自在前沿技術(shù)和應(yīng)用領(lǐng)域極為活躍的特斯拉公司首席執(zhí)行官埃隆·馬斯克(Elon Musk)之口。這位持續(xù)讓世人驚嘆的科技巨子說,“就連狗都在搶GPU”。
有鑒于此,所以馬斯克雖然在口頭上叫停研究AI技術(shù),但他的身體卻很誠實(shí):這位老兄在今年3月9日建立了一家取名為“X.AI”的AI公司,還偷偷摸摸買了10000顆英偉達(dá)GPU。
想分英偉達(dá)一杯羹的還有來自英特爾公司架構(gòu)、圖形和軟件(IAGS)部門的副總裁、首席架構(gòu)師Raja Koduri,這位技術(shù)大拿已于今年3月底離職。接下來,Raja Koduri將創(chuàng)辦一家AI技術(shù)公司,主要研發(fā)新一代生成式AI工具,目的是削弱英偉達(dá)對(duì)數(shù)字電影和視頻游戲市場(chǎng)的控制力。
與馬斯克的X.AI公司不知道要干嘛相比,Raja Koduri的計(jì)劃更清晰。他這家尚未命名的AI初創(chuàng)公司,第一個(gè)項(xiàng)目,是要?jiǎng)?chuàng)建一套AI工具,以便讓包括電影和游戲藝術(shù)家在內(nèi)的消費(fèi)群體,無論用PC、Mac、iPad還是其他設(shè)備,都無需深入研究軟件代碼而直接生成自己想要的工作結(jié)果。
盡管這些AI賽道新手看上去很想大干一場(chǎng),但真正對(duì)英偉達(dá)有現(xiàn)實(shí)挑戰(zhàn)能力的還是AMD、微軟和谷歌此類巨頭。其中,AMD在游戲領(lǐng)域的GPU對(duì)英偉達(dá)有些許威脅,但I(xiàn)DC需要的服務(wù)器專用GPU性能無法望其項(xiàng)背。
至于微軟、谷歌甚至云服務(wù)商比如亞馬遜,都一面和英偉達(dá)保持良好的業(yè)務(wù)合作,一面又在下大本錢研發(fā)自己的AI專用GPU。
比如微軟,這個(gè)桌面PC時(shí)代的超級(jí)霸主,正是OpenAI的背后金主(2019年微軟給OpenAI投了10億美元),同時(shí)也是英偉達(dá)H100芯片最大的采購方。今年3月,微軟用數(shù)萬顆英偉達(dá)GPU幫OpenAI組裝了一臺(tái)AI超級(jí)計(jì)算機(jī)。
但微軟也在推進(jìn)自己的AI芯片研發(fā)計(jì)劃,代號(hào)“雅典娜”。這項(xiàng)計(jì)劃始于2019年,目標(biāo)是為訓(xùn)練LLM(大語言模型)等軟件而設(shè)計(jì),同時(shí)可支持推理,能為ChatGPT背后的所有AI軟件提供算力支持,初代雅典娜GPU量產(chǎn)時(shí)間表被定于2024年。
與微軟相比,谷歌對(duì)英偉達(dá)的威脅可能更顯著。目前谷歌的AI處理芯片是專為AI研究開發(fā)機(jī)器學(xué)習(xí)(Machine Learning)的專屬芯片TPU(張量處理單元),能同時(shí)處理“云上”訓(xùn)練和推理,并設(shè)計(jì)了基準(zhǔn)測(cè)試工具M(jìn)LPerf。
谷歌TPU如今已迭代到V4版。據(jù)谷歌4月6日披露,得益于互連技術(shù)和領(lǐng)域特定加速器(DSA)方面的關(guān)鍵創(chuàng)新,谷歌云TPU v4在擴(kuò)展機(jī)器學(xué)習(xí)系統(tǒng)性能方面比其前代版本有了近10倍的飛躍。
TPU v4是谷歌于2021年推出的、專門用于執(zhí)行機(jī)器學(xué)習(xí)的AI芯片,是谷歌第5代特殊領(lǐng)域加速器(DSA:Domain Specific Accelerator)及第3代用于ML模型的超級(jí)計(jì)算機(jī)平臺(tái),其性能與英偉達(dá)A100相比,速度快1.2-1.7倍,功耗低1.3-1.9倍。
盡管如此,就眼下看,對(duì)英偉達(dá)具有商業(yè)層面現(xiàn)實(shí)威脅的公司,還不存在。這些威脅,現(xiàn)在還處于水面之下。
