市場缺口超10萬張,國內(nèi)GPU市場將在這些賽道“上分”!
GPU Utils 發(fā)布了一份關(guān)于英偉達(dá)GPU——主要是H100的研究報告,試圖梳理有關(guān)GPU供應(yīng)和需求的相關(guān)問題。在這篇主要針對美國市場的報告中,我們看到了目前阻礙大模型和人工智能發(fā)展的關(guān)鍵瓶頸GPU短缺是如何形成和發(fā)展的。
總的來說,GPU瓶頸的出現(xiàn)原因是多方面的,環(huán)環(huán)相扣的復(fù)雜工藝制造流程,半導(dǎo)體周期,對稀缺資源的搶占與恐慌乃至未曾預(yù)料到的人工智能的突然爆發(fā),都讓GPU算力變得無比緊張。
樂觀地看,2024年這一瓶頸或許會有所緩解。
數(shù)十萬張缺口,一百五十億需求
每個想要在人工智能爆發(fā)中分一杯羹的人都需要GPU。準(zhǔn)確地說,是英偉達(dá)的A100和H100,它們在訓(xùn)練和推理大模型中扮演關(guān)鍵角色。如果要想要從頭訓(xùn)練大模型,至少需要上千張A100或H100,而推理和微調(diào)大模型也至少需要儲存100張。
具體到每家的數(shù)量上,報告匯總了一些數(shù)據(jù):GPT4在1萬到2.5萬塊A100上訓(xùn)練,Meta有2.1萬塊A100,特斯拉有7000塊,Stability AI有5000塊,谷歌云大概有2.5萬塊H100,微軟Azure 有1萬到4萬塊,甲骨文可能也有同樣多的H100。值得一提的是,Azure的GPU基本都用來供應(yīng)OpenAI的訓(xùn)練了。
而根據(jù)馬斯克的說法,GPT5的訓(xùn)練可能會用到3萬到5萬張H100,因此對未來的估計上,報告指出OpenAI可能需要5萬張H100,Meta至少需要2.5萬張(也有人說實(shí)際上需要10萬乃至更多),所有的云服務(wù)廠商,微軟、谷歌云和亞馬遜云以及甲骨文各需要3萬張,私有云服務(wù)商,比如剛剛?cè)谫Y的CoreWeave等總需求是10萬張,而像Claude的開發(fā)者Anthropic這樣的初創(chuàng)公司也都至少需要1萬張GPU。
另外,一些金融公司比如JP Morgan等也在部署A100或H100,因此總體上看,對H100的需求超過了43萬張。
這還是不算中國市場的情況,由于制裁原因,字節(jié)跳動、百度、騰訊和阿里巴巴只能大量購買A100和H100的替代產(chǎn)品A800與H800,這一部分的需求沒有列入其中,根據(jù)《金融時報》的說法,其總額高達(dá)50億美金。
如果將這些數(shù)字相加,這就是目前英偉達(dá)面對的,總計規(guī)模高達(dá)200億美元的GPU需求。
GPU 短缺阻礙ChatGPT進(jìn)步速度
據(jù)《財富》雜志報道,OpenAI 公司 CEO 山姆奧特曼在一場非公開會議上透露,GPU 的嚴(yán)重短缺阻礙了 ChatGPT 的進(jìn)步。
報道稱,奧特曼于 5 月會見了多位 App 開發(fā)者和初創(chuàng)公司的管理者。倫敦 AI 初創(chuàng)公司 Humanloop 的 CEO 拉扎哈比卜在一則推文中稱,奧特曼認(rèn)為 OpenAI 缺少足夠的 GPU,這導(dǎo)致許多優(yōu)化 ChatGPT 的工作被迫推遲。
哈比卜的會議記錄顯示,客戶對 ChatGPT 最大的抱怨是 API 界面的速度和可靠性。奧特曼對此表示理解,并解釋稱主要原因是 GPU 嚴(yán)重不足。
會議記錄公開后不久,OpenAI 聯(lián)系了哈比卜,表示該活動不便公開發(fā)布。隨后哈比卜刪除了這則推文。據(jù)介紹,奧特曼抱怨了 GPU 短缺導(dǎo)致算力不足,OpenAI 無法擴(kuò)大 ChatGPT 的對話框列表。這影響了 ChatGPT 在回答用戶問題時可以處理的信息量,限制了 ChatGPT 的“記憶力”,如過往提問記錄等。此外,ChatGPT 由于算力不足也無法完成更繁瑣的任務(wù),例如寫出復(fù)雜的程序代碼等。
算力租賃正在興起
近期各AI廠商紛紛拿出大模型“秀肌肉”之時,多位觀察人士告訴財聯(lián)社記者,大數(shù)據(jù)、人工智能等領(lǐng)域的快速發(fā)展推動算力需求(特別是大模型和行業(yè)應(yīng)用等方面)迅速增長。據(jù)了解,GPU需求旺盛并已陷入供應(yīng)短缺。
“不像消費(fèi)顯卡,很多商家會有庫存,它本來存貨就很少,整個供應(yīng)鏈上的貨不超過三四千片,GPT熱度起來以后就被互聯(lián)網(wǎng)大廠全部鎖完了,今年3月后市場上基本沒有存貨了,部分大廠開始直接從國外渠道找一些貨回來,現(xiàn)在50%以上的訂單基本都是互聯(lián)網(wǎng)大廠下的?!睆垇喼拊诮邮茇斅?lián)社記者采訪時表示。
張亞洲告訴記者,包括微軟、英特爾等海外大廠一邊自研、一邊也在對外采購,他們前期訂的一部分(GPU訂單),可能用于大規(guī)模訓(xùn)練,對于推理還是不夠的?;旧蠌S商低于一個億的訂單,也許渠道商都不愿搭理,發(fā)郵件都不回?!盙PU的火爆程度由此可見一斑。
而從價格層面看,多款GPU價格從3、4月至今漲幅接近50%。張亞洲稱,“4月份的時候(訂單)大概還能排到10月份,現(xiàn)在已經(jīng)到明年上半年了?!?/span>
鯨平臺專家、鑒片工場創(chuàng)始人張力卜告訴財聯(lián)社記者,“很多企業(yè)和個人都需要用到高性能的GPU來進(jìn)行深度學(xué)習(xí)的訓(xùn)練和應(yīng)用,但自己購買服務(wù)器建設(shè)數(shù)據(jù)中心的成本又很高,所以選擇租賃云算力平臺是比較劃算和靈活的方式。”基于這一邏輯,租用計算資源的算力租賃模式當(dāng)前正在興起。
國內(nèi)GPU應(yīng)用三大市場
GPU應(yīng)用場景不斷擴(kuò)大拉動GPU市場空間迅猛增長,根據(jù)VerifiedMarket Research預(yù)測,2027年中國GPU市場規(guī)模將會增長至345.57億美元。
GPU市場主要應(yīng)用場景可概括為:AI&數(shù)據(jù)中心、智能汽車、游戲。
I&數(shù)據(jù)中心:新一輪AI對算力需求遠(yuǎn)超以往:ChatGPT類語言大模型底層是2017年出現(xiàn)的Transformer架構(gòu),該架構(gòu)相比傳統(tǒng)的CNN/RNN為基礎(chǔ)的AI模型,參數(shù)量達(dá)到數(shù)千億,對算力消耗巨大,對算力硬件有大量需求。隨著對商業(yè)數(shù)據(jù)和大數(shù)據(jù)處理要求算力的不斷提高,GPU的通用計算能力正在越來越廣泛地被應(yīng)用與數(shù)據(jù)中心和國家超算中心的建設(shè)。
智能汽車:智能汽車方興未艾,自動駕駛和智慧座艙是智能汽車發(fā)展的主要方向,均需大量使用GPU。
游戲:游戲業(yè)務(wù)是GPU應(yīng)用的傳統(tǒng)領(lǐng)域,對游戲畫面進(jìn)行3D渲染,英偉達(dá)的游戲業(yè)務(wù)穩(wěn)中有進(jìn)。
1、AI:數(shù)據(jù)中心和終端場景不斷落地對計算芯片提出更多更高需求
依據(jù)部署位置劃分,AI芯片可以細(xì)分為終端芯片和云端芯片,云端芯片市場空間越為終端芯片的2-3倍。
云端芯片:云端芯片應(yīng)用于云端服務(wù)器,可以進(jìn)一步細(xì)分為推理芯片和訓(xùn)練芯片。根據(jù)甲子光年數(shù)據(jù),2018年中國云端芯片市場約46.1億元,該機(jī)構(gòu)預(yù)計2023年增長至384.6億元。
終端芯片:應(yīng)用于嵌入式、移動終端、智能制造、智能家居等領(lǐng)域的AI芯片,終端芯片需要低功耗和更高的能效比,但是對算力的需求也相對較低,主要應(yīng)用與AI推理。根據(jù)甲子光年數(shù)據(jù),2018年中國終端芯片市場約15億元,該機(jī)構(gòu)預(yù)計2023年增長至173億元。
AI芯片總市場232億元,其中云端芯片市場空間更大,預(yù)計終端芯片將隨著AI在多行業(yè)落地將進(jìn)一步放量。甲子光年預(yù)測,中國AI芯片市場規(guī)模將從2021年232億元增長至2023年的500億元左右,對應(yīng)中國云端芯片市場的復(fù)合增長率為52.8%;終端芯片市場規(guī)模相對較小,但由于人工智能在汽車、安防、智能家居等行業(yè)滲透,屆時市場規(guī)模增長率達(dá)到62.2%。
2、汽車智能化浪潮下汽車GPU市場前景廣闊
自動駕駛
汽車智能化浪潮下,自動駕駛和智能座艙是最具有發(fā)展前景的兩個方向,GPU應(yīng)用于二者的域控制器,智能汽車主流的域控制器采用SoC與MCU結(jié)合的方案,SoC(片上系統(tǒng))由GPU、CPU、AI引擎、DPU等組成。GPU在自動駕駛中的作用表現(xiàn)在圖形處理和并行計算,ADAS平臺可以利用GPU的并行計算能力實(shí)時分析來自激光雷達(dá)、雷達(dá)和紅外攝像頭的傳感器數(shù)據(jù)。
蓋世汽車預(yù)計到2025年中國自動駕駛域控制器出貨量達(dá)到432萬臺,自動駕駛域控制器與SoC之比在1:1到1:4之間,市場份額較高的SoC通常搭載一片GPU。
智能座艙
GPU虛擬化技術(shù)助力智能座艙一芯多屏化發(fā)展,智能座艙芯片主要為SoC(片上系統(tǒng)),SoC由GPU、CPU、AI引擎、DPU等組成。智能座艙向著一芯多屏的形態(tài)發(fā)展,這對芯片并行計算的要求不斷提高,GPU硬件虛擬化技術(shù)在智能座艙中有著無可替代的優(yōu)勢。在智能座艙屏幕、儀表盤、車載與各系統(tǒng)中均需要使用GPU。
蓋世汽車預(yù)計2025年中國智能座艙域控制器出貨量達(dá)到528萬臺,智能座艙一臺域控制器內(nèi)置一個SoC,位于汽車的中央顯示屏內(nèi),一個SoC通常搭載一片GPU。
3、游戲玩家人數(shù)持續(xù)增長,游戲GPU市場規(guī)模穩(wěn)中有升
游戲市場是傳統(tǒng)意義上GPU最關(guān)鍵的市場,隨著千禧一代游戲需求的進(jìn)一步提升,全球游戲玩家數(shù)量穩(wěn)增,相應(yīng)地擴(kuò)展了游戲GPU市場規(guī)模。NewzooExpert預(yù)計2020-2025年全球游戲玩家人數(shù)復(fù)合年增率為4.2%。
游戲GPU的主要分類:根據(jù)現(xiàn)行市場上的主要產(chǎn)品可劃分為四類:1)游戲機(jī)、2)PC端主機(jī)游戲、3)控制臺、4)VR&AR。根據(jù)JonPeddie Research統(tǒng)計,2021年Q4全球PCGPU出貨量(包括集成和獨(dú)立顯卡)高達(dá)11000萬片。受到俄烏沖突、天然氣供應(yīng)等沖擊性全球事件影響,2022年Q1、Q2,全球PCGPU出貨量略有下降。
由于PC正常運(yùn)行必須要求硬件上同時具備CPU和GPU,因此每臺PC至少需要一張集成顯卡或獨(dú)立顯卡,此外,根據(jù)需求可再增購獨(dú)立顯卡。根據(jù)JPR統(tǒng)計,全球GPU與PC配售比在2022Q1達(dá)到了129%。
