市場缺口超10萬張，國內(nèi)GPU市場將在這些賽道“上分”！

2023-08-14 來源：賢集網(wǎng)

1536

GPU Utils 發(fā)布了一份關(guān)于英偉達(dá)GPU——主要是H100的研究報告，試圖梳理有關(guān)GPU供應(yīng)和需求的相關(guān)問題。在這篇主要針對美國市場的報告中，我們看到了目前阻礙大模型和人工智能發(fā)展的關(guān)鍵瓶頸GPU短缺是如何形成和發(fā)展的。

總的來說，GPU瓶頸的出現(xiàn)原因是多方面的，環(huán)環(huán)相扣的復(fù)雜工藝制造流程，半導(dǎo)體周期，對稀缺資源的搶占與恐慌乃至未曾預(yù)料到的人工智能的突然爆發(fā)，都讓GPU算力變得無比緊張。

樂觀地看，2024年這一瓶頸或許會有所緩解。

數(shù)十萬張缺口，一百五十億需求

每個想要在人工智能爆發(fā)中分一杯羹的人都需要GPU。準(zhǔn)確地說，是英偉達(dá)的A100和H100，它們在訓(xùn)練和推理大模型中扮演關(guān)鍵角色。如果要想要從頭訓(xùn)練大模型，至少需要上千張A100或H100，而推理和微調(diào)大模型也至少需要儲存100張。

具體到每家的數(shù)量上，報告匯總了一些數(shù)據(jù)：GPT4在1萬到2.5萬塊A100上訓(xùn)練，Meta有2.1萬塊A100，特斯拉有7000塊，Stability AI有5000塊，谷歌云大概有2.5萬塊H100，微軟Azure 有1萬到4萬塊，甲骨文可能也有同樣多的H100。值得一提的是，Azure的GPU基本都用來供應(yīng)OpenAI的訓(xùn)練了。

而根據(jù)馬斯克的說法，GPT5的訓(xùn)練可能會用到3萬到5萬張H100，因此對未來的估計上，報告指出OpenAI可能需要5萬張H100，Meta至少需要2.5萬張（也有人說實(shí)際上需要10萬乃至更多），所有的云服務(wù)廠商，微軟、谷歌云和亞馬遜云以及甲骨文各需要3萬張，私有云服務(wù)商，比如剛剛?cè)谫Y的CoreWeave等總需求是10萬張，而像Claude的開發(fā)者Anthropic這樣的初創(chuàng)公司也都至少需要1萬張GPU。

另外，一些金融公司比如JP Morgan等也在部署A100或H100，因此總體上看，對H100的需求超過了43萬張。

這還是不算中國市場的情況，由于制裁原因，字節(jié)跳動、百度、騰訊和阿里巴巴只能大量購買A100和H100的替代產(chǎn)品A800與H800，這一部分的需求沒有列入其中，根據(jù)《金融時報》的說法，其總額高達(dá)50億美金。

如果將這些數(shù)字相加，這就是目前英偉達(dá)面對的，總計規(guī)模高達(dá)200億美元的GPU需求。

GPU 短缺阻礙ChatGPT進(jìn)步速度

據(jù)《財富》雜志報道，OpenAI 公司 CEO 山姆奧特曼在一場非公開會議上透露，GPU 的嚴(yán)重短缺阻礙了 ChatGPT 的進(jìn)步。

報道稱，奧特曼于 5 月會見了多位 App 開發(fā)者和初創(chuàng)公司的管理者。倫敦 AI 初創(chuàng)公司 Humanloop 的 CEO 拉扎哈比卜在一則推文中稱，奧特曼認(rèn)為 OpenAI 缺少足夠的 GPU，這導(dǎo)致許多優(yōu)化 ChatGPT 的工作被迫推遲。

哈比卜的會議記錄顯示，客戶對 ChatGPT 最大的抱怨是 API 界面的速度和可靠性。奧特曼對此表示理解，并解釋稱主要原因是 GPU 嚴(yán)重不足。

會議記錄公開后不久，OpenAI 聯(lián)系了哈比卜，表示該活動不便公開發(fā)布。隨后哈比卜刪除了這則推文。據(jù)介紹，奧特曼抱怨了 GPU 短缺導(dǎo)致算力不足，OpenAI 無法擴(kuò)大 ChatGPT 的對話框列表。這影響了 ChatGPT 在回答用戶問題時可以處理的信息量，限制了 ChatGPT 的“記憶力”，如過往提問記錄等。此外，ChatGPT 由于算力不足也無法完成更繁瑣的任務(wù)，例如寫出復(fù)雜的程序代碼等。

算力租賃正在興起

近期各AI廠商紛紛拿出大模型“秀肌肉”之時，多位觀察人士告訴財聯(lián)社記者，大數(shù)據(jù)、人工智能等領(lǐng)域的快速發(fā)展推動算力需求（特別是大模型和行業(yè)應(yīng)用等方面）迅速增長。據(jù)了解，GPU需求旺盛并已陷入供應(yīng)短缺。

“不像消費(fèi)顯卡，很多商家會有庫存，它本來存貨就很少，整個供應(yīng)鏈上的貨不超過三四千片，GPT熱度起來以后就被互聯(lián)網(wǎng)大廠全部鎖完了，今年3月后市場上基本沒有存貨了，部分大廠開始直接從國外渠道找一些貨回來，現(xiàn)在50%以上的訂單基本都是互聯(lián)網(wǎng)大廠下的?！睆垇喼拊诮邮茇斅?lián)社記者采訪時表示。

張亞洲告訴記者，包括微軟、英特爾等海外大廠一邊自研、一邊也在對外采購，他們前期訂的一部分（GPU訂單），可能用于大規(guī)模訓(xùn)練，對于推理還是不夠的?；旧蠌S商低于一個億的訂單，也許渠道商都不愿搭理，發(fā)郵件都不回?！盙PU的火爆程度由此可見一斑。

而從價格層面看，多款GPU價格從3、4月至今漲幅接近50%。張亞洲稱，“4月份的時候（訂單）大概還能排到10月份，現(xiàn)在已經(jīng)到明年上半年了?！?/span>

鯨平臺專家、鑒片工場創(chuàng)始人張力卜告訴財聯(lián)社記者，“很多企業(yè)和個人都需要用到高性能的GPU來進(jìn)行深度學(xué)習(xí)的訓(xùn)練和應(yīng)用，但自己購買服務(wù)器建設(shè)數(shù)據(jù)中心的成本又很高，所以選擇租賃云算力平臺是比較劃算和靈活的方式。”基于這一邏輯，租用計算資源的算力租賃模式當(dāng)前正在興起。

國內(nèi)GPU應(yīng)用三大市場

GPU應(yīng)用場景不斷擴(kuò)大拉動GPU市場空間迅猛增長，根據(jù)VerifiedMarket Research預(yù)測，2027年中國GPU市場規(guī)模將會增長至345.57億美元。

GPU市場主要應(yīng)用場景可概括為：AI&數(shù)據(jù)中心、智能汽車、游戲。

I&數(shù)據(jù)中心：新一輪AI對算力需求遠(yuǎn)超以往：ChatGPT類語言大模型底層是2017年出現(xiàn)的Transformer架構(gòu)，該架構(gòu)相比傳統(tǒng)的CNN/RNN為基礎(chǔ)的AI模型，參數(shù)量達(dá)到數(shù)千億，對算力消耗巨大，對算力硬件有大量需求。隨著對商業(yè)數(shù)據(jù)和大數(shù)據(jù)處理要求算力的不斷提高，GPU的通用計算能力正在越來越廣泛地被應(yīng)用與數(shù)據(jù)中心和國家超算中心的建設(shè)。

智能汽車：智能汽車方興未艾，自動駕駛和智慧座艙是智能汽車發(fā)展的主要方向，均需大量使用GPU。

游戲：游戲業(yè)務(wù)是GPU應(yīng)用的傳統(tǒng)領(lǐng)域，對游戲畫面進(jìn)行3D渲染，英偉達(dá)的游戲業(yè)務(wù)穩(wěn)中有進(jìn)。

1、AI：數(shù)據(jù)中心和終端場景不斷落地對計算芯片提出更多更高需求

依據(jù)部署位置劃分，AI芯片可以細(xì)分為終端芯片和云端芯片，云端芯片市場空間越為終端芯片的2-3倍。

云端芯片：云端芯片應(yīng)用于云端服務(wù)器，可以進(jìn)一步細(xì)分為推理芯片和訓(xùn)練芯片。根據(jù)甲子光年數(shù)據(jù)，2018年中國云端芯片市場約46.1億元，該機(jī)構(gòu)預(yù)計2023年增長至384.6億元。

終端芯片：應(yīng)用于嵌入式、移動終端、智能制造、智能家居等領(lǐng)域的AI芯片，終端芯片需要低功耗和更高的能效比，但是對算力的需求也相對較低，主要應(yīng)用與AI推理。根據(jù)甲子光年數(shù)據(jù)，2018年中國終端芯片市場約15億元，該機(jī)構(gòu)預(yù)計2023年增長至173億元。

AI芯片總市場232億元，其中云端芯片市場空間更大，預(yù)計終端芯片將隨著AI在多行業(yè)落地將進(jìn)一步放量。甲子光年預(yù)測，中國AI芯片市場規(guī)模將從2021年232億元增長至2023年的500億元左右，對應(yīng)中國云端芯片市場的復(fù)合增長率為52.8%；終端芯片市場規(guī)模相對較小，但由于人工智能在汽車、安防、智能家居等行業(yè)滲透，屆時市場規(guī)模增長率達(dá)到62.2%。

2、汽車智能化浪潮下汽車GPU市場前景廣闊

自動駕駛

汽車智能化浪潮下，自動駕駛和智能座艙是最具有發(fā)展前景的兩個方向，GPU應(yīng)用于二者的域控制器，智能汽車主流的域控制器采用SoC與MCU結(jié)合的方案，SoC（片上系統(tǒng)）由GPU、CPU、AI引擎、DPU等組成。GPU在自動駕駛中的作用表現(xiàn)在圖形處理和并行計算，ADAS平臺可以利用GPU的并行計算能力實(shí)時分析來自激光雷達(dá)、雷達(dá)和紅外攝像頭的傳感器數(shù)據(jù)。

蓋世汽車預(yù)計到2025年中國自動駕駛域控制器出貨量達(dá)到432萬臺，自動駕駛域控制器與SoC之比在1:1到1:4之間，市場份額較高的SoC通常搭載一片GPU。

智能座艙

GPU虛擬化技術(shù)助力智能座艙一芯多屏化發(fā)展，智能座艙芯片主要為SoC（片上系統(tǒng)），SoC由GPU、CPU、AI引擎、DPU等組成。智能座艙向著一芯多屏的形態(tài)發(fā)展，這對芯片并行計算的要求不斷提高，GPU硬件虛擬化技術(shù)在智能座艙中有著無可替代的優(yōu)勢。在智能座艙屏幕、儀表盤、車載與各系統(tǒng)中均需要使用GPU。

蓋世汽車預(yù)計2025年中國智能座艙域控制器出貨量達(dá)到528萬臺，智能座艙一臺域控制器內(nèi)置一個SoC，位于汽車的中央顯示屏內(nèi)，一個SoC通常搭載一片GPU。

3、游戲玩家人數(shù)持續(xù)增長，游戲GPU市場規(guī)模穩(wěn)中有升

游戲市場是傳統(tǒng)意義上GPU最關(guān)鍵的市場，隨著千禧一代游戲需求的進(jìn)一步提升，全球游戲玩家數(shù)量穩(wěn)增，相應(yīng)地擴(kuò)展了游戲GPU市場規(guī)模。NewzooExpert預(yù)計2020-2025年全球游戲玩家人數(shù)復(fù)合年增率為4.2%。

游戲GPU的主要分類：根據(jù)現(xiàn)行市場上的主要產(chǎn)品可劃分為四類：1）游戲機(jī)、2）PC端主機(jī)游戲、3）控制臺、4）VR&AR。根據(jù)JonPeddie Research統(tǒng)計，2021年Q4全球PCGPU出貨量（包括集成和獨(dú)立顯卡）高達(dá)11000萬片。受到俄烏沖突、天然氣供應(yīng)等沖擊性全球事件影響，2022年Q1、Q2，全球PCGPU出貨量略有下降。

由于PC正常運(yùn)行必須要求硬件上同時具備CPU和GPU，因此每臺PC至少需要一張集成顯卡或獨(dú)立顯卡，此外，根據(jù)需求可再增購獨(dú)立顯卡。根據(jù)JPR統(tǒng)計，全球GPU與PC配售比在2022Q1達(dá)到了129%。