這波AI潮真正賺錢的只有這三家企業(yè),AI企業(yè)要吃紅利還得再等等
今年以來,人工智能(AI)成為香餑餑,世界各大IT巨頭競相采購服務(wù)器并訓(xùn)練大模型。
結(jié)合業(yè)界人士以及各大AI頭部企業(yè)最新消息顯示,盡管科技公司都投入大量資源發(fā)展最新AI技術(shù),但是多家頭部企業(yè)表示這一業(yè)務(wù)目前難以產(chǎn)生足夠的利潤。
成本巨大、獲利較難
據(jù)微軟、AMD等龍頭企業(yè)表示,AI業(yè)務(wù)難以獲利的最重要原因,還在于AI研發(fā)相關(guān)工具成本過于高昂,比如生成式AI大模型的耗費就是典型的燒錢。
據(jù)華爾街日報爆料,微軟的AI編程工具GitHub Copilot用戶量高達(dá)150萬,但是平均每個月在每個用戶身上都要倒貼20美元,最高能達(dá)80美元。不止微軟“表面光鮮”,谷歌、亞馬遜、Adobe、Zoom等巨頭也面臨同樣的窘境。據(jù)SemiAnalysis的專家Dylan Patel統(tǒng)計,OpenAI光是運行ChatGPT,每日投入的成本就可能高達(dá)70萬美元。
據(jù)悉,生成式人工智能工具的商業(yè)模式未經(jīng)充分驗證,其運行成本高昂,需要配備昂貴芯片的大型服務(wù)器,且耗電巨大。并且當(dāng)下AI相關(guān)應(yīng)用的落地場景、應(yīng)用價值也仍待挖掘。目前,微軟、谷歌、Adobe等其它科技公司正在嘗試各種方法來推銷付費人工智能服務(wù)。
谷歌的人工智能助手服務(wù)每月訂閱費6美元,此后也計劃額外收取每月30元的費用;網(wǎng)絡(luò)視頻公司Zoom也嘗試內(nèi)部開發(fā)更簡便的AI來降低成本;Adobe則采取每月限量使用的機(jī)制,來確保其人工智能服務(wù)Firefly不會陷入虧損,用戶每月有固定的分配額度,一旦超過,其運行速度會大幅降低;OpenAI的ChatGPT 4.0每月訂閱費用為20美元,但是舊版本可免費使用。
上文所述的微軟和GitHub還沒有回應(yīng)該服務(wù)是否盈利,但該企業(yè)計劃后續(xù)升級會提高使用價格,除了Microsoft 365企業(yè)基本月費13美元之外,人工智能強(qiáng)化版本每月會額外收取30美元。
亞馬遜云部門主管Adam Selipsky表示,他接觸的許多客戶都對運行一些大模型的成本感到不滿。微軟企業(yè)戰(zhàn)略主管Chris Young認(rèn)為,企業(yè)和消費者需要時間來了解他們希望如何使用人工智能,以及愿意為此支付多少費用。他表示,“很明顯,我們現(xiàn)在必須把對AI的興趣和興奮轉(zhuǎn)化為真正的行動?!?/span>
生成式人工智能公司W(wǎng)riter的首席執(zhí)行官May Habib表示,AI公司估值的上升反映了人們對其前景的看好,但是公司高管們很快就會更加關(guān)注成本問題。她認(rèn)為,2024年將是人工智能投資熱度降溫的一年。
英偉達(dá)贏麻了
當(dāng)ChatGPT橫空出世,英偉達(dá)“命運的齒輪”就已經(jīng)悄悄轉(zhuǎn)動。
黃仁勛道,AI的iphone時刻已經(jīng)到來。如今,“一個新的計算時代已經(jīng)開始,全球公司正在從通用型向加速計算和生成型人工智能過渡”,英偉達(dá)也在AI芯片上收獲了比預(yù)想更好的利潤。
英偉達(dá)公布的2024第二財報季業(yè)績顯示,截至2023年7月30日,公司第二季度收入135.07億美元,同比增長101%,比上一季度增長88%,高于分析師預(yù)期110.4億美元;歸屬凈利潤實現(xiàn)61.88億美元,同比增長8.43倍;攤薄每股收益為2.48美元,同比上年同期增長854%,環(huán)比上一季度增長202%。
各項指標(biāo)超過預(yù)期,這或許也是英偉達(dá)史上最佳的業(yè)績報告。AI熱潮推動的大模型訓(xùn)練的GPU市場需求還處在高位,英偉達(dá)作為市面上唯一的高端GPU的供應(yīng)商,H100系列芯片在市場中一卡難求。因此,英偉達(dá)在財報中不僅披露了新產(chǎn)品進(jìn)展,也在加快產(chǎn)能建設(shè)。
自英偉達(dá)發(fā)布大模型專用GPU并量產(chǎn)供貨后,由于市場需求遠(yuǎn)大于產(chǎn)能供應(yīng),市面上的英偉達(dá)H100芯片被瘋狂加價,有時候甚至一卡難求。
據(jù)市場消息稱,英偉達(dá)AI芯片H100在2023年8月的市場總需求可能在43.2萬張左右,而據(jù)據(jù)eBay網(wǎng)站顯示,目前一張專門用于訓(xùn)練AI大模型的H100芯片在Ebay上的價格甚至炒到了4.5萬美元,折合人民幣超過了30萬元。
SK海力士低調(diào)吸金
去年9月推出的H100,是英偉達(dá)產(chǎn)品矩陣中最先進(jìn)的GPU。
相較于前任A100,它的價格翻了1.5-2倍左右,但性能卻有了質(zhì)的飛躍:推理速度提升3.5倍,在訓(xùn)練速度提升2.3倍;如果用伺服器叢集運算的方式,訓(xùn)練速度更是能提高到9倍。在LLM訓(xùn)練中,它能讓原本一個星期的工作量,縮短為20個小時。
一塊英偉達(dá)H100,主要由三個部分構(gòu)成:中心的H100裸片兩側(cè)各有三個HBM堆棧,最外層則是臺積電的2.5D CoWoS封裝框。
三個部件里,核心的邏輯芯片供應(yīng)是最簡單的,它主要產(chǎn)自臺積電臺南18號工廠,使用4N工藝節(jié)點(實際是5nm+)。由于5nm+下游的PC、智能手機(jī)和非AI相關(guān)數(shù)據(jù)中心芯片市場疲軟,目前臺積電5nm+產(chǎn)能利用率不到70%。因此邏輯芯片供應(yīng)沒有問題。
英偉達(dá)最主要的供應(yīng)缺口,來自邏輯芯片兩側(cè)的6塊HBM(High Bandwidth Memory,高帶寬內(nèi)存),和把邏輯芯片、HBM連接起來的CoWoS封裝(Chip on wafer on Substrate,芯片、晶圓、基板封裝)。
HBM是一種基于3D堆疊工藝的DRAM內(nèi)存芯片。其技術(shù)原理,就是將多個DDR芯片,垂直堆疊在一起,通過硅通孔(TSV)和微凸塊(μBmps)技術(shù),把芯片相互連接,從而突破了現(xiàn)有的性能限制,大大提高了存儲容量,實現(xiàn)更高帶寬、更高位寬、更低功耗、更小尺寸的DDR組合陣列。
內(nèi)存芯片對GPU性能至關(guān)重要,尤其是訓(xùn)練AI所用的高性能GPU。推理和訓(xùn)練工作負(fù)載是內(nèi)存密集型任務(wù)。隨著AI模型中參數(shù)數(shù)量的指數(shù)級增長,僅權(quán)重一項就將模型大小推高到了TB級。因此,從內(nèi)存中存儲和檢索訓(xùn)練和推理數(shù)據(jù)的能力決定了GPU性能的上限。AI大模型和應(yīng)用越多,越有利于HBM制造商。
從整體HBM市場來看,兩大韓國存儲巨頭SK海力士及三星占絕對壟斷地位,二者合計市占率在90%左右。
英偉達(dá)H100上面使用的HBM3由SK海力士獨家供應(yīng),這是目前最先進(jìn)的HBM產(chǎn)品。
HBM3工藝復(fù)雜、成本高昂、產(chǎn)能有限,2022年,在整個HBM市場中,HBM3僅占約8%的市場份額。作為全球唯一有能力量產(chǎn)HBM3的公司,SK海力士牢牢卡住了英偉達(dá)H100的脖子;而前代GPU A100/A800以及AMD的MI200使用的則是落后一代的HBM2E技術(shù)。
不過,當(dāng)前存儲芯片業(yè)界正處于HBM2E向HBM3換代的過程中。據(jù)Trendforce數(shù)據(jù),預(yù)計到2024年,HBM3市占率將超過60%,三星、美光等存儲芯片廠都在積極布局,都對SK海力士的市場份額虎視眈眈。
臺積電:根本忙不過來
先進(jìn)封裝則是一項與HBM內(nèi)存相輔相成的技術(shù)——要用HBM堆棧,必須用先進(jìn)封裝把內(nèi)存和GPU連接起來。
H100上使用的臺積電CoWoS先進(jìn)封裝,是一項2.5D封裝技術(shù)。
主流的2D封裝方案,是在基板(Substrate)的表面水平安裝所有芯片和無源器件的集成方式,類似于平面的拼圖。
而2.5D先進(jìn)封裝,則可以類比為橫向排列的積木。多層DDR芯片堆疊的HBM堆棧,必須依賴先進(jìn)封裝才能實現(xiàn)。
臺積電的CoWoS先進(jìn)封裝方案,由CoW和oS組合而來:先將芯片通過Chip on Wafer(CoW)的封裝制程連接至硅晶圓,再把CoW芯片與基板連接(on Substrate),整合成CoWoS。
CoWoS技術(shù)大大提高了互聯(lián)密度以及數(shù)據(jù)傳輸帶寬,同時縮小了封裝尺寸,但工藝也非常復(fù)雜,因此主要用于高端市場。
據(jù)媒體報道,目前臺積電CoWoS封裝月產(chǎn)8000片,今年底有望提升至11000片,2024年底有望實現(xiàn)14500至16600片左右的月產(chǎn)能,也就是說,想要提升一倍的產(chǎn)量,幾乎需要一年半的時間。
AI企業(yè)獲利還要再等五到十年?
根據(jù)分析平臺Similarweb的數(shù)據(jù),ChatGPT的每月在線訪問量在經(jīng)歷了數(shù)月的增長后,分別在6月和7月下降了10%。圖片生成式AI平臺Midjourney的月訪問量在截至7月的3個月內(nèi)連續(xù)下降。
指數(shù)風(fēng)投(Index Ventures)合伙人Mark Goldberg表示,商業(yè)人工智能應(yīng)用的出現(xiàn)曾經(jīng)被寄予“光速實現(xiàn)”的樂觀預(yù)期,但現(xiàn)在“出現(xiàn)了一種淺層次的幻滅感”:ChatGPT的初始用戶增長激增,導(dǎo)致投資者高估了消費者將使用由生成式人工智能驅(qū)動的工具的速度。
投資者在這些產(chǎn)品尚未擁有客戶或收入之前便急于支持正在建設(shè)這些產(chǎn)品的初創(chuàng)公司,這引發(fā)了對市場可能過熱的擔(dān)憂。
風(fēng)險投資者表示,他們?nèi)匀徊淮_定圍繞這項技術(shù)構(gòu)建新產(chǎn)品的初創(chuàng)公司的獲勝商業(yè)模式是什么樣的——許多初創(chuàng)企業(yè)尚未證明他們能否留住用戶,并開發(fā)出現(xiàn)有公司難以輕易模仿的產(chǎn)品。
由于盈利模式不確定,一些公司已經(jīng)對于向生成式人工智能的投資提出了懷疑。
據(jù)小i集團(tuán)董事局主席&首席執(zhí)行官袁輝的說法,ChatGPT意味著整個產(chǎn)業(yè)的變革升級,很多行業(yè)將會被重塑,是一個顛覆性的創(chuàng)新。他說,“沒有一次工業(yè)革命可以與人工智能相提并論。過去工業(yè)革命還是在某個領(lǐng)域或某一地區(qū)以某個國家為主導(dǎo),但現(xiàn)在AI已經(jīng)沒有邊界了?!?/span>
“ChatGPT對人類將有兩個重大影響。”袁輝稱,一是接下來五到十年是AI的技術(shù)紅利,是六十年積累后巨大的紅利變現(xiàn)期;二是AI發(fā)展正在加速,早期曾預(yù)言這需要三十年五十年甚至更長時間。
ChatGPT已經(jīng)可以快速進(jìn)入到各行各業(yè)并產(chǎn)生價值,但袁輝提醒道,ChatGPT未來面臨著三個關(guān)鍵的挑戰(zhàn)。一是需要可控,就是從意識形態(tài)、倫理道德上來講必須可控,否則將極度不安全;二是如與行業(yè)結(jié)合,必須得可定制;第三是可交付?!八欢ㄒ獙崿F(xiàn)可控可交付可定制才能在行業(yè)中大規(guī)模地變現(xiàn)?!彼f。
