ChatGPT強力“催化”AI產(chǎn)業(yè),不靠炒作,我國AI芯片有哪些實力選手?
數(shù)據(jù)、算力、算法,作為 AI 發(fā)展的三大基石。
資本市場輪番炒作。市場炒算法模型,究竟是誰能第一個推出中國的版的 ChatGPT ?市場炒數(shù)據(jù)標注、數(shù)據(jù)訓練,這是算法模型形成的“推進器”。
那算力呢?A 股市場對這方面的炒作熱情不高,畢竟國產(chǎn) AI 芯片的技術(shù)水平擺在那,但也有公司在做。
美股的英偉達給了表率。作為全球 AI 芯片一哥,霸主,幾乎壟斷了全球高端GPU 市場。
據(jù)瑞銀公布數(shù)據(jù)顯示,截至今年1月末,上線不過2個月的ChatGPT月活用戶已突破1億,成為史上增長最快的消費類應用。此前有消息表示,ChatGPT已導入了至少1萬個英偉達高端 GPU 。
AI 算力就是AI芯片,目前最廣泛使用GPU芯片,我們俗稱顯卡。當然 CPU、FPGA、ASCI 也作為 AI 芯片使用,但適用范圍和效果上遠不如GPU。
CPU的計算性能和功耗通常難以滿足 AI 的需要,而GPU憑借高算力成為 AI 芯片的主流選擇,F(xiàn)PGA 憑借可編程的特性適用算法尚不成熟、應用規(guī)模相對較小的 AI 場景,ASIC針對AI場景進行定制化涉及,能夠?qū)崿F(xiàn)功耗與算力的較高性價比。
GPU芯片,被美國 Intel,英偉達,AMD 三家企業(yè)壟斷,其中英偉達是高端 AI 芯片的王者。去年8月底,美國政府發(fā)布出口禁令,限制英偉達向我們出口 A100 和和 H100 等高端AI芯片,AMD 也被限制。
AI芯片分工生變,云端推理加速轉(zhuǎn)移
據(jù)外媒semianalysis報道,ChatGPT每天在計算硬件方面的運營成本為694444美元,Open AI需要大約3617臺HGX A100服務器(28936個GPU)為ChatGPT提供服務。真正需要用云端芯片進行推理的需求增加,云端無法承受如此龐大的數(shù)據(jù)和工作量,如果能夠?qū)I云端芯片的處理工作向邊緣側(cè)轉(zhuǎn)移,或許將為大模型的訓練和推理釋放更多的計算空間。
與此同時,用戶需求也在改變著典型的AI芯片分工方式,一方面消費者希望保護個人數(shù)據(jù)隱私,即將終端數(shù)據(jù)保留在終端設(shè)備上,另一方面,消費者又需要可靠的數(shù)據(jù),并即時獲得處理結(jié)果,數(shù)據(jù)不斷從邊緣側(cè)產(chǎn)生,AI處理的重心正在持續(xù)向邊緣轉(zhuǎn)移。
因此,將推理工作轉(zhuǎn)移至邊緣側(cè)終端完成也成為不少企業(yè)為之努力的目標和趨勢。高通就在推升終端側(cè)的推理能力方面有著出色表現(xiàn)。
雷峰網(wǎng)了解到,高通正在采取不同的方式實現(xiàn)終端側(cè)的學習能力,對包括小樣本學習、無監(jiān)督持續(xù)學習、聯(lián)邦學習和低復雜度的終端側(cè)訓練等方向的研究,且已經(jīng)取得了一些成效。
通過小樣本學習,在關(guān)鍵詞識別方面,AI能夠“看完”某一人的筆跡或書面文字之后快速進行辨認,也能在用戶錄入數(shù)據(jù)時進行局部模型適應,憑借少量樣本數(shù)據(jù)和數(shù)據(jù)標記能力,提升關(guān)鍵詞識別能力。
在聯(lián)邦學習方面,云端創(chuàng)造的模型被下發(fā)到邊緣側(cè)終端之后,基于一定程度的離線學習,終側(cè)端就可以根據(jù)消費者實際情況調(diào)整模型,由于終端側(cè)學習的過程會產(chǎn)生噪音,因此還能將其回傳到云端進一步提升模型的泛化能力。在實際的應用場景中,如果一輛汽車不斷在多個國家的不同路況上行駛,云端模型就可以持續(xù)進行適應,假以時日模型經(jīng)過優(yōu)化,就能打造出更加優(yōu)秀的自動駕駛汽車模型。
為了讓AI在終側(cè)端發(fā)揮最大作用,高通也有針對性的技術(shù)創(chuàng)新。
例如,高通支持INT4的精度推理。INT4相比INT8能夠?qū)崿F(xiàn)60% 的能效提升和90%的AI推理速度提升,如果從INT8轉(zhuǎn)化到INT4、或從浮點計算轉(zhuǎn)化到整數(shù)計算,在同樣的算力下能夠處理更多的數(shù)據(jù)。如果將32位浮點模型轉(zhuǎn)化為INT4模型,能效甚至能夠提升到64倍。
國內(nèi)主流AI芯片廠商
雖說ChatGPT“成精”了,但歸根結(jié)底還是AI,AI的基礎(chǔ)就是算力,而算力依靠的是芯片。當前主流的AI芯片可分為GPU、FPGA、ASIC等三大類型:
第一,GPU適用于通用并行計算,能夠為AI訓練任務提供更高算力;
第二,F(xiàn)PGA具有低延時,開發(fā)周期短等特性,可用于AI推理任務等;
第三,ASIC與通用集成電路相比功耗更低性能更優(yōu),可用于針對AI訓練任務設(shè)定特定框架。
那么,問題來了,國內(nèi)有哪些值得期待的AI芯片廠商呢?
一、GPU領(lǐng)域
在全球GPU領(lǐng)域,英偉達是當之無愧的絕對霸主,長期壟斷高端GPU市場。
近幾年,國產(chǎn)GPU發(fā)展勢頭迅猛,雖然還處于起步階段,但已經(jīng)聚集了景嘉微、龍芯中科、海光信息、芯動科技、壁仞科技、沐曦集成、登臨科技、航錦科技等多家實力廠商,備受資本追捧。
在諸多廠商的努力下,國產(chǎn)GPU爭分奪秒地交出了很多優(yōu)秀的作品,比如芯動科技“風華2號”、 壁仞科技BR100、景嘉微JM7200、沐曦集成MXN系列等。不過,國產(chǎn)GPU的落地應用不多,很多產(chǎn)品尚未量產(chǎn)上市,商業(yè)化前景仍面臨嚴峻挑戰(zhàn)。
國內(nèi)是國內(nèi)首家自主研發(fā)GPU并用于商用的廠商,先后研制成功JM5系列、JM7系列、JM9系列等高性能GPU芯片,被稱為中國版英偉達,但與英偉達的技術(shù)差距還是比較大。
二、FPGA領(lǐng)域
賽靈思是FPGA的“發(fā)明者”,1985年推出全球第一顆FPGA芯片XC206,自此一直是FPGA領(lǐng)域的頭號玩家。
目前,國內(nèi)有紫光同創(chuàng)、安路科技、復旦微電、京微齊力、高云半導體、安路科技、成都華微電子等廠商進入FPGA行業(yè)。FPGA是可以先購買再設(shè)計的“萬能芯片”,技術(shù)壁壘很高,但在國產(chǎn)替代大趨勢下,國產(chǎn)FPGA廠商走上了發(fā)展快車道。
國產(chǎn)FPGA廠商正在奮力追趕,實現(xiàn)了部分技術(shù)突破。紫光同創(chuàng)率先成功研發(fā)首款國產(chǎn)自主產(chǎn)權(quán)千萬門級高性能FPGA PGT180H,隨后復旦微電推出國內(nèi)首款28nm工藝制程的億門級FPGA產(chǎn)品,填補了國產(chǎn)高端FPGA空白。此外,安路科技中低端FPGA產(chǎn)品已可對標海外龍頭廠商,出貨量持續(xù)增長。
不過,目前國產(chǎn)FPGA廠商營收規(guī)模均較小,出貨集中在40nm和55nm工藝水平,賽靈思等頭部廠商存在兩到三代的技術(shù)差距。
三、ASIC領(lǐng)域
ASIC是指一種只為專一目的而設(shè)計的集成電路,用途較為單一,但由于為特定計算打造,效率比通用GPG芯片高得多。
隨著機器學習、邊緣計算的發(fā)展,產(chǎn)生大量數(shù)據(jù)處理任務,ASIC芯片開始受到重視,谷歌、英特爾、英偉達等相繼發(fā)布TPU、DPU等ASIC芯片。
眼下,國內(nèi)主流ASIC廠商包括華為海思、寒武紀、瀾起科技、地平線、燧原科技、中星微電子、黑芝麻智能等,正瞄準ASIC市場迅速發(fā)力。
其中,寒武紀目前已研發(fā)出終端、邊緣端、云端系列ASIC芯片,產(chǎn)品面向互聯(lián)網(wǎng)、金融、交通、能源、電力和制造等領(lǐng)域的復雜AI應用場景。而地平線自研BPU架構(gòu)的車規(guī)級AI芯片如征程系列、AIoT邊緣AI芯片、旭日系列等,能夠為高級別的自動駕駛提供更可靠、更超強的算力支持和處理能力。
總的來說,ChatGPT的橫空出世,帶火了AI芯片。
不過,AI芯片領(lǐng)域競爭激烈,海外廠商具有巨大優(yōu)勢,但身處中國這個AI落地的最大市場,國產(chǎn)AI芯片廠商仍有彎道超車的機會。
