計(jì)算芯片“新貴”DPU,是國產(chǎn)芯片的下一個突破口嗎?
與卸載方法相比,芯片正面臨標(biāo)線限制( reticle limits ),網(wǎng)絡(luò)和存儲功能的 CPU 處理非常昂貴等挑戰(zhàn),這些事實(shí)結(jié)合起來使 DPU 成為可能。因?yàn)槠涑霈F(xiàn)能夠更好地保護(hù)服務(wù)器工作負(fù)載,尤其是在多租戶(multitenant)環(huán)境中,這使得 DPU 不可避免。而現(xiàn)在,這種卸載的經(jīng)濟(jì)性使 DPU變得非常可取。
Amazon Web Services 發(fā)明了 Nitro DPU,Google 與 Intel 合作創(chuàng)建“Mount Evans”IPU,AMD 收購 了Xilinx 和 Pensando(兩者都有 DPU)以及 Nvidia 收購 Mellanox Technology。他們這些動作背后的原因都是——DPU 正在成為網(wǎng)絡(luò)中的控制點(diǎn),并且越來越多地成為計(jì)算和存儲的看門人,它是這些超大規(guī)模廠商和希望將 DPU 傳播給大眾的 IT 供應(yīng)商的所有系統(tǒng)架構(gòu)的中心。
進(jìn)入九月,在美國發(fā)出對中國出口高性能數(shù)據(jù)中心GPU的限制后,加速計(jì)算核心技術(shù)國產(chǎn)化的趨勢日漸明朗,這也順勢帶動了國產(chǎn)AI芯片、DPU、GPU市場熱度。在資本市場上,中國相關(guān)概念股應(yīng)聲上漲、同時相關(guān)企業(yè)融資成功的消息更是層出不窮,國內(nèi)芯片企業(yè)正在趁勢快速發(fā)展著。
9月20日訊,根據(jù)國內(nèi)媒體報(bào)道,國產(chǎn)DPU芯片公司中科馭數(shù)今天宣布完成數(shù)億元B輪融資,融資規(guī)模遠(yuǎn)超以往輪次。據(jù)悉,本次融資主要由金融街資本領(lǐng)投,建設(shè)銀行旗下建信資本跟投,老股東靈均投資、光環(huán)資本、泉宗資本追投,中科馭數(shù)希望借此加速自研DPU芯片的迭代與產(chǎn)業(yè)布局。
問題來了,如今火爆全網(wǎng)的DPU到底是什么?它和我們這些普通消費(fèi)者所熟知的CPU、GPU到底有什么不同之處?比起混合CPU+GPU的傳統(tǒng)異構(gòu)計(jì)算架構(gòu),DPU在計(jì)算領(lǐng)域里究竟擁有著怎樣的優(yōu)勢?在這場圍繞數(shù)字化時代的異構(gòu)計(jì)算大亂斗中,國產(chǎn)DPU的發(fā)展前景如何?讓我們來好好探討一下。
什么是DPU?
所謂DPU,指的是數(shù)據(jù)處理器(Data Processing Unit),理論上是繼CPU、GPU之后,設(shè)置在數(shù)據(jù)中心內(nèi)部的第三顆主力芯片。
根據(jù)維基顯示,DPU的概念最早是由美國初創(chuàng)公司Fungible提出的。在Fungible的定義中,DPU是一種運(yùn)行Linux操作系統(tǒng)的SoC,其主要目標(biāo)是通過承擔(dān)原本由CPU承擔(dān)的網(wǎng)絡(luò)、存儲和安全的加速處理任務(wù),滿足網(wǎng)絡(luò)側(cè)的專用計(jì)算需求,以此優(yōu)化和提升數(shù)據(jù)中心效能。
事實(shí)上,由于制程接近邊際效益、摩爾定律逐漸失效的緣故,如今CPU芯片的性能增長正在逐年放緩,CPU的性能從5-10年前每年30%的增幅,到三年前大概只有每年不到3%的性能增幅。
作為對比,由于云端應(yīng)用的豐富、數(shù)據(jù)中心規(guī)模的擴(kuò)大、數(shù)字化進(jìn)展的驅(qū)動,近些年來網(wǎng)絡(luò)帶寬正在飛速上漲,這也導(dǎo)致了目標(biāo)算力、網(wǎng)絡(luò)帶寬與計(jì)算性能的失調(diào),進(jìn)一步加劇了服務(wù)器節(jié)點(diǎn)上CPU的計(jì)算負(fù)擔(dān),CPU的算力幾乎已經(jīng)無法應(yīng)對大量云計(jì)算帶來的負(fù)擔(dān)。
在這種背景下,DPU自然應(yīng)運(yùn)而生。
不同于為了高效管理本地資源而生的傳統(tǒng)CPU架構(gòu),DPU可以說是一種為了管理大量網(wǎng)絡(luò)資源而生的架構(gòu)。舉個例子,為了實(shí)現(xiàn)大量數(shù)據(jù)傳輸,數(shù)據(jù)中心的主機(jī)每天都要進(jìn)行海量的?絡(luò)協(xié)議處理,這會大量占用算力,而DPU則可以承擔(dān)起網(wǎng)絡(luò)協(xié)議處理的工作,以此分擔(dān)CPU的負(fù)載,幫助CPU釋放算力負(fù)擔(dān)。
除了網(wǎng)絡(luò)協(xié)議外,DPU還能承載數(shù)據(jù)中心所需的存儲、安全和虛擬化等工作負(fù)載。舉個例子,傳統(tǒng)的數(shù)據(jù)中心要遠(yuǎn)程讀取存儲數(shù)據(jù),還需經(jīng)過CPU的編譯和轉(zhuǎn)發(fā),而DPU則可以通過RDMA(遠(yuǎn)程直接數(shù)據(jù)存取)直接讀取主機(jī)存儲數(shù)據(jù),而AWS推出的Nitro Hypervisor更是宣稱可以通過DPU承擔(dān)虛擬化負(fù)載,讓CPU免去執(zhí)行虛擬化所需的算力損耗。
綜上所述,大家應(yīng)該也看明白了,DPU的作用本質(zhì)就是給CPU“減負(fù)”。將原本CPU要承擔(dān)的網(wǎng)絡(luò)、存儲、虛擬化等功能卸載到自己身上,并利用自己的算力特長,對這些工作進(jìn)行加速運(yùn)算。
事實(shí)上,DPU已經(jīng)不是第一個為彌補(bǔ)CPU能力不足而發(fā)揚(yáng)光大的產(chǎn)品,多年前GPU的大熱也是為了彌補(bǔ)CPU在圖形處理能力方面的短板,近年逐漸興起的AI芯片本質(zhì)也是為了彌補(bǔ)CPU在人工智能算法方面的不足。至于普通消費(fèi)者,只要知道DPU是為了數(shù)據(jù)中心這種大規(guī)模算力場景而生的,與我們的臺式機(jī)、筆記本電腦基本無關(guān)就行了。
百家爭鳴,誰能笑到最后?
雖說最早提出DPU概念的是Fungible,但是將DPU這一概念重新推向時代潮頭的無疑是英偉達(dá)。2020年4月,英偉達(dá)以69億美元完成對以色列網(wǎng)絡(luò)芯片商邁絡(luò)思(Mellanox)的收購,英偉達(dá)CEO黃仁勛更是將DPU定義為和CPU、GPU并肩的數(shù)據(jù)中心的“三大支柱”之一。
自此,DPU正式成為了芯片領(lǐng)域里的香饃饃,巨大的市場需求推動越來越多的玩家進(jìn)入DPU賽道。除了國外主流芯片廠商外,如今不少國產(chǎn)公司已在這條百億美元賽道上嶄露頭角,其中不乏阿里云、百度云等互聯(lián)網(wǎng)巨頭,也有中科馭數(shù)、芯啟源、大禹智芯等初創(chuàng)公司。
先看看國外企業(yè),去年6月,英特爾發(fā)布了其可編程網(wǎng)絡(luò)設(shè)備IPU(基礎(chǔ)設(shè)施處理器),用于加速存儲虛擬化、網(wǎng)絡(luò)虛擬化和安全等功能,并釋放CPU核心。今年9月,AMD以19億美元的價格收購DPU芯片廠商Pensando Systems,以此補(bǔ)齊“云戰(zhàn)略”最后一塊拼圖。
在今年4月的GTC大會上,英偉達(dá)發(fā)布了新一代數(shù)據(jù)處理器 —— BlueField-3 DPU。這是首款為 AI 和加速計(jì)算而設(shè)計(jì)的 DPU ,專門針對多租戶、云原生環(huán)境進(jìn)行了優(yōu)化,據(jù)悉一個BlueField-3 DPU所提供的數(shù)據(jù)中心服務(wù),可相當(dāng)于多達(dá)300個x86主核才能實(shí)現(xiàn)的服務(wù)。
國產(chǎn)廠商這邊,今年6月,阿里云在三代神龍卡的基礎(chǔ)上正式推出其自主研發(fā)的云基礎(chǔ)設(shè)施處理器(CIPU),號稱將替代CPU成為云時代IDC的處理核心,可以綜合調(diào)度CPU、GPU、存儲硬盤、交換機(jī)等硬件。事實(shí)上,這枚芯片除了名字之外,與 DPU的功能和作用幾乎無異。
成立于2018年的中科馭數(shù),在自研敏捷異構(gòu)KPU芯片架構(gòu)以及DPU軟件開發(fā)平臺HADOS的基礎(chǔ)上,自主研發(fā)了業(yè)界首顆融合高性能網(wǎng)絡(luò)與數(shù)據(jù)庫一體化加速功能的DPU芯片和標(biāo)準(zhǔn)加速卡系列產(chǎn)品,目前已經(jīng)和金證股份、中移物聯(lián)網(wǎng)等企業(yè)達(dá)成戰(zhàn)略合作。
此外,成立于2015的芯啟源和成立于2020年的大禹智芯也是目前國內(nèi)DPU賽道的主流玩家,其中芯啟推出了基于SoC架構(gòu)的DPU完整解決方案,并于今年6月完成了數(shù)億元Pre-A3輪融資,大禹智芯則是一家由英特爾、思科核心研發(fā)人員組成的初創(chuàng)企業(yè),于今年7月宣布完成數(shù)千萬元Pre-A輪融資。
作為芯片新物種,DPU市場空間正在快速擴(kuò)張。賽迪顧問預(yù)測,全球DPU市場將在2023-2024年迎來爆發(fā)式增長,預(yù)計(jì)至2025年,中國DPU產(chǎn)業(yè)市場規(guī)模將超過565.9億元,全球DPU產(chǎn)業(yè)市場規(guī)模將超過245.3億美元,復(fù)合增速分別為 51.73%、170.60%。
與國外廠商“逐鹿中原”
“我們認(rèn)為DPU的潛力確實(shí)是巨大的。”在鄢貴??磥?,從技術(shù)發(fā)展的角度來看,DPU的出現(xiàn)有一定的必然性——上層應(yīng)用對于算力的需求在過去5年急劇增長,使得DPU的應(yīng)用場景很多,它將廣泛分布在5G、云計(jì)算、大數(shù)據(jù)、數(shù)據(jù)中心和邊緣計(jì)算等領(lǐng)域。
而從工業(yè)和信息化部今年發(fā)布的《新型數(shù)據(jù)中心發(fā)展三年行動計(jì)劃(2021—2023年)》中,鄢貴海更是看到了新型算力芯片難得的歷史發(fā)展機(jī)遇。
該計(jì)劃明確提出要加快提升算力算效水平,“推動CPU、GPU等異構(gòu)算力提升,逐步提高自主研發(fā)算力的部署比例”“加強(qiáng)專用服務(wù)器等核心技術(shù)研發(fā)”“樹立基于5G和工業(yè)互聯(lián)網(wǎng)等重點(diǎn)應(yīng)用場景的邊緣數(shù)據(jù)中心應(yīng)用標(biāo)桿”等要求和措施。
“雖然國內(nèi)廠商在芯片產(chǎn)品化的環(huán)節(jié)相比國外一線廠商還有差距,但是在DPU架構(gòu)的理解上是有獨(dú)到的見解的,而且我國目前在數(shù)據(jù)中心這個領(lǐng)域,無論是市場規(guī)模、增速還是用戶數(shù)量,相較于國外都有巨大的優(yōu)勢?!臂迟F海認(rèn)為,國內(nèi)廠商有望充分利用這一“應(yīng)用勢能”,加快發(fā)展步伐,在DPU這個賽道與國外廠商“逐鹿中原”。
不過,挑戰(zhàn)與機(jī)遇并存。
“目前要解決DPU標(biāo)準(zhǔn)化應(yīng)用,還存在一定挑戰(zhàn)?!臂迟F海解釋道,由于數(shù)據(jù)中心本身的復(fù)雜性,各大廠商一方面采用商用現(xiàn)貨組件(即COTS)來構(gòu)建系統(tǒng),追求低成本,一方面又設(shè)法分層服務(wù)化,打造面向不用類型客戶的標(biāo)準(zhǔn)化產(chǎn)品,但除此之外的所有技術(shù)實(shí)現(xiàn)幾乎都是“八仙過海,各顯神通”——如AWS有Nitro,阿里云有MOC。
“有的廠商強(qiáng)化IO能力、有的關(guān)注路由轉(zhuǎn)發(fā)、有的重視存儲卸載、有的關(guān)注安全加密,不一而足?!臂迟F海說,而上層負(fù)載不同,也必然對底層架構(gòu)有各異的需求,這也許是目前DPU標(biāo)準(zhǔn)化面臨的最大挑戰(zhàn)。
