英偉達一口氣收購兩家AI企業(yè)，打的什么主意？

2024-04-26 來源：賢集網(wǎng)

2215

英偉達又出手了！繼去年投資30多家創(chuàng)企后，近期該公司又投資了兩家人工智能初創(chuàng)企業(yè)Run:ai與Deci。

當?shù)貢r間4月24日，英偉達宣布，已經(jīng)同Run:ai簽訂最終收購協(xié)議。公司認為，這能夠幫助客戶更有效地利用其AI計算資源。

Run:ai成立于2018年，是一家基于開源容器編排平臺Kubernetes的工作負載管理和編排軟件提供商。當下，AI的部署變得越來越復(fù)雜，工作負載分布在云、邊緣和本地數(shù)據(jù)中心基礎(chǔ)設(shè)施中。管理和編排生成式AI、推薦系統(tǒng)、搜索引擎和其他工作負載需要復(fù)雜的調(diào)度，從而優(yōu)化系統(tǒng)級別和底層基礎(chǔ)設(shè)施的性能。

而Run:ai的產(chǎn)品能夠?qū)崿F(xiàn)高效GPU集群的資源利用。簡單來說，其產(chǎn)品能夠支持開發(fā)人員并行運行多個AI工作負載，從而提高AI芯片的利用效率，降低了成本。

目前，Run:ai的解決方案已與英偉達的DGX、DGX SuperPOD、Base Command、NGC容器和AI Enterprise軟件等產(chǎn)品結(jié)合，英偉達DGX和DGX Cloud的客戶將能夠使用Run:ai的AI工作負載功能。

英偉達官方并未透露收購交易金額等條款詳情。但據(jù)以色列媒體Calcalist等相關(guān)媒體日前報道，交易金額為7億美元。

同樣收獲英偉達青睞的另一家AI創(chuàng)企Deci，也致力于實現(xiàn)AI芯片的“降本增效”。據(jù)The Information報道，英偉達同意收購以色列初創(chuàng)公司Deci，無法獲悉具體的收購金額。

據(jù)Deci官網(wǎng)，該公司成立于2019年，其提供高效的生成式AI和計算機視覺模型，可部署在各種環(huán)境中，同時保持數(shù)據(jù)安全并控制推理成本。

據(jù)了解，其解決方案通過調(diào)整AI模型大小，從而使其能夠在AI芯片上更便宜地運行。目前，Deci已與微軟、英特爾、AMD、亞馬遜等多家科技巨頭達成合作。

不難看出，英偉達這兩筆投資的目的都在于幫助其客戶更加有效的利用自家AI芯片產(chǎn)品。

The Information相關(guān)報道指出，兩位了解交易情況的人稱，Run:ai提高AI芯片效率的能力可能會吸引更多客戶使用NVIDIA DGX Cloud。另外，英偉達可能會提供Deci以及CUDA軟件，從而使開發(fā)人員能夠更便宜地構(gòu)建AI驅(qū)動的應(yīng)用程序。

英偉達在官方通稿中亦指出，客戶期望從更好的GPU利用率、改進的GPU基礎(chǔ)設(shè)施管理以及開放式架構(gòu)帶來的更大靈活性中受益。

英偉達“最強AI芯片”誕生

2024 GTC大會上，黃仁勛介紹了運行AI模型的新一代芯片和軟件。他表示，新一代的B200 GPU擁有2080億個晶體管，可以提供高達20 petaflops的FP4性能。相比之下，H100僅為4 petaflops。

此外，將兩個B200 GPU與單個Grace CPU 結(jié)合在一起的 GB200，可以為LLM推理工作負載提供30倍的性能，并且顯著提高效率。

黃仁勛還強調(diào)稱：“與H100相比，GB200的成本和能耗降低了25倍！

關(guān)于市場近期頗為關(guān)注的能源消耗問題，B200 GPU也交出了最新的答卷。

黃仁勛表示，此前訓(xùn)練一個1.8 萬億參數(shù)模型，需要8000 個 Hopper GPU 并消耗15 MW電力。但如今，2000 個 Blackwell GPU就可以實現(xiàn)這一目標，耗電量僅為4MW。

在擁有1750億參數(shù)的GPT-3大模型基準測試中，GB200的性能是H100的7倍，訓(xùn)練速度是H100的4倍。

值得一提的是，B200 GPU的重要進步之一，是采用了第二代Transformer引擎。

它通過對每個神經(jīng)元使用4位（20 petaflops FP4）而不是8位，直接將計算能力、帶寬和模型參數(shù)規(guī)模翻了一倍。

而只有當這些大量的GPU連接在一起時，第二個重要區(qū)別才會顯現(xiàn)，那就是新一代NVLink交換機可以讓576個GPU相互通信，雙向帶寬高達1.8TB/秒。

而這就需要英偉達構(gòu)建一個全新的網(wǎng)絡(luò)交換芯片，其中包括500億個晶體管和一些自己的板載計算：擁有3.6 teraflops FP8處理能力。

在此之前，僅16個GPU組成的集群，就會耗費60%的時間用于相互通信，只有40%的時間能用于實際計算。

一石激起千層浪，“最強AI芯片”的推出讓網(wǎng)友紛紛贊嘆。

其中英偉達高級科學(xué)家Jim Fan直呼：Blackwell新王誕生，新的摩爾定律已經(jīng)應(yīng)運而生。

無芯片，不AI

AI芯片是AI算力的核心。

有說法稱，對標ChatGPT，做好一個大模型的最低門檻就是1萬塊A100的芯片。前面說到，隨著人工智能應(yīng)用場景和數(shù)據(jù)規(guī)模的擴大，算法模型的復(fù)雜度呈指數(shù)級增長，特別是深度學(xué)習(xí)成為主流，需要更快的計算速度。雖然CPU可以執(zhí)行AI算法，但由于內(nèi)部邏輯多，對于AI算法來說效率不高。因此，出現(xiàn)了專門的AI芯片，它們設(shè)計用于高效并行計算，加速AI計算過程，并提高性價比。

廣義而言，AI 芯片指的是專門用于處理人工智能應(yīng)用中大量計算任務(wù)的模塊，除了以 GPU、FPGA、ASIC 為代表的 AI 加速芯片，還有比較前沿性的研究，例如：類腦芯片、可重構(gòu)通用 AI 芯片等。狹義的 AI 芯片指的是針對人工智能算法做了特殊加速設(shè)計的芯片。

這里面，GPU是AI芯片主力軍，因為它擁有卓越的高性能計算能力和通用性，適用于處理復(fù)雜算法和通用型人工智能平臺。而隨著人工智能技術(shù)、平臺和終端的不斷成熟，隨著視覺、語音、深度學(xué)習(xí)的算法在FPGA以及ASIC芯片上的不斷優(yōu)化，此兩者也有望逐步占有更多的市場份額。

根據(jù)VMR數(shù)據(jù)，全球和中國的GPU市場規(guī)模預(yù)計將繼續(xù)快速增長。2021年全球GPU市場規(guī)模達到334.7億美元，預(yù)計到2030年將增至4773.7億美元，年復(fù)合增長率達34.4%。2020年中國GPU市場規(guī)模為47.39億美元，預(yù)計到2027年將增至345.57億美元，年復(fù)合增長率為32.8%。這表明GPU在人工智能領(lǐng)域的需求將繼續(xù)擴大，并將成為市場的重要推動力量。

尋找中國版英偉達，期待國產(chǎn)替代空間

對于AI在下一輪科技革命中的地位，各國已經(jīng)形成共識，都在紛紛搶灘。從中美對比來說，競爭優(yōu)勢的爭奪就主要涉及前面提到的算法、大數(shù)據(jù)資源和算力三方面。在算法設(shè)計方面，雙方?jīng)]有明顯差距，主要依賴設(shè)計團隊的智慧和靈感；在大數(shù)據(jù)資源方面，中國占據(jù)著絕對優(yōu)勢，雙方在大數(shù)據(jù)分析技術(shù)上相近。然而，決定人工智能產(chǎn)品的關(guān)鍵要素還包括“算力"，計算能力是計算機的核心能力，這也是中美兩國長期競爭超級計算機領(lǐng)域的原因之一。國內(nèi)大模型與國外的主要差距也體現(xiàn)在算力層面，沒有算力基礎(chǔ)，后面算法等發(fā)展都無法進行。

在AI芯片領(lǐng)域，國外的芯片巨頭占據(jù)了大部分市場份額，有著明顯的先發(fā)優(yōu)勢，比如英偉達、AMD、英特爾的營收幾乎代表整個GPU行業(yè)收入。而國內(nèi)的AI芯片產(chǎn)業(yè)起步較晚，與世界先進水平存在較大差距，國內(nèi)AI芯片市場也較為分散，集中度較低，發(fā)展空間巨大。

不過，國內(nèi)一批新興力量正在崛起，競爭梯隊越發(fā)豐富。從國內(nèi)AI芯片廠商格局來看，以大算力或者高性能計算芯片為代表，一梯隊，有成熟產(chǎn)品、批量出貨的企業(yè)，主要包括寒武紀、華為海思、百度昆侖芯、燧原科技，這四家有2-3代更多的產(chǎn)品，技術(shù)能力、軟件能力都有一定積累；二梯隊，主要包括以AI芯片起家的壁仞科技、天數(shù)智心、摩爾線程、沐曦等。壁仞科技去年發(fā)布的產(chǎn)品規(guī)格很高，但主要還停留在紙面數(shù)據(jù)，實測數(shù)據(jù)、實際性能方面業(yè)界和第三方評測機構(gòu)評價沒有那么高，軟件層面從使用角度來講也還有很大的成長空間。其他幾家也陸續(xù)有產(chǎn)品推出，但技術(shù)能力還停留在推理層面，不像一梯隊企業(yè)有更成熟的產(chǎn)品經(jīng)驗；三梯隊，如海光、景嘉微等。技術(shù)能力還有待市場的認可和驗證。

從產(chǎn)品來說，目前國內(nèi)已經(jīng)批量生產(chǎn)的產(chǎn)品大多都是A100的上一代，如昆侖芯三代、思遠590、燧思3.0等，不過，各公司正在研發(fā)更新一代產(chǎn)品，縮小國內(nèi)外差距。向后看，基于國家政策的大力支持，以及自主可控的迫切需求，中國廠商有望迎來更大的國產(chǎn)替代機遇。而如果國內(nèi)產(chǎn)品能夠替代英偉達的算力產(chǎn)品，將會是非常大的機會。數(shù)據(jù)中心建設(shè)方面也需要服務(wù)器，會帶動國內(nèi)提供大型服務(wù)器的廠商，比如浪潮信息、中科曙光等，以及光模塊、調(diào)節(jié)芯片和散熱技術(shù)，需求都會受益于大模型浪潮。相信隨著國內(nèi)企業(yè)的持續(xù)投入和創(chuàng)新，以及政府的支持，中國在人工智能領(lǐng)域的發(fā)展勢頭仍然很強，有望逐步縮小與國外競爭對手的差距。