繼續(xù)打破摩爾定律,Blackwell芯片發(fā)展到了哪一步了?
英偉達的路線圖將每年更新
在最近的演講中,黃仁勛詳細闡述了英偉達芯片產(chǎn)品的年度升級周期計劃,該計劃將堅持遵循數(shù)據(jù)中心規(guī)模、年度更新頻率、技術(shù)約束以及統(tǒng)一架構(gòu)的發(fā)展路徑。
具體而言,英偉達將依托當(dāng)前最先進的半導(dǎo)體制程技術(shù),通過采用統(tǒng)一的架構(gòu)來覆蓋整個數(shù)據(jù)中心GPU產(chǎn)品線,并致力于實現(xiàn)每年一次的產(chǎn)品更新迭代。
黃仁勛強調(diào)指出,英偉達憑借CUDA+GPU的組合策略,成功構(gòu)建了安裝量持續(xù)增長、開發(fā)者及應(yīng)用日益豐富、研發(fā)規(guī)模不斷擴大、性能持續(xù)提升的良性生態(tài)循環(huán)。
目前,CUDA生態(tài)已遍布全球各地,得到了廣泛應(yīng)用。
例如,谷歌已宣布將cuDF納入其云計算平臺,以加速世界范圍內(nèi)受歡迎的數(shù)據(jù)科學(xué)庫Pandas的運行。
此外,在深度學(xué)習(xí)cuDNN、物理模擬Modulus、通信Aerial RAN、基因序列分析Parabricks以及量子計算模擬cuQUANTUM、數(shù)據(jù)處理cuDF等多個領(lǐng)域,均有專業(yè)的CUDA軟件提供支持。
黃仁勛表示,英偉達的路線圖將保持年度更新的節(jié)奏,其核心思想在于[構(gòu)建數(shù)據(jù)中心規(guī)模的產(chǎn)品體系,以年度為周期逐步推進并實現(xiàn)技術(shù)突破,向客戶提供高質(zhì)量的產(chǎn)品和服務(wù)]。
他進一步承諾,英偉達不會滿足于現(xiàn)狀,將繼續(xù)致力于提升產(chǎn)品性能、降低訓(xùn)練和推理成本,以及拓展AI功能,以滿足不斷增長的市場需求和技術(shù)挑戰(zhàn)。
量產(chǎn)Blackwell及Rubin架構(gòu)的路線圖亮相
今年三月,英偉達在其盛大的年度GTC大會上,正式發(fā)布了具備2080億晶體管的Blackwell芯片。
這款芯片是英偉達首次采用MCM(多芯片封裝)技術(shù)設(shè)計的GPU,實現(xiàn)了在同一芯片上集成雙GPU的突破。
英偉達創(chuàng)始人兼CEO黃仁勛在會上指出,在短短八年的時間里,英偉達的AI算力實現(xiàn)了驚人的飛躍。
從2016年P(guān)ascal芯片的19 TFLOPS,到2024年Blackwell芯片的20000 TFLOPS,算力提升了高達1000倍,這一增速幾乎超越了摩爾定律在最佳時期的發(fā)展速度。
搭載Blackwell芯片的最新DGX超算系統(tǒng)在各項性能指標(biāo)上均實現(xiàn)了顯著提升。
相較于上一代Hopper系統(tǒng),Blackwell系統(tǒng)不僅在NVLink域集成了72個GPU,實現(xiàn)了性能9倍的提升,同時在NVLink帶寬方面也實現(xiàn)了18倍的增長,AI算力更是提升了45倍,供能效率也提高了10倍。
目前,市場對GB200充滿期待,業(yè)界普遍預(yù)測,到2025年,GB200的出貨量有望突破百萬顆,占據(jù)英偉達高端GPU出貨量的近40%至50%。
此外,黃仁勛還公布了英偉達未來三代芯片的發(fā)展路線圖,包括計劃于2025年推出的Blackwell Ultra,2026年亮相的Rubin,以及2027年預(yù)計推出的Rubin Ultra。
值得一提的是,這也是下一代AI平臺Rubin的首次公開亮相。
目前,英偉達已經(jīng)開始量產(chǎn)其高性能GPU架構(gòu)Blackwell,相關(guān)產(chǎn)品將陸續(xù)上市,包括適用于HPC/AI領(lǐng)域的B200/GB200系列,以及面向游戲市場的RTX 50系列。
同時,黃仁勛還透露了Rubin架構(gòu)的未來發(fā)展藍圖,該架構(gòu)將配備全新的GPU、基于Arm架構(gòu)的Vera CPU,以及采用NVLink 6、CX9 SuperNIC和X1600融合InfiniBand/以太網(wǎng)交換機的高級網(wǎng)絡(luò)技術(shù)。
展望未來,英偉達將繼續(xù)按照既定的發(fā)展計劃推進芯片研發(fā)與生產(chǎn)。
預(yù)計2024年Blackwell芯片將全面投入生產(chǎn),2025年推出Blackwell Ultra產(chǎn)品,2026年發(fā)布Rubin系列,最終在2027年推出集大成之作——Rubin Ultra,并配備基于Arm的Vera CPU和先進的NVLink 6 Switch技術(shù)。
數(shù)據(jù)中心將進入數(shù)百萬GPU時代
NVIDIA創(chuàng)始人兼CEO黃仁勛正式宣布,公司將每年定期推出全新的Spectrum-X系列產(chǎn)品。
作為全球首款專為AI領(lǐng)域打造的以太網(wǎng)網(wǎng)絡(luò)平臺,NVIDIA Spectrum-X相較傳統(tǒng)以太網(wǎng)網(wǎng)絡(luò)平臺,在網(wǎng)絡(luò)性能上實現(xiàn)了顯著提升,高達1.6倍,有效加速了AI工作負載的處理、分析以及執(zhí)行速度。
在Spectrum-X系列中,Spectrum-X800專為數(shù)萬個GPU量身打造,而X800 Ultra則針對數(shù)十萬個GPU進行了優(yōu)化,至于X1600,其擴展能力可支持至數(shù)百萬個GPU,展現(xiàn)出強大的靈活性與可擴展性。
目前,在競爭激烈的高性能以太網(wǎng)市場中,NVIDIA Spectrum-X亦面臨著來自行業(yè)巨頭如Intel和Mellanox的強勁挑戰(zhàn)。
值得一提的是,CoreWeave、GMO Internet Group、Lambda、Scaleway以及STPX Global Yotta等眾多領(lǐng)先的AI云服務(wù)提供商已率先采用NVIDIA Spectrum-X,為其AI基礎(chǔ)設(shè)施帶來了前所未有的極致網(wǎng)絡(luò)性能體驗。
用Isaac生態(tài)系統(tǒng)迎接機器人時代
黃仁勛明確指出,英偉達正致力于通過推進機器人技術(shù)堆棧以加速物理AI的生成。
這一進程涵蓋了多個關(guān)鍵組件,包括適用于模擬應(yīng)用的Omniverse平臺、具備人形基礎(chǔ)模型特征的Project GR00T,以及提供強大計算能力的Jetson Thor機器人計算機。
英偉達發(fā)布的NVIDIA Isaac平臺,旨在為開發(fā)人員提供一套功能強大的工具集合,用以構(gòu)建各類AI機器人,這些機器人類型廣泛,包括但不限于自主移動機器人(AMR)、工業(yè)機械手臂以及人形機器人。
這一平臺的強大能力得益于AI模型的支持,以及Jetson Orin和Thor等超級計算機的運算能力。
NVIDIA Isaac Lab作為Isaac Sim中的參考應(yīng)用程序,特別針對AI機器人基礎(chǔ)模型的訓(xùn)練進行了優(yōu)化,包括強化學(xué)習(xí)、模仿學(xué)習(xí)和遷移學(xué)習(xí)等多種方法。
這一功能為機器人應(yīng)用提供了強大的基礎(chǔ)模型訓(xùn)練支持,覆蓋了多個應(yīng)用場景,從而顯著提升了機器人的性能和智能化水平。
目前,Isaac生態(tài)系統(tǒng)正經(jīng)歷著迅猛的發(fā)展。全球多家領(lǐng)先的機器人行業(yè)企業(yè),如比亞迪、西門子、泰瑞達和Intrinsic等,已將NVIDIA Isaac加速庫、基于物理學(xué)的仿真技術(shù)以及AI模型集成至其軟件框架和機器人模型中。
這些舉措極大地提高了工廠、倉庫和配送中心的工作效率,使得機器人成為執(zhí)行重復(fù)性、高精度任務(wù)的智能助手,為各行各業(yè)帶來了革命性的變革。
新一輪工業(yè)革命開始,AI工廠正在誕生
在今年的五月份財報會議上,黃仁勛明確指出,下一場工業(yè)革命已然拉開帷幕。
此次革命不僅限于云服務(wù)提供商,生成式AI技術(shù)已廣泛滲透到消費互聯(lián)網(wǎng)公司、各類企業(yè)、主權(quán)AI、汽車制造以及醫(yī)療保健等諸多領(lǐng)域,成功塑造了多個價值數(shù)十億美元的垂直市場。
英偉達,作為技術(shù)領(lǐng)域的領(lǐng)軍企業(yè),正站在新一輪增長浪潮的起點之上。
為積極響應(yīng)并推動此次技術(shù)革命,英偉達攜手眾多制造廠商,共同推出了一系列基于NVIDIA Blackwell架構(gòu)的先進系統(tǒng)。
這些系統(tǒng)不僅配備了Grace CPU,還融入了NVIDIA領(lǐng)先的網(wǎng)絡(luò)和基礎(chǔ)設(shè)施技術(shù)。
為加快不同規(guī)模與配置的系統(tǒng)開發(fā)進程,英偉達旗下的MGX模塊化參考設(shè)計平臺已全面支持這一系列新系統(tǒng)。
英偉達向世界展示了一個全新的未來圖景,即加速計算正成為引領(lǐng)新一輪產(chǎn)業(yè)革命的核心力量。
人類首次通過僅3萬億美元的IT產(chǎn)業(yè),創(chuàng)造出能夠直接服務(wù)于100萬億美元產(chǎn)業(yè)的全方位技術(shù)解決方案。
此外,隨著傳統(tǒng)軟件工廠向現(xiàn)代化AI工廠的轉(zhuǎn)型,我們見證了從CPU到GPU、從信息檢索到內(nèi)容生成、從簡單指令處理到大模型應(yīng)用、從單一工具使用到多元技能融合的全面升級。
這一變革不僅推動了技術(shù)棧的深刻重塑,更預(yù)示著未來產(chǎn)業(yè)發(fā)展的無限可能與廣闊前景。
建立350+加速庫,算力將增長1000倍
為了充分發(fā)揮GPU加速計算的潛力,開發(fā)專業(yè)的加速庫顯得尤為重要。
英偉達團隊已成功推出超過350個面向特定領(lǐng)域的加速庫。
這些卓越的加速庫囊括了業(yè)界聞名的深度學(xué)習(xí)加速庫cuDNN、物理模擬庫、5G無線電加速庫Aerial、芯片制造加速平臺Coolitho、基因測序加速庫Pair of Bricks以及組合優(yōu)化加速庫Co OPT等。
它們被廣泛應(yīng)用于醫(yī)療健康、金融、計算機、汽車等多個行業(yè)領(lǐng)域,并深入覆蓋至科學(xué)研究的前沿陣地,如量子計算機仿真系統(tǒng)Coup Quantum等。
值得一提的是,谷歌云端已率先部署了英偉達的數(shù)據(jù)處理加速庫QDF,使得廣受歡迎的數(shù)據(jù)科學(xué)庫Pandas的性能得以數(shù)百倍的提升。
在展望未來時,黃仁勛公開披露了英偉達的長期戰(zhàn)略規(guī)劃藍圖。
公司已為未來八年做好了充分準(zhǔn)備,預(yù)計屆時算力將實現(xiàn)驚人的千倍增長。
為實現(xiàn)這一具有里程碑意義的宏偉目標(biāo),黃仁勛先生透露了英偉達即將啟動的重大舉措——即實施令牌(Token)計劃。
展望未來,無論編寫何種類型的代碼,都需要將其轉(zhuǎn)化為AI系統(tǒng)能夠理解的令牌序列。
英偉達期望通過這一創(chuàng)新性的方式,構(gòu)建出一個真正統(tǒng)一的AI編程模型,為未來的科技發(fā)展奠定堅實基礎(chǔ)。
結(jié)尾:
業(yè)內(nèi)人士普遍認為,科技巨頭們致力于追求的核心目標(biāo),便是率先實現(xiàn)通用人工智能的突破。
盡管目前尚無法準(zhǔn)確預(yù)測AGI的實現(xiàn)還需多久,但顯而易見的是,在新一輪的創(chuàng)新周期中,AI將成為決定科技競爭格局的關(guān)鍵因素。
