英特爾Gaudi 2藉臺積電代工發(fā)力 高性價比搶攻中國AI市場
英特爾(Intel)于11日在北京發(fā)表Gaudi 2中國特供版深度學習處理器,受到中國媒體幾乎一面倒點讚,除了多家媒體評價,相比NVIDIA AI GPU,Gaudi 2最顯著的優(yōu)勢在于其“更高的性價比”外。
中媒強調(diào),Gaudi 2的推出,替中國訓練大型語言模型(LLM)帶來NVIDIA以外的替代方案,挑戰(zhàn)NVIDIA所壟斷的AI訓練市場。
英特爾執(zhí)行副總裁兼資料中心與AI事業(yè)群總經(jīng)理Sandra Rivera更強調(diào),Gaudi 2完全是合法合規(guī),適用于中國市場。英特爾指出,Gaudi 2及下一代Gaudi 3將會繼續(xù)支援中國客戶,預計Gaudi 3也會推出中國特別版本。
不過,英特爾Habana Labs營運長Eitan Medina也坦承,目前還沒有推出更高階的英特爾GPU用于LLM訓練和推論工作任務,英特爾唯一方案只有Gaudi 2。未來第四代,英特爾將統(tǒng)一Habana和AXG之間的路線圖,進行更深層次的整合。
對于NVIDIA的市場爭奪,Rivera表態(tài),市場需要替代品,該公司致力于為中國用戶提供更高的深度學習效能和效率,成為大規(guī)模部署AI的更優(yōu)解。
英特爾還透露,Gaudi 2在中國首批將與百度智慧云、浪潮資訊、美團、紫光新華三、超聚變、華勤技術等公司合作。
其實在2022年5月,英特爾已經(jīng)在歐美市場發(fā)布過Gaudi 2,此次在北京的產(chǎn)品發(fā)表,是針對中國市場的特供版,類似NVIDIA推出A100與H100的客制化版本A800與H800。
但無論是Gaudi 2還是A800,都是由臺積電7奈米代工,而NVIDIA新世代H800,以及英特爾將于2024年推出的Habana Gaudi 3,則是採用臺積電4/5奈米制程打造。英特爾表示,受惠于臺積電5奈米,Gaudi 3效能將大躍進。
值得一提的是,在加速運算方面,英特爾除了推出AI專用晶片Gaudi 2外,也在2022年推出針對資料中心的GPU Max 系列(代號為 Ponte Vecchio),這兩款產(chǎn)品在AI運算上,存在一定的重合。
對此,英特爾透露預計2025年,Habana Gaudi將與英特爾Ponte Vecchio GPU產(chǎn)品,整合架構與功能,成為統(tǒng)一架構的新產(chǎn)品,并帶來更好的軟體適配能力與AI處理能力。
如此一來,在2023~2024年間,Gaudi仍將是英特爾未來2年內(nèi),針對AI工作負載的算力解決方案,而2025年起,英特爾將採用高階GPU配置推出AI算力方案。
