華為芯片和硬件戰(zhàn)略Fellow艾偉:把握ARM架構(gòu)未來(lái)黃金十年
華為芯片和硬件戰(zhàn)略Fellow艾偉分析了新時(shí)期算力架構(gòu)的發(fā)展趨勢(shì)。他認(rèn)為未來(lái)十年是屬于ARM架構(gòu)的黃金十年,而且會(huì)重寫X86的輝煌,而華為現(xiàn)在能夠提供基于全ARM的開(kāi)發(fā)平臺(tái),希望工程師們?cè)谛碌挠?jì)算架構(gòu)中建立自己的新技能。
ARM正在重演X86的輝煌歷史
艾偉說(shuō),從2000年到2020年算力架構(gòu)在發(fā)生變化。
第一,2000年X86占據(jù)市場(chǎng)第一的份額,總算力輸出達(dá)到了70%。到了2020年,算力架構(gòu)發(fā)生了逆轉(zhuǎn),世界上最大算力架構(gòu)變成了ARM平臺(tái),基于ARM指令的處理器總算力輸出達(dá)到了全球82%。
第二,上游產(chǎn)業(yè)產(chǎn)生端到端變化。一是半導(dǎo)體先進(jìn)工藝的發(fā)展,已經(jīng)不再由PC機(jī)牽引,而轉(zhuǎn)向了ARM架構(gòu)的智能手機(jī),ARM成為半導(dǎo)體產(chǎn)業(yè)的主要驅(qū)動(dòng)力。二是基于ARM的產(chǎn)品形態(tài)更加豐富多彩,在這種情況下,軟件工程師就擁有了一個(gè)更加開(kāi)放、多樣化的創(chuàng)新平臺(tái),現(xiàn)在ARM平臺(tái)上的軟件越來(lái)越多。
艾偉表示,人們的質(zhì)疑點(diǎn)是ARM現(xiàn)在還是下里巴人,性能比X86要低。但追溯歷史,可以看到當(dāng)年X86與UNIX相比,性能也要遜色,但自PC機(jī)從上世紀(jì)80年代開(kāi)始興起之后,1993年基于X86架構(gòu)的PC機(jī)的總算力輸出超過(guò)了基于UNIX的大型機(jī)和小型機(jī)。1998年英特爾推出的至強(qiáng)處理器達(dá)到服務(wù)器水平,量變轉(zhuǎn)化成質(zhì)變,到現(xiàn)在X86依然占據(jù)整個(gè)數(shù)據(jù)中心90%以上的市場(chǎng)份額,整個(gè)替換過(guò)程是顛覆性變化。
如今,這個(gè)歷史可能會(huì)再次被重復(fù)。而主角換成了ARM。
2007年智能手機(jī)上市,很快到了2013年,智能手機(jī)的算力輸出超過(guò)了X86,2019年,基于ARM架構(gòu)的鯤鵬920處理能力達(dá)到了高端服務(wù)器的水平。從量變到質(zhì)變的故事會(huì)再次發(fā)生。
工程師要在新計(jì)算架構(gòu)中建立技能
“對(duì)于每一位工程師來(lái)說(shuō),在這個(gè)時(shí)候需要把自己的技能轉(zhuǎn)移到新的計(jì)算架構(gòu)中去?!卑瑐ミ@樣建議。
目前半導(dǎo)體的摩爾定律遇到了瓶頸。以前處理器主頻升高會(huì)使性能越來(lái)越好,但當(dāng)處理器性能達(dá)到一定水平時(shí),再提高主頻會(huì)碰到巨大的功耗約束。如何突破這個(gè)瓶頸,繼續(xù)提高CPU的算力呢?
艾偉說(shuō),我們已經(jīng)看到了一條路徑——多核并行。這個(gè)路徑在ARM架構(gòu)上走得比較快。從手機(jī)看,很早就實(shí)現(xiàn)了四核到八核的處理器;從服務(wù)器來(lái)看,華為推出第一代鯤鵬910時(shí),推出了32核的處理器,去年發(fā)布的鯤鵬920,再次把處理器CPU核數(shù)提高到64核,其中CPU的核心架構(gòu)也是華為自研的。
“這種情況帶來(lái)整個(gè)產(chǎn)業(yè)趨勢(shì)的變化,我們看到現(xiàn)在不只是華為,已經(jīng)上市的多個(gè)ARM處理器都在增加更多的核數(shù)?!卑瑐フf(shuō)。其中也包括英特爾、AMD。利用多核處理器提升算力,軟件工程師也因此面臨新挑戰(zhàn)。
除了處理器的多核趨勢(shì),新的計(jì)算架構(gòu)里,還需要一個(gè)高速低時(shí)延的總線,能夠?qū)崿F(xiàn)更加快捷的訪問(wèn)數(shù)據(jù)、訪問(wèn)外設(shè)、訪問(wèn)網(wǎng)絡(luò)。所以最底層的物理技術(shù)也要提升。艾偉說(shuō),鯤鵬920支持8通道內(nèi)存訪問(wèn),整個(gè)性能提升了64%,可以用更多的數(shù)據(jù)及時(shí)喂養(yǎng)給CPU做計(jì)算。華為提供了PCIe4.0總線性能,支持64G總線性能,可以用更多的方式連接外設(shè)和網(wǎng)絡(luò)。
“當(dāng)我們把先進(jìn)半導(dǎo)體工藝、多核架構(gòu)、高速內(nèi)存訪問(wèn)、高速總線連接在一起,我們?yōu)檎麄€(gè)軟件產(chǎn)業(yè)提供了更加開(kāi)放而且持續(xù)實(shí)現(xiàn)性能提升的平臺(tái)。”艾偉說(shuō),“這個(gè)平臺(tái)意味著我們?nèi)匀豢梢垣@得更加廉價(jià)充沛的算力支持?!?/p>
半個(gè)世紀(jì)以前的大型機(jī)和小型機(jī)時(shí)代,用戶少、應(yīng)用數(shù)目少;PC機(jī)時(shí)代,每年可以達(dá)到上億新增用戶,應(yīng)用數(shù)目達(dá)到十萬(wàn)級(jí)別;智能手機(jī)時(shí)代和云手機(jī)時(shí)代,用戶數(shù)增長(zhǎng)達(dá)到了十億級(jí)別,軟件達(dá)到了百萬(wàn)級(jí)別。艾偉說(shuō),所有這些上層應(yīng)用的繁榮、軟件的繁榮,都是從底層開(kāi)始改變,讓單位成本所購(gòu)買的算力,提升了十億倍,這是一個(gè)非常驚人的數(shù)據(jù),而且今后華為還會(huì)持續(xù)提升性價(jià)比,提供更加充沛的算力。
華為提供基于全ARM的開(kāi)發(fā)平臺(tái)
讓一個(gè)產(chǎn)業(yè)接受一個(gè)新的指令架構(gòu),需要做很多底層工作。艾偉說(shuō),我們從操作系統(tǒng)到中間件,再到軟件開(kāi)發(fā)工具,各個(gè)方面都逐步充實(shí)了ARM上基本的軟件平臺(tái)支持。從早期只有少數(shù)的幾十個(gè)應(yīng)用,到現(xiàn)在有2000多個(gè)應(yīng)用,而且應(yīng)用量呈現(xiàn)加速發(fā)展勢(shì)頭,這得益于我們具備了完整的軟件開(kāi)發(fā)平臺(tái)和工具環(huán)境。
把一個(gè)軟件從一個(gè)CPU遷移到另外一個(gè)CPU,除了可能會(huì)帶來(lái)性能提升、成本下降、功耗降低的好處,最關(guān)鍵的是在新的CPU上做出的創(chuàng)新功能和創(chuàng)新價(jià)值如何體現(xiàn)?
艾偉認(rèn)為,答案在5G網(wǎng)絡(luò)。5G網(wǎng)絡(luò)可以用更寬的帶寬、更低的時(shí)間實(shí)現(xiàn)對(duì)終端、對(duì)云計(jì)算、對(duì)數(shù)據(jù)中心的連接,而且5G網(wǎng)絡(luò)不只是一個(gè)簡(jiǎn)單的通用計(jì)算,它會(huì)面向人工智能。
在4G網(wǎng)絡(luò)上,中國(guó)各個(gè)產(chǎn)業(yè)得到大發(fā)展,如移動(dòng)互聯(lián)網(wǎng)、移動(dòng)支付、共享經(jīng)濟(jì)、微信、短視頻等等。4G網(wǎng)絡(luò)的空口時(shí)延是10毫秒,從終端發(fā)起一個(gè)呼叫到返回到被呼叫終端的響應(yīng)時(shí)間是100毫秒,手機(jī)游戲的玩家可以清晰地看到時(shí)延數(shù)據(jù),這個(gè)時(shí)延數(shù)據(jù)匹配了人體的手、眼、腦的反映時(shí)間,所以我們覺(jué)得很流暢。
在5G網(wǎng)絡(luò)中,帶寬和時(shí)延的性能改進(jìn)了10倍。艾偉說(shuō),5G網(wǎng)絡(luò)的時(shí)延降低到1毫秒,端到端的請(qǐng)求響應(yīng)時(shí)間降到10毫秒,這個(gè)時(shí)延超過(guò)了人體神經(jīng)的反應(yīng),會(huì)給AR、VR應(yīng)用帶來(lái)新的體驗(yàn)。同時(shí)在智能終端上,在機(jī)器人的應(yīng)用上,會(huì)更廣泛。利用5G網(wǎng)絡(luò),數(shù)字世界和物理世界能夠更緊密地連接起來(lái),通過(guò)軟件算法的運(yùn)算給出高價(jià)值的信息,優(yōu)化物理世界,這個(gè)世界會(huì)發(fā)生不可逆轉(zhuǎn)的變化。
為實(shí)現(xiàn)這樣的變化,華為提供了一個(gè)更加全面的、基于全ARM的開(kāi)發(fā)平工具平臺(tái)。“我們可能不再需要買一個(gè)X86的PC了,只要是基于ARM的手機(jī)、基于ARM的PC,甚至于基于ARM的智能電視,都可以實(shí)現(xiàn)編程功能?!卑瑐フf(shuō),“我們可以實(shí)現(xiàn)隨時(shí)隨地的編程和創(chuàng)造,我們可以得到觸手可得的開(kāi)發(fā)工具,讓靈感創(chuàng)造持續(xù)發(fā)揮出來(lái)。”而更重要的是,在掌握這些軟件技能后,應(yīng)用可以部署在終端、部署在邊緣計(jì)算、部署在數(shù)據(jù)中心的云計(jì)算,所有這些部署場(chǎng)景,都是機(jī)會(huì)。
艾偉說(shuō),我們相信在一個(gè)全ARM的開(kāi)發(fā)環(huán)境,以及全ARM的應(yīng)用運(yùn)行部署環(huán)境上,軟件工程師會(huì)得到更高效率,以及更廣闊的職業(yè)發(fā)展前景。
