九色综合狠狠综合久久,色一情一乱一伦一区二区三区,人人妻人人藻人人爽欧美一区,扒开双腿疯狂进出爽爽爽动态图

歡迎訪問深圳市中小企業(yè)公共服務(wù)平臺(tái)電子信息窗口

了解ARMv指令集的重要性,國產(chǎn)CPU自研指令集為何這么難?

2023-12-05 來源:賢集網(wǎng)
2730

關(guān)鍵詞: ARM 高通 龍芯

今年也是國產(chǎn)ARM芯片繼續(xù)停擺的一年。

去年此時(shí),ARM公司正式宣布拒絕向中國企業(yè)出售先進(jìn)的NeoverseV1和V2系列CPU設(shè)計(jì)IP。這意味著最先進(jìn)的ARM V9指令集版本,與國內(nèi)絕大多數(shù)企業(yè)無緣。在國產(chǎn)ARM迭代停滯的同時(shí),ARM指令集也在日新月異進(jìn)步。

不得不說,國產(chǎn)ARM芯片落后困境愈發(fā)嚴(yán)峻,留給廠商們尋找出路的時(shí)間不多了。



ARMv指令集發(fā)展史

無論是蘋果的自研核心還是ARM的原生IP,都需要以ARMv指令集作為地基。因此,ARMv指令集的強(qiáng)弱至關(guān)重要。

在進(jìn)入以iOS和Android系統(tǒng)為代表的智能手機(jī)時(shí)代之后,最早的手機(jī)處理器都是直接基于ARMv6指令集打造,代表產(chǎn)品有高通驍龍S1(包括MSM7x25),這些處理器連GPU都沒有。

ARMv7-A算是一次比較大的迭代更新,高通早期自研的Scorpion微架構(gòu)就是基于ARMv7-A指令集自主研發(fā)而來,代表產(chǎn)品有驍龍S1時(shí)期的QSD8x50。

ARM也是從ARMv7-A指令集開始,才大力發(fā)展原生核心IP的研發(fā)與授權(quán),從Cortex-A5到Cortex-A17,這些早期的32bit處理器核心就都是基于ARMv7-A打造而來。

為了迎接64bit時(shí)代,ARM在2016年推出了ARMv8-A指令集,其主打可伸縮矢量擴(kuò)展,專為高性能計(jì)算、數(shù)據(jù)中心而生。采用這一指令集的代表有Cortex-A53、Cortex-A57、Cortex-A72和Cortex-A73(還有嵌入式領(lǐng)域的A32和A35)。

2017年,ARM發(fā)布了ARMv8.2指令集,它引入了新的fp16運(yùn)算和int8 dot指令,優(yōu)化得當(dāng)就能大幅加速深度學(xué)習(xí)框架的推理效率。從Cortex-A55和Cortex-A75開始至今的所有SoC核心架構(gòu)都是基于ARMv8.2指令集研發(fā)的。

ARM在2021年3月31日正式發(fā)布了ARMv9指令集,它在兼容ARMv8的基礎(chǔ)上,不再局限于移動(dòng)/嵌入式市場,未來將發(fā)力PC、HPC高性能計(jì)算、深度學(xué)習(xí)等新市場,以滿足全球?qū)δ苋找鎻?qiáng)大的安全、人工智能和無處不在的專用處理的需求。

用ARM的話說,ARMv9是10年來最重要的創(chuàng)新,是未來3000億ARM芯片的基礎(chǔ)。



Armv9三大升級(jí),Armv8“遙遙落后”

自Arm于2011年10月首次發(fā)布Armv8架構(gòu)以來,ARM在2021年發(fā)布了新的內(nèi)核架構(gòu)Arm v9.2,Arm v9.2是針對(duì)Arm v8的首次重大升級(jí)?!笆昴ヒ粍Α保珹rm v9.2升級(jí)在哪兒?

據(jù)ARM高級(jí)副總裁、首席架構(gòu)師兼技術(shù)院士Richard Grisenthwaite介紹,Armv9繼續(xù)使用AArch64作為基準(zhǔn)指令集,但是在其功能上增加了一些非常重要的擴(kuò)展,主要是Arm在新架構(gòu)上增加了三個(gè)主要支柱,分別是安全能力、機(jī)器學(xué)習(xí)能力、改進(jìn)的矢量和DSP能力。

第一大支柱:安全性。在安全性方面,Armv9進(jìn)行了重大升級(jí),引入了新的安全功能,在兼容現(xiàn)有安全標(biāo)準(zhǔn)的基礎(chǔ)上,對(duì)TrustZone和Crypto做了擴(kuò)展,這些安全功能可以幫助開發(fā)者構(gòu)建更加安全的應(yīng)用程序,保護(hù)用戶的數(shù)據(jù)和隱私。以上的安全特性,國產(chǎn)Armv8處理器是完全不具備的。這就意味著,針對(duì)安全需求明顯的客戶,基于Armv8的國產(chǎn)芯片硬傷明顯,而且無法通過軟實(shí)力的更新進(jìn)行彌補(bǔ)。

第二大支柱:機(jī)器學(xué)習(xí)/AI能力。從技術(shù)演進(jìn)和發(fā)展的態(tài)勢可以看到,機(jī)器學(xué)習(xí)的負(fù)載或者程序類級(jí)別在通用平臺(tái)中的計(jì)算和使用已經(jīng)成為常態(tài)。機(jī)器學(xué)習(xí)是Armv9的重要組成部分,Armv9引入了新的AI和機(jī)器學(xué)習(xí)功能,包括支持INT8和BF16運(yùn)算的向量運(yùn)算單元以及支持矢量矩陣運(yùn)算的擴(kuò)展(SVE2)。這些功能可以提升AI和機(jī)器學(xué)習(xí)的性能,加速語音識(shí)別、圖像處理等應(yīng)用的發(fā)展。

第三大支柱:改進(jìn)的矢量和DSP能力。Arm進(jìn)一步開發(fā)了SVE2(Scalable Vector Extension 2),增加了新的矢量運(yùn)算和矩陣運(yùn)算指令,以增強(qiáng)機(jī)器學(xué)習(xí)和數(shù)字信號(hào)處理能力,這些擴(kuò)展可極大增益基于Armv9架構(gòu)的處理器在人工智能、圖像處理、音頻處理和高性能計(jì)算等應(yīng)用領(lǐng)域中實(shí)現(xiàn)更高的性能和更低的碳消耗。

與Armv9支持的卓越AI能力相比,Armv8.2就顯得非常的局限,在高速發(fā)展的AI時(shí)代,Armv8.2被拋棄將只是時(shí)間問題。當(dāng)然,我們可以從技術(shù)的角度嘗試彌補(bǔ)Armv8架構(gòu)在SVE2實(shí)現(xiàn)上的功能弱勢,包括但不限于使用軟件庫或編譯器優(yōu)化來模擬SVE2的行為。但這種招式好比一把雙刃劍,殺敵一千自損八百,增加了程序設(shè)計(jì)的復(fù)雜度又帶來了性能上的開銷成本,如何做好資源的平衡,又是一個(gè)囚徒困境的問題。

總之,Armv9在性能上進(jìn)一步提升了性能,包括更高的運(yùn)行速度、更低的功耗以及更強(qiáng)的并行處理能力。這些改進(jìn)使得Armv9能夠更好地滿足不斷增長的計(jì)算需求和更好的用戶體驗(yàn)。當(dāng)然對(duì)于整體性能而言,Armv9通過改進(jìn)了系統(tǒng)級(jí)性能,如增加內(nèi)存帶寬、降低內(nèi)存延遲等。以上改進(jìn)項(xiàng)可以使得基于Armv9的處理器能夠更好地支持復(fù)雜的多任務(wù)處理和高負(fù)載應(yīng)用程序。


主流國產(chǎn)CPU指令集皆來自國外

從零自研CPU最難點(diǎn)在于生態(tài)建設(shè),x86與ARM主流地位建立在壟斷性的生態(tài)根基上。當(dāng)前國產(chǎn)CPU發(fā)展的突圍捷徑,有且只有借勢而為主流指令集生態(tài)。

事實(shí)上,我國六大主流CPU廠商,兆芯、海光、鯤鵬、飛騰、龍芯、申威,其指令集技術(shù)皆來自國外,主要目的在于借勢已成熟的指令集生態(tài)。

兆芯、海光選用x86架構(gòu),兼容了最廣泛的x86生態(tài),在服務(wù)器、PC領(lǐng)域是平替Intel、AMD的最佳選擇。對(duì)于用戶而言,這意味無需繁瑣的編譯開發(fā)工作,即可將業(yè)務(wù)數(shù)據(jù)遷移國產(chǎn)CPU平臺(tái),減少時(shí)間、人力成本,順暢過渡到國內(nèi)的x86體系。

鯤鵬、飛騰則選用ARM架構(gòu),一方面在于ARM架構(gòu)的商業(yè)模式,廠商可在授權(quán)公版架構(gòu)基礎(chǔ)上進(jìn)一步研發(fā),從技術(shù)角度開發(fā)門檻低,成品速度快;另一方面,ARM近些年有意進(jìn)軍服務(wù)器市場,雖目前占比僅在7%,但上下游生態(tài)發(fā)展較為迅速。

而龍芯的LoongArch,也是基于MIPS架構(gòu)借鑒而來,可直接兼容MIPS架構(gòu)生態(tài)。不過MIPS架構(gòu)其實(shí)早在幾年前就已名存實(shí)亡,因此龍芯面臨著從零建設(shè)生態(tài)的困難。一邊以轉(zhuǎn)譯器等方式兼容主流x86生態(tài),一邊積極開拓原生應(yīng)用。好在攻難克艱,生態(tài)發(fā)展穩(wěn)步推進(jìn)。例如,近期騰訊會(huì)議宣布已原生支持龍芯系列。

從國內(nèi)主流CPU廠商的架構(gòu)選擇可看出,發(fā)展道路殊途同歸。指令集都引自國外,生態(tài)也要兼容國外。那么問題又來了,國內(nèi)以技術(shù)引進(jìn)的方式尋求CPU產(chǎn)業(yè)突圍,這樣還能算是自主發(fā)展嗎?



國外引進(jìn)與自主并不相悖,技術(shù)可控才是關(guān)鍵

在國外CPU巨頭先發(fā)優(yōu)勢下,后來者從零趕超難如登天。國內(nèi)CPU技術(shù)發(fā)展道路,亦如國產(chǎn)高鐵、大飛機(jī)“引進(jìn)消化再創(chuàng)新”一樣,國外引進(jìn)與自主創(chuàng)新并不相悖。

在“引進(jìn)消化再創(chuàng)新”的過程中,評(píng)判技術(shù)自主的標(biāo)志在于,專利不侵權(quán),同時(shí)不依賴國外完成差異化創(chuàng)新;更關(guān)鍵的在于可控,即產(chǎn)品有是否的迭代空間、技術(shù)是否有進(jìn)化潛力。當(dāng)前,國內(nèi)稱得上“自主且可控”,主要為龍芯、申威、海光、兆芯。

龍芯LoongArch架構(gòu)已獲得第三方專利認(rèn)證,雖存在與MIPS的專利糾紛,但目前已基本解決,僅剩1條為待定事項(xiàng)。同時(shí),龍芯產(chǎn)品經(jīng)幾年的發(fā)展追趕,性能基本將近2019年Intel發(fā)布的十代酷睿水平,體現(xiàn)出龍芯產(chǎn)品迭代發(fā)展的潛力,未來可期。

海光在ZEN1基礎(chǔ)上,多年高強(qiáng)度持續(xù)研發(fā)投入,目前已完成對(duì)引進(jìn)技術(shù)的消化吸收創(chuàng)新。從海光增添安全計(jì)算模塊,解決漏洞堵掉后門,以及三年三款產(chǎn)品自主迭代可以看出,海光的確有能力、有權(quán)利動(dòng)刀ZEN1內(nèi)核,走出與AMD后續(xù)ZEN架構(gòu)不同的道路。從而證明了海光對(duì)技術(shù)可以做到自主可控。

而鯤鵬、飛騰等國產(chǎn)ARM廠商,技術(shù)發(fā)展方面,更多表現(xiàn)為“自主但不可控”。雖然兩家廠商在ARM授權(quán)架構(gòu)基礎(chǔ)上,可以自主研發(fā)出性能不錯(cuò)的ARM芯片;但問題在于ARM公司目前已經(jīng)斷供先進(jìn)版本授權(quán),這意味著掐斷了國內(nèi)ARM芯片的迭代發(fā)展之路。而受專利限制,國內(nèi)ARM廠商也無權(quán)基于現(xiàn)有架構(gòu)授權(quán),自研微架構(gòu)迭代。

并且隨著ARM赴美上市進(jìn)度加速,ARM公司卡脖子行為已實(shí)質(zhì)發(fā)生。因此國產(chǎn)ARM技術(shù)發(fā)展,實(shí)際已做不到自主可控;國內(nèi)對(duì)ARM架構(gòu)的摸索,也成為一次錯(cuò)誤嘗試。

國內(nèi)CPU發(fā)展的發(fā)力方向應(yīng)該在于,完成引進(jìn)技術(shù)的消化與創(chuàng)新,在國外的先進(jìn)技術(shù)基礎(chǔ)上實(shí)現(xiàn)自主可控。這樣才能最大限度發(fā)揮后發(fā)優(yōu)勢,站在前人肩膀上實(shí)現(xiàn)后來者逆襲。