以經(jīng)過簡化的AI訓練管道流程來看,在數(shù)據(jù)采集進來后的數(shù)據(jù)存儲階段對主內(nèi)存的需求以小于1TB來計算(實際應用中一個集群或?qū)嵗膬?nèi)存容量會是簡化模型的數(shù)倍。),這時GPU還無須參與訓練中。
到了數(shù)據(jù)準備階段,將數(shù)據(jù)進行整理、驗證,此時主內(nèi)存容量上升到1TB。比如SDXL訓練網(wǎng)絡(luò)架構(gòu),在數(shù)據(jù)準備階段,所有的圖像都要被規(guī)整成統(tǒng)一的規(guī)格、大小、像素、尺寸,從而更加高效的利用到網(wǎng)絡(luò)中的這些資源,降低延遲和在空間展示中節(jié)省資源。
在AI訓練階段,不僅需要強大的GPU內(nèi)存,主內(nèi)存的容量需求會是GPU內(nèi)存的兩倍,且必須有非常高的帶寬,才能讓GPU本地內(nèi)存滿足數(shù)據(jù)的吞吐速度。由此可見,DDR5內(nèi)存對于AI訓練的重要性。
Rambus為 DDR5 服務(wù)器內(nèi)存模塊提供完整的內(nèi)存接口芯片組,包含 RCD、PMIC、SPD Hub、溫度傳感器 IC。Rambus最近推出最先進的全新DDR5 服務(wù)器電源管理IC(PMIC)系列,包含適用于高性能應用的業(yè)界領(lǐng)先超高電流電源器件,滿足AI及其他高級工作負載對最高性能與容量內(nèi)存模塊的需求。
Rambus DDR5服務(wù)器PMIC產(chǎn)品特點
PMIC是DDR5內(nèi)存架構(gòu)中的關(guān)鍵組件,可實現(xiàn)更多的內(nèi)存通道、更大容量的模組和更高的帶寬。Rambus DDR5服務(wù)器PMIC系列包含符合JEDEC超高電流(PMIC5020)、高電流(PMIC5000)和低電流(PMIC5010)規(guī)范的產(chǎn)品。
JEDEC定義了三種不同的PMIC,針對不同的電流輸出水平。它們都共享相同的封裝尺寸、引腳布局,并且大多數(shù)寄存器集相同。每種設(shè)計的電源效率都針對其目標應用的預期電流水平進行了優(yōu)化。
極高電流的PMIC 5020目標是約30安培的最大持續(xù)直流電流,是這三種服務(wù)器PMIC中最新定義的。Rambus是首家提供樣品的公司。該PMIC針對的是最高帶寬和最高容量的模塊。
高電流PMIC 5000一直是主要的PMIC,支持的最大持續(xù)直流電流大約為20安培。這款特定的PMIC針對標準到四階模塊,容量為64GB、96GB和128GB。低電流 PMIC 5010 面向容量較低的市場,它支持的最大持續(xù)電流約為 12 安培。
大多數(shù)速率高達 60,400 MT/s 的 DDR5 RDIMM 都使用 PMIC 5000 高電流版本和 PMIC 5010 低電流版本 PMIC。目前這兩種型號正處于大批量生產(chǎn)階段。
而新發(fā)布的PMIC5020,主要用于數(shù)據(jù)速率達到7200MT/s的第四代DDR5,以及第一代的MRDIMM模組,另外,還包括一些6400MT/s數(shù)據(jù)速率但容量特別高的如256GB內(nèi)存模組,也會使用超高電流的PMIC5020。
Rambus內(nèi)存互連芯片業(yè)務(wù)部門產(chǎn)品營銷副總裁John Eble表示,Rambus提供完整的DDR5 RDIMM芯片組,對于我們的客戶、客戶的用戶,以及整個生態(tài)系統(tǒng)是多贏的。對于DDR5 RDIMM完整芯片組,我們是經(jīng)過預先驗證的,可以帶給客戶具有經(jīng)過驗證的互操作性和非常優(yōu)秀的時序、功率優(yōu)化,而且也有足夠穩(wěn)健的供應鏈供給。
設(shè)計挑戰(zhàn)
應用DDR5技術(shù)的DIMM架構(gòu)如何實現(xiàn)更高的內(nèi)存性能。John Eble進行了詳細解析。
現(xiàn)在DDR5內(nèi)存已經(jīng)開始轉(zhuǎn)移到雙通道架構(gòu),在展現(xiàn)的DDR5 RDIMM架構(gòu)在DDR5當中數(shù)據(jù)流的通道比特率是32,另外加上8位ECC,來保證他們在連接器上有著各自所需的存儲和吞吐量以及內(nèi)存性能。
上圖中的雙通道 RCD 現(xiàn)在在主機端以 DDR5 速度運行。因此它的運行速度與 DRAM 相同。圖中每個引腳的開關(guān)頻率將比DDR4高出一倍多。
DDR5的每通道最高頻率速度達到8400MT/s。但實際上根據(jù)JEDEC今年4月發(fā)布的最新數(shù)據(jù),表示在DRAM的規(guī)格當中可以達到8800MT/s的速度。
更高的數(shù)據(jù)傳輸速率(裕度至關(guān)重要),所有這些數(shù)據(jù)信號所需的連接器引腳數(shù)量的增加以及主電源電壓從 1 至 1.2 伏降至 1.1 伏,這些因素共同促使決定采用專用的電源管理IC,幫助控制更加精細的電壓。
DDR5模塊增加了PMIC和相關(guān)的無源組件,這是DDR4到DDR5最顯著的變化之一。
通過將電源管理集成到內(nèi)存模塊(DIMM)上,主板可以為內(nèi)存模塊提供單一的高電壓電源。由內(nèi)存模組上的PMIC向模組提供輸入高壓12V電源,避免通過模塊連接器從主板向內(nèi)存模組組件輸出如1V的電壓,大大降低了輸電網(wǎng)絡(luò)上的IR下降問題。
PMIC有四個開關(guān)降壓調(diào)節(jié)器,其中兩個采用雙相配置,兩個低壓差調(diào)節(jié)器,為模塊上的各種組件產(chǎn)生總共五個不同的電壓供應和電壓水平。
PMIC可以針對其所在的特定模塊進行調(diào)整。隨著用戶增加內(nèi)存容量,他們以遞增的方式為服務(wù)器添加電源管理。因此,將PMIC集成到內(nèi)存模塊上極大地簡化主板設(shè)計,減少所需的面積,并降低電源系統(tǒng)過度配置的浪費。
為了實現(xiàn)更高的數(shù)據(jù)傳輸速率,DDR5需要更嚴格且精準的電壓范圍。在電源配置變化的情況下,它需要非常低的噪音,要在較低電壓下保持可靠性。
電源設(shè)計上的挑戰(zhàn)來看,首先是散熱問題。PMIC會產(chǎn)生熱量,而且它靠近對熱非常敏感的DRAM。因此,進行熱模擬并確保熱量以一種不會影響模塊的方式消散,這一點非常重要。
第二個設(shè)計挑戰(zhàn)是如何將PMIC及其無源元件安裝在模塊上,因為模塊的尺寸是固定的。模塊上已經(jīng)有很多元器件。因此為PMIC騰出空間,確保其功率完整性達到最佳狀態(tài),并確保其不會造成任何干擾或散熱問題,這是一個很大的挑戰(zhàn)。
第三個挑戰(zhàn)是確保PMIC上的開關(guān)穩(wěn)壓器不會將任何不需要的噪聲引入DIMM的其他部分。
最后是需要確保PMIC可靠且強大。Rambus 專門內(nèi)置了特殊電路來處理可能的壓力條件,以確保擁有非常強大的部件。
憑借在高性能內(nèi)存領(lǐng)域積累30多年的經(jīng)驗,Rambus已成為RDIMM制造商的“一站式” DDR5 內(nèi)存接口芯片供應商,能夠為制造商提供最高級別的驗證保證并加快其產(chǎn)品上市時間。
中國市場
中國內(nèi)存市場蓬勃發(fā)展,已經(jīng)形成了內(nèi)存顆粒、內(nèi)存模組、服務(wù)器、OEM、ODM、云一套連貫的生態(tài)鏈,中國在全球的內(nèi)存生態(tài)里扮演著非常重要的一環(huán)。
Rambus大中華區(qū)總經(jīng)理蘇雷表示,Rambus中國的業(yè)務(wù)理念不單單把自己作為一個產(chǎn)品的供應方,更多的是定位成業(yè)務(wù)的合作伙伴,助力中國內(nèi)存整個產(chǎn)業(yè)鏈的生態(tài)發(fā)展。我們通過跟內(nèi)存上下游合作伙伴的緊密協(xié)同工作,通過利用Rambus內(nèi)存產(chǎn)品方面的經(jīng)驗和積累去服務(wù)好中國市場。
無論是在客戶產(chǎn)品布局,還是產(chǎn)品設(shè)計、研發(fā)問題定位、甚至量產(chǎn)階段,Rambus通過提供高效、優(yōu)質(zhì)的產(chǎn)品和全面、細致的技術(shù)服務(wù)與行業(yè)經(jīng)驗,來踐行“in China for China”的理念,最終實現(xiàn)跟客戶的成長與共贏。
寫在最后
John Eble對DDR5和PMIC發(fā)展情況做一些預判。隨著對更高性能和電源效率的需求不斷增長,未來可能會定義新型內(nèi)存模塊?,F(xiàn)在業(yè)界已經(jīng)經(jīng)歷了將 PMIC 集成到模塊驗證和認證中的學習曲線,并看到了由此帶來的好處。那么,很有可能會繼續(xù)在模塊上集成PMIC,以進一步優(yōu)化電源管理并提高整體系統(tǒng)性能。這將成為一種趨勢。
DDR5 在服務(wù)器和個人電腦領(lǐng)域都得到了相當迅速的采用。在服務(wù)器方面也即將達到平衡點。據(jù)集邦咨詢的報告,預計下個季度DDR5 普及率將超過 50%。
另外,PMIC 供應對DDR5服務(wù)器模塊來說非常重要。早前曾出現(xiàn)過PMIC 短缺的問題,不過現(xiàn)在整個供應鏈已經(jīng)恢復,目前沒有看到PMIC供應短缺的情況。