企業(yè)發(fā)布

打通AI芯片到大模型訓(xùn)練的算力橋梁，開放加速設(shè)計(jì)指南強(qiáng)力助推

2023/10/17 15:27:44 來源：中國(guó)企業(yè)新聞網(wǎng) 評(píng)論：(0)

導(dǎo)言：日前，2023全球AI芯片峰會(huì)（GACS 2023）在深圳市舉行，AI芯片產(chǎn)業(yè)鏈頂尖企業(yè)、專家學(xué)者齊聚，圍繞生成式AI與大模型算力需求、AI芯片高效落地等產(chǎn)業(yè)議題進(jìn)行研討分享。

　　日前，2023全球AI芯片峰會(huì)（GACS 2023）在深圳市舉行，AI芯片產(chǎn)業(yè)鏈頂尖企業(yè)、專家學(xué)者齊聚，圍繞生成式AI與大模型算力需求、AI芯片高效落地等產(chǎn)業(yè)議題進(jìn)行研討分享。

　　面向大模型時(shí)代的計(jì)算需求，算力創(chuàng)新已不僅是單個(gè)處理器微架構(gòu)和芯片工藝的突破，而需要產(chǎn)業(yè)攜手進(jìn)行軟硬件全棧系統(tǒng)架構(gòu)全面創(chuàng)新。當(dāng)前各類AI芯片創(chuàng)新仍面臨存儲(chǔ)墻、功耗墻等架構(gòu)痼疾，隨著開放的通用指令架構(gòu)、互聯(lián)總線、AI加速器、開源的操作系統(tǒng)、模型框架、工具鏈和軟件紛紛涌現(xiàn)，開放開源的算力系統(tǒng)創(chuàng)新，已經(jīng)成為實(shí)現(xiàn)AI芯片轉(zhuǎn)化為高效算力的二級(jí)引擎。

　　會(huì)上，浪潮信息分享了在開放加速計(jì)算系統(tǒng)領(lǐng)域的最新成果《開放加速規(guī)范AI服務(wù)器設(shè)計(jì)指南》，通過系統(tǒng)平臺(tái)層面的技術(shù)創(chuàng)新，攜手產(chǎn)業(yè)上下游加速生成式AI算力產(chǎn)業(yè)發(fā)展。

　　大模型推動(dòng)算力產(chǎn)業(yè)步入系統(tǒng)級(jí)創(chuàng)新時(shí)代

　　隨著制程工藝逼近天花板，AI芯片正迎來架構(gòu)創(chuàng)新的黃金時(shí)代，諸多創(chuàng)新者正通過越來越廣泛的創(chuàng)新思路來繞過摩爾定律瀕臨極限的瓶頸，圍繞架構(gòu)創(chuàng)新，AI芯片產(chǎn)業(yè)正從早期的百花齊放，向更深更多維層面發(fā)展。

　　與此同時(shí)，參數(shù)量高達(dá)數(shù)千億的大模型創(chuàng)新往往需要在成百上千的AI服務(wù)器組成的平臺(tái)上進(jìn)行訓(xùn)練。面向AIGC的算力能力考量的不僅僅是單一芯片、或者是單一服務(wù)器，而是包含計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)設(shè)備，軟件、框架、模型組件，機(jī)柜、制冷、供電基礎(chǔ)設(shè)施等在內(nèi)的一體化高度集成的智算集群。

　　因此，要將AI芯片真正轉(zhuǎn)化為大模型算力，需要產(chǎn)業(yè)鏈上下游攜手從規(guī)模化算力部署的角度進(jìn)行系統(tǒng)級(jí)創(chuàng)新，統(tǒng)籌考慮大模型訓(xùn)練需求特點(diǎn)，設(shè)計(jì)構(gòu)建算力系統(tǒng)，以實(shí)現(xiàn)全局最優(yōu)的性能、能效或TCO指標(biāo)。

　　開放加速設(shè)計(jì)指南，打通從芯片到大模型的算力橋梁

　　2019年，開放計(jì)算組織OCP面向大模型訓(xùn)練發(fā)布了開放加速計(jì)算（OAI）技術(shù)標(biāo)準(zhǔn)，旨在促進(jìn)上下游協(xié)同，降低產(chǎn)業(yè)創(chuàng)新成本和周期。開放加速計(jì)算（OAI）系統(tǒng)架構(gòu)具備更高的散熱和互聯(lián)能力，可以承載具有更高算力的芯片，同時(shí)具備非常強(qiáng)的跨節(jié)點(diǎn)擴(kuò)展能力。因?yàn)樘烊贿m用于大規(guī)模深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),已經(jīng)在全球范圍內(nèi)得到芯片、系統(tǒng)及應(yīng)用廠商的廣泛參與支持。

　　大模型訓(xùn)練對(duì)開放加速計(jì)算系統(tǒng)的總功耗、總線速率、電流密度的需求不斷提升，給系統(tǒng)設(shè)計(jì)帶來了巨大的挑戰(zhàn)。因此，浪潮信息基于系統(tǒng)研發(fā)和大模型工程實(shí)踐經(jīng)驗(yàn)，將從AI芯片到大模型算力系統(tǒng)所需完成的體系結(jié)構(gòu)、信號(hào)完整性、散熱、可靠性、架構(gòu)設(shè)計(jì)等大量系統(tǒng)性設(shè)計(jì)標(biāo)準(zhǔn)進(jìn)行細(xì)化總結(jié)，發(fā)布了面向生成式AI場(chǎng)景的《開放加速規(guī)范AI服務(wù)器指南》（以下簡(jiǎn)稱《指南》），提出四大設(shè)計(jì)原則、全棧設(shè)計(jì)方法，包括硬件設(shè)計(jì)參考、管理接口規(guī)范和性能測(cè)試標(biāo)準(zhǔn)。

　　《開放加速規(guī)范AI服務(wù)器指南》全棧設(shè)計(jì)方法

　　《開放加速規(guī)范AI服務(wù)器指南》統(tǒng)籌考慮大模型分布式訓(xùn)練對(duì)于計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)的需求特點(diǎn)，提供了從節(jié)點(diǎn)層到集群層的AI芯片應(yīng)用部署全棧設(shè)計(jì)參考。包括各項(xiàng)硬件規(guī)范、電氣規(guī)范、時(shí)序規(guī)范，并提供管理、故障診斷和網(wǎng)絡(luò)拓?fù)湓O(shè)計(jì)等軟硬協(xié)同參考，旨在通過節(jié)點(diǎn)層/集群層多維協(xié)同設(shè)計(jì)確保AI服務(wù)器節(jié)點(diǎn)和服務(wù)器集群以超大規(guī)模集群互連的大模型訓(xùn)練能力。

　　基于板端QSFP-DD的跨節(jié)點(diǎn)互連拓?fù)?/strong>

　　由于架構(gòu)復(fù)雜度高、芯片種類多、高速信號(hào)多、系統(tǒng)功耗大等特點(diǎn)，異構(gòu)加速計(jì)算節(jié)點(diǎn)常面臨故障率高的問題。因此，《指南》提供了詳細(xì)的系統(tǒng)測(cè)試指導(dǎo)，對(duì)結(jié)構(gòu)、散熱、壓力、穩(wěn)定性、軟件兼容性等方面的測(cè)試要點(diǎn)進(jìn)行了全面梳理，幫助用戶最大程度降低系統(tǒng)生產(chǎn)、部署、運(yùn)行過程中的故障風(fēng)險(xiǎn)，提高系統(tǒng)穩(wěn)定性，減少斷點(diǎn)對(duì)訓(xùn)練持續(xù)性的影響。

　　OAM互連信號(hào)損耗要求

　　不同于通用計(jì)算系統(tǒng)，面向生成式AI的加速計(jì)算系統(tǒng)具有軟硬件強(qiáng)耦合特性。為了提高開放加速計(jì)算系統(tǒng)的算力可用性，《指南》給出了八類AI主流業(yè)務(wù)和三類AIGC大模型基準(zhǔn)測(cè)評(píng)和調(diào)優(yōu)方法，以確保開放加速計(jì)算系統(tǒng)能夠有效支撐當(dāng)前主流大模型的創(chuàng)新應(yīng)用。

　　AI芯片廠商可以基于《指南》快速將符合開放加速規(guī)范的AI芯片落地成高可用高可靠高性能的大模型算力系統(tǒng)，提高系統(tǒng)適配和集群部署效率，減少芯片合作伙伴在系統(tǒng)層面的研發(fā)成本投入，加速生成式AI算力產(chǎn)業(yè)的創(chuàng)新步伐。

　　全棧協(xié)同，高效釋放大模型創(chuàng)新生產(chǎn)力

　　目前，浪潮信息已經(jīng)基于開放加速規(guī)范發(fā)布了三代AI服務(wù)器產(chǎn)品，和10余家芯片伙伴實(shí)現(xiàn)了多元AI計(jì)算產(chǎn)品的創(chuàng)新研發(fā)。多元算力產(chǎn)品方案得到了眾多用戶的認(rèn)可，已經(jīng)在多個(gè)智算中心應(yīng)用落地，成功支持GPT-2、源1.0及實(shí)驗(yàn)室自研蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)等多個(gè)超大規(guī)模巨量模型的高效訓(xùn)練。

　　同時(shí)，為進(jìn)一步解決大模型算力的系統(tǒng)全棧問題、兼容適配問題、性能優(yōu)化問題等，浪潮信息基于大模型自身實(shí)踐與服務(wù)客戶的專業(yè)經(jīng)驗(yàn)，推出OGAI大模型智算軟件棧，能夠?yàn)榇竽Ｐ蜆I(yè)務(wù)提供AI算力系統(tǒng)環(huán)境部署、算力調(diào)度及開發(fā)管理的完整軟件棧和工具鏈，幫助更多企業(yè)順利跨越大模型研發(fā)應(yīng)用門檻，充分釋放大模型算力價(jià)值。

　　作為全球領(lǐng)先的AI算力基礎(chǔ)設(shè)施供應(yīng)商，浪潮信息將通過智算系統(tǒng)軟硬件高度協(xié)同進(jìn)行持續(xù)創(chuàng)新，攜手產(chǎn)業(yè)伙伴加速AI算力繁榮發(fā)展并充分釋放算力生產(chǎn)力，推動(dòng)實(shí)現(xiàn)"助百模，智千行"，加速生成式AI產(chǎn)業(yè)創(chuàng)新。

免責(zé)聲明：
※ 以上所展示的信息來自媒體轉(zhuǎn)載或由企業(yè)自行提供，其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本網(wǎng)站證實(shí)，對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本網(wǎng)站不作任何保證或承諾，請(qǐng)讀者僅作參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。如果以上內(nèi)容侵犯您的版權(quán)或者非授權(quán)發(fā)布和其它問題需要同本網(wǎng)聯(lián)系的，請(qǐng)?jiān)?0日內(nèi)進(jìn)行。
※ 有關(guān)作品版權(quán)事宜請(qǐng)聯(lián)系中國(guó)企業(yè)新聞網(wǎng)：020-34333079 郵箱：cenn_gd@126.com 我們將在24小時(shí)內(nèi)審核并處理。

分享到：

[責(zé)任編輯：姚小冰]

更多新聞，請(qǐng)關(guān)注
中國(guó)企業(yè)新聞網(wǎng)

標(biāo)簽：

相關(guān)網(wǎng)文

明日啟幕 | 信華信"論壇+展位"深度參與2023全球工業(yè)互聯(lián)網(wǎng)大會(huì) 2023-10-17

愛立信方迎談"5G進(jìn)化論"：以"四能"引領(lǐng)5G新浪潮 2023-10-17
萬代南夢(mèng)宮（中國(guó)）"筑夢(mèng)向未來，困境兒童陪伴計(jì)劃"在廣東開展 2023-10-17

A.O.史密斯AI-LiNK智能蒸烤一體機(jī)"蒸"得很健康 2023-10-17
蘭鈞首批314Ah電芯正式量產(chǎn)下線 2023-10-17

河南省際聯(lián)盟醫(yī)用耗材集采普益盛濟(jì)已中標(biāo) 2023-10-17
福建首個(gè)「上戲藝術(shù)特色課程教學(xué)基地」落戶華師希平雙語(yǔ)學(xué)校 2023-10-17

TÜV萊茵助力比亞迪海豹通過歐盟大批量WVTA認(rèn)證 2023-10-17
ISRA VISION榮獲長(zhǎng)期戰(zhàn)略合作伙伴獎(jiǎng) 2023-10-17

萊美新課程Strength Development，引領(lǐng)精品小團(tuán)體健身新方案 2023-10-17

24小時(shí)熱點(diǎn)圖片

中國(guó)海油：以油為
海關(guān)總署副署長(zhǎng)王
海關(guān)總署副署長(zhǎng)王
國(guó)家稅務(wù)總局“稅
王軍在河北調(diào)研稅

網(wǎng)客評(píng)論

一周新聞資訊點(diǎn)擊排行

亞運(yùn)會(huì)期間長(zhǎng)江干流六座梯級(jí)電站累計(jì)發(fā)電160億千瓦時(shí)
長(zhǎng)江電力入選“央企ESG·先鋒100”指數(shù)

·9月末，廣義貨幣(M2)余額289.67萬億元
·中國(guó)建筑發(fā)布2023年半年度計(jì)提資產(chǎn)減值準(zhǔn)備公告
·教育部辦公廳公布第一批市域產(chǎn)教聯(lián)合體名單
·憂遁寶品牌助力鄉(xiāng)村振興為健康產(chǎn)業(yè)保駕護(hù)航
·中央?yún)R金公司增持四大行A股股份
·前三季度，經(jīng)常項(xiàng)下跨境人民幣結(jié)算金額為10.16萬億元
·工業(yè)和信息化部等四部門印發(fā)綠色航空制造業(yè)發(fā)展綱要（2023-2035年）

圖片新聞

更多

中國(guó)海油：以油為媒共贏共榮
17.4萬立方米LNG運(yùn)輸船“文成”號(hào)命名交付
長(zhǎng)江電力入選“央企ESG·先鋒100”指數(shù)
中國(guó)中鐵投資建設(shè)的剛果（金）布桑加水電站開始發(fā)電

六度影院鲁鲁片在线看_亚洲av无码乱码国产精品_国产精品一二三入口播放_国产一区二区不卡高清更新