企業(yè)發(fā)布
首頁 > 企業(yè)發(fā)布 > 詳細(xì)內(nèi)容
浪潮首席科學(xué)家王恩東:從計(jì)算到智算計(jì)算產(chǎn)業(yè)迎來新格局,以創(chuàng)新應(yīng)答新挑戰(zhàn)
2021/4/16 9:35:30 來源:中國企業(yè)新聞網(wǎng)
導(dǎo)言:中國工程院院士,浪潮集團(tuán)執(zhí)行總裁、首席科學(xué)家王恩東15日在浪潮數(shù)據(jù)中心合作伙伴大會上表示,智慧時代,計(jì)算需求呈指數(shù)級增長,計(jì)算技術(shù)、產(chǎn)品與產(chǎn)業(yè)面臨著多元化、巨量化和生態(tài)化的新挑戰(zhàn)。
中國工程院院士,浪潮集團(tuán)執(zhí)行總裁、首席科學(xué)家王恩東15日在浪潮數(shù)據(jù)中心合作伙伴大會上表示,智慧時代,計(jì)算需求呈指數(shù)級增長,計(jì)算技術(shù)、產(chǎn)品與產(chǎn)業(yè)面臨著多元化、巨量化和生態(tài)化的新挑戰(zhàn)。計(jì)算產(chǎn)業(yè)迎來由計(jì)算到智算、多元算力融合、算力供給基建化的新格局。
當(dāng)天,“浪潮數(shù)據(jù)中心合作伙伴大會(IPF)2021”在蘇州舉行,王恩東在出席大會時作如上表述!
智慧計(jì)算無處不在,重塑著世界的方方面面,為第一、二、三產(chǎn)業(yè)發(fā)揮重要價值 -- 無人農(nóng)場、智能農(nóng)機(jī)、智慧農(nóng)業(yè)正在改變延續(xù)了上千年的農(nóng)業(yè)生產(chǎn)方式;智能工廠讓生產(chǎn)效率顯著提升;醫(yī)療機(jī)器人在抗擊新冠疫情中大顯身手,無接觸送貨、無人機(jī)送餐也已成為智慧物流的亮點(diǎn)。智慧計(jì)算已經(jīng)滲透進(jìn)各個行業(yè),讓智慧時代充滿希望。
十四五,數(shù)字經(jīng)濟(jì)推動智慧算力加速普及和升級,智慧時代,計(jì)算能力需求將出現(xiàn)巨大的飛躍。王恩東說:“面對指數(shù)級增長的計(jì)算需求,計(jì)算技術(shù)、產(chǎn)品與產(chǎn)業(yè)也面臨著三大挑戰(zhàn)。計(jì)算場景愈加復(fù)雜、計(jì)算架構(gòu)更加多元;巨量模型、巨量數(shù)據(jù)、巨量算力及巨量應(yīng)用挑戰(zhàn)著現(xiàn)有計(jì)算機(jī)體系結(jié)構(gòu),以及如何用開放包容地最大化生態(tài)效能。”
王恩東表示:“以創(chuàng)新應(yīng)答挑戰(zhàn),浪潮通過創(chuàng)新智算體系結(jié)構(gòu)、構(gòu)建智算產(chǎn)品體系、推動智算中心落地、建設(shè)元腦產(chǎn)業(yè)鏈生態(tài)引領(lǐng)智算發(fā)展。智慧計(jì)算,未來可期!薄
以下是演講全文:
歡迎大家來到太湖之濱,蒞臨“智算·向新”浪潮數(shù)據(jù)中心合作伙伴大會,正是由于在座各位的大力支持,浪潮在過去的一年又取得了高速的發(fā)展,繼續(xù)保持服務(wù)器全球第三,中國第一,并且成為全球人工智能計(jì)算的領(lǐng)導(dǎo)者。在此,感謝大家一年來對浪潮的支持和幫助,謝謝大家!
過去的一年,應(yīng)該說是極不平凡的一年,全球新冠病毒肆虐,徹底改變了人類的生活方式,“綠水青山枉自多,全球無奈病毒何”,全球經(jīng)濟(jì)出現(xiàn)大幅的下滑,美國發(fā)起的貿(mào)易戰(zhàn)愈演愈烈,對全球經(jīng)濟(jì)雪上加霜,中國率先控制住了疫情,率先實(shí)現(xiàn)了經(jīng)濟(jì)恢復(fù)和增長,完勝脫貧攻堅(jiān)戰(zhàn),制定了激動人心的“十四五”規(guī)劃,宣告中國進(jìn)入了新的發(fā)展階段,將構(gòu)建以國內(nèi)大循環(huán)為主體、國內(nèi)國際雙循環(huán)相互促進(jìn)的新發(fā)展格局。
在過去一年,大家聽到最多的一個詞就是創(chuàng)新,創(chuàng)新在新發(fā)展理念中的核心地位深入人心,創(chuàng)新驅(qū)動發(fā)展也是“十四五”規(guī)劃的關(guān)鍵詞。創(chuàng)新就是生產(chǎn)力,企業(yè)賴之以強(qiáng)、國家賴之以盛。創(chuàng)新也是浪潮的核心價值觀之一,創(chuàng)新、誠信、共贏更是浪潮堅(jiān)持發(fā)展合作伙伴、建設(shè)生態(tài)體系的初心。
立足新的發(fā)展階段,我們應(yīng)當(dāng)如何貫徹新發(fā)展理念、構(gòu)建新的計(jì)算產(chǎn)業(yè)發(fā)展格局?帶著這樣的問題,今天我要報(bào)告的題目是《創(chuàng)新驅(qū)動共建計(jì)算新格局》。
和大家分享一下,面向經(jīng)濟(jì)主戰(zhàn)場數(shù)字化轉(zhuǎn)型的重大機(jī)遇,浪潮對于計(jì)算向智算發(fā)展、多元融合新格局的洞察與思考,以及通過技術(shù)架構(gòu)和產(chǎn)品體系的創(chuàng)新、算力供給模式的創(chuàng)新和生態(tài)平臺建設(shè)等幾個方面進(jìn)行的布局和規(guī)劃。
既然是思考,我們不妨把時間的維度放大一點(diǎn),在百萬年以前,我們?nèi)祟惖淖嫦茸叱錾,走向草原,逐步形成了人類智能,?jīng)歷了漁獵采集時代、農(nóng)業(yè)時代、工業(yè)時代、信息時代,創(chuàng)造了光輝燦爛的文明和科技。
隨著以人工智能為代表的新一代信息技術(shù)的進(jìn)步,人類社會正在加速度進(jìn)入智慧時代,這是對終點(diǎn)的沖刺,還是新的百萬年的開始?我想這可能是值得思考的問題。為什么這么說呢?
我們來看一些關(guān)于人類大腦和未來的人工智能的大腦,或者說硅基大腦和碳基大腦發(fā)展的情況。
類腦計(jì)算是全球的研究熱點(diǎn),清華的施路平教授在去年曾經(jīng)說:“碳基上能夠?qū)崿F(xiàn)的,硅基上一定能夠?qū)崿F(xiàn)”,而實(shí)際情況也顯示,碳基生物大腦同硅基系統(tǒng)的結(jié)合已經(jīng)不再是科幻小說或者科幻電影,而是逐步在形成科學(xué)和技術(shù)上的突破。比如就在最近,埃隆·馬斯克公布了一項(xiàng)“腦機(jī)接口”的最近實(shí)驗(yàn),科學(xué)家在獼猴的大腦皮層當(dāng)中植入了兩顆芯片,捕捉大腦活動的信號,實(shí)現(xiàn)將大腦信號翻譯成游戲的動作。如此以來猴子動動腦子便玩打乒乓球的游戲了。
腦機(jī)接口技術(shù)延展了生物大腦,在中國2020年人工智能學(xué)會推選出的自然科學(xué)類五個應(yīng)用獎當(dāng)中,有兩個就是關(guān)于類腦計(jì)算和腦機(jī)接口。所以最近一個時期,腦機(jī)接口技術(shù)獲得了比較顯著的進(jìn)展。
我們已經(jīng)肯定,人工智能技術(shù)大的爆發(fā),站在人類歷史這樣更大的時空維度上,我想這一切應(yīng)當(dāng)是剛剛開始。現(xiàn)在,我們創(chuàng)造了無數(shù)的智慧大腦,城市大腦、交通大腦、企業(yè)大腦等等,這一些都在改變著我們世界的方方面面。
在第一產(chǎn)業(yè),無人農(nóng)場、智能農(nóng)機(jī)、智慧農(nóng)業(yè)正在改變幾千年的農(nóng)業(yè)生產(chǎn)模式。在黑龍江,浪潮與北大荒集團(tuán)合作建設(shè)智慧農(nóng)業(yè),開拓了全球最大面積的無人農(nóng)場,智能農(nóng)機(jī)覆蓋了農(nóng)業(yè)生產(chǎn)的耕、種、管、收全流程。
2020年中國農(nóng)業(yè)無人機(jī)的銷量超過了1.5萬架,一架無人機(jī)一天農(nóng)業(yè)噴散面積達(dá)到300畝是人工的20倍。無人機(jī)裝載了病蟲害的識別系統(tǒng),能夠及時發(fā)現(xiàn)受病蟲害侵蝕的葉子,實(shí)現(xiàn)農(nóng)藥的精準(zhǔn)噴散,減少了農(nóng)藥的使用量。通過噴灑催熟劑可以實(shí)現(xiàn)農(nóng)作物成熟周期的同步,實(shí)現(xiàn)規(guī);呐渴崭睿杀敬蟠蠼档,利潤率大幅提升。
在第二產(chǎn)業(yè),2020年中國制造業(yè)增加值達(dá)到26萬億,繼續(xù)保持世界第一制造大國的地位。智能制造是數(shù)字經(jīng)濟(jì)的皇冠,正在成為各個國家搶占數(shù)字經(jīng)濟(jì)制高點(diǎn)的主戰(zhàn)場。作為雙循環(huán)的基礎(chǔ)發(fā)力點(diǎn),智能制造將成為提升我國整體制造業(yè)水平的關(guān)鍵增長引擎。中國智能制造裝備產(chǎn)值在2020年已經(jīng)超過了2萬億。就在蘇州,浪潮建設(shè)了一座PCBA智慧工廠,整個生產(chǎn)制造過程彈性透明、可追溯,智能技術(shù)貫穿了設(shè)計(jì)、生產(chǎn)、配送和檢測的全部流程,生產(chǎn)效率提升60%以上。
智能計(jì)算更是對第三產(chǎn)業(yè)形成了深刻的改變,在突如其來的新冠疫情面前發(fā)生了巨大的作用,各種功能的醫(yī)療機(jī)器人等人工智能設(shè)備也服務(wù)在各地防疫前線,無接觸送貨、無人機(jī)送餐成為智慧物流的亮點(diǎn)。
浪潮也與中國工商銀行合作,形成了智慧金融解決方案,幫助更多的人實(shí)現(xiàn)了創(chuàng)業(yè)夢想。在上海奉賢生態(tài)谷基于浪潮計(jì)算平臺建設(shè)了一條無人駕駛實(shí)驗(yàn)公路,在北京天壇醫(yī)院浪潮建設(shè)的智慧醫(yī)療平臺幫助醫(yī)生實(shí)現(xiàn)更快速、更精準(zhǔn)的病理分析。
同時,智慧計(jì)算也已經(jīng)成為守護(hù)大自然的好幫手,在云南,浪潮協(xié)助西雙版納國家自然保護(hù)區(qū)建設(shè)了亞洲象活動軌跡采集活動,在雨林中可以實(shí)時地收集亞洲象的行動數(shù)據(jù)和活動軌跡。
基于人工智能技術(shù),實(shí)現(xiàn)毫秒級的精準(zhǔn)識別,準(zhǔn)確率達(dá)到99%,即使在光線不足的夜晚也可以根據(jù)一個尾巴和背影識別出亞洲象,通過對野生大象長期的追蹤和觀測,為洞察大象物種的習(xí)性,種群的遷移軌跡提供了幫助。從而也能夠?qū)侠淼拈_展亞洲象國家公園的規(guī)劃,為棲息地改造,食源地優(yōu)化等保護(hù)措施提供科學(xué)的依據(jù)。
通過上面的例子可以看到,智慧計(jì)算時代的序幕已經(jīng)拉開,人工智能已經(jīng)開始滲透到經(jīng)濟(jì)社會的方方面面,深刻影響著工作和生活。在這個過程中浪潮也一直在發(fā)揮著很重要的作用。
智慧時代是充滿希望的,所以我們也看到全球主要的經(jīng)濟(jì)體都在積極投入到人工智能的技術(shù)研究和產(chǎn)業(yè)發(fā)展當(dāng)中,像中國、美國、歐盟等等都發(fā)布了多個重要的支持政策,投入了巨量研發(fā)基金。根據(jù)IDC的數(shù)據(jù),2020年全球?qū)θ斯ぶ悄艿耐顿Y總額達(dá)到了500億美元,預(yù)計(jì)到2024年投資總額將超過1100億美元,投入值非常大,回報(bào)也將是非常豐厚的。根據(jù)普華永道的預(yù)測,到2030年人工智能技術(shù)將為全球GDP帶來14%的提升,大約16萬億美元。
進(jìn)入智慧時代,相比以往傳統(tǒng)信息化的應(yīng)用對計(jì)算能力的需求將是非常大的飛躍,傳統(tǒng)信息化應(yīng)用是以基于數(shù)據(jù)庫事物處理的業(yè)務(wù)為主,像辦公系統(tǒng)、ERP、郵件等,計(jì)算量隨著業(yè)務(wù)量的增加呈線性增長,但是智慧計(jì)算對于計(jì)算力的需求是指數(shù)級增長的,在2020年以GPU為代表的AI加速芯片所交付的計(jì)算力已經(jīng)超過了同類CPU,預(yù)計(jì)到2025年加速芯片所提供的計(jì)算力可能在整個計(jì)算力交付當(dāng)中超過80%。
所以,從計(jì)算到智算,智慧計(jì)算將成為智慧時代的核心動力。另外,智慧時代生產(chǎn)力的三要素也發(fā)生了相應(yīng)的改變,勞動者從人轉(zhuǎn)向了“人+AI”,勞動效率顯著提升,勞動工具從傳統(tǒng)的機(jī)械設(shè)備變成了智能裝備就像前面看到的智能農(nóng)機(jī)。而勞動對象從礦石農(nóng)產(chǎn)品等變成了大數(shù)據(jù),數(shù)據(jù)作為重要的生產(chǎn)要素應(yīng)當(dāng)說蘊(yùn)含著巨大的價值。
面對指數(shù)級增長的計(jì)算需求,計(jì)算的技術(shù)、產(chǎn)品、產(chǎn)業(yè)也面臨著巨大的挑戰(zhàn),具體來說體現(xiàn)在以下三個方面:
第一,多元化的挑戰(zhàn)。計(jì)算場景的復(fù)雜、計(jì)算架構(gòu)的多元。
第二,巨量化的挑戰(zhàn)。由巨量模型、巨量數(shù)據(jù)、巨量算力、巨量應(yīng)用所引發(fā)對現(xiàn)有計(jì)算及體系結(jié)構(gòu)的挑戰(zhàn)。
第三,生態(tài)化的挑戰(zhàn)。現(xiàn)在的智算正處于群雄并起的階段,自成體系,生態(tài)離散,產(chǎn)業(yè)鏈上下游脫節(jié)。
第一個挑戰(zhàn)是多元化。計(jì)算的關(guān)鍵任務(wù)是支撐業(yè)務(wù)的發(fā)展,不同的業(yè)務(wù)類型勢必要求不同的計(jì)算系統(tǒng)完成,比如針對傳統(tǒng)的地震波模擬的科學(xué)計(jì)算,對于數(shù)值精度要求很高,而AI訓(xùn)練則可以適用數(shù)值范圍大、精度相對低的16位附件類型。對于AI推理,由于推理要求的速度快、能耗少,則可以更低的數(shù)值精度下處理,像4位、2位甚至1位的整數(shù)類型。
也就是說,AI應(yīng)用引入了新的計(jì)算類型,從推理到訓(xùn)練跨度大,同時數(shù)據(jù)量也從GB到TB、PB不斷提升,數(shù)據(jù)類型從結(jié)構(gòu)化到半結(jié)構(gòu)化、非結(jié)構(gòu)化更加復(fù)雜多樣。不同數(shù)值精度的計(jì)算類型對計(jì)算芯片的指令集、架構(gòu)等要求也是不一樣的,這樣就導(dǎo)致之前一直使用的通用CPU沒有辦法滿足多元計(jì)算場景的要求,應(yīng)當(dāng)說這也是計(jì)算芯片種類越來越多的重要原因。
芯片種類多的另一個原因就是芯片代工模式的普及。現(xiàn)在芯片設(shè)計(jì)、制造等關(guān)鍵環(huán)節(jié)都有開源開放的軟件、工具,包括代工企業(yè)都可以使用。但是芯片從造出來到大規(guī)模用起來往往還隔著一個巨大的生態(tài)鴻溝,芯片應(yīng)用一般都面臨著開發(fā)者學(xué)習(xí)成本高、用戶應(yīng)用遷移難、芯片制造公司難以上規(guī)模的困難和挑戰(zhàn)。
人工智能芯片出來之后,大部分都面臨著面向開發(fā)者的幫助文檔、調(diào)試工具、交流回答問題的社區(qū)建設(shè)不足,開發(fā)者學(xué)習(xí)的時間長、難度大,如果學(xué)習(xí)多個芯片,那這種難更大時間就更不夠,所以開發(fā)者的學(xué)習(xí)積極性就會下降。
對于芯片的最終使用者來說,由于芯片的指令集或者芯片架構(gòu)的差異,導(dǎo)致編程庫、編程模型、算法框架無法有效地橫向拉通,這是大量的應(yīng)用遷移困難,可能只是百分之一億的對原來的編程環(huán)境小小的依賴就會導(dǎo)致對新芯片的適配工作前功盡棄。
芯片供應(yīng)商如果想解決開發(fā)者的問題或者是使用者的問題,往往需要投入比芯片的研發(fā)成本高數(shù)十倍的投入。以往我們認(rèn)為因特就是一個芯片公司、硬件公司,但其實(shí)在因特內(nèi)部有超過一萬人在威爾芯片的配套支撐、應(yīng)用適配、軟件優(yōu)化做工作。
英偉達(dá)公司的CUDA軟件環(huán)境更是通過長期的大規(guī)模的投入才打造了支撐GPU在HPC和AI方面的霸主地位。
第二,巨量化。首先表現(xiàn)在模型參數(shù)多,訓(xùn)練數(shù)據(jù)量大。以自然語言處理為例,基于此訓(xùn)練模型興起之后,模型精度隨著模型尺寸及訓(xùn)練數(shù)據(jù)的增加顯著提升,在2020年GPT-3模型的參數(shù)量首次突破了千億大關(guān),達(dá)到了1750億。
按照當(dāng)前的發(fā)展趨勢預(yù)測,到2023年模型的參數(shù)量會突破百萬億,也就是基本達(dá)到人腦神經(jīng)突觸數(shù)量,人腦的神經(jīng)突觸數(shù)量約125萬億。
巨量模型就需要巨量內(nèi)存,當(dāng)前1顆GPU板載高速內(nèi)存容量大概是40GB,對于包含百萬億參數(shù)的巨量模型,僅是將這些參數(shù)分配到每個GPU內(nèi)存當(dāng)中就需要1萬塊GPU才能裝得下,考慮到訓(xùn)練當(dāng)中還需要額外的存儲,實(shí)際上就需要2萬塊GPU才能夠啟動百萬億參數(shù)模型的訓(xùn)練,F(xiàn)有AI芯片的架構(gòu)已經(jīng)不足以支撐巨量模型的參數(shù)存儲需求。
同時,巨量模型依賴海量數(shù)據(jù)的喂養(yǎng)。目前AI算法本質(zhì)上還是依賴量變的質(zhì)變,很難從一個質(zhì)變跳躍到另一個質(zhì)變。例如最新的巨量模型需要萬億級的詞量數(shù)據(jù)。海量數(shù)據(jù)需要海量存儲,在超大規(guī)模集群中同時滿足幾萬塊AI芯片的高性能讀取,對存儲系統(tǒng)是個極大的挑戰(zhàn)。
第二個表現(xiàn)就是計(jì)算力需求的指數(shù)級增長,深度學(xué)習(xí)從2011年興起到今天,對于算力的需求一直是指數(shù)級增長的,每隔3.4個月算力需求翻一倍。左圖中縱軸Petaflops乘以day,代表著1P每秒的算力計(jì)算一天所需用的浮點(diǎn)計(jì)算量,共計(jì)8.6千億次浮點(diǎn)運(yùn)算。就像我們用千瓦時來度量用電量,在天文學(xué)里面,我們以光年為單位度量距離,在這里我們用Petaflops-day簡稱為PD來度量算力,去年巨量模型需要巨大的算力,2020年GPT-3的算力就需要3640個PD。
到2023年,巨量也就是百萬億參數(shù)的這種巨量模型的算力需要百萬PD,現(xiàn)在世界上最快的超算是日本的富岳,在這上面完成百萬PD的計(jì)算所需要的時間需要兩年,在不同的領(lǐng)域需要不同類型的巨量的模型。
GPT-3是以處理英文理解任務(wù)為主的,為了滿足不同的語言、不同的場景的精度要求也需要訓(xùn)練不同的巨量模型。如此龐大的計(jì)算力需求給計(jì)算技術(shù)和產(chǎn)業(yè)帶來了機(jī)遇和巨大的挑戰(zhàn)。解決這樣的挑戰(zhàn)需要從體系結(jié)構(gòu)、系統(tǒng)軟件各個方面開展創(chuàng)新。
巨量化第三個表現(xiàn)是模型應(yīng)用規(guī)模大,AI的應(yīng)用已經(jīng)滲透到各個行業(yè),以互聯(lián)網(wǎng)頭部企業(yè)為例,他們基于自身的已有的AI技術(shù)搭建了開放平臺,在這上面承載著各類AI的基礎(chǔ)能力(語言識別、圖像識別、自然語言處理)等等。
這些開放平臺已經(jīng)吸引了超百萬的AI開發(fā)者,開發(fā)了各種AI應(yīng)用和服務(wù),繁榮了AI的應(yīng)用生態(tài)也加速了AI相同符合產(chǎn)業(yè)的落地。同時我們也看到,這些AI開放平臺每天承載著數(shù)萬億次的調(diào)用量、數(shù)百萬小時的語音識別、超過百億張圖像識別、超過萬億句自然語言的理解。如此巨量的調(diào)用對智算中心的應(yīng)用支撐能力產(chǎn)生了極大的挑戰(zhàn)。
第三,生態(tài)化。AI技術(shù)鏈條和產(chǎn)業(yè)鏈條在現(xiàn)在還是脫節(jié)的。很多人可能會問一個問題或者有這樣的疑問,大家都說人工智能好,但是這個東西跟現(xiàn)在的業(yè)務(wù)、跟客戶的應(yīng)用場景怎么結(jié)合起來,我想用AI技術(shù)做智能化轉(zhuǎn)型和升級,但是我發(fā)現(xiàn)我沒有人懂算法和模型,也缺少好的AI開發(fā)平臺,同時那么多的算法、模型如何找到不同的算法在應(yīng)用當(dāng)中的最優(yōu)組合,F(xiàn)在懂這些的人往往是集中在科研機(jī)構(gòu)或者頭部企業(yè),這些地方集中了最優(yōu)秀的AI人才,但缺少對傳統(tǒng)行業(yè)的需求場景、業(yè)務(wù)規(guī)律的深入理解,也拿不到最關(guān)鍵的業(yè)務(wù)數(shù)據(jù)對模型進(jìn)行訓(xùn)練,這就導(dǎo)致技術(shù)無用武之地。
埃森哲等咨詢機(jī)構(gòu)的調(diào)查報(bào)告也表明了這個問題,70%以上有技術(shù)的研究機(jī)構(gòu)和科技公司缺少需求場景、領(lǐng)域知識和數(shù)據(jù),70%以上的行業(yè)用戶則缺少技術(shù)人才、AI平臺和實(shí)踐能力。
計(jì)算技術(shù)與產(chǎn)業(yè)生態(tài)是離散化,這與我們講的多元化的挑戰(zhàn)是相呼應(yīng)的,芯片架構(gòu)五花八門,指令集不同無法兼容,而面向芯片的編程庫等等又跟芯片緊密綁定,靈活性差。小公司只做了一個環(huán)節(jié),這就造成生態(tài)的縱向不通;大公司則希望構(gòu)建封閉系統(tǒng),就造成了生態(tài)橫向不通。這些都嚴(yán)重制約了AI技術(shù)的應(yīng)用和發(fā)展。
通過上面的分析我們可以看到,一方面智算需求蓬勃發(fā)展是重大的機(jī)遇,另一方面是多元化、巨量化、生態(tài)化的挑戰(zhàn)和困難亟需解決,面向新的需求機(jī)遇,迎接新的挑戰(zhàn),應(yīng)該說計(jì)算技術(shù)和產(chǎn)業(yè)需要構(gòu)建一個新的發(fā)展格局。
我想簡單概括起來可以描述為計(jì)算逐步向智算轉(zhuǎn)型,多元算力融合和算力供給方式的基建化,面對計(jì)算新格局,作為全球領(lǐng)先的人工智能計(jì)算企業(yè),浪潮啟動了新的五年計(jì)劃,確定了新的發(fā)展目標(biāo)和策略。
我們將從技術(shù)、產(chǎn)品、方案和生態(tài)四個方面不斷創(chuàng)新,來引領(lǐng)智算的發(fā)展,具體來講的話,包括創(chuàng)新智算體系結(jié)構(gòu),構(gòu)建智算產(chǎn)品體系推動智算中心落地,建設(shè)元腦產(chǎn)業(yè)鏈生態(tài)。
首先來講,創(chuàng)新智算體系結(jié)構(gòu),我們在2014年就提出了融合架構(gòu)以及融合架構(gòu)三步走的技術(shù)路線,指明了數(shù)據(jù)中心體系結(jié)構(gòu)的發(fā)展方向,目前已經(jīng)從1.0走到了2.0,以IO方式實(shí)現(xiàn)了存儲資源和FPGA、GPU各種PU的加速設(shè)備池化,正在逐步進(jìn)入到如何架構(gòu)3.0階段,能夠提供更高效靈活智能的體系架構(gòu)。
基于融合架構(gòu),浪潮將從硬件重構(gòu)、軟件定義兩個方面引領(lǐng)智算技術(shù)的體系創(chuàng)新,支撐AI的應(yīng)用。在融合架構(gòu)2.0階段,我們已經(jīng)實(shí)現(xiàn)了CPU同各種加速單元的協(xié)同來提升計(jì)算的性能。但普遍采用的是PCIe互聯(lián)的方式,仍然存在地址空間隔離,不支持緩存一致等問題,沒有克服架構(gòu)里面固有的功耗強(qiáng)、內(nèi)存墻等問題,性能和擴(kuò)展性受限。在融合架構(gòu)3.0階段,我們可以通過片內(nèi)大容量的緩存,片外高帶寬內(nèi)存等存算一體方式實(shí)現(xiàn)計(jì)算數(shù)據(jù)結(jié)合,突破存儲墻。通過高速互聯(lián)交換網(wǎng)絡(luò)支持更廣泛的多元異構(gòu)計(jì)算,支持新型存儲資源置換,提高性能降低功耗,實(shí)現(xiàn)更大規(guī)模的資源可擴(kuò)展。進(jìn)一步通過在互聯(lián)處理單元中卸載控制平面,實(shí)現(xiàn)控制和計(jì)算的分離,進(jìn)而打造更為靈活資源的可重構(gòu)。
在系統(tǒng)軟件創(chuàng)新方面我們會在可重構(gòu)的硬件資源池組織上,通過軟件定義的方式實(shí)現(xiàn)控制層和基礎(chǔ)設(shè)施的分離,統(tǒng)一資源組織模型,標(biāo)準(zhǔn)化可編程結(jié)構(gòu),形成軟件定義計(jì)算、軟件定義存儲、軟件定義網(wǎng)絡(luò)。通過微服務(wù)化實(shí)現(xiàn)集中管理平臺的高可用和高擴(kuò)展。
在這個基礎(chǔ)之上會進(jìn)一步與AI技術(shù)結(jié)合,從業(yè)務(wù)上實(shí)現(xiàn)集于特征感知的自適應(yīng)應(yīng)用編排和彈性的資源調(diào)度。例如面向視頻分析、語音識別、自然語言處理、語義理解等典型的AI場景,可以按需定義訓(xùn)練和推理系統(tǒng)。從管理上實(shí)現(xiàn)智能化的運(yùn)營、運(yùn)維,也就是智算中心的無人巡檢、以創(chuàng)新為分析、容量預(yù)測、故障自預(yù)等等。
舉個例子,這是我們已經(jīng)研發(fā)完成,并且在大客戶當(dāng)中有了成功實(shí)踐的案例,通過創(chuàng)新體系架構(gòu)實(shí)現(xiàn)了智算中心的彈性高擴(kuò)展。在這個案例當(dāng)中通過浪潮的智能網(wǎng)卡,在控制面實(shí)現(xiàn)了對虛機(jī)、裸機(jī)、容器統(tǒng)一管理,在數(shù)據(jù)面以硬件輔助的方式為虛擬化實(shí)力提供潔凈硬件性能的計(jì)算存儲和網(wǎng)絡(luò)功能,通過IO虛擬化卸載、CPU有效利用率可以提升80%,網(wǎng)絡(luò)存儲延遲達(dá)到了本地延遲水平。電商秒殺性能提升30%,計(jì)算性價比提升20%。
這一個是我們正在研究的項(xiàng)目,目標(biāo)是加速巨量模型的高性能計(jì)算能力,當(dāng)前NPU與CPU之間是通過PCIE互聯(lián)的方式,嚴(yán)重制約了NPU訪問系統(tǒng)內(nèi)存的帶寬,NPU不增加片上內(nèi)存應(yīng)對模型越來越大的挑戰(zhàn),但是巨量模型的出現(xiàn)是單純增加片上內(nèi)存這條路已經(jīng)走不下去了。
所以我們提出了新的體系結(jié)構(gòu)、參考設(shè)計(jì),核心在于通過高速互聯(lián)來連接NPU和CPU,為NPU提供高速訪問系統(tǒng)內(nèi)存的能力。通過數(shù)據(jù)自動壓縮和解壓縮單元,進(jìn)一步加速NPU訪問內(nèi)存的效率,這樣可以通過大容量高速內(nèi)存池達(dá)到完全容納GPT-3模型,避免模型分割所導(dǎo)致的芯片利用率低、通信頻繁等問題。
在產(chǎn)品方面,浪潮會在融合架構(gòu)技術(shù)路線指引下,將持續(xù)鞏固算力系統(tǒng),云數(shù)智軟件平臺方面的優(yōu)勢提供硬件重構(gòu)的計(jì)算整機(jī)系統(tǒng),包括智算基礎(chǔ)系統(tǒng)、智算加速系統(tǒng),也會面向海量數(shù)據(jù)和高速互聯(lián)來提供智算存儲和數(shù)據(jù)中心交換機(jī)產(chǎn)品。
此外,我們也會將技術(shù)戰(zhàn)持續(xù)的往底層延伸,面向不同的場景來開發(fā)定制化的AI加速、網(wǎng)絡(luò)加速、存儲加速產(chǎn)品,最終形成覆蓋芯片板卡、系統(tǒng)平臺和算法的領(lǐng)先的產(chǎn)品體系,在加速芯片和板卡方面,芯片多元化應(yīng)該既是挑戰(zhàn)也是應(yīng)對當(dāng)前算力需求復(fù)雜多樣的手段。
像FPGA在特定場景下,相對CPU來講都會有10-15倍的性能提升,而GPU各種AI加速芯片面向訓(xùn)練推理等矩陣運(yùn)算則有無可比擬的優(yōu)勢,傳統(tǒng)業(yè)務(wù)應(yīng)用像網(wǎng)站數(shù)據(jù)庫等還需要CPU來處理。
浪潮能夠以創(chuàng)新的設(shè)計(jì)對算力單元進(jìn)行高效的融合,也會在一些專有的領(lǐng)域開發(fā)我們自己的加速器,像智能網(wǎng)卡、視頻加速器等等,這些在下午的演講當(dāng)中會給大家介紹這些產(chǎn)品。
面向計(jì)算的新格局我們會持續(xù)創(chuàng)新,打造全球領(lǐng)先的智算硬件平臺,在智算基礎(chǔ)系統(tǒng)方面,浪潮具備業(yè)內(nèi)最豐富的產(chǎn)品布局,擁有全球計(jì)算架構(gòu)最全,配置最多,規(guī)格最高的服務(wù)器。
僅僅在去年一年,浪潮服務(wù)器刷新12項(xiàng)SPEC CPU測試世界紀(jì)錄,打破5項(xiàng)Java性能世界記錄,未來智算基礎(chǔ)系統(tǒng)將向開放、融合、多元方向發(fā)展,深度參與開放計(jì)算生態(tài),領(lǐng)導(dǎo)開放計(jì)算的發(fā)展,面向智能化、容器化等需求建立多元化的計(jì)算平臺。
在智算加速系統(tǒng)方面,浪潮為智算中心提供了最領(lǐng)先的算力機(jī)組,浪潮NF8488A5是目前全球最高性能的AI服務(wù)器。在MLperf全球AI基準(zhǔn)測試中,這個機(jī)器單機(jī)訓(xùn)練性能測試以絕對優(yōu)勢做到全球第一,推理性能測試在打破了18項(xiàng)記錄,成為打破記錄最多的AI服務(wù)器。下一步我們將持續(xù)以加速器為中心的體系結(jié)構(gòu)創(chuàng)新,開發(fā)高性能的AI系列服務(wù)器,同時也會研發(fā)高效率制冷技術(shù),實(shí)現(xiàn)高性能和低PUE打造綠色節(jié)能的AI系列產(chǎn)品。
面向海量訓(xùn)練大數(shù)據(jù),浪潮具備全球性能最好的存儲系統(tǒng)。存儲系統(tǒng)已經(jīng)三次打破SPC-1全球性能測試記錄,在未來我們將面向基礎(chǔ)設(shè)施云化、大數(shù)據(jù)、AI等應(yīng)用場景,打造超高密度和超大規(guī)模的智算存儲系統(tǒng),并且針對不同應(yīng)用的需求構(gòu)建容災(zāi)、備份、歸檔等數(shù)據(jù)全生命周期的解決方案。
在網(wǎng)絡(luò)互聯(lián)上,浪潮發(fā)布了國內(nèi)首個商用SONiC網(wǎng)絡(luò)操作系統(tǒng),搭載浪潮自主研發(fā)的核心交換機(jī)和TOR交換機(jī),實(shí)現(xiàn)了數(shù)據(jù)中心的智能高速互聯(lián),在未來我們浪潮的網(wǎng)絡(luò)將全面實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)平面、控制平面的可編程,為數(shù)據(jù)中心帶來更加智能化基于意圖的全自驅(qū)網(wǎng)絡(luò)解決方案。
在系統(tǒng)軟件層面,基于在操作系統(tǒng)、云平臺、大數(shù)據(jù)以及AI平臺的長期積累,在業(yè)內(nèi)率先提出智算操作系統(tǒng),通過軟件定義方向在南向智算操作系統(tǒng)實(shí)現(xiàn)多元異構(gòu)計(jì)算、新型存儲和網(wǎng)絡(luò)資源的統(tǒng)一管理。在管理平臺實(shí)現(xiàn)應(yīng)用感知的智能調(diào)度和面向智算中心的統(tǒng)一運(yùn)營和智能運(yùn)維。在北向支持各種各樣的智能化創(chuàng)新應(yīng)用,保障從海量數(shù)據(jù)處理、大規(guī)模分布式訓(xùn)練、自動模型生成,到實(shí)時推理應(yīng)用的快速部署上線和高效的運(yùn)維。
應(yīng)該說智算操作系統(tǒng)將是智算中心的神經(jīng)系統(tǒng),讓算力的生產(chǎn)、聚合、調(diào)度和釋放渾然一體。
在去年線上的合作伙伴大會上,我們提出了智算中心的概念,智算中心應(yīng)該是智慧時代最主要的計(jì)算力的生產(chǎn)中心和供應(yīng)中心,以融合架構(gòu)計(jì)算系統(tǒng)為平臺,以數(shù)據(jù)為資源能夠以強(qiáng)大的AI算力來驅(qū)動對數(shù)據(jù)進(jìn)行深度加工,產(chǎn)生各種智慧計(jì)算的服務(wù),并且通過以云的形式向組織和個人提供服務(wù)。
智算中心正在成為推動經(jīng)濟(jì)社會運(yùn)行的重要基礎(chǔ)設(shè)施也是我國新基建的重要內(nèi)容,智算中心該怎么建呢?在去年浪潮聯(lián)合國家信息中心發(fā)布了《智能計(jì)算中心規(guī)劃建設(shè)指南》,并且在指南當(dāng)中提出了智算中心的參考架構(gòu)。
下面講一個例子,江蘇一直是科技創(chuàng)新的大省,是數(shù)字經(jīng)濟(jì)發(fā)展的排頭兵,就在今年年初江蘇按照《智能計(jì)算中心規(guī)劃建設(shè)指南》,在南京投資建設(shè)了智算中心,由寒武紀(jì)和浪潮聯(lián)合承建已經(jīng)投入運(yùn)營使用。
這個智算中心對外可以提供的算力達(dá)到了每秒百億億/次,采用了最先進(jìn)的AI處理芯片和AI計(jì)算平臺,應(yīng)該說代表著當(dāng)前我國智算中心建設(shè)的最高水平,該中心將為區(qū)域的公共算力服務(wù)、創(chuàng)新應(yīng)用孵化、產(chǎn)業(yè)聚集發(fā)展、科研創(chuàng)新和人才培養(yǎng)提供助力和支撐。
AI產(chǎn)業(yè)化是一個千億級的市場,產(chǎn)業(yè)AI化是一個萬億級的市場,無論AI產(chǎn)業(yè)化還是產(chǎn)業(yè)AI化,產(chǎn)業(yè)鏈的拉通和生態(tài)的建設(shè)都是必須的,在AI產(chǎn)業(yè)化的過程當(dāng)中,浪潮是新興AI企業(yè)的主要伙伴和算力提供商,這些創(chuàng)業(yè)企業(yè)或者擁有領(lǐng)先的芯片,或者積累了大量優(yōu)質(zhì)的算法框架模型和數(shù)據(jù),這些優(yōu)質(zhì)的AI技術(shù)正是產(chǎn)業(yè)AI化過程當(dāng)中行業(yè)用戶所需要的,也是為那些用戶提供服務(wù)的傳統(tǒng)軟件開發(fā)商所欠缺的。
為了幫助行業(yè)用戶更好地進(jìn)行智慧轉(zhuǎn)型,連接傳統(tǒng)的ISV和新興的AI企業(yè),浪潮提出了元腦生態(tài)計(jì)劃,在今后我們還會將元腦生態(tài)升級,與合作伙伴共建共贏、共享元腦生態(tài)平臺,幫助合作伙伴成長,助力伙伴轉(zhuǎn)型,聚合左右手合作伙伴的力量來加速行業(yè)和產(chǎn)業(yè)的智能化進(jìn)程,實(shí)現(xiàn)浪潮與伙伴和客戶共同的發(fā)展。
生態(tài)系統(tǒng)首先應(yīng)該是開放的,我們浪潮多年來一直在踐行開放計(jì)算的理念,引領(lǐng)開放計(jì)算的標(biāo)準(zhǔn),是全球唯一三大開放計(jì)算組織的發(fā)起成員或者是白金會員,牽頭制定了服務(wù)器的全部國標(biāo),是開放基礎(chǔ)設(shè)施基金會的創(chuàng)始會員,社區(qū)貢獻(xiàn)中國第一。同時也是國際SPEC組織機(jī)器學(xué)習(xí)委員會的主席。我們與伙伴的合作也是開放的,不斷地在進(jìn)行合作中的創(chuàng)新,我們聯(lián)合Intel公司開展第八代服務(wù)器CPU平臺參考設(shè)計(jì),聯(lián)合三星公司貢獻(xiàn)了業(yè)界首先NVME策劃方案,與英偉達(dá)合作開發(fā)了首個支持NVLink低延遲單層鏈路通訊架構(gòu)。
在算法和應(yīng)用創(chuàng)新方面我們聯(lián)合第四范式公司突破了金融票據(jù)世界基礎(chǔ),聯(lián)合馬達(dá)智數(shù)打造了數(shù)據(jù)預(yù)處理、數(shù)據(jù)三位一體展示軟件,聯(lián)合聲揚(yáng)科技研發(fā)了面向金融行業(yè)的識別算法。
應(yīng)當(dāng)說在過去的一年,浪潮推動的元腦生態(tài)的建設(shè)成績還是非常不錯的,已經(jīng)發(fā)展了1萬5千多的合作伙伴,包括2200多個行業(yè)ISV,超過90%的方案百強(qiáng)企業(yè)。在人工智能百強(qiáng)企業(yè)當(dāng)中有85%都與浪潮有著深度的合作,這里面不僅包括BAT等互聯(lián)網(wǎng)頭部企業(yè),也包括第四范式、寒武紀(jì)等AI的企業(yè)。
下面講一個例子,在智慧交通領(lǐng)域浪潮在積極推動智慧交通方案的邏輯,為交通行業(yè)的頭部供應(yīng)商提供了超過80%的人工智能服務(wù)器,部署了60余類交通算法與應(yīng)用,涵蓋了闖紅燈、超速等等十幾種典型的場景,浪潮也與臻識科技、優(yōu)碼創(chuàng)達(dá)一起推動了江西省智慧交通的建設(shè),為客戶提供的非現(xiàn)場視頻審核一體機(jī)在南昌、上饒、新余等16個地市落地,幫助客戶提升審片效率40多倍。
各位合作伙伴,計(jì)算向智算轉(zhuǎn)型,多元算力融合,智算中心基建化應(yīng)該是未來計(jì)算產(chǎn)業(yè)的新格局,也為我們帶來了巨大的發(fā)展的機(jī)遇。在過去的五年,在各位合作伙伴的支持和幫助下,浪潮已經(jīng)成為全球智算智慧計(jì)算的領(lǐng)導(dǎo)者,服務(wù)器全球前三,AI服務(wù)器全球第一,小型機(jī)中國第一,存儲出貨量增速全球第一。
新的五年計(jì)劃已經(jīng)開啟,在新的征程當(dāng)中浪潮將通過技術(shù)、產(chǎn)品、方案方面的持續(xù)創(chuàng)新,推動智算新格局的建設(shè)和發(fā)展,并圍繞著元腦生態(tài)和各位合作伙伴競爭合作攜手共進(jìn),于變局中開新局,加速成為全球第一。謝謝大家!
免責(zé)聲明:
※ 以上所展示的信息來自媒體轉(zhuǎn)載或由企業(yè)自行提供,其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本網(wǎng)站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本網(wǎng)站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。如果以上內(nèi)容侵犯您的版權(quán)或者非授權(quán)發(fā)布和其它問題需要同本網(wǎng)聯(lián)系的,請?jiān)?0日內(nèi)進(jìn)行。
※ 有關(guān)作品版權(quán)事宜請聯(lián)系中國企業(yè)新聞網(wǎng):020-34333079 郵箱:cenn_gd@126.com 我們將在24小時內(nèi)審核并處理。
標(biāo)簽 :
相關(guān)網(wǎng)文
一周新聞資訊點(diǎn)擊排行
關(guān)于我們 | CENN服務(wù) | 對外合作 | 刊登廣告 | 法律聲明 | 聯(lián)系我們 | 手機(jī)版
客戶服務(wù)熱線:020-34333079、34333137 舉報(bào)電話:020-34333002 舉報(bào)郵箱:cenn_gd@126.com
版權(quán)所有:中國企業(yè)新聞網(wǎng) 運(yùn)營商:廣州至高點(diǎn)網(wǎng)絡(luò)科技投資有限公司 地址:廣州市海珠區(qū)江燕路353號保利紅棉48棟1004