企業(yè)發(fā)布
首頁 > 企業(yè)發(fā)布 > 詳細內容
浪潮網(wǎng)絡:算力、存儲高速增長 讓高階網(wǎng)絡互連持續(xù)精進
2022/8/8 15:29:12 來源:中國企業(yè)新聞網(wǎng)
導言:據(jù)工信部發(fā)布的信息顯示,我國近五年算力年均增速超過30%。其中,在用數(shù)據(jù)中心的服務器規(guī)模為1900萬臺,存儲容量達到800EB(1EB=1024PB)。面對算力、存儲的高速增長,網(wǎng)絡作為數(shù)據(jù)中心三大關鍵要素之一,它的技術發(fā)展日益成為業(yè)界關注的焦點。
據(jù)工信部發(fā)布的信息顯示,我國近五年算力年均增速超過30%。其中,在用數(shù)據(jù)中心的服務器規(guī)模為1900萬臺,存儲容量達到800EB(1EB=1024PB)。面對算力、存儲的高速增長,網(wǎng)絡作為數(shù)據(jù)中心三大關鍵要素之一,它的技術發(fā)展日益成為業(yè)界關注的焦點。
針對高性能計算、數(shù)據(jù)中心領域中的高階網(wǎng)絡互連技術發(fā)展,在由高效能服務器和存儲技術國家重點實驗室和開放計算中國社區(qū)聯(lián)合主辦的"第六期開放計算技術沙龍:網(wǎng)絡技術研究與實踐"線上研討會中,來自清華大學的教授、博士生導師向東老師以《高性能高階(High-Radix)網(wǎng)絡互連架構及通訊協(xié)議》為主題,針對業(yè)內主流的蜻蜓網(wǎng)絡(Dragonfly)架構以及相關的網(wǎng)絡架構特點、優(yōu)勢進行了詳細解讀。針對Dragonfly網(wǎng)絡適用于高端市場的應用情況,浪潮網(wǎng)絡推出了更加具備市場貼合度的無損網(wǎng)絡解決方案。以采用RoCE技術的數(shù)據(jù)中心以太網(wǎng)交換機為核心,具備網(wǎng)絡流控、死鎖消除以及存儲即插即用等特點。
萬級、十萬級、百萬級互連節(jié)點 彰顯蜻蜓網(wǎng)絡魅力
Dragonfly網(wǎng)絡憑借較低的網(wǎng)絡直徑和較低的部署成本,已經(jīng)在高性能計算領域得到了廣泛應用。向東教授認為,Dragonfly網(wǎng)絡所具備的特點,同樣也適用于當下算力需求增長迅速、算力多樣化的數(shù)據(jù)中心網(wǎng)絡之中。"Dragonfly網(wǎng)絡作為一個二級全連接網(wǎng)絡,其網(wǎng)絡設計成本遠低于3-DTorus及胖樹等其他網(wǎng)絡架構,不僅適合于搭建超級計算機,同時也適用于數(shù)據(jù)中心。"向東教授說道。
當前,高性能計算的網(wǎng)絡設計成本主要取決于機柜間的全局光纖數(shù)目,減少光纖數(shù)目及交換機端口數(shù)目是降低設計成本的核心要素。Dragonfly網(wǎng)絡的拓撲結構可以將數(shù)據(jù)包傳輸路徑的全局光纖數(shù)目降低為1。當高性能計算集群達到1萬個計算節(jié)點以上的規(guī)模時,采用Dragonfly網(wǎng)絡拓撲結構平臺所需交換機芯片的端口數(shù)目僅需30多個左右。當集群節(jié)點規(guī)模達到10萬時,采用Dragonfly網(wǎng)絡拓撲結構的交換機芯片端口數(shù)目則在55左右。
Dragonfly網(wǎng)絡是一個二階全連接網(wǎng)絡,分別由Router(路由器)、Group(組)以及整個System(系統(tǒng))構成。Group中的Router與終端進行連接,Router之間實現(xiàn)Intra-group interconnection network全連接。與此同時,Group之間也實現(xiàn)了Inter-group interconnection network。其中,Group中采用電纜實現(xiàn)Router之間的互連,Group之間則采用光纖互連。
Dragonfly網(wǎng)絡雖然在成本方面、降低交互芯片連接端口數(shù)量較低等優(yōu)勢,但是面對超算、數(shù)據(jù)中心計算節(jié)點的增多,包括Dragonfly、Dragonfly+等網(wǎng)絡結構依然要面臨網(wǎng)絡連線較為復雜,網(wǎng)絡總體設計成本仍然偏高,以及整體網(wǎng)絡所需的全局光纖數(shù)仍然偏高等挑戰(zhàn)。
向東教授及其團隊為此研發(fā)設計出CLHR,即基于通訊局部化的高階互連網(wǎng)絡以及相應的路由算法。通過采用CLHR,一套擁有15萬臺服務器且采用Dragonfly網(wǎng)絡結構的超算平臺,其交換芯片端口數(shù)可控制在30個以內。當整體服務器規(guī)模達到100萬臺以上時,交換芯片的端口數(shù)量也可以控制在50個以內。向東教授指出,采用CLHR,相比二階全聯(lián)接的Dragonfly網(wǎng)絡,端口總體數(shù)量得到有效降低。此外,數(shù)據(jù)通訊不需要虛擬通道,不需要設計Misrouting算法,任何節(jié)點間通訊可使用多條最短路徑。
讓智算普惠 無損網(wǎng)絡釋放更多價值
無論是高性能計算領域中較為普遍采用的Dragonfly網(wǎng)絡,還是針對其進行優(yōu)化、改進的CLHR,向東教授認為這些技術上的創(chuàng)新都是為了實現(xiàn)無損網(wǎng)絡所作出的努力。以往,傳統(tǒng)數(shù)據(jù)中心會采用無損網(wǎng)絡技術,但面對數(shù)據(jù)中心的算力攀升、算力的多樣化,向東教授認為打造無損網(wǎng)絡已經(jīng)成為一種趨勢,這需要在網(wǎng)絡架構的設計上更加精致,需要網(wǎng)絡平臺具備高效的流控能力、嚴格避免PFC死鎖情況的出現(xiàn)。
目前,浪潮網(wǎng)絡所提供的無損網(wǎng)絡解決方案已經(jīng)成功的應用到南京智能計算中心項目的建設之中。通過融合浪潮的計算、存儲、網(wǎng)絡和人工智能開發(fā)平臺整體解決方案,構建端到端、無損、低延時的RDMA(遠程直接內存訪問)承載網(wǎng)絡。
浪潮網(wǎng)絡推出的無損網(wǎng)絡解決方案,不僅有效的應對了智算中心算力增長、算力需求多樣、存儲指數(shù)級攀升的需求。同時,也為現(xiàn)有的高性能計算平臺構建低延遲、高帶寬的網(wǎng)絡平臺,提供了在性價比和未來發(fā)展前景上都不錯的一種選擇。
免責聲明:
※ 以上所展示的信息來自媒體轉載或由企業(yè)自行提供,其原創(chuàng)性以及文中陳述文字和內容未經(jīng)本網(wǎng)站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本網(wǎng)站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。如果以上內容侵犯您的版權或者非授權發(fā)布和其它問題需要同本網(wǎng)聯(lián)系的,請在30日內進行。
※ 有關作品版權事宜請聯(lián)系中國企業(yè)新聞網(wǎng):020-34333079 郵箱:cenn_gd@126.com 我們將在24小時內審核并處理。
標簽 :
相關網(wǎng)文
一周新聞資訊點擊排行