企業(yè)發(fā)布
首頁 > 企業(yè)發(fā)布 > 詳細內(nèi)容
亞馬遜云科技宣布Amazon EC2 P5e 實例正式可用
2024/9/18 16:36:06 來源:中國企業(yè)新聞網(wǎng)
導(dǎo)言:9月18日,亞馬遜云科技宣布由英偉達H200 GPU提供支持的 Amazon Elastic Compute Cloud P5e(Amazon EC2 P5e)實例現(xiàn)已正式可用。
9月18日,亞馬遜云科技宣布由英偉達H200 GPU提供支持的 Amazon Elastic Compute Cloud P5e(Amazon EC2 P5e)實例現(xiàn)已正式可用。亞馬遜云科技是首個將英偉達H200 GPU用于生產(chǎn)環(huán)境的領(lǐng)先云提供商。與基于英偉達H100 GPU的Amazon EC2 P5實例相比,Amazon EC2 P5e實例GPU內(nèi)存容量提升1.7倍,GPU內(nèi)存寬帶提升1.5倍。Amazon EC2 P5e非常適用于復(fù)雜的大型語言模型(LLM)和多模態(tài)基礎(chǔ)模型(FM)的訓(xùn)練、微調(diào)和推理,用于支持最苛刻和計算密集型的生成式AI應(yīng)用,如問答、代碼生成、視頻和圖像生成、語音識別等。
Amazon EC2 P5e實例提供8個英偉達H200 GPU,具有1128GB高帶寬GPU內(nèi)存,同時提供第三代AMD EPYC處理器,2TB系統(tǒng)內(nèi)存和30TB本地NVMe存儲。Amazon EC2 P5e實例還提供 3,200 Gbps的聚合網(wǎng)絡(luò)帶寬并支持GPUDirect RDMA,從而能夠繞過CPU進行節(jié)點間通信,實現(xiàn)更低的延遲和高效的橫向擴展性能。Amazon EC2 P5e實例具有的更高的內(nèi)存帶寬、更大的GPU內(nèi)存容量和對更大的batch sizes的支持,從而顯著提升客戶工作負載的性能、降低成本并簡化運營。
Amazon EC2 P5e實例現(xiàn)已可通過Amazon EC2 Capacity Block for ML工具訪問并在美國東部(俄亥俄州)區(qū)域正式可用。
此外,亞馬遜云科技還宣布將推出Amazon EC2 P5en實例,通過將英偉達H200 GPU與定制的第四代英特爾Xeon可擴展處理器相結(jié)合支持PCle Gen5,將提供高達四倍的CPU和GPU之間的帶寬,降低網(wǎng)絡(luò)延遲,進一步提高工作負載性能。
免責(zé)聲明:
※ 以上所展示的信息來自媒體轉(zhuǎn)載或由企業(yè)自行提供,其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本網(wǎng)站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本網(wǎng)站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。如果以上內(nèi)容侵犯您的版權(quán)或者非授權(quán)發(fā)布和其它問題需要同本網(wǎng)聯(lián)系的,請在30日內(nèi)進行。
※ 有關(guān)作品版權(quán)事宜請聯(lián)系中國企業(yè)新聞網(wǎng):020-34333079 郵箱:cenn_gd@126.com 我們將在24小時內(nèi)審核并處理。
標簽 :
相關(guān)網(wǎng)文
一周新聞資訊點擊排行
關(guān)于我們 | CENN服務(wù) | 對外合作 | 刊登廣告 | 法律聲明 | 聯(lián)系我們 | 手機版
客戶服務(wù)熱線:020-34333079、34333137 舉報電話:020-34333002 投稿郵箱:cenn_gd@126.com
版權(quán)所有:中國企業(yè)新聞網(wǎng) 運營商:廣州至高點網(wǎng)絡(luò)科技投資有限公司 地址:廣州市海珠區(qū)江燕路353號保利紅棉48棟1004