企業(yè)發(fā)布
首頁 > 企業(yè)發(fā)布 > 詳細(xì)內(nèi)容
刷新紀(jì)錄!浪潮AI獲自動駕駛nuScenes競賽目標(biāo)檢測第一名
2022/10/31 15:01:13 來源:中國企業(yè)新聞網(wǎng)
導(dǎo)言:近日,在全球權(quán)威的自動駕駛nuScenes競賽的最新一期評測中,浪潮信息AI團隊斬獲純視覺3D目標(biāo)檢測任務(wù)(nuScenes Detection task)第一名,并將關(guān)鍵性指標(biāo)nuScenes Detection Score(NDS)提高到62.4%
近日,在全球權(quán)威的自動駕駛nuScenes競賽的最新一期評測中,浪潮信息AI團隊斬獲純視覺3D目標(biāo)檢測任務(wù)(nuScenes Detection task)第一名,并將關(guān)鍵性指標(biāo)nuScenes Detection Score(NDS)提高到62.4%
自動駕駛已被眾多車企與AI 領(lǐng)先公司視為未來出行方式變革最重要的支撐性技術(shù),而目標(biāo)檢測作為自動駕駛技術(shù)的核心模塊,其算法的精度和穩(wěn)定性正在眾多AI研究團隊的推動下,不斷創(chuàng)下新高。nuScenes數(shù)據(jù)集是目前自動駕駛領(lǐng)域中最流行的公開數(shù)據(jù)集之一,數(shù)據(jù)采集自波士頓和新加坡的實際自動駕駛場景,是第一個集成攝像頭、激光雷達和毫米波雷達等多種傳感器,實現(xiàn)360度全傳感器覆蓋的數(shù)據(jù)集。nuScenes數(shù)據(jù)集提供了二維、三維物體標(biāo)注、點云分割、高精地圖等豐富的標(biāo)注信息,包含1000個場景,擁有140萬幀圖像、39萬幀激光雷達點云數(shù)據(jù)、23個物體類別、140萬個三維標(biāo)注框,其數(shù)據(jù)標(biāo)注量比KITTI數(shù)據(jù)集高出7倍以上。
此次浪潮信息AI團隊參與的純視覺3D目標(biāo)檢測任務(wù)是競爭最激烈的賽道,吸引了百度、鑒智機器人、縱目科技、卡內(nèi)基梅隆大學(xué)、加利福尼亞大學(xué)伯克利分校、MIT、清華大學(xué)、香港科技大學(xué)、上海交通大學(xué)等全球各地的頂尖AI團隊!
純視覺3D目標(biāo)檢測任務(wù),就是在不使用激光雷達、毫米波雷達等額外的傳感器信息條件下,僅使用6個攝像頭完成車外360度環(huán)視視野的3D目標(biāo)檢測,不僅需要檢測周圍環(huán)境中所有的車、行人、障礙物、交通標(biāo)志、指示燈等若干類對象,還要精確感知到他們在真實物理世界中的位置、大小、方向、速度等信息。該項任務(wù)的主要難點是通過2D圖像難以準(zhǔn)確的獲取目標(biāo)的真實深度和速度,當(dāng)提取的深度信息不準(zhǔn)確時,一切的三維感知任務(wù)都會變得異常困難;而當(dāng)提取的速度信息不準(zhǔn)確時,則可能會對后續(xù)的決策規(guī)劃任務(wù)產(chǎn)生致命性的影響。
浪潮信息AI團隊創(chuàng)新開發(fā)了基于多相機的時空融合模型架構(gòu)(Inspur_DABNet4D),在多視角視覺輸入統(tǒng)一轉(zhuǎn)換到BEV(Bird Eye View)特征空間這一技術(shù)框架的基礎(chǔ)上,引入了數(shù)據(jù)樣本增強、深度增強網(wǎng)絡(luò)、時空融合網(wǎng)絡(luò)、預(yù)訓(xùn)練權(quán)重等,得到了更魯棒更精確的BEV特征,大幅地優(yōu)化了目標(biāo)物體監(jiān)測速度和位移方向預(yù)測。
基于多相機的時空融合模型架構(gòu)實現(xiàn)了四大核心技術(shù)突破。一是,更豐富的數(shù)據(jù)樣本增強算法,將真值以真實的3D物理坐標(biāo)實現(xiàn)拷貝貼圖,并實現(xiàn)了時序中的擴展,顯著的提高目標(biāo)檢測精度,可將mAP(全類平均正確率,mean Average Precision)平均提升2%+;二是,更強大的深度增強網(wǎng)絡(luò),主要針對現(xiàn)有方案深度信息難以學(xué)習(xí)和建模的問題,通過深度網(wǎng)絡(luò)架構(gòu)優(yōu)化、點云數(shù)據(jù)監(jiān)督指導(dǎo)訓(xùn)練、深度補全等技術(shù),大幅提高深度預(yù)測精度;三是,更精細(xì)的時空融合網(wǎng)絡(luò),除了進一步優(yōu)化駕駛場景中自車運動所帶來的時空信息錯位融合問題,還引入了sweep幀數(shù)據(jù)隨機抽取與當(dāng)前幀融合,并實現(xiàn)不同幀的數(shù)據(jù)樣本同步增強操作,使得模型能夠端到端學(xué)習(xí)到更精細(xì)的時序特征;四是,更完善的統(tǒng)一建模形式,即針對駕駛場景的視角廣、尺度大、任務(wù)多的特點,設(shè)計了端到端的特征提取、融合、檢測頭的統(tǒng)一建模架構(gòu),結(jié)構(gòu)簡單、訓(xùn)練高效、場景通用。預(yù)訓(xùn)練模型可隨時替換自監(jiān)督模型,快捷便利地完成測試和精度提升。
得益于更先進算法和更高算力的進步,nuScenes競賽的3D目標(biāo)檢測任務(wù)榜單成績在2022年取得大幅提升,其中浪潮信息AI團隊將關(guān)鍵性指標(biāo)NDS提升到62.4%,而相比而言年初的榜單最佳成績是47%。
免責(zé)聲明:
※ 以上所展示的信息來自媒體轉(zhuǎn)載或由企業(yè)自行提供,其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本網(wǎng)站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本網(wǎng)站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。如果以上內(nèi)容侵犯您的版權(quán)或者非授權(quán)發(fā)布和其它問題需要同本網(wǎng)聯(lián)系的,請在30日內(nèi)進行。
※ 有關(guān)作品版權(quán)事宜請聯(lián)系中國企業(yè)新聞網(wǎng):020-34333079 郵箱:cenn_gd@126.com 我們將在24小時內(nèi)審核并處理。
標(biāo)簽 :
相關(guān)網(wǎng)文
一周新聞資訊點擊排行
關(guān)于我們 | CENN服務(wù) | 對外合作 | 刊登廣告 | 法律聲明 | 聯(lián)系我們 | 手機版
客戶服務(wù)熱線:020-34333079、34333137 舉報電話:020-34333002 投稿郵箱:cenn_gd@126.com
版權(quán)所有:中國企業(yè)新聞網(wǎng) 運營商:廣州至高點網(wǎng)絡(luò)科技投資有限公司 地址:廣州市海珠區(qū)江燕路353號保利紅棉48棟1004