企業(yè)發(fā)布
首頁 > 企業(yè)發(fā)布 > 詳細內(nèi)容
北森AI智能簡歷解析技術(shù)獲國家發(fā)明專利
2020/12/29 13:22:46 來源:中國企業(yè)新聞網(wǎng)
導言:近日,北森獲得國家知識產(chǎn)權(quán)局授權(quán)的AI簡歷解析相關(guān)技術(shù)發(fā)明專利 -- “一種基于深度學習的簡歷解析方法和系統(tǒng)”。該項專利技術(shù)由北森成都總部相關(guān)團隊研發(fā),專利期限為20年,將被用于招聘場景下大規(guī)模、多類別、復雜簡歷的智能化解析。
近日,北森獲得國家知識產(chǎn)權(quán)局授權(quán)的AI簡歷解析相關(guān)技術(shù)發(fā)明專利 -- “一種基于深度學習的簡歷解析方法和系統(tǒng)”。該項專利技術(shù)由北森成都總部相關(guān)團隊研發(fā),專利期限為20年,將被用于招聘場景下大規(guī)模、多類別、復雜簡歷的智能化解析。
本次申請的是北森簡歷解析的核心技術(shù)專利。無論是招聘網(wǎng)站的固定格式簡歷,還是候選人郵箱投遞的表格式、自由格式簡歷,甚至是移動端拍照上傳的圖片簡歷,該技術(shù)可以從任意格式的半結(jié)構(gòu)化文檔簡歷中,提取候選人的個人信息、工作經(jīng)歷、教育背景等字段信息,以支持后續(xù)搜索、篩選、智能推薦等工作展開。
相比于目前市面上常見的簡歷解析技術(shù),北森實現(xiàn)兩大突破。
其一,字段提取方法上,使用獨立的語句切分+文本分類模型替換序列標注。
同類的其他技術(shù)在提取字段信息時,是通過序列標注模型來識別目標實體的起止位置和類別,這種方式會增加任務(wù)的訓練難度,對訓練數(shù)據(jù)也有更高要求。
北森則利用“半結(jié)構(gòu)化簡歷的布局通常更明晰,字段之間會以空格、冒號等隔開”的特點,將字段的提取分為語句切分和字段類別識別兩個階段任務(wù)分別建模實現(xiàn)。相比于以往,該方法可以提取長文本字段,讓起止位置的識別更準確,并且能夠支持上百種類別識別。
其二,使用句子粒度的區(qū)塊和分條模型替換詞粒度的分類器。
在從簡歷中確定個人信息、教育經(jīng)歷、工作經(jīng)歷等區(qū)塊的位置時,同類技術(shù)最好的方法是以詞為粒度,每行文本獨立地通過文本分類模型得到區(qū)塊類別。但是這種技術(shù)在遇到相似的信息時,比如相似的實習經(jīng)歷或工作經(jīng)歷,容易出現(xiàn)判別錯誤。
實際上,通過大量分析簡歷發(fā)現(xiàn),簡歷的每行內(nèi)容屬于哪個區(qū)塊是有一定相關(guān)性的,即當前行屬于哪個區(qū)塊會受到上一行和下一行內(nèi)容的影響。所以,北森提出區(qū)塊和條目識別模型的序列標注,以句子為單位進行輸入,且包括類別信息,可以在建模過程中直接捕獲到前后幾行對當前行的影響,大大提升準確率。
從最原始的模板解析到現(xiàn)在基于深度學習的智能簡歷解析,北森簡歷解析經(jīng)歷了四大發(fā)展階段,每一次重構(gòu)都是重大突破。目前簡歷解析涉及從文檔讀取、布局識別、字段識別等方方面面,而北森將持續(xù)探索簡歷解析技術(shù)的研發(fā)與落地,為行業(yè)帶來更優(yōu)體驗。
“基于深度學習的簡歷解析方法和系統(tǒng)”將進一步在北森的招聘產(chǎn)品及服務(wù)中進行應(yīng)用。通過在內(nèi)容提取、類別識別等各個方面的優(yōu)化,相關(guān)產(chǎn)品將創(chuàng)新性推出更準確、更全面的簡歷字段解析體驗;同時,北森會針對渠道簡歷、獵頭推薦簡歷等樣式較固定的簡歷提供了解析配置,遇到個別字段解析出現(xiàn)問題可以快速響應(yīng),快速兼容,影響小上線快,給客戶更好的技術(shù)支持體驗。
關(guān)于北森
北森是一家人力資源科技公司,擁有國內(nèi)領(lǐng)先的一體化HR SaaS和人才管理平臺 -- iTalent X,為企業(yè)提供云端HR軟件、人才管理技術(shù)和平臺的端到端整體解決方案,幫助企業(yè)實現(xiàn)從員工招募、入職、管理到離職的全面數(shù)字化管理。每天,有超過6000家中大型企業(yè)、超過15萬的HR和超過2000萬的企業(yè)員工正在使用iTalent X。 2016年起北森已連續(xù)四年位列中國HR SaaS市場占有率第一(數(shù)據(jù)來源:IDC)。
免責聲明:
※ 以上所展示的信息來自媒體轉(zhuǎn)載或由企業(yè)自行提供,其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本網(wǎng)站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本網(wǎng)站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。如果以上內(nèi)容侵犯您的版權(quán)或者非授權(quán)發(fā)布和其它問題需要同本網(wǎng)聯(lián)系的,請在30日內(nèi)進行。
※ 有關(guān)作品版權(quán)事宜請聯(lián)系中國企業(yè)新聞網(wǎng):020-34333079 郵箱:cenn_gd@126.com 我們將在24小時內(nèi)審核并處理。
標簽 :
相關(guān)網(wǎng)文
一周新聞資訊點擊排行
關(guān)于我們 | CENN服務(wù) | 對外合作 | 刊登廣告 | 法律聲明 | 聯(lián)系我們 | 手機版
客戶服務(wù)熱線:020-34333079、34333137 傳真:020-34333002 舉報電話:020-34333002、13925138999(春雷) 舉報郵箱:cenn_gd@126.com
版權(quán)所有:中國企業(yè)新聞網(wǎng) 運營商:廣州至高點網(wǎng)絡(luò)技術(shù)有限公司 地址:廣州市海珠區(qū)江燕路353號保利紅棉48棟1004