企業(yè)發(fā)布
首頁 > 企業(yè)發(fā)布 > 詳細(xì)內(nèi)容
專訪深算院CTO陳志標(biāo):釋放“AI+”新質(zhì)生產(chǎn)力,深算院如何“把大數(shù)據(jù)變小”?
2024/3/29 14:50:32 來源:中國企業(yè)新聞網(wǎng)
導(dǎo)言:近期,南都·灣財(cái)社推出《新質(zhì)·中國造》欄目,深入千行百業(yè),遍訪灣區(qū)企業(yè),解鎖灣區(qū)新質(zhì)生產(chǎn)力,共探高質(zhì)量發(fā)展之道。
近期,南都·灣財(cái)社推出《新質(zhì)·中國造》欄目,深入千行百業(yè),遍訪灣區(qū)企業(yè),解鎖灣區(qū)新質(zhì)生產(chǎn)力,共探高質(zhì)量發(fā)展之道。本期對(duì)話深圳計(jì)算科學(xué)研究院YashanDB首席技術(shù)官陳志標(biāo),探討國產(chǎn)數(shù)據(jù)庫如何實(shí)現(xiàn)創(chuàng)新突圍,搶抓數(shù)字經(jīng)濟(jì)時(shí)代的新機(jī)遇。
以下是專訪內(nèi)容:
1.如何應(yīng)對(duì)AI時(shí)代所面臨的算力挑戰(zhàn)?
Q:南都·灣財(cái)社:數(shù)據(jù)、算力和算法是發(fā)展人工智能的三要素,深算院做了怎樣的前瞻性布局?
陳志標(biāo):今年,政府工作報(bào)告中首次提及開展“人工智能+”行動(dòng),人工智能產(chǎn)業(yè)發(fā)展提升至國家戰(zhàn)略的層面。數(shù)據(jù)是人工智能發(fā)展的基礎(chǔ)性戰(zhàn)略資源,深算院重點(diǎn)圍繞“數(shù)據(jù)”領(lǐng)域,針對(duì)當(dāng)前面臨的一些重大挑戰(zhàn)進(jìn)行技術(shù)攻關(guān),致力為人工智能的長(zhǎng)遠(yuǎn)發(fā)展打牢基礎(chǔ)、夯實(shí)根基。
首先是海量數(shù)據(jù)帶來的計(jì)算挑戰(zhàn)。面向人工智能和數(shù)字化浪潮帶來的海量數(shù)據(jù),為了突破數(shù)據(jù)庫系統(tǒng)的能力邊界,深算院基于原創(chuàng)的有界計(jì)算理論,真正做到使用小資源實(shí)現(xiàn)大數(shù)據(jù)實(shí)時(shí)分析,即“大數(shù)據(jù)變小”,節(jié)省大量傳統(tǒng)計(jì)算算力。深算院YashanDB在工程應(yīng)用中融入這一理論研究成果,經(jīng)實(shí)測(cè),面向從10GB增長(zhǎng)到1TB的不同規(guī)模數(shù)據(jù)量,YashanDB實(shí)現(xiàn)響應(yīng)時(shí)延維持亞秒級(jí),性能提升千倍以上且未衰減,極大地節(jié)約了計(jì)算資源,為AI時(shí)代所面臨的算力挑戰(zhàn)帶來新解法。
再者是數(shù)據(jù)質(zhì)量方面的挑戰(zhàn)。高質(zhì)量數(shù)據(jù)是釋放人工智能的價(jià)值的前提,如何用自動(dòng)化的技術(shù)手段提高數(shù)據(jù)的準(zhǔn)確性、公正性和健壯性是當(dāng)前學(xué)術(shù)界和工業(yè)界的研究熱點(diǎn)。數(shù)據(jù)作為AI模型的“燃料”,訓(xùn)練語料質(zhì)量、多樣性和完備性變得愈發(fā)重要;诖耍覀円环矫嫱ㄟ^數(shù)據(jù)采集與分類、數(shù)據(jù)清洗、數(shù)據(jù)合成與擴(kuò)充,以形成領(lǐng)域模型和高質(zhì)量語料庫;另一方面,當(dāng)大模型應(yīng)用在某個(gè)特定的領(lǐng)域和任務(wù)進(jìn)行微調(diào)時(shí),基于已積累的領(lǐng)域模型和高質(zhì)量語料庫,我們提出一種基于模型驅(qū)動(dòng)的迭代框架,進(jìn)一步提升下游模型的“糾錯(cuò)”能力,從而實(shí)現(xiàn)性能提升。
最后是數(shù)據(jù)多樣性挑戰(zhàn)。面對(duì)來源多樣、格式復(fù)雜的數(shù)據(jù),如何消除不同模態(tài)數(shù)據(jù)之間語義上的鴻溝快速進(jìn)行整合和計(jì)算是另一個(gè)難點(diǎn)。當(dāng)前主流方案考慮將數(shù)據(jù)按原始形態(tài)保存,在必要時(shí)通過轉(zhuǎn)換統(tǒng)一為關(guān)系數(shù)據(jù)再做分析,這類方法需要轉(zhuǎn)換大量無關(guān)數(shù)據(jù),難以支撐數(shù)據(jù)的快速變化。針對(duì)多!伴g接計(jì)算”模式的實(shí)時(shí)性難題,我們做了一些新的嘗試——基于語義實(shí)體連接,實(shí)現(xiàn)關(guān)系表中元組與圖數(shù)據(jù)中節(jié)點(diǎn)的對(duì)應(yīng),這樣可以針對(duì)特定實(shí)體進(jìn)行跨模計(jì)算,以“直接計(jì)算”代替“間接計(jì)算”,提升分析效率。
2.破解中小企業(yè)大數(shù)據(jù)應(yīng)用門檻高的難題
Q:南都·灣財(cái)社:數(shù)據(jù)已經(jīng)被列為重要的生產(chǎn)要素,在您看來,如何激活大數(shù)據(jù)在產(chǎn)業(yè)發(fā)展中的新動(dòng)能,釋放新質(zhì)生產(chǎn)力?
陳志標(biāo):隨著大數(shù)據(jù)、云計(jì)算等數(shù)字化技術(shù)的飛速發(fā)展和廣泛應(yīng)用,越來越多的企業(yè)開始依賴數(shù)據(jù)支撐業(yè)務(wù)運(yùn)轉(zhuǎn),數(shù)據(jù)應(yīng)用場(chǎng)景也隨之增多,讓大企業(yè)用得好大數(shù)據(jù),讓中小企業(yè)用得起大數(shù)據(jù),才能真正助力企業(yè)充分釋放數(shù)據(jù)價(jià)值、激活產(chǎn)業(yè)發(fā)展新動(dòng)能。
雖然大企業(yè)已經(jīng)建立了較完善的數(shù)據(jù)管理體系,但在整個(gè)數(shù)據(jù)利用方面還存在一些障礙,例如原始數(shù)據(jù)質(zhì)量不高、數(shù)據(jù)共享不足、價(jià)值未被充分挖掘等等;那對(duì)中小企業(yè)而言,受限于預(yù)算和技術(shù)團(tuán)隊(duì)等現(xiàn)狀,最顯著的問題是數(shù)據(jù)的使用門檻很高,無法享受大數(shù)據(jù)賦予的紅利,例如在大數(shù)據(jù)環(huán)境下處理PB級(jí)甚至是EB級(jí)數(shù)據(jù)對(duì)算力的要求十分高,這讓大多數(shù)中小企業(yè)對(duì)大數(shù)據(jù)計(jì)算依然可望而不可即,也會(huì)導(dǎo)致數(shù)字鴻溝的進(jìn)一步擴(kuò)大。
要進(jìn)一步釋放產(chǎn)業(yè)發(fā)展中的數(shù)據(jù)價(jià)值,一方面,基礎(chǔ)設(shè)施安全是企業(yè)用好數(shù)據(jù)的底線,數(shù)據(jù)庫等基礎(chǔ)軟件系統(tǒng)作為關(guān)鍵基礎(chǔ)設(shè)施,必須實(shí)現(xiàn)安全可信和持續(xù)演進(jìn),才能支持各行業(yè)在產(chǎn)業(yè)升級(jí)和轉(zhuǎn)型過程中的需求;另一方面,從數(shù)據(jù)的存、算、管、用全鏈條助力企業(yè)更簡(jiǎn)單地管理數(shù)據(jù),通過提供一站式數(shù)據(jù)管理解決方案,讓用戶簡(jiǎn)化學(xué)習(xí)及運(yùn)維成本,能夠聚焦在業(yè)務(wù)創(chuàng)新,充分將數(shù)據(jù)要素轉(zhuǎn)化為生產(chǎn)力。
更為重要的是,中小企業(yè)對(duì)我國GDP的貢獻(xiàn)高達(dá)60%,如何破解中小企業(yè)大數(shù)據(jù)應(yīng)用門檻高的難題更是激活產(chǎn)業(yè)的關(guān)鍵。針對(duì)海量數(shù)據(jù)計(jì)算成本過高的問題,我們致力于重新構(gòu)建一套資源受限下的大數(shù)據(jù)查詢處理框架,把大數(shù)據(jù)變小,讓資源受限的中小企業(yè)也能享受大數(shù)據(jù)帶來的便利。
3.以數(shù)據(jù)為中心的新型數(shù)據(jù)管理技術(shù)或?qū)⒊蔀橹匾较?/strong>
Q:南都·灣財(cái)社:我們看到數(shù)字經(jīng)濟(jì)的浪潮風(fēng)起云涌,人工智能的發(fā)展也進(jìn)入大模型時(shí)代。站在您的角度,也可以結(jié)合深算院的發(fā)展情況,談?wù)劯惺艿揭恍⿻r(shí)代發(fā)展的機(jī)遇或者說風(fēng)口?
陳志標(biāo):如果說數(shù)據(jù)是數(shù)字經(jīng)濟(jì)時(shí)代的“石油”,那么數(shù)據(jù)管理就好比“發(fā)動(dòng)機(jī)”,共同構(gòu)成了面向千行百業(yè)的核心能力。在海量數(shù)據(jù)供給、活躍創(chuàng)新生態(tài)和巨大市場(chǎng)需求的多重推動(dòng)下,尤其隨著AI大模型的快速發(fā)展,必將催生新的市場(chǎng)和更多應(yīng)用場(chǎng)景,企業(yè)創(chuàng)新創(chuàng)業(yè)勢(shì)能將持續(xù)增強(qiáng)。
與此同時(shí),隨著新應(yīng)用場(chǎng)景的涌現(xiàn),對(duì)數(shù)據(jù)質(zhì)量、數(shù)據(jù)多樣性、數(shù)據(jù)處理的新鮮度和融合性等提出了更高的要求,這也將給數(shù)據(jù)管理帶來更多挑戰(zhàn);趥鹘y(tǒng)計(jì)算模式開發(fā)的產(chǎn)品難以應(yīng)對(duì)龐大的計(jì)算體量、解決計(jì)算復(fù)雜性等問題,因此以數(shù)據(jù)為中心的新型數(shù)據(jù)管理技術(shù)或?qū)⒊蔀橹匾较颉?
深算院作為新型科研機(jī)構(gòu),致力于打破一直以來存在的理論研究與工程轉(zhuǎn)化之間的鴻溝。秉承“理論和系統(tǒng)并重”的初衷,我們堅(jiān)持從0到1的基礎(chǔ)軟件開發(fā),具備從產(chǎn)品定義、代碼實(shí)現(xiàn)到質(zhì)量保障端到端的工程實(shí)現(xiàn)能力,目前已開發(fā)從理論到工程全自研的崖山、采石磯、釣魚城三款戰(zhàn)略性基礎(chǔ)軟件系統(tǒng)并實(shí)現(xiàn)落地應(yīng)用。
以數(shù)據(jù)庫領(lǐng)域?yàn)槔,作為現(xiàn)代信息技術(shù)領(lǐng)域的三大核心基礎(chǔ)之一,數(shù)據(jù)庫是數(shù)字經(jīng)濟(jì)的重要底座。深算院全自研的崖山數(shù)據(jù)庫系統(tǒng)YashanDB,就是將原創(chuàng)理論突破與成熟工程化能力有機(jī)結(jié)合的產(chǎn)品。一方面,針對(duì)行業(yè)國產(chǎn)化替代需求,我們將產(chǎn)品的內(nèi)核能力做深做足做實(shí),攻克了高端領(lǐng)域技術(shù)制高點(diǎn)——共享集群技術(shù),通過引入自適應(yīng)異步并行、細(xì)粒度多版本并發(fā)控制支持高吞吐并發(fā)數(shù)據(jù)讀寫;通過抽象全局緩存,提供統(tǒng)一、透明的數(shù)據(jù)快速訪問,降低實(shí)例間的網(wǎng)絡(luò)開銷,提升訪問效率;通過全局資源運(yùn)行時(shí)調(diào)度降低多實(shí)例間并發(fā)沖突,因此可以提供與國外系統(tǒng)相當(dāng)?shù)膬?nèi)核性能和高可用性保障,實(shí)現(xiàn)1:1的平替效果,有力解決“卡脖子”問題,目前YashanDB已經(jīng)在金融、政府、能源等國計(jì)民生行業(yè)的核心業(yè)務(wù)系統(tǒng)中提供了自主可控的底層技術(shù)支撐;另一方面,面向大數(shù)據(jù)與人工智能時(shí)代的新應(yīng)用場(chǎng)景,我們積極探索有界計(jì)算、跨模融合計(jì)算等前沿大數(shù)據(jù)技術(shù)的落地和應(yīng)用,例如基于有界計(jì)算理論的數(shù)據(jù)尺度無關(guān)查詢處理技術(shù)突破了關(guān)系理論限制,有效解決了數(shù)據(jù)規(guī)模對(duì)算力的依賴問題,有望為大數(shù)據(jù)處理帶來革命性的進(jìn)步,在我們的最新發(fā)布版本中已實(shí)現(xiàn)了有界計(jì)算的能力。
未來,我們將繼續(xù)深化與學(xué)術(shù)界和產(chǎn)業(yè)界的協(xié)作關(guān)系,不斷擴(kuò)寬“朋友圈”,攜手更多行業(yè)伙伴探索新場(chǎng)景的底層技術(shù)國產(chǎn)化應(yīng)用,打造關(guān)鍵行業(yè)國產(chǎn)化的標(biāo)桿示范,助力加快實(shí)現(xiàn)IT系統(tǒng)全面自主創(chuàng)新,共同構(gòu)建一個(gè)穩(wěn)健、繁榮的大數(shù)據(jù)與數(shù)據(jù)庫產(chǎn)業(yè)生態(tài)。
免責(zé)聲明:
※ 以上所展示的信息來自媒體轉(zhuǎn)載或由企業(yè)自行提供,其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本網(wǎng)站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本網(wǎng)站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。如果以上內(nèi)容侵犯您的版權(quán)或者非授權(quán)發(fā)布和其它問題需要同本網(wǎng)聯(lián)系的,請(qǐng)?jiān)?0日內(nèi)進(jìn)行。
※ 有關(guān)作品版權(quán)事宜請(qǐng)聯(lián)系中國企業(yè)新聞網(wǎng):020-34333079 郵箱:cenn_gd@126.com 我們將在24小時(shí)內(nèi)審核并處理。
標(biāo)簽 :
相關(guān)網(wǎng)文
24小時(shí)熱點(diǎn)圖片
一周新聞資訊點(diǎn)擊排行
關(guān)于我們 | CENN服務(wù) | 對(duì)外合作 | 刊登廣告 | 法律聲明 | 聯(lián)系我們 | 手機(jī)版
客戶服務(wù)熱線:020-34333079、34333137 舉報(bào)電話:020-34333002 投稿郵箱:cenn_gd@126.com
版權(quán)所有:中國企業(yè)新聞網(wǎng) 運(yùn)營商:廣州至高點(diǎn)網(wǎng)絡(luò)科技投資有限公司 地址:廣州市海珠區(qū)江燕路353號(hào)保利紅棉48棟1004