世界讀書(shū)日 | 以AI致敬古籍經(jīng)典
“ 歷經(jīng)千百年歲月洗禮,古籍以其不可估量的歷史價(jià)值、以其蘊(yùn)含的風(fēng)華文雅一路傳承,成為人類(lèi)文明不可磨滅、未曾銷(xiāo)蝕的精神力量。閱讀古籍,在時(shí)空交錯(cuò)中與先賢圣哲流傳世代的思想精髓摩擦碰撞,更能在萬(wàn)古江河的歷史動(dòng)線(xiàn)中建立博古通今的鏈接??墒牵嬲墓偶ǔT趫D書(shū)館和博物館里被束之高閣,普通民眾鮮有機(jī)”

恰逢4月23日“世界讀書(shū)日”之際,小編向大家盤(pán)點(diǎn)咱漢王家的各種AI黑科技是怎樣助力古籍走入尋常、讓今人得以相遇古人,追尋流淌千年的文化基因,領(lǐng)略中國(guó)乃至世界古籍沉浸千百年智慧的迷人魅力。
01
—
手抄本古籍識(shí)別
文檔電子化讓古籍躍然屏幕
—
手抄本古籍識(shí)別
文檔電子化讓古籍躍然屏幕
基于深度學(xué)習(xí)技術(shù),在海量數(shù)據(jù)訓(xùn)練基礎(chǔ)上,經(jīng)多年研發(fā),漢王科技突破性解決了手抄本古籍識(shí)別這一OCR領(lǐng)域難題,這是文字識(shí)別領(lǐng)域的一項(xiàng)重大技術(shù)突破。面對(duì)手抄本古籍內(nèi)容,利用此技術(shù)只要隨手一拍,就可以秒級(jí)轉(zhuǎn)換為文本。無(wú)論是背景干擾嚴(yán)重的復(fù)印紙、還是形狀彎曲的紙稿,都可以輕松應(yīng)對(duì),真正做到了人眼可辨即可識(shí)。

作為業(yè)界致力于OCR識(shí)別技術(shù)研發(fā)和應(yīng)用的先驅(qū)者,自2013年,漢王科技就將文檔電子化的觸角延伸至包括圖書(shū)館等多個(gè)國(guó)家級(jí)項(xiàng)目。在圖書(shū)館領(lǐng)域,漢王已與國(guó)家圖書(shū)館持續(xù)合作了十三個(gè)年頭。從最初的圖書(shū)掃描加工,到元數(shù)據(jù)加工,再到高精度全文加工;從簡(jiǎn)體中文識(shí)別,到繁體中文識(shí)別,再到高難度的古籍識(shí)別;從紙質(zhì)文獻(xiàn)到電子文獻(xiàn);從內(nèi)容加工服務(wù)到管理平臺(tái)建設(shè),漢王深度與國(guó)家圖書(shū)館合作,不斷挑戰(zhàn)新的業(yè)務(wù)高度。
02
—
突破自然語(yǔ)言處理
文本結(jié)構(gòu)化樹(shù)智慧圖書(shū)館標(biāo)桿
—
突破自然語(yǔ)言處理
文本結(jié)構(gòu)化樹(shù)智慧圖書(shū)館標(biāo)桿
2015年,得益于深度學(xué)習(xí)算法的快速進(jìn)展,大規(guī)模社交文本數(shù)據(jù)以及語(yǔ)料數(shù)據(jù)的不斷積累,NLP技術(shù)有了飛躍式的發(fā)展。漢王科技進(jìn)行文檔大數(shù)據(jù)化研發(fā)工作,力圖突破NLP技術(shù),建立起自己的文檔大數(shù)據(jù)庫(kù)體系,開(kāi)發(fā)各種新的應(yīng)用,主攻包括文本分類(lèi)、聚類(lèi)、結(jié)構(gòu)化數(shù)據(jù)抽取、知識(shí)抽取、知識(shí)圖譜、機(jī)器閱讀等在內(nèi)的NLP技術(shù)。
在對(duì)文史出版社叢書(shū)文獻(xiàn)進(jìn)行知識(shí)加工過(guò)程中,通過(guò)從文獻(xiàn)中碎片化抽取、清洗、歸集、融合得到基礎(chǔ)數(shù)據(jù),深度加工挖掘得到人物、地點(diǎn)、機(jī)構(gòu)、事件類(lèi)的知識(shí)條目,再基于知識(shí)條目構(gòu)建人物庫(kù)、地點(diǎn)庫(kù)、機(jī)構(gòu)庫(kù)、事件庫(kù)等知識(shí)資源庫(kù),并通過(guò)關(guān)系定義實(shí)現(xiàn)跨類(lèi)別的知識(shí)關(guān)聯(lián),提供了超越圖書(shū)內(nèi)容信息的深度知識(shí)服務(wù)。
在承接的國(guó)家圖書(shū)館"智慧圖書(shū)館體系建設(shè)項(xiàng)目"中,漢王針對(duì)民國(guó)文獻(xiàn)數(shù)字資源開(kāi)展知識(shí)化加工,完成數(shù)字資源精細(xì)化標(biāo)引和知識(shí)內(nèi)容抽取,細(xì)化文獻(xiàn)顆粒度,多維度揭示文獻(xiàn)的知識(shí)內(nèi)容,并開(kāi)展多維度、多層次知識(shí)組織,提供基于知識(shí)圖譜的可視化展示。該項(xiàng)目實(shí)施過(guò)程中就應(yīng)用到了包括基于深度學(xué)習(xí)的新一代文字識(shí)別、自然語(yǔ)言理解、智能抽取、知識(shí)圖譜構(gòu)建、數(shù)據(jù)可視化等多項(xiàng)人工智能創(chuàng)新型技術(shù)。這將是雙方在人工智能新時(shí)代,針對(duì)文化領(lǐng)域的一個(gè)重點(diǎn)創(chuàng)新與嘗試,其成果將作為全國(guó)智慧圖書(shū)館體系建設(shè)的重要參考之一。
03
—
數(shù)字技術(shù)增強(qiáng)現(xiàn)實(shí)世界
AR/VR技術(shù)讓山海經(jīng)走進(jìn)元宇宙
元宇宙時(shí)代的到來(lái)為文博行業(yè)注入了新科技的力量。數(shù)字技術(shù)與現(xiàn)實(shí)世界的結(jié)合變得更加深入,增強(qiáng)人通過(guò)數(shù)字化平臺(tái)感知世界、鏈接世界的能力。漢王科技結(jié)合自身在AI人工智能、AR/VR/MR等技術(shù)方面的積累,拓展文物數(shù)字藏品展示與使用場(chǎng)景,在元宇宙時(shí)代煥發(fā)出新的生命力。

在某省級(jí)圖書(shū)館虛擬古籍館項(xiàng)目中,以古籍場(chǎng)館實(shí)體為基礎(chǔ),結(jié)合館藏古籍實(shí)際,對(duì)古籍館及部分藏品進(jìn)行數(shù)字采集,高度還原古籍藏品的真實(shí)形態(tài),讓讀者可以隨時(shí)隨地通過(guò)網(wǎng)絡(luò)虛擬瀏覽古籍館;
綜合運(yùn)用音視頻、燈光、色調(diào)、配樂(lè)、解說(shuō)等多種元素進(jìn)行圖書(shū)館的虛擬古籍館展廳制作,給觀賞者帶來(lái)如臨其境的參展體驗(yàn)。
在國(guó)家圖書(shū)館山海經(jīng)AR方案規(guī)劃中,漢王對(duì)山海經(jīng)里的各版本古籍插圖進(jìn)行重新設(shè)計(jì)和建模,設(shè)計(jì)腳本和動(dòng)作,投射到現(xiàn)實(shí)環(huán)境進(jìn)行增強(qiáng)現(xiàn)實(shí)展示打造沉浸空間,神獸可以從畫(huà)面中走出與參觀者進(jìn)行對(duì)話(huà),參觀者可以進(jìn)入到劇本中一起探索山海經(jīng),喚醒山海神獸,打造山海秘境。參觀者可以通過(guò)手機(jī)或者AR眼鏡進(jìn)入秘境之中,同時(shí)支持多場(chǎng)景切換,同時(shí)每個(gè)參觀者也可以自由選擇自己在場(chǎng)景的形象體驗(yàn)換裝沉浸式體驗(yàn),并且支持互動(dòng)拍照合影,體驗(yàn)一把仙界之旅.

中國(guó)古籍經(jīng)典如漫天星光,璀璨閃耀,即便擷取些許也能成為照亮暗夜之光。面對(duì)當(dāng)前方興未艾的數(shù)字化浪潮,漢王從浩瀚磅礴的“文化宇宙”出發(fā),集結(jié)AI技術(shù)的力量,將經(jīng)典化作可以滋養(yǎng)文化根基的養(yǎng)分,化作深化社會(huì)思考的基石,這不僅是給予熱愛(ài)閱讀的人一份穿越時(shí)光、見(jiàn)字如面的慰藉,也在文化層面上深度釋放科技溫度、助力我國(guó)傳統(tǒng)文化加速?gòu)?fù)興。