“漢王檔案全文識別系統(tǒng)”在全國檔案新技術(shù)新產(chǎn)品展示會上大放異彩
2019年10月23日-25日,由中國檔案學(xué)會主辦的“全國檔案新技術(shù)新產(chǎn)品展示會”在北京國際會展中心盛大召開。


國家檔案局局長李明華、副局長付華、中國檔案學(xué)會理事長段東升、中檔案學(xué)會秘書長鄧小軍、故宮博物院院長王旭東、第一歷史檔案館館長孫森林等領(lǐng)導(dǎo)參與了本次展示會并在“全國檔案館館長論壇”上做了重要報(bào)告。

“漢王數(shù)字”攜近年來的最新科研成果“漢王檔案全文識別系統(tǒng)”在本次展示會上精彩亮相,這一產(chǎn)品是漢王公司在人工智能領(lǐng)域的又一杰出力作。依托漢王在文檔分析與文字識別方面數(shù)十年的研發(fā)經(jīng)驗(yàn)和數(shù)據(jù)樣本積累,科研人員利用深度學(xué)習(xí)技術(shù)訓(xùn)練出了一套仿照人眼斷字的切分模型,并成功解決了檔案識別中常見的復(fù)雜版式、重度噪音干擾、手寫字體、低分辨率圖像等高難度識別問題。其中印刷體識別達(dá)到99%以上準(zhǔn)確率,手寫字體識別可達(dá)到95%以上準(zhǔn)確率。該系統(tǒng)為檔案數(shù)據(jù)由“圖像化”向“文本化”轉(zhuǎn)換提供了捷徑,必將成為國家檔案大數(shù)據(jù)戰(zhàn)略的關(guān)鍵一環(huán)。

2018年10月,國家檔案局頒布了《機(jī)關(guān)檔案管理規(guī)定》,第四十九條提出“機(jī)關(guān)應(yīng)當(dāng)積極采用數(shù)據(jù)分析、文本挖掘等新方法,擴(kuò)展檔案開發(fā)的力度和深度”。由于全國檔案數(shù)量巨大,一直以來,檔案文本內(nèi)容數(shù)字化都面臨著成本高、效率低、周期長的困境。“漢王檔案全文識別系統(tǒng)”的推出,可以很好的解決這一長期困擾檔案行業(yè)的普遍性問題。

展示會上,參展嘉賓對“漢王檔案全文識別系統(tǒng)”表現(xiàn)出了濃厚的興趣,對漢王新技術(shù)所呈現(xiàn)的效果稱贊不已。多數(shù)嘉賓表示會繼續(xù)關(guān)注漢王識別技術(shù)的發(fā)展情況,并盛情邀請我公司技術(shù)人員到單位詳細(xì)交流。
