文檔“大數(shù)據(jù)” 漢王攻堅AI難點-自然語言處理(下)
攻堅人工智能難中之難
中文自然語言處理
自然語言處理-NLP NaturalLanguageProcessing是研究人與計算機交互的語言問題。從語言識別,到語義識別,從而真正做到可以交互。業(yè)界普遍認為,自然語言處理是人工智能中最難的部分,也是決定AI是否“智能”的關(guān)鍵因素。
目前在這一領(lǐng)域從事相關(guān)技術(shù)研發(fā)工作的主角為國際巨頭谷歌。目前谷歌正在開發(fā)一套神經(jīng)網(wǎng)絡(luò),開發(fā)代號是神經(jīng)官能癥(neurosis),而這套智慧網(wǎng)絡(luò)的核心就是讓機器具有強大的學(xué)習(xí)能力,理解人類幾千年積累下來的自然語言信息,幫助人類隨時調(diào)用和理解這些信息,進行快速學(xué)習(xí),以適應(yīng)知識大爆炸的時代來臨。

而對于博大精深的中文,是以“字”為單位,一個中文文本或一個漢字(含標點符號等)串可能有多個含義,相對于天然分詞的英文,中文處理的難度有所提高,是自然語言理解中的主要困難和障礙。漢王利用其中文文字識別技術(shù)優(yōu)勢,布局自然語言理解技術(shù)研發(fā)與突破,在未來將幫助更多的相關(guān)工作者或機構(gòu)將平面的書本變成立體化的知識書庫。

為此,漢王科技融合武漢大學(xué)的研發(fā)團隊聯(lián)合成立了武漢漢王大數(shù)據(jù)技術(shù)有限公司,專門研究及開發(fā)“自然語言理解”課題方面的技術(shù)及產(chǎn)品。
布局各領(lǐng)域文檔大數(shù)據(jù)工程
從大的技術(shù)發(fā)展來看,現(xiàn)在無論是IT技術(shù)業(yè)、互聯(lián)網(wǎng)業(yè),“自然語言理解”都是最尖端的研究方向。武漢漢王大數(shù)據(jù)的“自然語言理解工具化”發(fā)展方向,已經(jīng)成為最尖端的IT技術(shù)研究工作。
2016年,漢王科技不僅成立了武漢漢王大數(shù)據(jù)技術(shù)有限公司,還成功收購了北京影研創(chuàng)新科技發(fā)展有限公司,影研科技業(yè)務(wù)范圍涵蓋文檔信息化應(yīng)用及內(nèi)容管理解決方案,目前在醫(yī)療和法院市場具有競爭優(yōu)勢,將技術(shù)、資金注入影研科技,顯而易見,漢王完成了醫(yī)療和法院文檔大數(shù)據(jù)市場的進入。
隨著漢王數(shù)字、武漢漢王大數(shù)據(jù)、影研科技的發(fā)展,漢王科技在文檔數(shù)據(jù)化領(lǐng)域的布局將進一步延伸,通過承擔國家級、各行業(yè)項目,漢王進行文檔“大數(shù)據(jù)化”研發(fā)工作,并同步建立起自己的文檔大數(shù)據(jù)庫,而未來要做的,則是在大數(shù)據(jù)基礎(chǔ)上開發(fā)各種新的應(yīng)用,以探索文檔數(shù)據(jù)化更廣闊的應(yīng)用前景。
基于NLP的文檔大數(shù)據(jù)
讓AI真正“智能”
這種通過自然語言處理(NLP)而“結(jié)構(gòu)化的文檔大數(shù)據(jù)”會給整個社會帶來從生活到思維上革命性的變化:未來,法院法律文檔大數(shù)據(jù)平臺可以為律師等法律工作者提供海量的同類案例參考,使其能更方便地借鑒歷史判案情況,也可以幫助普通人查閱理解自己在生活中遇到的各種相關(guān)法律問題;而挖掘健康領(lǐng)域數(shù)字化文檔資源價值,也將對醫(yī)療市場產(chǎn)生顛覆性的影響,未來,醫(yī)學(xué)界人士可透過院內(nèi)、院際的互通數(shù)據(jù),輔以病患本身的健康信息與過往病歷,迅速做出較以往精確許多的診斷,加速推動包括疾病診斷與預(yù)測、臨床實驗數(shù)據(jù)的分析與處理等諸多應(yīng)用。