湖南省科技信息研究所 www.fanghuojl.cn 時(shí)間:2019月03月20日 [字體: 大 中 小 ]
成果名稱:基于大數(shù)據(jù)智能化處理的情報(bào)挖掘系統(tǒng)研究及應(yīng)用
成果簡(jiǎn)介:
大數(shù)據(jù)時(shí)代,決策環(huán)境發(fā)生巨大變化,龐大而復(fù)雜的數(shù)據(jù)考驗(yàn)著情報(bào)系統(tǒng)的技術(shù)體系結(jié)構(gòu)和數(shù)據(jù)處理能力。本項(xiàng)目面向科技情報(bào)研究人員與科技情報(bào)服務(wù)機(jī)構(gòu),提出基于大數(shù)據(jù)智能處理的情報(bào)判讀理論、方法,運(yùn)用人工智能等技術(shù)開發(fā)輔助情報(bào)判讀的情報(bào)挖掘系統(tǒng),并在科技情報(bào)工作中得到系統(tǒng)的應(yīng)用,實(shí)現(xiàn)了基于科研項(xiàng)目、論文、企業(yè)年報(bào)、網(wǎng)頁媒體報(bào)道等大數(shù)據(jù)的科技情報(bào)自動(dòng)采集、抽取、分析以及自動(dòng)生成報(bào)告,通過固化專家思路和直接展示判讀點(diǎn)信息的方法,使情報(bào)生產(chǎn)從基于個(gè)人能力的生產(chǎn)發(fā)展成專家與情報(bào)人員協(xié)同的標(biāo)準(zhǔn)化生產(chǎn),改變了情報(bào)生產(chǎn)方式,建立了基于情報(bào)生產(chǎn)線的情報(bào)工作體系。
主要技術(shù)內(nèi)容:一是從理論上提出大數(shù)據(jù)環(huán)境下情報(bào)的核心是判讀;情報(bào)判讀的目的是通過發(fā)現(xiàn)并跟蹤領(lǐng)域關(guān)鍵人物、重要機(jī)構(gòu)和熱點(diǎn)主題,對(duì)領(lǐng)域發(fā)展可能的判讀點(diǎn)做出判斷;提出包括科研項(xiàng)目、學(xué)術(shù)論文、技術(shù)專利、企業(yè)年報(bào)、媒體報(bào)道等情報(bào)判讀信息要素結(jié)構(gòu)框架,為情報(bào)判讀的規(guī)范化作業(yè)提供理論與方法上的支持。二是以情報(bào)判讀任務(wù)需要為導(dǎo)向,從一般情報(bào)判讀思維和特點(diǎn)出發(fā),充分發(fā)揮判讀人員知識(shí)、經(jīng)驗(yàn)和主觀能動(dòng)作用,綜合專業(yè)領(lǐng)域知識(shí)、情報(bào)學(xué)方法與信息技術(shù)等多學(xué)科領(lǐng)域的優(yōu)勢(shì),研究開發(fā)用于情報(bào)判讀的基于大數(shù)據(jù)智能化處理的情報(bào)挖掘群系統(tǒng),具體包括基于科研項(xiàng)目、學(xué)術(shù)論文、專利、企業(yè)年報(bào)以及網(wǎng)頁媒體報(bào)道共5 個(gè)情報(bào)挖掘子系統(tǒng)。三是從湖南省科技信息研究所產(chǎn)業(yè)競(jìng)爭(zhēng)情報(bào)判讀標(biāo)志建立、子系統(tǒng)功能應(yīng)用到群系統(tǒng)功能應(yīng)用三個(gè)層次,研究制定了情報(bào)挖掘系統(tǒng)在不同情報(bào)判讀任務(wù)類型中的應(yīng)用方法與技術(shù)流程。
知識(shí)產(chǎn)權(quán)情況:取得計(jì)算機(jī)軟件著作權(quán)10 項(xiàng),著作2 本,論文12 篇(含人大復(fù)印資料全文收錄一篇)。
技術(shù)經(jīng)濟(jì)指標(biāo):該成果建立的發(fā)達(dá)國家重大科研項(xiàng)目和《財(cái)富》500 強(qiáng)企業(yè)年報(bào)關(guān)系型數(shù)據(jù)庫和全文數(shù)據(jù)庫,GB 級(jí)數(shù)據(jù)全文檢索響應(yīng)在毫秒之內(nèi);建立的中文科技詞庫收錄科技詞匯382 萬,覆蓋科技情報(bào)工作的全部領(lǐng)域和所有專業(yè);中文學(xué)術(shù)論文數(shù)據(jù)覆蓋率達(dá)98%以上,論文題錄數(shù)據(jù)抓取工具響應(yīng)速度為500 毫秒,1 小時(shí)平均抓取2000 篇論文,科技詞條分析工具處理速度5 分鐘,平均1 篇論文需要10 毫秒;學(xué)術(shù)研究情報(bào)挖掘描述準(zhǔn)確率達(dá)95%以上;學(xué)術(shù)研究概貌描述情報(bào)報(bào)告完成效率較以前平均提升50%。網(wǎng)頁信息情報(bào)挖掘系統(tǒng)響應(yīng)速度為500 毫秒,1 小時(shí)平均抓取20000 條互聯(lián)網(wǎng)文本信息,網(wǎng)絡(luò)文本信息實(shí)體解析速度9 分鐘,平均1 條文本信息需要27 毫秒;聚類精度達(dá)98%。
應(yīng)用推廣及效率情況:該成果在廣西有色金屬集團(tuán)匯元錳業(yè)有限公司、中車株洲所研究院產(chǎn)經(jīng)中心、楚天科技股份有限公司等正式使用,取得良好應(yīng)用口碑,同時(shí),該成果有效推動(dòng)了湖南省產(chǎn)業(yè)競(jìng)爭(zhēng)情報(bào)研究體系地不斷完善,提升了企業(yè)技術(shù)創(chuàng)新能力,推動(dòng)了湖南省經(jīng)濟(jì)建設(shè)。除此之外,該成果還在北京、浙江、河北、寧夏、山東省、廣西等10 多個(gè)省市級(jí)科技情報(bào)機(jī)構(gòu)開展推廣應(yīng)用,提高了科技情報(bào)事業(yè)的信息化水平,推動(dòng)了科技情報(bào)挖掘分析的自動(dòng)化。