RM新时代APP官网

舊版網(wǎng)站入口

站內(nèi)搜索

《基于多維度聚合的網(wǎng)絡資源知識發(fā)現(xiàn)研究》中期檢查報告

2016年03月11日14:39

一、 研究進展情況

1. 研究計劃總體執(zhí)行情況及各子課題進展情況

總體上,本項目組成員依據(jù)項目的研究計劃和時間安排,基本完成了預期的研究目標。目前,本課題的研究工作和進度基本與研究計劃吻合,主要對項目的總體研究框架,子課題一和子課題二展開了廣泛而深入的研究。具體來說,本課題的研究工作與進度如下:

1.1研究架構

課題組在進一步了解本課題相關領域理論研究和實踐進展的基礎上,完善了研究架構,確定了研究重點和難點,進一步明確了任務分工。在此基礎上,制定了最終的研究方案。形成了一篇研究成果《基于多維度聚合的網(wǎng)絡資源知識發(fā)現(xiàn)》(已經(jīng)錄用),該論文詳細論述了基于多維度的網(wǎng)絡資源知識發(fā)現(xiàn)框架。該框架依據(jù)知識發(fā)現(xiàn)的基本流程(數(shù)據(jù)準備->數(shù)據(jù)挖掘->解釋與評估),從網(wǎng)絡信息資源的結構信息、網(wǎng)絡內(nèi)容信息和網(wǎng)絡使用信息三個維度,分別探討三個維度上的網(wǎng)絡信息資源的知識發(fā)現(xiàn)方法,而后在上述研究基礎上,探討面向全網(wǎng)絡資源多維度聚合的知識發(fā)現(xiàn)方法。由此可見,該知識發(fā)現(xiàn)框架既遵循知識發(fā)現(xiàn)的一般規(guī)律,具有可靠的理論基礎,同時又針對網(wǎng)絡資源的特性,具有針對性。最后,論文又依托該框架,以科技成果資源為應用對象,設計了基于多維度聚合的網(wǎng)絡資源知識發(fā)現(xiàn)框架的應用實施方案。通過上述分析可知,本論文作為項目初步研究成果,具有提綱挈領的作用,為后繼的研究提供了方向和實施方案。

1.2子課題一研究進展

子課題1的研究已經(jīng)全面展開,重點研究了四個方面的內(nèi)容:網(wǎng)絡資源的關聯(lián)結構特征研究,網(wǎng)絡資源關聯(lián)網(wǎng)絡中的知識分布研究,網(wǎng)絡資源關聯(lián)網(wǎng)絡的演化研究,網(wǎng)絡資源關聯(lián)網(wǎng)絡中的用戶行為研究。具體來說,各部分的研究情況如下:

(1) 網(wǎng)絡資源的關聯(lián)結構特征研究

對網(wǎng)絡資源關聯(lián)網(wǎng)絡結構形態(tài)進行研究,重點考察了以下幾個方面的內(nèi)容:首先,對關聯(lián)網(wǎng)絡的基本特征進行統(tǒng)計分析,通過度分布、聚類系數(shù)的統(tǒng)計分析考察關聯(lián)網(wǎng)絡知識節(jié)點的離散聚合特征,通過特征路徑長度分析考察知識節(jié)點的連通性和距離;其次,進一步研究了關聯(lián)網(wǎng)絡中的社區(qū)結構,從中觀層次分析知識的集聚特征和領域劃分,通過對研究網(wǎng)絡的層次結構研究領域關鍵詞的層次性,通過對網(wǎng)絡自相似形態(tài)的分析考察關聯(lián)網(wǎng)絡的對稱性和復制性;最后,以模體和群落為對象分析了網(wǎng)絡資源的中觀結構,探尋從微觀個體到宏觀結構的聯(lián)系。論文《網(wǎng)絡資源的關聯(lián)結構探析》正在撰寫中,論文架構已經(jīng)搭建,實驗數(shù)據(jù)已經(jīng)搜集。

(2) 網(wǎng)絡資源關聯(lián)網(wǎng)絡中的知識分布研究

本部分重點研究了網(wǎng)絡資源關聯(lián)網(wǎng)絡中的知識特征與規(guī)律。已經(jīng)形成論文《網(wǎng)絡資源關聯(lián)網(wǎng)絡中的知識分布規(guī)律研究》(正在撰寫),該論文主要通過統(tǒng)計分析關聯(lián)網(wǎng)絡的節(jié)點分布,識別關鍵知識節(jié)點;通過研究連接分布,分析關聯(lián)網(wǎng)絡的中心節(jié)點/中心連線;通過研究關聯(lián)網(wǎng)絡知識單元的作者分布,尋找網(wǎng)絡中的關鍵的知識生產(chǎn)者;通過研究作者合作關系,探索關聯(lián)網(wǎng)絡中的知識合作和知識遷移;通過研究關聯(lián)網(wǎng)絡中的機構分布,尋找知識創(chuàng)造的核心群體;通過知識節(jié)點產(chǎn)生時間的分布研究,分析知識節(jié)點的增長老化特征;通過對網(wǎng)絡資源類型的時序統(tǒng)計分析,探索資源的分布和資源生產(chǎn)的發(fā)展趨勢。

(3) 網(wǎng)絡資源關聯(lián)網(wǎng)絡的演化研究

本部分重點研究了在大數(shù)據(jù)環(huán)境下,網(wǎng)絡資源關聯(lián)網(wǎng)絡動態(tài)演化特征,通過分析與實證研究,我們發(fā)現(xiàn)一方面網(wǎng)絡資源關聯(lián)網(wǎng)絡的結構形態(tài)是隨時間動態(tài)變化的,另一方面網(wǎng)絡資源關聯(lián)網(wǎng)絡的結構演化形成網(wǎng)絡中的小世界效應和無標度特征。小世界效應表現(xiàn)知識單元的強關聯(lián)性,無標度反映知識節(jié)點的非均勻性。此外,通過研究網(wǎng)絡中心性的遷移規(guī)則,分析了中心遷移和新知識產(chǎn)生的關系,通過研究了網(wǎng)絡中的弱鏈接,討論了新知識的演化和發(fā)現(xiàn)。

(4) 網(wǎng)絡資源關聯(lián)網(wǎng)絡中的用戶行為研究。

有關網(wǎng)絡資源關聯(lián)網(wǎng)絡中的用戶行為研究主要探索了:用戶的檢索和使用路徑的形成規(guī)律和內(nèi)在動因。并形成了論文《社會化標簽系統(tǒng)中基于社會網(wǎng)絡的知識推送網(wǎng)絡演化研究》(已經(jīng)發(fā)表),具體來說,主要是利用網(wǎng)絡分析方法,將社會化標簽系統(tǒng)中基于社會網(wǎng)絡的知識推送網(wǎng)絡構造方法描述為六個步驟。借鑒演化理論,將基于社會網(wǎng)絡的知識推送網(wǎng)絡演化動力歸納為內(nèi)生動力和外生動力。移植生物進化論的相關理論,提出多重動力機制作用下基于社會網(wǎng)絡的知識推送網(wǎng)絡演化周期性模型: 每個周期的起點就是新一輪社會網(wǎng)絡的構建,每個周期內(nèi)部的演化過程分為選擇階段、遺傳階段、變異階段。該知識推送網(wǎng)絡演化模型,為向用戶提供主動推送服務提供了依據(jù)。

1.3子課題二研究進展

課題2網(wǎng)絡資源語義揭示與多維度聚合已經(jīng)展開初步的研究。具體來說,主要是對海量網(wǎng)絡信息資源的多粒度分割、語義提取、語義標注、多維度聚合等幾個方面進行了探索,并形成了相關研究成果《基于有序分類的文本多粒度分割與語義標注研究》(已經(jīng)投稿),網(wǎng)絡通常以一篇web文檔作為網(wǎng)絡信息資源組織的基本單位,信息組織的粒度過粗,這也直接導致很難實現(xiàn)檢索即所得的信息資源精準定位服務,更難完成網(wǎng)絡信息資源的多維度語義關聯(lián),實現(xiàn)網(wǎng)絡信息資源的關聯(lián)集成服務。為解決網(wǎng)絡信息資源組織存在的上述問題,該論文采取有序分類的方法對網(wǎng)絡信息資源的多粒度分割與語義標注進行了研究,提出了基于有序分類的文本多粒度層級分割與語義標注方法,該方法在總體上采取自下而上的分層聚類的方法來實現(xiàn)網(wǎng)絡內(nèi)容信息的層級分割,構建出一棵文檔分割樹。該結構的突出優(yōu)勢是可以實現(xiàn)信息資源的多粒度組織。在對網(wǎng)絡內(nèi)容信息進行多粒度分割的同時,進行各個粒度層次上的語義提取與關聯(lián),并形成論文《Research on fine-grained linked data creation for digital library resources》(已經(jīng)投稿),具體來說,采取潛在語義分析的方式進行文檔分割樹各個粒度層次上的語義提取,而后,基于相似度計算、基于規(guī)則推理,借助D2R,SILK等工具,實現(xiàn)各個粒度層次上的語義關聯(lián),將各個文檔分割樹關聯(lián)成多粒度的語義網(wǎng)絡結構(也即關聯(lián)數(shù)據(jù)),實現(xiàn)網(wǎng)絡內(nèi)容信息的多粒度多維度的語義關聯(lián),進而滿足網(wǎng)絡用戶的多粒度的信息需求,實現(xiàn)檢索即所得的集成知識服務,降低用戶負擔,提高用戶滿意度。

2. 調(diào)查研究及學術交流情況

(1)文獻資料收集

通過圖書館、期刊網(wǎng)、互聯(lián)網(wǎng)、內(nèi)部參考、簡報等渠道大量收集了國內(nèi)外與本課題相關的文獻。下載了期刊論文438篇,學位論文30余篇,會議論文120余篇,此外還通過各種渠道獲得了時新的PPT,研究手稿等重要的研究資料,并對這些資料進行了分類,整理。

(2)學術會議與交流

為分享研究成果,征得其他專家學者的幫助,項目成員也開展了廣泛的學術交流。具體來說:已在11th International Conference on Knowledge Management上投稿,該會議將于2015年11月在日本舉行。

(3)國際合作

為與項目組的國外專家開展廣泛的合作,派遣多名項目成員去國外訪學,在國外專家的指導下深入開展項目的研究工作。

3. 研究中存在的主要問題、改進措施,研究心得、意見建議

隨著項目研究的不斷拓展和深入,在項目研究中也遇到了一些問題。這些問題給項目的順利開展帶來了不小的困難。具體來說,主要體現(xiàn)在以下幾個方面:

(1)隨著項目研究的不斷擴展,各子課題研究的內(nèi)容也越來越豐富,這勢必會造成各個子課題內(nèi)部,以及子課題之間的研究內(nèi)容之間的聯(lián)系越來越復雜,使得整體把握項目的內(nèi)在聯(lián)系變得越來越困難。

(2)隨著項目研究的不斷深入,各子課題探索的內(nèi)容也越來越專指,這勢必會造成各子課題之間關聯(lián)性的降低,甚至脫節(jié),使得項目研究偏離研究的核心內(nèi)容。

為解決上述問題,保證項目研究的順利進行,項目組經(jīng)過討論,對項目組的成員結構進行了調(diào)整。除設立“學術秘書”負責整體協(xié)調(diào)各子課題的研究進展之外,還在各子課題之間設立了“跨子課題研究專員”,該研究專員負責兩個子課題之間的銜接。

二、 研究成果情況

三、 代表性成果簡介

(1)《基于多維度聚合的網(wǎng)絡資源知識發(fā)現(xiàn)框架研究》(已經(jīng)錄用)

該論文詳細論述了基于多維度的網(wǎng)絡資源知識發(fā)現(xiàn)框架。該框架依據(jù)知識發(fā)現(xiàn)的基本流程(數(shù)據(jù)準備->數(shù)據(jù)挖掘->解釋與評估),從網(wǎng)絡信息資源的結構信息、網(wǎng)絡內(nèi)容信息和網(wǎng)絡使用信息三個維度,分別探討三個維度上的網(wǎng)絡信息資源的知識發(fā)現(xiàn)方法,而后在上述研究基礎上,探討面向全網(wǎng)絡資源多維度聚合的知識發(fā)現(xiàn)方法。由此可見,該知識發(fā)現(xiàn)框架既遵循知識發(fā)現(xiàn)的一般規(guī)律,具有可靠的理論基礎,同時又針對網(wǎng)絡資源的特性,具有針對性。最后,論文又依托該框架,以科技成果資源為應用對象,設計了基于多維度聚合的網(wǎng)絡資源知識發(fā)現(xiàn)框架的應用實施方案。

(2)《社會化標簽系統(tǒng)中基于社會網(wǎng)絡的知識推送網(wǎng)絡演化研究》(已經(jīng)發(fā)表)

該論文主要是利用網(wǎng)絡分析方法,將社會化標簽系統(tǒng)中基于社會網(wǎng)絡的知識推送網(wǎng)絡構造方法描述為六個步驟。借鑒演化理論,將基于社會網(wǎng)絡的知識推送網(wǎng)絡演化動力歸納為內(nèi)生動力和外生動力。移植生物進化論的相關理論,提出多重動力機制作用下基于社會網(wǎng)絡的知識推送網(wǎng)絡演化周期性模型: 每個周期的起點就是新一輪社會網(wǎng)絡的構建,每個周期內(nèi)部的演化過程分為選擇階段、遺傳階段、變異階段。

四、 階段性成果清單

[1] 基于多維度聚合的網(wǎng)絡資源知識發(fā)現(xiàn). 夏立新,陳晨,王忠義.論文.情報科學雜志.錄用.9274字.

[2] 社會化標簽系統(tǒng)中基于社會網(wǎng)絡的知識推送網(wǎng)絡演化研究.易明,毛進,鄧衛(wèi)華,曹高輝.論文.中國圖書館學報.2014年3月.16373字

[3] Inferring microbial interaction networks based on consensus similarity network fusion.Jiang Xingpeng, Hu Xiaohua. 論文,Science China.2014年11月,4024字.

[4] Social network analysis on a topic based navigation guidance system in a public health portal. Journal of the American Society for Information Science & Technology. Zhang, J., Zhai, S., Liu, H., & Stevenson, J.(2015年已錄用)

[5] Optimization of the Subject Directory in a Government Agriculture Department Web Portal. Journal of the American Society for Information Science & Technology. Zhang, J., Zhai, S., Stevenson, J. & Xia, L.(2015年已錄用)

[6] 大數(shù)據(jù)時代情報危機的發(fā)展演變及其應對策略.夏立新,陳燕芳.情報學報(二審)。

(責編:李葉)
RM新时代APP官网