全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室>>面向?qū)W科領(lǐng)域的網(wǎng)絡(luò)信息資源深度聚合與服務(wù)研究>>研究動(dòng)態(tài)

面向?qū)W科領(lǐng)域的網(wǎng)絡(luò)信息資源深度聚合與服務(wù)研究中期檢測(cè)報(bào)告

2016年11月29日15:38來(lái)源：全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室

一、研究進(jìn)展情況

①研究計(jì)劃總體執(zhí)行情況及各子課題進(jìn)展情況

項(xiàng)目總體按計(jì)劃進(jìn)行，至今已完成了第一階段和第二階段的大部分工作，正在重點(diǎn)推進(jìn)第三階段的工作。第一階段的任務(wù)為：數(shù)據(jù)收集和基礎(chǔ)理論研究（2013.1-2013.6）；第二階段的任務(wù)為：專項(xiàng)深化研究（2013.7-2015.7）。在前兩個(gè)階段工作的基礎(chǔ)上，正在設(shè)計(jì)原型系統(tǒng)和開(kāi)發(fā)測(cè)試，同時(shí)開(kāi)展實(shí)證研究（詳見(jiàn)后文報(bào)告）。2014年7月以來(lái)的研究?jī)?nèi)容主要包括：基于SVR模型的中文領(lǐng)域術(shù)語(yǔ)自動(dòng)抽取研究；信息覓食理論與學(xué)科導(dǎo)航網(wǎng)站性能優(yōu)化；搜索引擎服務(wù)質(zhì)量與用戶忠誠(chéng)關(guān)系的實(shí)證研究；大數(shù)據(jù)時(shí)代科技情報(bào)服務(wù)的挑戰(zhàn)與思考；基于多維度聚合的網(wǎng)絡(luò)資源知識(shí)發(fā)現(xiàn)框架研究；基于機(jī)器學(xué)習(xí)的自動(dòng)文摘研究綜述；基于關(guān)聯(lián)數(shù)據(jù)的學(xué)科網(wǎng)絡(luò)信息深度聚合框架構(gòu)建；網(wǎng)絡(luò)檢索結(jié)果聚類研究綜述；中文網(wǎng)絡(luò)灰色文獻(xiàn)分布探析，等等。

2014年7月以來(lái)已發(fā)表35篇學(xué)術(shù)論文，其中英文論文8篇，中文論文27篇。

②調(diào)查研究及學(xué)術(shù)交流情況

調(diào)查研究情況。目前采集的數(shù)據(jù)和文獻(xiàn)資料主要用于學(xué)科本體構(gòu)建、用戶行為研究、學(xué)科服務(wù)機(jī)制研究等實(shí)證研究方面。其中，2000-2015年《情報(bào)學(xué)報(bào)》數(shù)據(jù)集用于中文領(lǐng)域術(shù)語(yǔ)自動(dòng)抽取研究；200多萬(wàn)條查詢?nèi)罩緮?shù)據(jù)用于基于搜索日志的用戶行為分析；5萬(wàn)余篇CSSCI論文題錄數(shù)據(jù)用于我國(guó)圖書(shū)情報(bào)學(xué)科知識(shí)結(jié)構(gòu)的演化分析；259份問(wèn)卷數(shù)據(jù)用于對(duì)搜索引擎服務(wù)質(zhì)量評(píng)價(jià)體系的研究；89份問(wèn)卷訪談樣本數(shù)據(jù)用于行動(dòng)者網(wǎng)絡(luò)理論視角下的CALIS運(yùn)行機(jī)制研究，等等。此外，項(xiàng)目組成員還奔赴北京、上海等地的高校、圖書(shū)館、情報(bào)所、企業(yè)等研究機(jī)構(gòu)進(jìn)行實(shí)地調(diào)研和數(shù)據(jù)資料采集工作。

學(xué)術(shù)交流情況。學(xué)術(shù)會(huì)議： 2015年3月，項(xiàng)目主持人和骨干成員出席iSchool年會(huì)（iConeference 2015），參與了大會(huì)專題研討會(huì)和海報(bào)展示，并參加了多項(xiàng)學(xué)術(shù)交流活動(dòng)； 2015年7月初，項(xiàng)目組成員赴土耳其伊斯坦布爾參加第15屆國(guó)際科學(xué)計(jì)量學(xué)與信息計(jì)量學(xué)年會(huì)并做邀請(qǐng)報(bào)告；2016年3月，項(xiàng)目組成員赴美國(guó)費(fèi)城參加iConference 2016年會(huì)；2016年6月，項(xiàng)目組成員赴北京參加數(shù)據(jù)科學(xué)與情報(bào)學(xué)國(guó)際研討會(huì)。國(guó)際合作：2016年4月-6月間，項(xiàng)目組成員陸續(xù)邀請(qǐng)到前任國(guó)際科學(xué)計(jì)量學(xué)與信息計(jì)量學(xué)學(xué)會(huì)(ISSI)主席Prof. Dr. Ronald Rousseau、美國(guó)Indiana University的Prof. Ying Ding、美國(guó)UIUC信息學(xué)院副院長(zhǎng)Prof. J. Stephen Downie等前來(lái)開(kāi)展交流合作，圍繞信息資源的測(cè)度以分析、用戶采納和接受信息的行為、網(wǎng)絡(luò)數(shù)據(jù)挖掘等主題進(jìn)行了深入的探討。

③成果宣傳推介情況

2014年7月7日，項(xiàng)目負(fù)責(zé)人以本項(xiàng)目首席專家身份在光明日?qǐng)?bào)理論版發(fā)表文章《大數(shù)據(jù)時(shí)代人文社會(huì)科學(xué)如何發(fā)展》，探討學(xué)科發(fā)展尤其是人文社會(huì)科學(xué)研究在大數(shù)據(jù)時(shí)代的發(fā)展問(wèn)題，并對(duì)項(xiàng)目成果進(jìn)行宣傳推介。本文受到全國(guó)哲學(xué)社會(huì)科學(xué)規(guī)劃辦公室網(wǎng)站、光明網(wǎng)、人民網(wǎng)、求是網(wǎng)、鳳凰網(wǎng)、中國(guó)臺(tái)灣網(wǎng)等多家網(wǎng)絡(luò)媒體轉(zhuǎn)載。

2016年2月，項(xiàng)目首席專家在《人民日?qǐng)?bào)》發(fā)表?？碚撐恼?，縱論“大數(shù)據(jù)使社科研究不再“望數(shù)興嘆”。文章從研究全程評(píng)價(jià)和全部研究數(shù)據(jù)資產(chǎn)化、研究資料的碎片化重組、計(jì)算化分析與可視化表現(xiàn)的結(jié)合、學(xué)科融合與數(shù)據(jù)服務(wù)發(fā)展等視角闡述如何運(yùn)用大數(shù)據(jù)開(kāi)啟社會(huì)科學(xué)研究新局面。文章還認(rèn)為，大數(shù)據(jù)的運(yùn)用還將進(jìn)一步推動(dòng)學(xué)術(shù)技術(shù)分析服務(wù)、數(shù)據(jù)服務(wù)的發(fā)展，傳統(tǒng)承擔(dān)文獻(xiàn)資料服務(wù)和普通信息服務(wù)的圖書(shū)館、情報(bào)服務(wù)機(jī)構(gòu)等將向數(shù)據(jù)委托服務(wù)、計(jì)算分析服務(wù)轉(zhuǎn)型。人民日?qǐng)?bào)網(wǎng)絡(luò)版、中國(guó)社會(huì)科學(xué)網(wǎng)、新華網(wǎng)、環(huán)球網(wǎng)等主流媒體均予以宣傳報(bào)道，很好地對(duì)項(xiàng)目的研究成果進(jìn)行了宣傳推介。

此外，項(xiàng)目組還向國(guó)家哲學(xué)社會(huì)科學(xué)規(guī)劃辦公室遞交成果簡(jiǎn)報(bào)1份，向《情報(bào)學(xué)報(bào)》、《圖書(shū)情報(bào)工作》、《情報(bào)科學(xué)》等期刊進(jìn)行了推介，洽談專題組稿的計(jì)劃和工作安排。

④研究中存在的主要問(wèn)題、改進(jìn)措施，研究心得、意見(jiàn)建議

一些最新的研究進(jìn)展和階段性成果沒(méi)有及時(shí)進(jìn)行總結(jié)，并將最新進(jìn)展報(bào)送規(guī)劃辦公室，在通過(guò)新聞媒體向社會(huì)大眾宣傳推廣上也存在不足。今后，課題組應(yīng)繼續(xù)加強(qiáng)向規(guī)劃辦提供工作簡(jiǎn)報(bào)，并利用多種有效途徑向?qū)W術(shù)網(wǎng)站、重要報(bào)刊、學(xué)術(shù)期刊等媒體推介課題研究成果，加強(qiáng)對(duì)研究成果的宣傳推廣。

在深層網(wǎng)絡(luò)數(shù)據(jù)的采集和價(jià)值挖掘上，遇到了一些難點(diǎn)，這也是本課題中比較難以應(yīng)對(duì)的任務(wù)，對(duì)原型系統(tǒng)的開(kāi)發(fā)也需要進(jìn)一步加大人力物力。課題組將在接下來(lái)的工作階段中，繼續(xù)凝神聚力，攻堅(jiān)克難，爭(zhēng)取在這兩個(gè)方面取得突破和進(jìn)展。

二、研究成果情況

代表性成果Journal of Informetrics發(fā)文“Selecting publication keywords for domain analysis in bibliometrics: A comparison of three methods”，著重探討了文獻(xiàn)關(guān)鍵詞分析中一個(gè)尚未引起重視的問(wèn)題，即在大量領(lǐng)域文獻(xiàn)中如何精確有效地選擇關(guān)鍵詞分析的對(duì)象。論文討論了傳統(tǒng)的TF方法，以及兩種替代方法：TF-IDF方法以及TF-KAI方法。這兩種方法考慮到了關(guān)鍵詞消歧。進(jìn)一步的實(shí)證研究表明，TF-KAI方法表現(xiàn)性能最佳，它能夠保存領(lǐng)域?qū)＜姨暨x出的關(guān)鍵詞，并揭示領(lǐng)域內(nèi)的研究焦點(diǎn)。本文對(duì)關(guān)鍵詞選取的理論和實(shí)踐具有重要價(jià)值。

代表性成果Scientometrics發(fā)文“Exploring the topic hierarchy of digital library research in China using keyword networks a K-core decomposition approach”，提出一種通過(guò)構(gòu)建關(guān)鍵詞網(wǎng)絡(luò)以及K核分解，自動(dòng)發(fā)現(xiàn)主題層級(jí)的方法。相鄰的類團(tuán)能夠根據(jù)其密度和聚類系數(shù)合并到對(duì)應(yīng)層級(jí)中。對(duì)中國(guó)數(shù)字圖書(shū)館領(lǐng)域的關(guān)鍵詞網(wǎng)絡(luò)進(jìn)行分析，發(fā)現(xiàn)了4個(gè)不同的層級(jí)。基礎(chǔ)層包含17個(gè)內(nèi)部緊密相聯(lián)系的核心概念；中間層包括13個(gè)中介概念，并與基礎(chǔ)層中的技術(shù)概念直接相連；詳細(xì)層包含65個(gè)實(shí)體概念，并聚成13個(gè)類團(tuán)；邊緣層則包含了一個(gè)局部和孤立的概念。

代表性成果《圖書(shū)與情報(bào)》發(fā)文“大數(shù)據(jù)時(shí)代科技情報(bào)服務(wù)的挑戰(zhàn)與思考”，從大數(shù)據(jù)科技環(huán)境的時(shí)代特征著手分析了大數(shù)據(jù)環(huán)境對(duì)科技情報(bào)工作的主要挑戰(zhàn)，并結(jié)合當(dāng)前實(shí)踐提出了相應(yīng)的對(duì)策建議。論文認(rèn)為：數(shù)據(jù)處理是科技情報(bào)機(jī)構(gòu)服務(wù)創(chuàng)新的動(dòng)力。大數(shù)據(jù)的離散分布和開(kāi)放可得、用戶信息需求向深度廣度發(fā)展以及資源服務(wù)一體化，弱化了科技情報(bào)機(jī)構(gòu)的資源優(yōu)勢(shì)，提高了信息分析的難度，給科技情報(bào)機(jī)構(gòu)的服務(wù)能力提出了挑戰(zhàn)。同時(shí)，也為大規(guī)模資源保障體系和信息服務(wù)模式的創(chuàng)新提供了可能。

代表性成果《情報(bào)資料工作》發(fā)文“行動(dòng)者網(wǎng)絡(luò)理論視角下的CALIS運(yùn)行機(jī)制”，從信息管理的視角，將行動(dòng)者網(wǎng)絡(luò)理論引入CALIS運(yùn)行機(jī)制的研究中，系統(tǒng)地分析目前CALIS的運(yùn)行機(jī)制及現(xiàn)狀。結(jié)果表明現(xiàn)存障礙共包括經(jīng)費(fèi)不足、忽略以用戶為中心的資源建設(shè)及技術(shù)。支撐不夠等七個(gè)層面，各行動(dòng)者涉及的利益主要包括共建、共享及共知等七個(gè)維度。最后文章對(duì)現(xiàn)有問(wèn)題給出了相應(yīng)的對(duì)策，并對(duì)未來(lái)CALIS可能的發(fā)展方向進(jìn)行了探索。

代表性成果《情報(bào)理論與實(shí)踐》發(fā)文“基于SVR模型的中文領(lǐng)域術(shù)語(yǔ)自動(dòng)抽取研究——面向圖書(shū)情報(bào)領(lǐng)域”，結(jié)合語(yǔ)言學(xué)和統(tǒng)計(jì)方法，通過(guò)構(gòu)建術(shù)語(yǔ)庫(kù)提取術(shù)語(yǔ)抽取模板來(lái)抽取候選術(shù)語(yǔ)。此外，還通過(guò)引入回歸的方法，將術(shù)語(yǔ)抽取問(wèn)題轉(zhuǎn)化為對(duì)詞語(yǔ)成為術(shù)語(yǔ)的概率的預(yù)測(cè)問(wèn)題。術(shù)語(yǔ)是本體的重要組成部分，術(shù)語(yǔ)自動(dòng)抽取是本體自動(dòng)構(gòu)建的基礎(chǔ)，文章采用回歸的方法對(duì)未登錄詞進(jìn)行概率( 某個(gè)數(shù)值( 組合) 對(duì)應(yīng)的候選詞集合中術(shù)語(yǔ)的概率) 預(yù)測(cè)，獲得該詞可能為術(shù)語(yǔ)的概率。論文提出的方法最后通過(guò)實(shí)驗(yàn)驗(yàn)證了其有效性。

代表性成果《情報(bào)科學(xué)》發(fā)文“基于多維度聚合的網(wǎng)絡(luò)資源知識(shí)發(fā)現(xiàn)框架研究”，以網(wǎng)絡(luò)資源為研究對(duì)象，以多維度聚合為主要手段，針對(duì)網(wǎng)絡(luò)資源內(nèi)容的大數(shù)據(jù)化、動(dòng)態(tài)化、多維度等特征，探索基于語(yǔ)義關(guān)聯(lián)的網(wǎng)絡(luò)資源深度揭示與多維度聚合，以此為基礎(chǔ)研究基于多維度聚合的網(wǎng)絡(luò)資源知識(shí)發(fā)現(xiàn)框架，進(jìn)而研發(fā)基于多維度聚合的網(wǎng)絡(luò)資源知識(shí)發(fā)現(xiàn)技術(shù)系統(tǒng)，并結(jié)合特定領(lǐng)域、特定需求進(jìn)行應(yīng)用示范與對(duì)策研究。

代表性成果《圖書(shū)館》發(fā)文“基于關(guān)聯(lián)數(shù)據(jù)的學(xué)科網(wǎng)絡(luò)信息深度聚合框架構(gòu)建”，回顧關(guān)聯(lián)數(shù)據(jù)、學(xué)科網(wǎng)絡(luò)信息深度聚合概念；分析基于關(guān)聯(lián)數(shù)據(jù)的學(xué)科網(wǎng)絡(luò)信息深度聚合框架構(gòu)建的可行性，構(gòu)建“聚合框架”并對(duì)學(xué)科網(wǎng)絡(luò)信息關(guān)聯(lián)數(shù)據(jù)發(fā)布工作流程進(jìn)行分析；提出“聚合框架”實(shí)施應(yīng)該注意的問(wèn)題：如成立學(xué)科網(wǎng)絡(luò)信息關(guān)聯(lián)數(shù)據(jù)管理中心，發(fā)布中文編碼體系詞表的關(guān)聯(lián)數(shù)據(jù)，遵守關(guān)聯(lián)數(shù)據(jù)查詢的內(nèi)容協(xié)商機(jī)制，注意關(guān)聯(lián)數(shù)據(jù)訪問(wèn)控制問(wèn)題以及注意關(guān)聯(lián)數(shù)據(jù)更新的同步問(wèn)題等。

代表性成果《情報(bào)資料工作》發(fā)文“信息覓食理論與學(xué)科導(dǎo)航網(wǎng)站性能優(yōu)化”，首先回顧信息覓食理論的理論基礎(chǔ)和基本模型;然后將信息線索劃分為文字型、像型、音頻型和視頻型四種類型,設(shè)計(jì)信息線索在學(xué)科導(dǎo)航網(wǎng)站中應(yīng)用的五個(gè)原則;最后,構(gòu)建基于信息覓食理論的學(xué)科導(dǎo)航網(wǎng)站性能優(yōu)化模型,選擇美國(guó)的Infomine學(xué)科導(dǎo)航網(wǎng)站進(jìn)行案例分析。

代表性成果《現(xiàn)代圖書(shū)情報(bào)技術(shù)》發(fā)文“基于搜索日志的用戶行為分析”，利用搜索引擎日志數(shù)據(jù)對(duì)用戶查詢行為特征進(jìn)行分析。采用分詞、統(tǒng)計(jì)分析、聚類分析、可視化等方法,分別從用戶的查詢串、查詢方式、查詢主題、查詢點(diǎn)擊行為和用戶類型5個(gè)方面對(duì)用戶使用搜索引擎時(shí)的行為特征進(jìn)行分析。發(fā)現(xiàn)搜索用戶偏好使用2-5個(gè)中文名詞短語(yǔ)組成的查詢串;更少使用口語(yǔ)化查詢,不愛(ài)使用高級(jí)檢索功能;查詢用詞變得多樣化;查詢時(shí)間存在高峰低谷;再次證實(shí)存在"翹尾現(xiàn)象"。使用搜索引擎日志可以獲得用戶行為特征,并能為改善搜索引擎提供一些建議。

代表性研究成果《情報(bào)理論與實(shí)踐》發(fā)文“網(wǎng)絡(luò)檢索結(jié)果聚類研究綜述”，根據(jù)網(wǎng)絡(luò)檢索結(jié)果聚類算法的改進(jìn)方向?qū)⑵浞譃槊嫦蚪?jīng)典和面向標(biāo)簽的聚類算法兩類。前者的改進(jìn)主要有優(yōu)化特征選擇、優(yōu)化聚類數(shù)K以及生成重疊聚類等; 后者的改進(jìn)主要有優(yōu)化類計(jì)分運(yùn)算、優(yōu)化類合并運(yùn)算、數(shù)據(jù)結(jié)構(gòu)優(yōu)化、候選標(biāo)簽選擇以及基于語(yǔ)義的優(yōu)化等。在對(duì)相關(guān)研究進(jìn)行綜述的基礎(chǔ)上探討了檢索結(jié)果聚類面臨的問(wèn)題和未來(lái)的發(fā)展方向。

課題組供稿

(責(zé)編：沈王一)

RM新时代APP官网

面向?qū)W科領(lǐng)域的網(wǎng)絡(luò)信息資源深度聚合與服務(wù)研究中期檢測(cè)報(bào)告

2016年11月29日15:38來(lái)源：全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室

主管主辦：全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室承辦：人民網(wǎng)

©1999-2026 全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室版權(quán)所有京ICP備12051030號(hào)-2

RM新时代APP官网

面向?qū)W科領(lǐng)域的網(wǎng)絡(luò)信息資源深度聚合與服務(wù)研究中期檢測(cè)報(bào)告

2016年11月29日15:38來(lái)源：全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室

主管主辦：全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室 承辦：人民網(wǎng)

©1999-2026 全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室 版權(quán)所有 京ICP備12051030號(hào)-2

主管主辦：全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室承辦：人民網(wǎng)

©1999-2026 全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室版權(quán)所有京ICP備12051030號(hào)-2