RM新时代APP官网

舊版網(wǎng)站入口

站內(nèi)搜索

面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)理論與方法研究的中期檢查報(bào)告

2018年12月03日16:01來(lái)源:全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室

一、研究進(jìn)展情況

1研究計(jì)劃總體執(zhí)行情況及各子課題進(jìn)展情況

本項(xiàng)目共分為五個(gè)子課題,分別為:

子課題一:面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)理論研究:目的與體系

子課題二:面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)方法研究:信息采集與知識(shí)抽取

子課題三:面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)方法研究:知識(shí)融合與知識(shí)發(fā)現(xiàn)

子課題四:面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)應(yīng)用研究:知識(shí)創(chuàng)新服務(wù)機(jī)制

子課題五:面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)應(yīng)用研究:實(shí)現(xiàn)與驗(yàn)證

以總體方案為指導(dǎo),按照研究計(jì)劃,通過(guò)文獻(xiàn)檢索、網(wǎng)絡(luò)調(diào)查、實(shí)地調(diào)研、專(zhuān)家訪談與通信咨詢(xún)等方式,針對(duì)要解決的問(wèn)題和要研究的內(nèi)容,分別開(kāi)展了各個(gè)子課題的研究,并在研究過(guò)程中注重各個(gè)子課題之間的關(guān)聯(lián),總體執(zhí)行情況概要如下:

? 從2016年12月開(kāi)始,結(jié)合原有的工作積累,對(duì)有關(guān)“知識(shí)創(chuàng)新”“知識(shí)服務(wù)”“數(shù)據(jù)科學(xué)”“知識(shí)發(fā)現(xiàn)”“知識(shí)融合”等相關(guān)研究進(jìn)行文獻(xiàn)檢索、文摘閱讀與原文篩選下載等工作,并且這項(xiàng)工作一直在持續(xù)進(jìn)行著;

? 咨詢(xún)國(guó)內(nèi)外領(lǐng)域?qū)<覍?duì)課題開(kāi)展與開(kāi)題等工作進(jìn)行指導(dǎo),同時(shí),制定課題開(kāi)題論證會(huì)議議程,2017年2月25日召開(kāi)了開(kāi)題會(huì),邀請(qǐng)到會(huì)的9位專(zhuān)家分別來(lái)自中國(guó)社會(huì)科學(xué)院、上海社科科學(xué)院、北京大學(xué)、武漢大學(xué)、南京大學(xué)、華中師范大學(xué)、南京農(nóng)業(yè)大學(xué)等機(jī)構(gòu);

? 2017年4-7月間,分別對(duì)中國(guó)科技信息研究所、中國(guó)船舶749所、中國(guó)兵器210所、中國(guó)同方、等知識(shí)服務(wù)機(jī)構(gòu)進(jìn)行實(shí)地訪問(wèn)和網(wǎng)絡(luò)調(diào)查,向情報(bào)工作人員發(fā)放問(wèn)卷,與研究人員交流等,獲得了有關(guān)知識(shí)服務(wù)、知識(shí)創(chuàng)新等方面的第一手資料;

? 選取數(shù)字圖書(shū)館、全文數(shù)據(jù)庫(kù)網(wǎng)站、學(xué)術(shù)搜索引擎三種類(lèi)型的在線(xiàn)知識(shí)服務(wù)平臺(tái)和Research Gate、分答、值乎、推文等社交平臺(tái),采集相關(guān)數(shù)據(jù)進(jìn)行數(shù)據(jù)處理、數(shù)據(jù)挖掘、知識(shí)融合與發(fā)現(xiàn)等的數(shù)據(jù)科學(xué)理論和方法研究;

? 邀請(qǐng)國(guó)內(nèi)外學(xué)者研討與交流6次;

? 舉辦主題為“數(shù)據(jù)科學(xué)驅(qū)動(dòng)的圖書(shū)資訊學(xué)變革與轉(zhuǎn)型”第14屆海峽兩岸圖書(shū)資訊學(xué)學(xué)術(shù)研討會(huì)1次;

? 完成發(fā)表17篇期刊論文,其中:被SCI/SSCI雙收錄1篇、CSSCI收錄13篇、CSSCI擴(kuò)展版收錄3篇;

? 完成頂級(jí)國(guó)際會(huì)議論文7篇;

? 完成錄用待發(fā)表期刊論文8篇,其中:被SCI/SSCI雙收錄1篇、被SCI收錄2篇、ESI收錄1篇、CSSCI期刊收錄4篇;

? 完成待出版專(zhuān)著1本:數(shù)據(jù)驅(qū)動(dòng)的知識(shí)服務(wù)體系與方法;

? 此外,參加2017年計(jì)算語(yǔ)言學(xué)領(lǐng)域的自動(dòng)摘要國(guó)際測(cè)評(píng)比賽論文1篇,專(zhuān)家寄語(yǔ)1篇,首席專(zhuān)家被邀大會(huì)報(bào)告與講座9次。

下面將分別簡(jiǎn)述子課題的進(jìn)展情況

1.1子課題一:面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)理論研究:目的與體系

該子課題是關(guān)于研究背景、需求與體系構(gòu)建的探索部分,圍繞著大數(shù)據(jù)、學(xué)科知識(shí)創(chuàng)新、知識(shí)創(chuàng)新服務(wù)和數(shù)據(jù)科學(xué)展開(kāi)。

① 2017年1月至2017年3月,按照計(jì)劃開(kāi)展的工作如下:

? 對(duì)有關(guān)“知識(shí)創(chuàng)新”“知識(shí)服務(wù)”“數(shù)據(jù)科學(xué)”等相關(guān)研究進(jìn)行文獻(xiàn)與綜述;

? 在聽(tīng)取專(zhuān)家論證建議與文獻(xiàn)綜述分析基礎(chǔ)上,課題組進(jìn)一步凝練了要強(qiáng)化圖書(shū)情報(bào)與數(shù)據(jù)科學(xué)關(guān)聯(lián)研究,并突出實(shí)證檢驗(yàn)研究以體現(xiàn)理論對(duì)實(shí)踐的指導(dǎo)意義的方案。

②2017年4月至2017年8月,按照計(jì)劃開(kāi)展的工作如下:

? 通過(guò)文獻(xiàn)調(diào)查、數(shù)據(jù)調(diào)查等手段,研究知識(shí)創(chuàng)新與大數(shù)據(jù)、知識(shí)服務(wù)與大數(shù)據(jù)、知識(shí)創(chuàng)新服務(wù)內(nèi)涵、數(shù)據(jù)科學(xué)的內(nèi)涵、特征,以及綜述與分析相關(guān)研究的國(guó)內(nèi)外現(xiàn)狀;

? 通過(guò)實(shí)地調(diào)查與專(zhuān)家訪談,探究大數(shù)據(jù)環(huán)境下現(xiàn)有知識(shí)服務(wù)存在的問(wèn)題以及知識(shí)服務(wù)未來(lái)的發(fā)展動(dòng)向。在調(diào)研中,側(cè)重對(duì)知識(shí)獲取、知識(shí)特征提取、知識(shí)多源集成、知識(shí)檢索、知識(shí)抽取和知識(shí)應(yīng)用六個(gè)方面的服務(wù)進(jìn)行調(diào)查與分析,研究大數(shù)據(jù)對(duì)學(xué)科知識(shí)創(chuàng)新的重構(gòu),總結(jié)大數(shù)據(jù)環(huán)境下學(xué)科知識(shí)創(chuàng)新的知識(shí)創(chuàng)新服務(wù)需求。

③2017年9月至2018年2月,按照計(jì)劃開(kāi)展的工作如下:

? 通過(guò)文獻(xiàn)調(diào)查、歸納總結(jié)等方法,在對(duì)國(guó)內(nèi)外知識(shí)創(chuàng)新服務(wù)相關(guān)研究現(xiàn)狀研究基礎(chǔ)上,結(jié)合學(xué)科知識(shí)創(chuàng)新的轉(zhuǎn)變與新路徑研究以及知識(shí)服務(wù)的重構(gòu)需求,引入野中郁次郎的SECI模型和DIKW價(jià)值鏈模型,研究知識(shí)創(chuàng)新服務(wù)的內(nèi)涵、特征、影響因素與支撐要素;

? 以“DIKW價(jià)值鏈”為指導(dǎo),借助于“綜合集成研討廳”將專(zhuān)家智慧、數(shù)據(jù)和信息、計(jì)算機(jī)技術(shù)相結(jié)合的思想,首先,分析在知識(shí)創(chuàng)新服務(wù)中的數(shù)據(jù)流動(dòng)的特點(diǎn)、方法與表現(xiàn)形式;然后,對(duì)“DIKW價(jià)值鏈”按照“大數(shù)據(jù)(D)?蘊(yùn)含知識(shí)的信息(I)?元知識(shí)(K)?智慧(融合和涌現(xiàn)知識(shí))(W)”進(jìn)行重構(gòu)與解讀。再次,以“重構(gòu)的DIKW價(jià)值鏈”為主線(xiàn),研究并構(gòu)建面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)的學(xué)理思想與基本方法論。

④2018年3月至2018年7月,按照計(jì)劃開(kāi)展的工作如下:

? 以知識(shí)創(chuàng)新服務(wù)需求為驅(qū)動(dòng),以重構(gòu)的“DIKW價(jià)值鏈”為導(dǎo)向,將數(shù)據(jù)科學(xué)的核心研究?jī)?nèi)容(多源異構(gòu)數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、數(shù)據(jù)可視化和數(shù)據(jù)產(chǎn)品)與知識(shí)創(chuàng)新服務(wù)的核心內(nèi)容(知識(shí)創(chuàng)新、信息采集與知識(shí)抽取、知識(shí)融合與知識(shí)發(fā)現(xiàn)、知識(shí)創(chuàng)新服務(wù)機(jī)制、知識(shí)創(chuàng)新服務(wù)應(yīng)用)相結(jié)合,研究并構(gòu)建面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)理論與方法體系。

1.2子課題二:面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)方法研究:信息采集與知識(shí)抽取

該子課題是圍繞知識(shí)創(chuàng)新服務(wù)目標(biāo),探索多源數(shù)據(jù)的信息采集與知識(shí)抽取面臨的特殊性和困境,提出可行的信息采集與知識(shí)抽取模式、途徑和程序。

①2017年1月至2017年3月,按照計(jì)劃開(kāi)展的工作如下:

? 整理與分析現(xiàn)有基于多源數(shù)據(jù)的信息采集與知識(shí)抽取現(xiàn)狀、功能和缺陷等。

②2017年4月至2017年6月,按照計(jì)劃開(kāi)展的工作如下:

? 通過(guò)分別對(duì)中國(guó)科技信息研究所、中國(guó)船舶749所、中國(guó)兵器210所、中國(guó)同方等知識(shí)服務(wù)機(jī)構(gòu)進(jìn)行實(shí)地訪問(wèn)和網(wǎng)絡(luò)調(diào)查,研究面向知識(shí)創(chuàng)新服務(wù)的知識(shí)源特征與采集需求,分析了面向知識(shí)創(chuàng)新服務(wù)的知識(shí)抽取的新特點(diǎn)與需求。

③2017年7月至2017年9月,按照計(jì)劃開(kāi)展的工作如下:

? 在現(xiàn)有研究調(diào)查基礎(chǔ)上,研究了數(shù)據(jù)源的評(píng)估原則、數(shù)據(jù)數(shù)據(jù)源質(zhì)量評(píng)估體系構(gòu)建,數(shù)據(jù)源質(zhì)量評(píng)估方法實(shí)現(xiàn);

? 針對(duì)基于多源數(shù)據(jù)的信息采集模式與采集加工平臺(tái),從采集流程中三個(gè)重要組成部分展開(kāi)了研究:一是多源異構(gòu)資源及其相應(yīng)的數(shù)據(jù)格式(數(shù)據(jù)源產(chǎn)生途徑、類(lèi)型特征、分布形式);二是用戶(hù)需求經(jīng)轉(zhuǎn)化后形成的數(shù)據(jù)源質(zhì)量信息和配置信息;三是針對(duì)不同類(lèi)型數(shù)據(jù)源采集模塊的功能設(shè)計(jì)。具體地,首先對(duì)網(wǎng)絡(luò)數(shù)據(jù)資源采集的典型方法和關(guān)鍵技術(shù)開(kāi)展技術(shù)基礎(chǔ)進(jìn)行了研究;其次通過(guò)實(shí)驗(yàn)樣例和測(cè)評(píng)指標(biāo)對(duì)多源數(shù)據(jù)的信息采集技術(shù)方案適用性進(jìn)行評(píng)估;再次針對(duì)所采集的數(shù)據(jù)結(jié)果,研究數(shù)據(jù)清洗與預(yù)處理的手段。由此,設(shè)計(jì)提出了基于多源數(shù)據(jù)的信息采集模式與流程。

④2017年10月至2018年2月,按照計(jì)劃開(kāi)展的工作如下:

? 對(duì)大數(shù)據(jù)驅(qū)動(dòng)的知識(shí)抽取涉及到的關(guān)鍵技術(shù)進(jìn)行研究,具體有異構(gòu)知識(shí)源的知識(shí)抽取方法研究和大數(shù)據(jù)驅(qū)動(dòng)的知識(shí)迭代抽取模式,包括詞語(yǔ)語(yǔ)義知識(shí)的分類(lèi)研究,引文域的自動(dòng)識(shí)別、引用類(lèi)型的分類(lèi)以及自動(dòng)摘要研究。尤其是針對(duì)科技文本的引文內(nèi)容方面,進(jìn)行了引文內(nèi)容抽取與相關(guān)應(yīng)用的研究,利用在線(xiàn)圖書(shū)評(píng)論數(shù)據(jù),對(duì)圖書(shū)評(píng)論與館藏的相關(guān)性進(jìn)行了探索等。

⑤2018年3月至2018年6月,按照計(jì)劃開(kāi)展的工作如下:

? 調(diào)查了知識(shí)驗(yàn)證方法方面的國(guó)內(nèi)外研究現(xiàn)狀,尤其是對(duì)候選知識(shí)質(zhì)量評(píng)估方法進(jìn)行了比較分析,并以人工智能的研究為例,進(jìn)行實(shí)證分析。

1.3子課題三:面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)方法研究:知識(shí)融合與知識(shí)發(fā)現(xiàn)

該子課題是圍繞著知識(shí)融合和知識(shí)發(fā)現(xiàn)的理論、方法、技術(shù)以及工具等,進(jìn)一步深化面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)的理論與方法研究。

①2017年1月至2017年3月,按照計(jì)劃開(kāi)展的工作如下:

? 結(jié)合原有關(guān)于知識(shí)融合研究(發(fā)表在《數(shù)字圖書(shū)館論壇》上的論文“大數(shù)據(jù)時(shí)代知識(shí)融合體系架構(gòu)設(shè)計(jì)研究”和前期課題)的工作積累,實(shí)證走訪調(diào)查了中國(guó)科技信息研究所、上海社會(huì)科學(xué)院信息研究所、江蘇省科學(xué)技術(shù)情報(bào)研究所、中國(guó)同方等機(jī)構(gòu),咨詢(xún)國(guó)內(nèi)外領(lǐng)域?qū)<,收集和閱讀有關(guān)知識(shí)融合與知識(shí)發(fā)現(xiàn)等相關(guān)文獻(xiàn),并進(jìn)一步整理和分析國(guó)內(nèi)外研究現(xiàn)狀,掌握現(xiàn)有知識(shí)融合與知識(shí)發(fā)現(xiàn)的現(xiàn)狀、功能和缺陷等。

②2017年4月至2017年8月,按照計(jì)劃開(kāi)展的工作如下:

? 針對(duì)基于多維動(dòng)態(tài)組合的知識(shí)融合與知識(shí)發(fā)現(xiàn)模式進(jìn)行了系列研究,主要有:通過(guò)引文內(nèi)容分析探索高被引論文的影響力演化模式,利用中文在線(xiàn)社交網(wǎng)站研究用戶(hù)飲食的偏好與演化模式,通過(guò)情感分析技術(shù)探測(cè)社交網(wǎng)絡(luò)上的中國(guó)用戶(hù)飲食偏好等。

③2017年9月至2018年2月,按照計(jì)劃開(kāi)展的工作如下:

? 針對(duì)大數(shù)據(jù)驅(qū)動(dòng)的知識(shí)融合與知識(shí)發(fā)現(xiàn)關(guān)鍵技術(shù)和方法進(jìn)行了系列研究,主要有:利用引文數(shù)據(jù)的內(nèi)容融合探測(cè)學(xué)科交叉知識(shí),以Research Gate為例評(píng)估學(xué)術(shù)社會(huì)化問(wèn)答平臺(tái)的答案質(zhì)量,對(duì)學(xué)術(shù)論文寫(xiě)作風(fēng)格的度量、論文接受與稿件處理周期的關(guān)系、基于學(xué)術(shù)社交網(wǎng)絡(luò)上閱讀行為進(jìn)行學(xué)科交叉度計(jì)算,基于科學(xué)推文數(shù)據(jù)的非正式科學(xué)交流語(yǔ)言分布、作者行為模式與地理分布,基于政策文件數(shù)據(jù)的替代計(jì)量指標(biāo)分布特征等。

④2018年3月至2018年8月,按照計(jì)劃開(kāi)展的工作如下:

? 針對(duì)知識(shí)融合與知識(shí)發(fā)現(xiàn)結(jié)果的展示及驗(yàn)證,主要的研究有文獻(xiàn)調(diào)查與整理,構(gòu)建情報(bào)研究知識(shí)庫(kù),分別以人工智能和石墨烯為例的實(shí)證分析,形成了初步的研究結(jié)果。

1.4子課題四:面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)應(yīng)用研究:知識(shí)創(chuàng)新服務(wù)機(jī)制

該子課題的研究包括知識(shí)創(chuàng)新服務(wù)的需求、知識(shí)創(chuàng)新服務(wù)的模式、知識(shí)創(chuàng)新服務(wù)的運(yùn)作以及知識(shí)創(chuàng)新服務(wù)的保障等。

① 2017年1月至2017年6月,按照計(jì)劃開(kāi)展的工作如下:

? 通過(guò)網(wǎng)絡(luò)調(diào)查,選取數(shù)字圖書(shū)館、全文數(shù)據(jù)庫(kù)網(wǎng)站和學(xué)術(shù)搜索引擎三種類(lèi)型的在線(xiàn)知識(shí)服務(wù)平臺(tái)進(jìn)行研究,以分析現(xiàn)有知識(shí)服務(wù)平臺(tái)提供的學(xué)術(shù)資源、知識(shí)服務(wù)的表現(xiàn)形式與平臺(tái)功能等;

? 結(jié)合調(diào)查與分析,研究與界定知識(shí)創(chuàng)新服務(wù)的定義、內(nèi)涵與特點(diǎn),以形成相關(guān)的理論與方法基礎(chǔ)。

②2017年7月至2017年12月,按照計(jì)劃開(kāi)展的工作如下:

? 借鑒數(shù)據(jù)科學(xué)的理論方法探索知識(shí)創(chuàng)新服務(wù)的顯在需求分析、潛在需求分析,對(duì)用戶(hù)的行為軌跡和活動(dòng)規(guī)律進(jìn)行特征表示、特征提取、用戶(hù)建模,挖掘出用戶(hù)潛在和顯在的知識(shí)服務(wù)需求進(jìn)行研究,并通過(guò)綜述研究了IT采納和使用中用戶(hù)轉(zhuǎn)移行為的特征、模式與影響因素。

③2018年1月至2018年6月,按照計(jì)劃開(kāi)展的工作如下:

? 通過(guò)調(diào)查與實(shí)證分析大數(shù)據(jù)時(shí)代知識(shí)服務(wù)平臺(tái)和系統(tǒng)所需的各種情報(bào)技術(shù)和工具,基于“DIKW價(jià)值鏈”從知識(shí)揭示、知識(shí)導(dǎo)航、智能檢索、知識(shí)學(xué)習(xí)和知識(shí)挖掘等方面進(jìn)行考查,并以基于語(yǔ)音互動(dòng)的付費(fèi)知識(shí)問(wèn)答社區(qū)運(yùn)營(yíng)模式為例,研究了知識(shí)服務(wù)平臺(tái)的運(yùn)營(yíng)現(xiàn)狀與發(fā)展的對(duì)策;

? 為探索以文獻(xiàn)資源主導(dǎo)的顯性知識(shí)創(chuàng)新服務(wù)模式和以參與者為主導(dǎo)的隱性知識(shí)創(chuàng)新服務(wù)模式,研究國(guó)際公眾科學(xué)領(lǐng)域演化路徑與研究熱點(diǎn),從項(xiàng)目視角、理論方法視角以及參與者視角等研究樂(lè)基于群體參與及協(xié)作的公眾科學(xué)研究模式的興起與發(fā)展?fàn)顟B(tài),以及對(duì)策建議等。

1.5子課題五:面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)應(yīng)用研究:實(shí)現(xiàn)與驗(yàn)證

該子課題是以知識(shí)創(chuàng)新研究為實(shí)證場(chǎng)景,構(gòu)建面向知識(shí)創(chuàng)新服務(wù)應(yīng)用模式與實(shí)現(xiàn)系統(tǒng),通過(guò)利用數(shù)據(jù)科學(xué)的理論與方法,以達(dá)到支撐使多源異構(gòu)數(shù)據(jù)得以處理、提取、匯聚、關(guān)聯(lián)、分析、融合,并實(shí)現(xiàn)從數(shù)據(jù)到知識(shí)的轉(zhuǎn)化直至最終創(chuàng)造出新知識(shí)的研究宗旨。

① 2017年6月至2017年12月,按照計(jì)劃開(kāi)展的工作如下:

? 數(shù)字圖書(shū)館、全文數(shù)據(jù)庫(kù)網(wǎng)站和學(xué)術(shù)搜索引擎三種類(lèi)型的在線(xiàn)知識(shí)服務(wù)平臺(tái)為例,描繪平臺(tái)運(yùn)行的信息流,進(jìn)而系統(tǒng)分析大數(shù)據(jù)知識(shí)服務(wù)的組織架構(gòu)、組織網(wǎng)絡(luò)、規(guī)章制度、組織信息管理等。

② 2018年1月至2018年12月,按照計(jì)劃開(kāi)展的工作如下:

? 面向?qū)W科領(lǐng)域的研究前沿探索應(yīng)用實(shí)證,以人工智能為例,開(kāi)展了研究前沿探索的實(shí)證。進(jìn)而,分析大數(shù)據(jù)時(shí)代知識(shí)創(chuàng)新服務(wù)平臺(tái)和系統(tǒng)所需的各種情報(bào)技術(shù)和工具,知識(shí)服務(wù)的全過(guò)程進(jìn)行平臺(tái)原型的功能設(shè)計(jì)等。

2調(diào)查研究及學(xué)術(shù)交流情況(調(diào)研數(shù)據(jù)整理運(yùn)用、文獻(xiàn)資料收集整理、學(xué)術(shù)會(huì)議、學(xué)術(shù)交流、國(guó)際合作等)

2.1調(diào)研數(shù)據(jù)整理運(yùn)用

? 在Web of Science數(shù)據(jù)庫(kù)核心合集中下載有關(guān)“人工智能”數(shù)據(jù)72萬(wàn)多條,并用于學(xué)科領(lǐng)域前沿的研究中;下載Public Library of Science (PLOS)中的7756論文并用于引文內(nèi)容抽取與分析中;下載Scopus和Altmetric.com數(shù)據(jù)集中共45萬(wàn)多條科學(xué)推文及其元數(shù)并用于知識(shí)挖掘與發(fā)現(xiàn)的研究中;下載 Altmetric.com公司中從2013年1月到2016年6月收集的所有政策文件數(shù)據(jù)共90036條,并用于知識(shí)挖掘與發(fā)現(xiàn)的研究中;在CNKI數(shù)據(jù)庫(kù)和SIPO數(shù)據(jù)庫(kù)中下載有關(guān)“石墨烯”領(lǐng)域的2000條文獻(xiàn)數(shù)據(jù)和4000條專(zhuān)利數(shù)據(jù) 并用于知識(shí)庫(kù)的構(gòu)建研究及分析中;下載美團(tuán)網(wǎng)美食頻道19個(gè)類(lèi)別、5132道菜肴中的115321條評(píng)論數(shù)據(jù)并用于在線(xiàn)社交網(wǎng)站的知識(shí)抽取研究中;

? 選取數(shù)字圖書(shū)館、全文數(shù)據(jù)庫(kù)網(wǎng)站、學(xué)術(shù)搜索引擎三種類(lèi)型的在線(xiàn)知識(shí)服務(wù)平臺(tái)和Research Gate、分答、值乎、推文等社交平臺(tái),采集相關(guān)數(shù)據(jù)用于數(shù)據(jù)處理、數(shù)據(jù)挖掘、知識(shí)融合與發(fā)現(xiàn)等的數(shù)據(jù)科學(xué)理論和方法研究;

? 分別對(duì)中國(guó)科技信息研究所、中國(guó)船舶749所、中國(guó)兵器210所、中國(guó)同方、等知識(shí)服務(wù)機(jī)構(gòu)進(jìn)行實(shí)地訪問(wèn)和網(wǎng)絡(luò)調(diào)查,向情報(bào)工作人員發(fā)放問(wèn)卷,用于2017年4-7月間,與研究人員交流等,獲得了有關(guān)知識(shí)服務(wù)、知識(shí)創(chuàng)新等方面的第一手資料。

2.2文獻(xiàn)資料收集整理

? 檢索了有關(guān)“知識(shí)創(chuàng)新”“知識(shí)服務(wù)”“數(shù)據(jù)科學(xué)”“知識(shí)融合”“知識(shí)發(fā)現(xiàn)”等方面的國(guó)內(nèi)外研究論文,一共有1200多篇,選擇主要的文獻(xiàn)進(jìn)行閱讀,用于主要觀點(diǎn)與內(nèi)容的提煉、研究綜述的撰寫(xiě)等。

2.3學(xué)術(shù)會(huì)議、學(xué)術(shù)交流與國(guó)際合作

? 2017年2月25日召開(kāi)了開(kāi)題會(huì),邀請(qǐng)有9位專(zhuān)家到會(huì)并征集咨詢(xún)建議;

? 組織學(xué)術(shù)研討與報(bào)告會(huì)6次,先后邀請(qǐng)印第安納大學(xué)丁穎教授、華北水利水電大學(xué)張琳教授、大連理工大學(xué)王賢文教授、武漢大學(xué)吳丹教授、加拿大麥吉爾大學(xué)舒非博士、北卡羅來(lái)納大學(xué)教堂山分校Javed Mostafa教授參加項(xiàng)目研討并做學(xué)術(shù)講座:

(1)2017年5月16日,華北水利水電大學(xué)張琳教授學(xué)術(shù)報(bào)告:“文獻(xiàn)計(jì)量與科學(xué)家個(gè)人成果評(píng)價(jià)研究”(http://sem.njust.edu.cn/38/34/c6134a145460/page.htm);

(2)2017年5月16日,大連理工大學(xué)王賢文教授學(xué)術(shù)報(bào)告:“地理位置大數(shù)據(jù)與計(jì)算社會(huì)科學(xué)研究”(http://sem.njust.edu.cn/38/34/c6134a145460/page.htm);

(3)2017年5月17日,武漢大學(xué)吳丹教授學(xué)術(shù)報(bào)告:“基于情境與APP交互的用戶(hù)移動(dòng)搜索行為研究”(http://sem.njust.edu.cn/38/75/c6134a145525/page.htm);

(4)2017年6 月21日,美國(guó)印第安納大學(xué)教授、教育部長(zhǎng)江學(xué)者講座教授丁穎博士學(xué)術(shù)報(bào)告:“Zero to One:Success to Innovation”(http://sem.njust.edu.cn/41/01/c6134a147713/page.htm);

(5)2018年4月18日,加拿大麥吉爾大學(xué)舒非博士學(xué)術(shù)報(bào)告:“National and International Scientific Elites”(http://sem.njust.edu.cn/97/ab/c6134a169899/page.htm);

(6)2018年6月20日,北卡羅來(lái)納大學(xué)教堂山分校Javed Mostafa教授學(xué)術(shù)報(bào)告:“Consumer Health Information Searching: TowardAutomated, Trustworthy, and Secure Personalization” (http://sem.njust.edu.cn/af/4a/c6134a175946/page.htm)。

? 2018年7月6日至8日,舉辦“第十四屆海峽兩岸圖書(shū)資訊學(xué)學(xué)術(shù)研討會(huì)”,本屆會(huì)議主題為:“數(shù)據(jù)科學(xué)驅(qū)動(dòng)的圖書(shū)資訊學(xué)變革與轉(zhuǎn)型”,到會(huì)的海峽兩岸40余所高校與科研院所的160余名知名專(zhuān)家、學(xué)者和學(xué)生,

(http://sem.njust.edu.cn/b1/d7/c6134a176599/page.htm)。

? 組織小型學(xué)術(shù)研討會(huì)12次,除了課題組成員外,還邀請(qǐng)了校外內(nèi)專(zhuān)業(yè)技術(shù)領(lǐng)域人員到會(huì)參與課題研討。

? 2017年8月29日,北京國(guó)際會(huì)議中心2C,參加納米研究前沿分析報(bào)告發(fā)布會(huì)。

? 2017年11月15-17日,貴陽(yáng)大數(shù)據(jù)中心參觀與交流。

3成果宣傳推介情況(成果發(fā)布會(huì)、《工作簡(jiǎn)報(bào)》報(bào)送情況、國(guó)家社科基金專(zhuān)刊投稿及采用情況等)

? 中國(guó)社會(huì)科學(xué)網(wǎng)報(bào)道:數(shù)據(jù)科學(xué)理論與方法體系亟待完善(2017年03月06日)(http://www.cssn.cn/gd/gd_rwhd/xslt/201703/t20170306_3441434.shtml)

? 首席專(zhuān)家被邀請(qǐng)會(huì)議主題報(bào)告與學(xué)術(shù)講座:

(1)王曰芬.2016年12月7日,中國(guó)“互聯(lián)網(wǎng)公益”研究報(bào)告發(fā)布會(huì),分論壇:互聯(lián)網(wǎng)公益數(shù)據(jù)監(jiān)護(hù)主持,并做報(bào)告:互聯(lián)網(wǎng)公益數(shù)據(jù)監(jiān)護(hù)

(https://charity.nju.edu.cn/9d/18/c835a171288/page6.htm)

(2)王曰芬.2017年2月24日,上海社會(huì)科學(xué)院學(xué)術(shù)演講“數(shù)據(jù)科學(xué)支撐的知識(shí)服務(wù)創(chuàng)新對(duì)策思考”( http://www2.sass.org.cn/detailAction.do?method=ShowNewsContent)

(3)王曰芬.2017年4月20-22日,高校新型智庫(kù)建設(shè)與協(xié)同創(chuàng)新發(fā)展論壇,河南財(cái)經(jīng)政法大學(xué),鄭州市東方維景國(guó)際酒店,CNKI主辦,主題報(bào)告:面向智庫(kù)的情報(bào)搜集與分析(http://edu.people.com.cn/n1/2017/0421/c1053-29228184.html)

(4)王曰芬.2017年6月8-9日,首屆數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)學(xué)術(shù)研討會(huì),北京世紀(jì)金源香山商旅酒店,主題報(bào)告:信息哲學(xué)視域下數(shù)據(jù)驅(qū)動(dòng)的科學(xué)知識(shí)發(fā)現(xiàn)方法論思考(大學(xué)圖書(shū)館學(xué)報(bào),2017(5):126-127)

(5)王曰芬.2017年7月21-23日,第七屆全國(guó)博士生論壇,北京科學(xué)院大學(xué)雁棲湖,大會(huì)報(bào)告:數(shù)據(jù)科學(xué)支撐的知識(shí)服務(wù)創(chuàng)新對(duì)策思考(http://ndsis.las.ac.cn/dct/page/65583)

(6)王曰芬.2017年8月18日,第六屆中國(guó)電科戰(zhàn)略情報(bào)研討會(huì),成都黃龍溪欣瑞大酒店,主題報(bào)告:大數(shù)據(jù)時(shí)代科技情報(bào)理論與方法創(chuàng)新及應(yīng)用

(http://www.sohu.com/a/165709252_466078)

(7)王曰芬.2017年9月13日,江蘇大學(xué)圖書(shū)館學(xué)術(shù)講座:數(shù)據(jù)科學(xué)支撐的知識(shí)服務(wù)創(chuàng)新對(duì)策思考(http://www.ujs.edu.cn/info/1065/17520.htm)

(8)王曰芬.2018年5月7日,華南師范大學(xué)講座:大數(shù)據(jù)與數(shù)據(jù)科學(xué)及其應(yīng)用

(http://em.scnu.edu.cn/a/20180507/6288.html)

(9)Wang Yuefen .Evolution study of individual author and component network in the life cycle stage based on scientific collaboration network data,The Annual Conference on Data, Information, and Society ,Nanjing, China, July 3–6, 2018.( http://www.dis2018.net/Program.html)

4研究中存在的主要問(wèn)題、改進(jìn)措施,研究心得、意見(jiàn)建議

4.1研究中存在的主要問(wèn)題與改進(jìn)措施

? 在研究中面臨的主要問(wèn)題:一是,難以收集到可以有效借鑒的國(guó)外研究資料;二是,從各種數(shù)據(jù)資源(數(shù)據(jù)庫(kù))中下載的數(shù)據(jù)處理上存在有效算法支撐不足,而導(dǎo)致效率低下、處理時(shí)間長(zhǎng);三是,在國(guó)際交流的范圍與深度上還不夠;四是,在傳播學(xué)術(shù)研究成果過(guò)程中向期刊投稿,大部分國(guó)內(nèi)期刊需要收取版面發(fā)稿補(bǔ)貼費(fèi)用,而導(dǎo)致有些論文不能及時(shí)發(fā)表。

? 改進(jìn)的措施:一是,擴(kuò)大文獻(xiàn)檢索與實(shí)際調(diào)研的范圍,擬將從2018年9月開(kāi)始加大對(duì)外交流的力度;二是,加大實(shí)證研究的范圍,并爭(zhēng)取與專(zhuān)業(yè)化學(xué)會(huì)取得聯(lián)系,將研究成果通過(guò)專(zhuān)業(yè)學(xué)會(huì)的傳播與發(fā)布;三是,與計(jì)算機(jī)等專(zhuān)業(yè)人員合作,爭(zhēng)取在數(shù)據(jù)處理算法與應(yīng)用上有一定的突破;四是,爭(zhēng)取多向國(guó)家社科基金委資助的期刊投稿。

4.2研究心得與意見(jiàn)建議

? 研究心得:本項(xiàng)目是一個(gè)以圖書(shū)館、情報(bào)與文獻(xiàn)學(xué)為主的多學(xué)科交叉融合的前沿性綜合研究,既要系統(tǒng)地探索數(shù)據(jù)科學(xué)的理論與方法,又要與面向知識(shí)創(chuàng)新服務(wù)的實(shí)踐應(yīng)用緊密結(jié)合,研究的難度較大、涉及的面較廣。為了使研究具有理論的深度、方法的效度與應(yīng)用的代表性,一方面需要廣泛地收集國(guó)內(nèi)外相關(guān)的研究成果,閱讀、匯總與摘錄,并進(jìn)行定量與定性結(jié)合的綜述,另一方面需要對(duì)國(guó)內(nèi)外相關(guān)的服務(wù)平臺(tái)與系統(tǒng)進(jìn)行調(diào)查研究、專(zhuān)家訪談,同時(shí)從多源異構(gòu)的數(shù)據(jù)源中下載大批量的數(shù)據(jù),以實(shí)踐與驗(yàn)證數(shù)據(jù)采集、處理、挖掘與知識(shí)融合、知識(shí)發(fā)現(xiàn)等方法和流程。因此,本課題后續(xù)研究中,要加大人力投入、總結(jié)提煉與實(shí)踐嘗試,同時(shí),注重各個(gè)課題之間內(nèi)容研究的銜接。

? 意見(jiàn)建議:由于從2016年開(kāi)始的經(jīng)費(fèi)預(yù)算中在研究成果出版費(fèi)上有限制,導(dǎo)致階段性的研究論文發(fā)表受到影響,為了更及時(shí)地傳播研究成果,特別是前沿性研究傳播的新穎性,建議在出版費(fèi)(國(guó)內(nèi)期刊論文版面費(fèi))的限制上能夠有所區(qū)別。

5其他需要說(shuō)明的問(wèn)題

? 本課題的項(xiàng)目號(hào)是16ZDA224,課題在研究中,由于沒(méi)有注重項(xiàng)目號(hào)正確的寫(xiě)法,導(dǎo)致在論文發(fā)表時(shí)出現(xiàn)了三種不同的寫(xiě)法,分別是:16ZDA224、16ZAD224、16DZA224,后面兩種寫(xiě)法出現(xiàn)了錯(cuò)誤。在中文期刊發(fā)表時(shí),由于能夠出現(xiàn)項(xiàng)目的名稱(chēng),所以目前的狀態(tài)是項(xiàng)目名稱(chēng)是正確的,而有些論文項(xiàng)目編號(hào)中的字母出現(xiàn)上述錯(cuò)誤。如今發(fā)現(xiàn)了這種錯(cuò)誤,并通知給各個(gè)子課題負(fù)責(zé)人,相信后期將不會(huì)有類(lèi)似錯(cuò)誤發(fā)生。

? 在已經(jīng)發(fā)表的17篇期刊論文中,為了得到其他基金在出版費(fèi)方面的支持,有7篇論文標(biāo)有兩個(gè)或者以上的項(xiàng)目號(hào)。待出版8篇論文中,有4篇標(biāo)有兩個(gè)或者以上的項(xiàng)目號(hào)。后續(xù)的研究中,將盡可能使發(fā)表的論文在基金署名上專(zhuān)屬一個(gè)基金,并加強(qiáng)研究成果的及時(shí)發(fā)表傳播。

? 為了鼓勵(lì)研究生積極申報(bào)與參加江蘇省研究生科研創(chuàng)新計(jì)劃項(xiàng)目,相關(guān)部門(mén)提出由導(dǎo)師主持項(xiàng)目給予資助并經(jīng)過(guò)審核立項(xiàng)的倡議,所以,課題研究過(guò)程中,為了使研究生尤其是博士研究生在投入研究時(shí)又能獲得省研究生科研創(chuàng)新計(jì)劃項(xiàng)目立項(xiàng),將用于資助學(xué)生參與會(huì)議和助研費(fèi)等的課題經(jīng)費(fèi)同時(shí)算作是對(duì)創(chuàng)新計(jì)劃項(xiàng)目的支持,因此論文發(fā)表時(shí)也要對(duì)立項(xiàng)的研究生創(chuàng)新計(jì)劃項(xiàng)目加以標(biāo)注,出現(xiàn)論文發(fā)表時(shí)沒(méi)有單標(biāo)一個(gè)項(xiàng)目。盡管如此,卻體現(xiàn)出國(guó)家社科基金所做的貢獻(xiàn)。

二、研究成果情況

1代表性成果簡(jiǎn)介

1.1基本內(nèi)容與主要觀點(diǎn)

? 關(guān)于知識(shí)創(chuàng)新面臨的大數(shù)據(jù)挑戰(zhàn)

從科學(xué)研究角度看,知識(shí)創(chuàng)新指通過(guò)科學(xué)研究獲得新的基礎(chǔ)科學(xué)和技術(shù)科學(xué)知識(shí)的過(guò)程,知識(shí)創(chuàng)新不僅是技術(shù)創(chuàng)新的基礎(chǔ),是新技術(shù)、新發(fā)明的源泉,還是促進(jìn)科技進(jìn)步和經(jīng)濟(jì)增長(zhǎng)的革命性力量。伴隨我國(guó)創(chuàng)新發(fā)展驅(qū)動(dòng)戰(zhàn)略和科技創(chuàng)新的需求,知識(shí)創(chuàng)新的目標(biāo)與要求必須朝著國(guó)家戰(zhàn)略倡導(dǎo)的“在新思想、新發(fā)現(xiàn)、新知識(shí)、新原理、新方法上積極進(jìn)取,強(qiáng)化源頭儲(chǔ)備”上發(fā)展。

作為大數(shù)據(jù)的重要組成部分,科學(xué)大數(shù)據(jù)正在使科學(xué)世界發(fā)生變化,驅(qū)動(dòng)科學(xué)研究進(jìn)入數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)范式這一全新階段。科學(xué)大數(shù)據(jù)是科學(xué)發(fā)現(xiàn)與知識(shí)創(chuàng)新的新引擎,將改變?nèi)祟?lèi)生活及其對(duì)世界的深層理解。在大數(shù)據(jù)背景下,及時(shí)更新、開(kāi)放的海量數(shù)據(jù)為知識(shí)創(chuàng)新提供豐富的知識(shí)原料,大數(shù)據(jù)技術(shù)與工具極大提高知識(shí)共享和轉(zhuǎn)化的效率,但大量多源、異構(gòu)、碎片化、良莠不齊的數(shù)據(jù)源和知識(shí)源也給知識(shí)創(chuàng)新帶來(lái)挑戰(zhàn)。因此,大數(shù)據(jù)使研究人員對(duì)知識(shí)的獲取和使用從過(guò)去的“一種混沌”(知識(shí)供給匱乏同時(shí)有效知識(shí)不足)走向“另一種混沌”(數(shù)據(jù)來(lái)源多樣、信息供給過(guò)載但有效知識(shí)不足),人們迫切希望從大數(shù)據(jù)中獲取系統(tǒng)化的知識(shí)支撐。

? 關(guān)于大數(shù)據(jù)對(duì)學(xué)科知識(shí)創(chuàng)新模式的重構(gòu)

大數(shù)據(jù)重構(gòu)了傳統(tǒng)科學(xué)研究中“數(shù)據(jù)—信息—知識(shí)—智慧”的價(jià)值鏈,體現(xiàn)在4個(gè)方面:①由于數(shù)據(jù)來(lái)源的廣泛性,知識(shí)不再以孤立的種群存在于某一種生態(tài)位(如某一種形態(tài)、某一個(gè)領(lǐng)域、某一種平臺(tái)、某一種存量與其他知識(shí)或者環(huán)境的簡(jiǎn)單關(guān)系)上,而愈來(lái)愈呈現(xiàn)出復(fù)雜種群系統(tǒng)特征,噪音和不確定性并未因?yàn)橹R(shí)的多位性而弱化,反而愈益強(qiáng)化;②由于數(shù)據(jù)變化的瞬態(tài)性,運(yùn)行于這種復(fù)雜種群基礎(chǔ)上的知識(shí)自生、交互與反饋、共生與競(jìng)爭(zhēng)、演化與再生等機(jī)制已經(jīng)發(fā)生質(zhì)的改變,知識(shí)“涌現(xiàn)”現(xiàn)象日益突出;③由于數(shù)據(jù)載體的多樣性,知識(shí)生產(chǎn)者、提供者、使用者與知識(shí)之間的“主體-客體”界限已經(jīng)模糊,學(xué)科知識(shí)創(chuàng)新研究的正式知識(shí)交流模式與非正式知識(shí)交流模式亦已交融整合,數(shù)據(jù)的無(wú)處不在使知識(shí)的不同依存載體、傳播媒介及價(jià)值鏈節(jié)點(diǎn)與能量要素也形成了一種數(shù)據(jù)“泛在協(xié)同”關(guān)系,與此同時(shí),這種泛在協(xié)同關(guān)系本身又為學(xué)科創(chuàng)新服務(wù)提供了一種全新的可轉(zhuǎn)化為知識(shí)的數(shù)據(jù)來(lái)源;④由于數(shù)據(jù)的多維關(guān)聯(lián)性,在數(shù)據(jù)與知識(shí)的交互和演化過(guò)程中,知識(shí)的“因果”已不再重要,取而代之的是基于數(shù)據(jù)關(guān)聯(lián)支撐的知識(shí)間的泛在“關(guān)聯(lián)”,這即可為學(xué)科創(chuàng)新研究生命周期各階段的全景知識(shí)提供了源泉,以激活學(xué)科創(chuàng)新工作者的隱形知識(shí),其亦是學(xué)科創(chuàng)新研究中的“偶遇”“意外”或者“異想”知識(shí)的源泉,為學(xué)科創(chuàng)新工作靈感提供動(dòng)力。因此,大數(shù)據(jù)使學(xué)科創(chuàng)新活動(dòng)處于“數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)”的第四范式,此研究范式產(chǎn)生的多源、廣泛、瞬態(tài)、多維關(guān)聯(lián)的大數(shù)據(jù),一方面為學(xué)科創(chuàng)新研究帶來(lái)越來(lái)越難以處理的數(shù)據(jù)困擾和知識(shí)渴求,另一方面為學(xué)科知識(shí)創(chuàng)新生命周期各階段全景知識(shí)提供源泉,也為研究中的等創(chuàng)新工作靈感或隱性知識(shí)提供激活的更多可能。

? 關(guān)于大數(shù)據(jù)驅(qū)動(dòng)下知識(shí)創(chuàng)新服務(wù)及其新需求

主要體現(xiàn)在以下4個(gè)方面:①?gòu)闹R(shí)主體上,大數(shù)據(jù)對(duì)知識(shí)創(chuàng)新主體提出新要求,知識(shí)主體需要基于數(shù)據(jù)和數(shù)據(jù)技術(shù)來(lái)決策,從數(shù)據(jù)中挖掘出知識(shí)的價(jià)值、發(fā)現(xiàn)新的知識(shí),借助社會(huì)媒體激發(fā)靈感或基于數(shù)字化平臺(tái)進(jìn)行廣泛交流與合作;②從知識(shí)資源上,知識(shí)的獲取不再局限于已經(jīng)公開(kāi)的文獻(xiàn)資源或組織內(nèi)部及其所在的社會(huì)網(wǎng)絡(luò),科研過(guò)程中的數(shù)據(jù)集、互聯(lián)網(wǎng)資源與社交媒體的交互數(shù)據(jù)都是組織知識(shí)創(chuàng)新的重要源頭;③從方法與途徑上,隨著數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、人工智能的發(fā)展,為知識(shí)的交流、共享、吸收與利用提供便利。同時(shí),各種媒體、專(zhuān)門(mén)機(jī)構(gòu)及其提供的服務(wù)可以使知識(shí)創(chuàng)新的主體突破地域的限制,促使知識(shí)創(chuàng)新社會(huì)化生態(tài)的形成。技術(shù)與方法成為知識(shí)創(chuàng)新主體的功能外延,媒體與專(zhuān)門(mén)機(jī)構(gòu)成為支撐知識(shí)創(chuàng)新的重要途徑,知識(shí)創(chuàng)新主體對(duì)于方法與途徑的依賴(lài)越來(lái)越強(qiáng);④從實(shí)現(xiàn)的支撐上,創(chuàng)新的源泉來(lái)自數(shù)據(jù)、信息與知識(shí)的轉(zhuǎn)化。知識(shí)經(jīng)濟(jì)的核心是通過(guò)知識(shí)與服務(wù)實(shí)現(xiàn)創(chuàng)新,進(jìn)而優(yōu)化科學(xué)研究、商業(yè)經(jīng)濟(jì)、企業(yè)管理、國(guó)家政策和制度設(shè)計(jì),知識(shí)服務(wù)是支撐知識(shí)創(chuàng)新的重要途徑。在大數(shù)據(jù)和關(guān)聯(lián)數(shù)據(jù)環(huán)境下,圖書(shū)情報(bào)、數(shù)據(jù)科學(xué)、計(jì)算機(jī)科學(xué)、科學(xué)學(xué)等進(jìn)一步匯聚,所形成的新的知識(shí)發(fā)現(xiàn)、趨勢(shì)鑒別、情報(bào)研究和決策分析方法、工具和服務(wù),正成為知識(shí)服務(wù)滿(mǎn)足知識(shí)創(chuàng)新需求的應(yīng)用支撐能力。服務(wù)機(jī)構(gòu)將以最大程度地激勵(lì)和支持用戶(hù)進(jìn)行創(chuàng)新作為知識(shí)服務(wù)的重要使命,借助于大數(shù)據(jù)思維與技術(shù)支撐知識(shí)創(chuàng)新變革,并提供有價(jià)值的知識(shí)或提供使數(shù)據(jù)/信息/知識(shí)/智慧得以高效轉(zhuǎn)化的途徑。

? 關(guān)于數(shù)據(jù)科學(xué)的理論與方法

數(shù)據(jù)科學(xué)這一術(shù)語(yǔ)早在二十世紀(jì)六十年代就已出現(xiàn),并常被用來(lái)指代數(shù)據(jù)的表示、收集、儲(chǔ)存、整合、分析和理解的科學(xué)原理。自二十世紀(jì)八十年代以來(lái),以大量數(shù)據(jù)支持決策的趨勢(shì)逐漸成為主流,在二十世紀(jì)九十年代初,隨著關(guān)系型數(shù)據(jù)庫(kù)技術(shù)的成熟以及數(shù)據(jù)業(yè)務(wù)的流程更加自動(dòng)化,數(shù)據(jù)科學(xué)領(lǐng)域誕生并迅速發(fā)展起來(lái)。數(shù)據(jù)科學(xué)的內(nèi)涵與特征主要體現(xiàn)在:

其一,以知識(shí)發(fā)現(xiàn)為主要研究目的。數(shù)據(jù)科學(xué)隨著大數(shù)據(jù)的興起,也被賦予了更加豐富的內(nèi)涵,亦在研究中被更廣泛的應(yīng)用。大量的研究人員從數(shù)據(jù)科學(xué)的具體實(shí)施過(guò)程和目的入手對(duì)其進(jìn)行了闡釋?zhuān)趯⒅R(shí)發(fā)現(xiàn)與提取作為數(shù)據(jù)科學(xué)的主要目的這一點(diǎn)上已基本形成了共識(shí)。

其二,多學(xué)科與復(fù)合領(lǐng)域特性。數(shù)據(jù)科學(xué)的多學(xué)科與復(fù)合領(lǐng)域特性在其興起伊始就被廣大數(shù)據(jù)科學(xué)研究人員所廣泛提及,數(shù)據(jù)科學(xué)的基礎(chǔ)學(xué)科知識(shí)組成應(yīng)該來(lái)源于計(jì)算機(jī)科學(xué),數(shù)學(xué)與統(tǒng)計(jì)學(xué)和應(yīng)用領(lǐng)域?qū)W科。

? 關(guān)于數(shù)據(jù)科學(xué)的主要應(yīng)用領(lǐng)域

其一,支持預(yù)測(cè)與決策。對(duì)未來(lái)的預(yù)測(cè)是基于統(tǒng)計(jì)學(xué)原理,從數(shù)據(jù)分析技術(shù)產(chǎn)生的開(kāi)始就建立的一個(gè)主要實(shí)踐方向。實(shí)現(xiàn)預(yù)測(cè)一直以來(lái)也是數(shù)據(jù)科學(xué)的一個(gè)重要應(yīng)用,也是進(jìn)行后續(xù)決策優(yōu)化的一個(gè)重要步驟。這一應(yīng)用的體現(xiàn)主要在經(jīng)濟(jì)管理領(lǐng)域,但是隨著數(shù)據(jù)科學(xué)的發(fā)展,應(yīng)用涉及領(lǐng)域的范圍也越來(lái)越廣泛。主要包括:一是實(shí)現(xiàn)更精確的預(yù)測(cè)。

其二,服務(wù)于創(chuàng)新型學(xué)科知識(shí)研究與發(fā)現(xiàn)。由于目前對(duì)數(shù)據(jù)科學(xué)的應(yīng)用多是在大數(shù)據(jù)背景下實(shí)現(xiàn)的,新型的數(shù)據(jù)集往往可以對(duì)已有的方法、流程進(jìn)行優(yōu)化,也可使決策更加智能。所以數(shù)據(jù)科學(xué)在研究?jī)?yōu)化方法、決策等方面的應(yīng)用也越來(lái)越流行。數(shù)據(jù)科學(xué)的這一應(yīng)用主要是面向本身就會(huì)產(chǎn)生復(fù)合大數(shù)據(jù)時(shí)代特征的新型數(shù)據(jù)集的學(xué)科,這些對(duì)象的特性決定了其與數(shù)據(jù)科學(xué)的相生相依的關(guān)系。這一應(yīng)用的主要體現(xiàn)在生物科學(xué)、醫(yī)學(xué)、環(huán)境科學(xué)等領(lǐng)域。

1.2學(xué)術(shù)價(jià)值與社會(huì)影響

? 研究產(chǎn)生的主要觀點(diǎn)的學(xué)術(shù)價(jià)值

? 推動(dòng)數(shù)據(jù)科學(xué)理論與方法體系的建設(shè)和迭代創(chuàng)新

數(shù)據(jù)科學(xué)是在多科學(xué)交叉基礎(chǔ)上產(chǎn)生的新興研究領(lǐng)域,一方面需要研究數(shù)據(jù)本身具有或者呈現(xiàn)出的各種類(lèi)型、特點(diǎn)、存在方式及其變化形式和規(guī)律,另一方面要為社會(huì)科學(xué)與自然科學(xué)提供新的研究方法。因此,基于現(xiàn)有的基礎(chǔ)理論與方法,結(jié)合應(yīng)用的需求,形成一套從數(shù)據(jù)獲取、處理到分析的數(shù)據(jù)科學(xué)理論與方法體系和針對(duì)應(yīng)用的關(guān)鍵技術(shù)方法,使數(shù)據(jù)/信息/知識(shí)得以轉(zhuǎn)化成解決實(shí)踐問(wèn)題的基本依據(jù),是建立和發(fā)展適應(yīng)大數(shù)據(jù)時(shí)代特征的各學(xué)科領(lǐng)域數(shù)據(jù)科學(xué)所必要的。同時(shí),針對(duì)理論與方法的具體內(nèi)容和應(yīng)用問(wèn)題,進(jìn)一步探索與大數(shù)據(jù)思維和技術(shù)結(jié)合的基礎(chǔ)理論與共性方法的科學(xué)性,將有力推動(dòng)數(shù)據(jù)科學(xué)理論與方法體系的迭代創(chuàng)新發(fā)展。

? 優(yōu)化大數(shù)據(jù)和數(shù)據(jù)科學(xué)新發(fā)展機(jī)遇背景下的圖書(shū)情報(bào)學(xué)科研究體系

在圖書(shū)情報(bào)領(lǐng)域,一方面,在技術(shù)與經(jīng)濟(jì)發(fā)展的驅(qū)動(dòng)下,實(shí)踐環(huán)節(jié)中產(chǎn)生了許許多多亟待解決的重大問(wèn)題,其中,如何使數(shù)據(jù)、信息更有效的集成,并轉(zhuǎn)化為知識(shí)進(jìn)而轉(zhuǎn)變形成支撐決策的智慧,關(guān)系到圖書(shū)情報(bào)領(lǐng)域?qū)W科體系創(chuàng)新的趨向與能否贏取核心競(jìng)爭(zhēng)優(yōu)勢(shì)的途徑;另一方面,已有的知識(shí)服務(wù)、知識(shí)創(chuàng)新、知識(shí)發(fā)現(xiàn)等理論與方法在其它學(xué)科滲透沖擊下迫切需要變革創(chuàng)新或者不斷完善以形成有實(shí)際效用的體系框架。大數(shù)據(jù)的發(fā)展與知識(shí)創(chuàng)新服務(wù)的迫切需求,為圖書(shū)情報(bào)領(lǐng)域的學(xué)科發(fā)展提供了一個(gè)切合時(shí)代趨勢(shì)的機(jī)遇。本課題從理論方法構(gòu)建、關(guān)鍵技術(shù)方法研究與應(yīng)用驗(yàn)證多個(gè)方面切入,并基于多元化的理論與多學(xué)科支撐,形成面向知識(shí)創(chuàng)新服務(wù)需求的數(shù)據(jù)科學(xué)的系列化研究成果,這將為圖書(shū)情報(bào)領(lǐng)域優(yōu)化學(xué)科體系提供重要的研究基礎(chǔ)與保障。同時(shí),針對(duì)學(xué)科知識(shí)創(chuàng)新的重構(gòu)和提供知識(shí)創(chuàng)新服務(wù),以數(shù)據(jù)科學(xué)作為圖書(shū)情報(bào)學(xué)科體系研究的重要支撐,將突破現(xiàn)有學(xué)科發(fā)展局限、深化研究主題、開(kāi)拓新的研究空間、提升研究水平,促使圖書(shū)情報(bào)領(lǐng)域的學(xué)科體系建設(shè)在未來(lái)發(fā)展中抓住核心競(jìng)爭(zhēng)力的優(yōu)勢(shì)契機(jī)。

? 研究產(chǎn)生的社會(huì)影響

課題在研究過(guò)程中,被國(guó)內(nèi)多個(gè)學(xué)術(shù)會(huì)議和研究機(jī)構(gòu)邀請(qǐng)進(jìn)行學(xué)術(shù)交流,所撰寫(xiě)的論文被國(guó)內(nèi)外核心期刊與頂級(jí)會(huì)議錄用,產(chǎn)生了較大社會(huì)影響。

? 課題研究觀點(diǎn)被社會(huì)的評(píng)價(jià)

上海社會(huì)科學(xué)院信息研究所的評(píng)價(jià): “2017年2月24日上午,國(guó)家社科重大項(xiàng)目首席專(zhuān)家、南京理工大學(xué)經(jīng)濟(jì)管理學(xué)院信息管理系王曰芬教授到信息所作學(xué)術(shù)演講。報(bào)告會(huì)上,王曰芬教授以“數(shù)據(jù)科學(xué)支撐的知識(shí)服務(wù)創(chuàng)新對(duì)策思考”,從國(guó)家大數(shù)據(jù)戰(zhàn)略和國(guó)家科技創(chuàng)新規(guī)劃切手,介紹了所承擔(dān)的國(guó)家重大項(xiàng)目的申請(qǐng)背景與項(xiàng)目?jī)?nèi)涵旨意,深入分析了國(guó)內(nèi)外知識(shí)服務(wù)、數(shù)據(jù)科學(xué)的起始與發(fā)展,結(jié)合中國(guó)當(dāng)代的發(fā)展環(huán)境,提出了基于數(shù)據(jù)科學(xué)的創(chuàng)新對(duì)策的新理念、新戰(zhàn)略和新實(shí)踐,為我們提供了以數(shù)據(jù)為基礎(chǔ)的知識(shí)服務(wù)如何發(fā)展并達(dá)到新經(jīng)濟(jì)與新技術(shù)所需的服務(wù)業(yè)態(tài)的全新思考。王曰芬教授在演講中所提出的數(shù)據(jù)的收集、分析與建模并為學(xué)科創(chuàng)新工作靈感提供動(dòng)力;數(shù)據(jù)科學(xué)可提供管理的優(yōu)化研究精度的提高;在以往知識(shí)服務(wù)產(chǎn)品的基礎(chǔ)上注重工具的使用;如何在雙輪互動(dòng)中進(jìn)行研究熱點(diǎn)挖掘、主題演化、趨勢(shì)預(yù)測(cè),如何將大數(shù)據(jù)分析與學(xué)科領(lǐng)域生命周期結(jié)合起來(lái),并進(jìn)行深度聚合與挖掘,用以發(fā)現(xiàn)各學(xué)科領(lǐng)域中的作者關(guān)鍵詞關(guān)系圖……,以上這些論述與分析,對(duì)信息所正在從事的一帶一路研究、科技創(chuàng)新研究、互聯(lián)網(wǎng)研究、信息安全研究、城市信息化研究、人才信息研究等均具有重要的啟示。(http://www2.sass.org.cn/detailAction.do?method=ShowNewsContent)”

? 課題研究中論文發(fā)表與引用及下載情況

發(fā)表期刊論文17篇,其中:SCI/SSCI雙收錄期刊《Scientometrics》發(fā)表論文1篇(在Web of Science核心合集數(shù)據(jù)庫(kù)中的Usage Metrics為43次)、CSSCI收錄的一級(jí)學(xué)會(huì)期刊《中國(guó)圖書(shū)館學(xué)報(bào)》發(fā)表2篇、CSSCI收錄的一級(jí)學(xué)會(huì)期刊《情報(bào)學(xué)報(bào)》發(fā)表3篇、CSSCI收錄期刊《圖書(shū)情報(bào)工作》《圖書(shū)與情報(bào)》《情報(bào)資料工作》《數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)》等期刊發(fā)表9篇、CSSCI擴(kuò)展版收錄期刊《數(shù)字圖書(shū)館論壇》發(fā)表3篇;發(fā)表本學(xué)科頂級(jí)會(huì)議(ISSI2017、ASIST2017)論文長(zhǎng)文3篇、短文4篇,其中被EI收錄6篇;發(fā)表的中文16篇學(xué)術(shù)期刊論文在CNKI數(shù)據(jù)庫(kù)中,截止到2018年7月22日共被下載4056次、被引用19次。

2階段性成果清單

2.1 學(xué)術(shù)論文發(fā)表

? 發(fā)表的學(xué)術(shù)期刊論文共17篇(其中:SCI/SSCI雙收錄期刊論文1篇,國(guó)內(nèi)一級(jí)學(xué)會(huì)期刊論文5篇)和發(fā)表的本學(xué)科頂級(jí)學(xué)術(shù)會(huì)議論文7篇(其中:被EI收錄6篇),具體信息見(jiàn)附件EXCEL。

2.2錄用待發(fā)表論文與交付待出版專(zhuān)著

? 被錄用待發(fā)表的學(xué)術(shù)期刊論文(共8篇)

(1) Lei Li, Daqing He, Chengzhi Zhang*, Li Geng, Ke Zhang. Characterizing Peer-Judged Answer Quality on Academic Q&A Sites: A Cross-Disciplinary Case Study on ResearchGate[J].Aslib Journal of Information Management.(in press)(SCI/SSCI雙收錄期刊)

(2) Qing qing Zhou*, Chengzhi Zhang*. Detecting Users’ Dietary Preferences and Their Evolutions via Chinese Social Media[J].Journal of Database Management. (in press) (SCI收錄期刊)

(3) Shutian Ma*, Yingyi Zhang, Chengzhi Zhang*. Using Multiple Web Resources and Inference Rules to Classify Chinese Word Semantic Relation[J].Information Discovery and Delivery.(in press). (ESI收錄期刊)

(4) Chao Min,Ying Ding, Jiang Li,Yi Bu,Lei Pei,Jianjun Sun*.Innovation or Imitation: The Diffusion of Citations[J].Journal of the association for information science and technology, 2018(in press). (SCI收錄期刊)

(5) 余厚強(qiáng),曹嘉君,王曰芬.情報(bào)學(xué)視角下的國(guó)際人工智能研究前沿分析[J].情報(bào)雜志(錄用)(CSSCI收錄期刊)

(6) 王曰芬*,鄒本濤,宋小康.大數(shù)據(jù)驅(qū)動(dòng)下情報(bào)研究知識(shí)庫(kù)及其體系架構(gòu)設(shè)計(jì)[J].情報(bào)理論與實(shí)踐(錄用)(CSSCI收錄期刊)

(7) 宋小康,何勁,王曰芬*.大數(shù)據(jù)驅(qū)動(dòng)下情報(bào)研究知識(shí)庫(kù)構(gòu)建的關(guān)鍵技術(shù)及實(shí)現(xiàn)[J].情報(bào)理論與實(shí)踐(錄用)(CSSCI收錄期刊)

(8) 曹嘉君,王曰芬*,宋小康.大數(shù)據(jù)驅(qū)動(dòng)下情報(bào)研究知識(shí)庫(kù)的應(yīng)用:以石墨烯領(lǐng)域?yàn)槔齕J].情報(bào)理論與實(shí)踐(錄用)(CSSCI收錄期刊)

? 待出版的專(zhuān)著:王曰芬等.數(shù)據(jù)驅(qū)動(dòng)的知識(shí)服務(wù)體系與方法[M].科學(xué)出版社

2.3發(fā)表其他研究成果

(1) 在2017年計(jì)算語(yǔ)言學(xué)領(lǐng)域的自動(dòng)摘要國(guó)際測(cè)評(píng)比賽論文

Shutian Ma, Jin Xu, Jie Wang and Chengzhi Zhang*. NJUST @ CLSciSumm-17. In: Proceedings of the 2nd Joint Workshop on Bibliometric-enhanced Information Retrieval and Natural Language Processing for Digital Libraries (BIRNDL 2017), Aug, 2017, Tokyo, Japan. (CL-SciSumm 2017測(cè)評(píng)比賽冠軍)

(2) 專(zhuān)家寄語(yǔ):王曰芬.創(chuàng)新驅(qū)動(dòng)發(fā)展需要基于大數(shù)據(jù)的知識(shí)服務(wù)[J]數(shù)字圖書(shū)館論壇,2018(3):1

(注:*表明的是課題的主要研究者)

三、下一步研究計(jì)劃

總體上,進(jìn)一步按照研究計(jì)劃,以理論與方法研究為重點(diǎn)、以應(yīng)用研究為落腳點(diǎn),強(qiáng)化學(xué)術(shù)交流、成果發(fā)布、國(guó)際合作。在2018年9月召開(kāi)一次中期研討會(huì),在2019年上半年將理論與方法研究成果與實(shí)踐工作部門(mén)對(duì)接,以爭(zhēng)取一定范圍的應(yīng)用,2019年底完成課題的總報(bào)告。具體地,每個(gè)子課題的工作方案如下:

? 子課題一:面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)理論研究:目的與體系

2018年9月至2019年6月

通過(guò)專(zhuān)家咨詢(xún)和集體攻關(guān)途徑,攻克與面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)理論與方法體系架構(gòu)有關(guān)的難點(diǎn)問(wèn)題;與其他子課題合作,在后續(xù)知識(shí)抽取、知識(shí)融合和知識(shí)創(chuàng)新服務(wù)的實(shí)現(xiàn)模式和實(shí)證應(yīng)用研究過(guò)程中,完善需求分析、理論與方法體系以及應(yīng)用與保障體系架構(gòu)設(shè)計(jì);在此過(guò)程中,整理并發(fā)表若干篇高水平的學(xué)術(shù)論文;

2019年7月至2019年12月

完成子課題研究報(bào)告。

? 子課題二:面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)方法研究:信息采集與知識(shí)抽取

2018年7月至2018年9月

分別開(kāi)展大數(shù)據(jù)驅(qū)動(dòng)的多層次知識(shí)表示模式、大數(shù)據(jù)用戶(hù)知識(shí)表示方法的研究;

2018年10月至2019年6月

與其他子課題合作,在后續(xù)有關(guān)大數(shù)據(jù)驅(qū)動(dòng)的知識(shí)融合的實(shí)現(xiàn)模式和實(shí)證應(yīng)用研究過(guò)程中,完善知識(shí)抽取模式、方法與技術(shù)實(shí)現(xiàn)方案;在此過(guò)程中,整理并發(fā)表若干篇高水平的學(xué)術(shù)論文;

2019年7月至2019年12月

完成子課題研究報(bào)告。

? 子課題三:面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)方法研究:知識(shí)融合與知識(shí)發(fā)現(xiàn)

2018年7月至2018年8月

分別開(kāi)展知識(shí)融合與知識(shí)發(fā)現(xiàn)結(jié)果的展示、知識(shí)融合與知識(shí)發(fā)現(xiàn)結(jié)果的驗(yàn)證研究;

2018年9月至2019年6月

與其他子課題合作,在后續(xù)有關(guān)知識(shí)創(chuàng)新服務(wù)應(yīng)用和實(shí)證研究過(guò)程中,完善知識(shí)融合和知識(shí)發(fā)現(xiàn)的模式、方法與技術(shù)實(shí)現(xiàn)方案;在此過(guò)程中,整理并發(fā)表若干篇高水平的學(xué)術(shù)論文;

2019年7月至2019年12月

完成子課題研究報(bào)告。

? 子課題四:面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)應(yīng)用研究:知識(shí)創(chuàng)新服務(wù)機(jī)制

2018年7月至2019年3月

基于知識(shí)管理的認(rèn)知模型和社會(huì)模型,探索知識(shí)創(chuàng)新服務(wù)的孵化機(jī)制;基于組織科學(xué)的創(chuàng)新擴(kuò)散理論,探索知識(shí)創(chuàng)新服務(wù)的擴(kuò)散機(jī)制;基于野中郁次郎的知識(shí)管理模型,探索知識(shí)創(chuàng)新服務(wù)的轉(zhuǎn)化機(jī)制;基于認(rèn)知科學(xué)的認(rèn)知吸收理論和組織行為學(xué)的吸收能力理論,探索知識(shí)創(chuàng)新服務(wù)的吸收機(jī)制;

2019年4月至2019年12月

對(duì)數(shù)據(jù)科學(xué)支撐的知識(shí)創(chuàng)新服務(wù)保障進(jìn)行系統(tǒng)研究,分別就組織管理、技術(shù)保障、產(chǎn)學(xué)研合作以及人才培養(yǎng)進(jìn)行充分調(diào)研和探索;發(fā)表若干篇高水平的學(xué)術(shù)論文,并最終形成論文集和結(jié)項(xiàng)驗(yàn)收?qǐng)?bào)告作為子課題成果,完成子課題結(jié)項(xiàng)。

? 子課題五:面向知識(shí)創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)應(yīng)用研究:實(shí)現(xiàn)與驗(yàn)證

2018年7月至2018年12月

理清大數(shù)據(jù)時(shí)代知識(shí)創(chuàng)新服務(wù)平臺(tái)和系統(tǒng)的創(chuàng)新型知識(shí)服務(wù)模式,分析服務(wù)平臺(tái)和系統(tǒng)中各要素,建立要素之間的關(guān)系;建立完整的大數(shù)據(jù)時(shí)代知識(shí)創(chuàng)新服務(wù)機(jī)制和模式的理論框架;進(jìn)行大數(shù)據(jù)知識(shí)創(chuàng)新服務(wù)平臺(tái)和系統(tǒng)的詳細(xì)設(shè)計(jì),進(jìn)行知識(shí)庫(kù)的構(gòu)建,完成知識(shí)服務(wù)平臺(tái)的建設(shè);

2019年1月至2019年8月

以某技術(shù)領(lǐng)域?yàn)槔_(kāi)展面向?qū)W科領(lǐng)域的研究前沿探索應(yīng)用實(shí)證、面向科研資源共享與用戶(hù)項(xiàng)目眾包的科研眾包應(yīng)用實(shí)證;構(gòu)建知識(shí)創(chuàng)新服務(wù)的應(yīng)用反饋機(jī)制,建立應(yīng)用效果的評(píng)估體系,實(shí)現(xiàn)服務(wù)的應(yīng)用反饋和效果評(píng)估;

2019年9月至2019年12月

對(duì)課題研制過(guò)程中形成的技術(shù)文檔進(jìn)行整理,并對(duì)整體的應(yīng)對(duì)體系進(jìn)行整合;發(fā)表若干篇高水平的學(xué)術(shù)論文,并最終形成論文集和結(jié)項(xiàng)驗(yàn)收?qǐng)?bào)告作為子課題成果,完成子課題結(jié)項(xiàng)。

(課題組供稿)

(責(zé)編:孫爽、閆妍)
RM新时代APP官网