RM新时代APP官网

舊版網(wǎng)站入口

站內(nèi)搜索

清末民國社會調(diào)查數(shù)據(jù)庫建設(shè)中期檢查報告

2017年12月08日13:21來源:全國哲學(xué)社會科學(xué)工作辦公室

一、 研究進展情況

1、課題開題與子課題進展情況

自2016年3月開題以來,至2017年7月,課題組已經(jīng)基本搭建起較為完整的數(shù)據(jù)庫架構(gòu),完成了總?cè)萘考s為8個G(一個G為1024M)的清末民國社會調(diào)查數(shù)據(jù)庫。現(xiàn)在數(shù)據(jù)庫中已經(jīng)有約2000萬字全文數(shù)據(jù)庫、300萬字原始文獻庫。另外,課題組還完成了約50萬字的文獻目錄索引,以及“婚姻家庭”專題數(shù)據(jù)庫的表格錄入工作?傮w完成進度已經(jīng)接近項目預(yù)計工作量的一半,項目進展順利。

子課題1已經(jīng)對清末民國社會調(diào)查中調(diào)查的概念、調(diào)查活動的背景、調(diào)查的性質(zhì)進行了深入分析。在此基礎(chǔ)上,已經(jīng)根據(jù)調(diào)查報告的特點以及歷史學(xué)和其他社會科學(xué)學(xué)者的需求,設(shè)計出了數(shù)據(jù)庫的總體結(jié)構(gòu)和功能;并對數(shù)據(jù)庫的建立制定了可行性方案和具體操作方案。在此基礎(chǔ)上,已經(jīng)初步搭建好數(shù)據(jù)庫的基礎(chǔ)架構(gòu)。

子課題2依據(jù)子課題3編制的文獻目錄索引提供的信息,查找、復(fù)制了原始社會調(diào)查文獻,已經(jīng)建立了規(guī)模為300萬字的原始文獻庫。上述原始文獻已經(jīng)被掃描并轉(zhuǎn)變?yōu)閜df格式,同時已經(jīng)導(dǎo)入到原始文獻庫中與全文數(shù)據(jù)庫一一對應(yīng)。

子課題3已經(jīng)完成約50萬字的原始社會調(diào)查文獻目錄索引的編制,包括調(diào)查文獻的名稱、類型、調(diào)查時間、調(diào)查地點、調(diào)查主體、調(diào)查內(nèi)容以及出版機構(gòu)、出版時間以及文獻來源等各類信息。該索引根據(jù)社會調(diào)查的內(nèi)容,將社會調(diào)查分為“綜合”、“環(huán)境”、“政治”、“經(jīng)濟”、“軍事”、“法律”、“社會”、“宗教”、“文化”、“教育”、“民族”、“華僑”、“社會調(diào)查理論與方法”十三大類,每大類又根據(jù)文獻條目之多少逐級細(xì)分,且不論分成幾個層級,其最后一級分類所在條目,均按著作或刊布時間依序排列。有些類別條目較多,但涉及不同地區(qū),則一般以地域予以分類。其中“綜合類”調(diào)查,主要指對某一特定地區(qū)的綜合性調(diào)查,涉及自然環(huán)境、政治、經(jīng)濟、社會、文化等諸多方面,不論這一地域,是一個村莊,市鎮(zhèn),還是省縣行政區(qū),或是港口、鐵路沿線等地。為便于檢索,據(jù)其調(diào)查范圍之大小,分為“全國及跨省區(qū)”、“省域”、“縣域”、“城鎮(zhèn)”、“村落”、以及包括“鐵路沿線”等其他小類!碍h(huán)境”類調(diào)查,主要包括“環(huán)境概況”、“資源”、“災(zāi)害”等幾個方面。其中“資源”包括“氣象與氣候”、“地質(zhì)”、“礦產(chǎn)”、“土壤與水資源”、“生物”(含森林植被、動物等)、“物產(chǎn)”等;“災(zāi)害”指的是水、旱、蝗、震以及傳染性疾病等各類災(zāi)害。其他各類情況,概述如下:政治——政治概況、國家行政、地方行政、基層自治、對外關(guān)系等;經(jīng)濟——經(jīng)濟概況、農(nóng)業(yè)、手工業(yè)及工業(yè)、商業(yè)、財政、金融與經(jīng)濟關(guān)系、經(jīng)濟組織等;軍事——軍事概況、武裝力量、戰(zhàn)爭、后勤;法律——法律概況、司法體制、司法行為、民商事習(xí)慣;社會——社會概況、人口、婚姻與家庭、社會階層、社會組織、社會問題與社會運動、風(fēng)俗習(xí)慣、醫(yī)療衛(wèi)生、社會保障等;宗教——宗教概況、佛教、道教、基督教、伊斯蘭教、民間宗教;文化——文化概況、新聞、出版、文藝、體育、文博、其他;教育——教育概況、各類教育、教育管理、教學(xué)內(nèi)容與方法、師資隊伍、學(xué)生學(xué)習(xí)與生活等;民族——民族概況、族別;華僑——華僑概況、國內(nèi)華僑、海外華僑。

子課題4已經(jīng)建立了約2000萬字的全文檢索庫,通過將數(shù)據(jù)輸入、校核與處理,通過將原始文獻轉(zhuǎn)換為word格式,從而建立了完整的全文數(shù)據(jù)庫。已經(jīng)完成項目規(guī)劃4000萬字的50%。上述內(nèi)容已經(jīng)全部導(dǎo)入到數(shù)據(jù)庫之中,目前,數(shù)據(jù)庫已經(jīng)能夠基本實現(xiàn)項目規(guī)劃的絕大部分功能。

子課題4同時也已經(jīng)完成了婚姻家庭專題應(yīng)用庫的表格錄入工作,后期將對社會調(diào)查中的數(shù)據(jù)進行編碼和重組,然后進行統(tǒng)計分析或繪制地圖,實現(xiàn)可視化和量化分析。

2、調(diào)查研究及學(xué)術(shù)交流情況

1、開題報告會

2016年3月27日上午9時,課題開題報告會在人民大學(xué)召開。來自中國人民大學(xué)、中國社會科學(xué)院、國家圖書館、北京大學(xué)、清華大學(xué)、北京師范大學(xué)、南開大學(xué)、福建教育出版社、上海精靈天下數(shù)字技術(shù)有限公司、中央民族大學(xué)、山西大學(xué)等單位的近30位專家學(xué)者以及課題組成員出席了會議。

北京師范大學(xué)朱漢國教授、中國社會科學(xué)院經(jīng)濟所封越健教授、中國社會科學(xué)院近代史所金以林教授、北京師范大學(xué)歷史學(xué)院李志英教授、南開大學(xué)歷史學(xué)院李金錚教授以及清華大學(xué)社科科學(xué)學(xué)院經(jīng)濟研究所龍登高教授擔(dān)任此次會議的評審專家。

人民大學(xué)洪大用副校長在致辭中表示,“清末民國社會調(diào)查數(shù)據(jù)庫建設(shè)”意義重大,它涉及社會學(xué)、經(jīng)濟學(xué)、統(tǒng)計學(xué)、歷史學(xué)等多個學(xué)科,不僅有助于拓展史料、促進計量史學(xué)的發(fā)展,還有助于推動跨學(xué)科、跨學(xué)校的交流與合作。

2、課題組落實評審專家意見會議

為了落實開題報告會各位評審專家的意見和建議,課題組全體成員于2016年3月27日下午2:00-4:00在中國人民大學(xué)清史研究所會議室召開了項目組討論會,在黃興濤教授、夏明方教授的主持下,曹新宇、伍婷婷、林展、陳鵬、韓祥等課題組成員針對評審專家的意見,深入討論了數(shù)據(jù)庫設(shè)計中的屬性表及多維分類表問題,對原有的設(shè)計計劃、課題組的工作進度及子課題的成員分工做出了相應(yīng)的調(diào)整,并具體部署了近期的有關(guān)工作。

3、屬性表錄入分工會議

2016年6月29日上午9時,由中國人民大學(xué)歷史學(xué)院黃興濤教授主持的國家社科基金重大項目“清末民國社會調(diào)查數(shù)據(jù)庫建設(shè)”屬性表分工會議,在中國人民大學(xué)清史所400會議室召開。上海精靈天下數(shù)字技術(shù)有限公司及課題組成員夏明方教授、邱志紅、李章鵬、伍婷婷、林展、陳鵬、杜佩紅等課題組成員參加了會議。會議由中國人民大學(xué)歷史學(xué)院林展講師主持,主要討論了數(shù)據(jù)庫建設(shè)屬性表錄入的分工及填寫要求。

4、數(shù)據(jù)庫建設(shè)進展報告會

2016年10月26日上午9時,由黃興濤教授主持的國家社科基金重大項目“清末民國社會調(diào)查數(shù)據(jù)庫建設(shè)”的數(shù)據(jù)庫建設(shè)進展報告會,在中國人民大學(xué)清史所400會議室召開。國家圖書館專家、上海精靈天下數(shù)字技術(shù)有限公司代表及課題組成員出席了本次會議。

5、屬性表填寫進展情況匯報會議

2016年11月7日下午14時,由中國人民大學(xué)歷史學(xué)院黃興濤教授主持的國家社科基金重大項目“清末民國社會調(diào)查數(shù)據(jù)庫建設(shè)”屬性表分工會議,在中國人民大學(xué)清史所400會議室召開。課題組錄入成員邱志紅、李章鵬、伍婷婷、林展、陳鵬、韓祥、杜佩紅參加了會議。會議由中國人民大學(xué)歷史學(xué)院林展講師主持,議題包括屬性表錄入的進展情況匯報及數(shù)據(jù)錄入中的問題。

6、“數(shù)字人文”與清史研究學(xué)術(shù)會議

2016年5月28-29日,課題組與中國人民大學(xué)《清史研究》編輯部在北京合作舉辦了“數(shù)字人文與清史研究”學(xué)術(shù)會議。來自北京大學(xué)、中國人民大學(xué)、中國社科院、北京師范大學(xué)、復(fù)旦大學(xué)、陜西師范大學(xué)、上海交通大學(xué)、河南大學(xué)、蘇州大學(xué)、南京師范大學(xué)以及香港科技大學(xué)、耶魯大學(xué)、哈佛大學(xué)、臺北“中研院”等海內(nèi)外14家學(xué)術(shù)單位的30余位專家學(xué)者參加了本次工作坊。

課題組首席專家黃興濤教授在工作坊上指出,數(shù)字人文發(fā)展在目前史學(xué)研究中所代表的開創(chuàng)意義,在某種程度上構(gòu)成了梁啟超百年前所提出“新史學(xué)”新的起點。歷史學(xué)者應(yīng)該積極發(fā)揮作用,做出一些具有示范性的、典型的數(shù)據(jù)庫。數(shù)據(jù)庫的建設(shè)使史學(xué)站在了一個新的高點,其資料、視野的廣闊性有助于克服目前史學(xué)研究中“碎片化”的傾向。大家要緊緊抓住史學(xué)的本質(zhì),即“反思性的再現(xiàn)過去和反思過去”的基礎(chǔ)上做出高質(zhì)量的數(shù)據(jù)庫,推進史學(xué)的進一步發(fā)展。

課題組成員林展向與會專家介紹了本課題的總體規(guī)劃和設(shè)計,得到與會專家的指導(dǎo)和好評。

3、學(xué)術(shù)會議與學(xué)術(shù)交流活動

除了上述會議外,課題組與上海精靈天下數(shù)字技術(shù)有限公司就數(shù)據(jù)庫建設(shè)相關(guān)的問題就行了12次溝通會議。

另外,項目組成員林展兩次被中國社會科學(xué)院近代史研究所邀請,介紹本課題的進展和相關(guān)經(jīng)驗。

4、成果宣傳推介情況

本項目在推進過程中,通過中國人民大學(xué)科研處共計上報兩期工作簡報:

2016年4月《工作簡報》第1期

2017年1月《工作簡報》第2期

二、 研究成果情況

1、黃興濤、李章鵬:《現(xiàn)代統(tǒng)計知識和觀念的傳入與清末新史學(xué)》,《史學(xué)史研究》2016年第3期。

本文對于現(xiàn)代統(tǒng)計知識和觀念傳入中國的過程進行了系統(tǒng)梳理。為“清末民國社會調(diào)查數(shù)據(jù)庫”結(jié)構(gòu)的搭建提供了重要的背景知識和理論支撐。

文章發(fā)現(xiàn),在1897年之前,以具體統(tǒng)計事例為載體的西方統(tǒng)計知識和統(tǒng)計觀念已經(jīng)傳入中國,1897年后,經(jīng)日本消化吸收的社會統(tǒng)計學(xué)理論開始系統(tǒng)地引入,這對清末和民國統(tǒng)計的影響廣泛而深遠。清末時,梁啟超等人把統(tǒng)計材料匯編為歷史,陳黻宸等人明確主張以統(tǒng)計法來研究和表述歷史,他們固然受到西方史學(xué)理論的影響,但現(xiàn)代統(tǒng)計知識、觀念和外來成果所施予的直接刺激也不容忽視。

清末時已有人在史書編纂、地方志纂修和具體歷史問題研究方面,嘗試使用統(tǒng)計分析法,這構(gòu)成為清末中國新史學(xué)有機的組成部分?梢哉f,“歷史統(tǒng)計學(xué)”的有關(guān)意識和實踐,在當(dāng)時已經(jīng)悄然醞釀、生發(fā)。只不過,清末尚沒有人明確提出“歷史統(tǒng)計學(xué)”的概念。這一任務(wù)直到20世紀(jì)20年代才由梁啟超、丁文江等人大體完成。清末學(xué)人在使用統(tǒng)計圖表分析歷史問題時,絕大多數(shù)都還沒有真正重視起數(shù)字,更沒有產(chǎn)生如何以精確的數(shù)字科學(xué)有效地分析和表述歷史的普遍觀念和系統(tǒng)見解。這是其明顯不足。實際上,清末民初時的中國史學(xué),還遠不具備重視量化統(tǒng)計分析的社會文化基礎(chǔ)。甚至迄今,我們的史學(xué)在這方面仍有很多的課要補、很長的路要走。

2、林展:《新世紀(jì)中國的史料整理與人文社會科學(xué)研究 ——以<民國時期社會調(diào)查叢編>為例》,《光明日報》2016年4月6日第14版。

本文以《民國時期社會調(diào)查叢編》為例,討論了新世紀(jì)史料整理的重要性,以及建立“清末民國社會調(diào)查”數(shù)據(jù)庫的必要性。

文章認(rèn)為,史料不僅是史學(xué)研究的基礎(chǔ),也是眾多人文社會科學(xué)研究的重要基礎(chǔ)。20世紀(jì)初梁啟超倡導(dǎo)的新史學(xué),如果脫離了史料的發(fā)掘整理,將是難以想象的。新世紀(jì)以來我國的史料整理工作,雖然借助于計算機與網(wǎng)絡(luò)技術(shù),呈現(xiàn)出異乎尋常的突飛猛進態(tài)勢,但總體來說,并不盡如人意。一個突出的特點是,影印出版的史料大幅度增長,而經(jīng)過歷史學(xué)者核對、比勘、系統(tǒng)分類的史料整理相對減少。這一現(xiàn)象對歷史學(xué)乃至整個人文社會科學(xué)可能產(chǎn)生的負(fù)面影響,迄今也沒有得到足夠重視。

難能可貴的是,盡管現(xiàn)行科研評價體制對史料整理工作并沒有給予足夠的重視和支持,但仍有少數(shù)富有遠見、不畏艱難的學(xué)者,基于對學(xué)術(shù)研究規(guī)律的信念,投身到大規(guī)模史料的系統(tǒng)整理工作之中,并對歷史學(xué)研究乃至其他人文社會學(xué)科帶來積極的影響!睹駠鴷r期社會調(diào)查叢編》(以下簡稱《叢編》)系列就是其中的一個顯例。

我們發(fā)現(xiàn),《叢編》在他引方面呈現(xiàn)下面的特征。其一是總體引用次數(shù)比較高,據(jù)不完全統(tǒng)計,從2005年至2014年,累計引用數(shù)量接近1000次。其二,引用次數(shù)呈現(xiàn)逐年升高的趨勢。其三,影響的范圍廣,除中國大陸地區(qū)外,中國臺灣地區(qū)、日本、美國、澳大利亞等地都有學(xué)術(shù)著作引用,涉及學(xué)科包括歷史學(xué)、社會學(xué)、政治學(xué)、教育學(xué)、經(jīng)濟學(xué)、心理學(xué)等。就期刊而論,自2005年至2014年,引用《叢編》的期刊論文一共有289篇,分布在199種期刊上。

這表明,以《叢編》為代表的專業(yè)化史料整理工作,具有重要的學(xué)術(shù)價值。當(dāng)然,現(xiàn)有的專業(yè)化史料整理工作也存在局限性,比如出版成本高、周期長、容量有限、難以進行原文對照、無法進行全文檢索等。有鑒于此,專業(yè)化史料整理工作需要在歷史學(xué)者專業(yè)知識的基礎(chǔ)上,充分利用計算機技術(shù),建設(shè)大規(guī)模集成式的歷史數(shù)據(jù)庫,從而為國內(nèi)外同行搭建一個重要的基礎(chǔ)性資料平臺。

課題組供稿 

(責(zé)編:王瑤)
RM新时代APP官网