RM新时代APP官网

舊版網(wǎng)站入口

站內(nèi)搜索

基于大數(shù)據(jù)融合的氣象災害應(yīng)急管理研究的中期檢查報告

2018年11月28日15:17來源:全國哲學社會科學工作辦公室

一、研究進展情況

主要內(nèi)容:

①研究計劃總體執(zhí)行情況及各子課題進展情況;

研究計劃總體執(zhí)行情況

本項目自啟動以來,積極組織相關(guān)領(lǐng)域?qū)<医M建研究團隊,成立子課題組,嚴格按照研究計劃、內(nèi)容分工扎實推進各子課題研究,定期召開課題研究成果匯報,調(diào)整方向和進度。具體進展情況如下:

子課題1:氣象災害大數(shù)據(jù)的本體構(gòu)建研究進展

目前本子課題已經(jīng)完成60%。

1)在分析現(xiàn)有領(lǐng)域本體構(gòu)建方法的基礎(chǔ)上,提出了一種基于形式概念分析(FCA)的領(lǐng)域本體構(gòu)建方法。該方法主要包括數(shù)據(jù)預處理、對象-屬性矩陣分析、概念格創(chuàng)建、概念語義相似度分析和本體構(gòu)建幾個步驟。

2)以氣象災害大數(shù)據(jù)為檢索對象,設(shè)計了基于氣象災害本體的氣象災害大數(shù)據(jù)語義檢索模型。模型首先對當前流行的同義詞集WordNet和本體庫SUMO進行擴展和融合,形成涵蓋同義詞集與本體概念之間相互映射關(guān)系的同義詞集——概念索引庫。然后融合氣象災害本體對氣象災害領(lǐng)域主題概念及其之間語義關(guān)系的明確定義,對用戶檢索詞進行本體概念匹配和語義擴展(如:將用戶檢索詞擴展為本體概念+概念同義詞+概念上下位詞+概念屬性),形成擴展的語義檢索式,然后檢索氣象災害大數(shù)據(jù),從而獲取更精確、更全面的氣象災害數(shù)據(jù),用于后續(xù)分析。同時課題以“臺風莫蘭蒂”作為本體語義擴展檢索實驗,比較分析了“臺風莫蘭蒂”及其語義擴展檢索式“2016 and(莫蘭蒂 臺風 風暴 暴雨 狂風 洪水 洪澇)and (福建 廈門 翔安 福州 閩南)”的檢索性能。實驗發(fā)現(xiàn),語義擴展檢索式檢索結(jié)果準確率更好,達到80%。

3)融合Web of Science和中國知網(wǎng)中“大數(shù)據(jù)”研究文獻數(shù)據(jù),借助CiteSpaceII可視化分析軟件繪制出國內(nèi)外大數(shù)據(jù)領(lǐng)域的科學知識圖譜——作者、國家和機構(gòu)的科研合作網(wǎng)絡(luò),關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò),文獻共被引聚類網(wǎng)絡(luò),揭示出國內(nèi)外大數(shù)據(jù)研究概貌。研究發(fā)現(xiàn),國內(nèi)大數(shù)據(jù)方面科研社區(qū)較多,但規(guī)模較小,而國際大數(shù)據(jù)科研社區(qū)較少,但規(guī)模較大,規(guī)模最大研究社區(qū),達到30多人。國家和機構(gòu)之間的科研合作極少,國際TOP30科研機構(gòu)中,大部分為美國高校,中國機構(gòu)較少。國內(nèi)外大數(shù)據(jù)研究涉及的熱點主要有:基于大數(shù)據(jù)的云計算;基于MapReduce和Hadoop的海量數(shù)據(jù)分布式處理研究;大數(shù)據(jù)在數(shù)據(jù)挖掘、社會網(wǎng)絡(luò)、互聯(lián)網(wǎng)金融、識別與預測等領(lǐng)域的應(yīng)用研究。而國內(nèi)涉及較少的研究熱點有:大數(shù)據(jù)模型和算法研究、大數(shù)據(jù)分類研究和大數(shù)據(jù)相關(guān)系統(tǒng)研究。

4)以暴雨災害為主題,基于FCA方法構(gòu)建了若干具體的全局和局部本體(如暴雨災害本體、次生災害本體和災害管理本體等),并分別使用基于單目標優(yōu)化的模擬退火算法、禁忌搜索算法和基于多目標優(yōu)化的網(wǎng)絡(luò)空間進化算法、多目標蟻群算法進行網(wǎng)絡(luò)空間主題爬蟲,以獲取網(wǎng)絡(luò)空間氣象災害大數(shù)據(jù)的相關(guān)非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)和資料。實驗結(jié)果表明,通過采用本體技術(shù)的多目標主題爬蟲方法的爬準率較其他網(wǎng)絡(luò)爬蟲方法效果更佳。

子課題2:氣象災害大數(shù)據(jù)的融合研究進展

目前本子課題已經(jīng)完成70%。

1)采用加權(quán)雙線性等計算方法,將社會統(tǒng)計數(shù)據(jù)分配到一定尺度的規(guī)則地理柵格上,通過非空間屬性大數(shù)據(jù)的網(wǎng)格化,實現(xiàn)了多源數(shù)據(jù)的分解與融合,以便與環(huán)境、地形等數(shù)據(jù)綜合使用,實現(xiàn)大數(shù)據(jù)的融合分析。

2)采用雙線性插值法,將各種硬(軟)數(shù)據(jù)統(tǒng)一到等經(jīng)緯度格點上,然后再求解加權(quán)最小成本目標函數(shù)。該算法由研究區(qū)域范圍內(nèi)各個格點的硬(軟)數(shù)據(jù)與待求解的理想結(jié)果之差的平方和,以及待求解的融合結(jié)果矢量的二階導數(shù)組成。

3)借鑒FGDC地理空間數(shù)據(jù)內(nèi)容標準(CSDGM)V.2.0和ISO 地理信息(CD 2.0)理念,采用ArcGIS 軟件提供的坐標轉(zhuǎn)換功能實現(xiàn)數(shù)據(jù)坐標系統(tǒng)的歸一化,具體包括社會統(tǒng)計數(shù)據(jù)的網(wǎng)格化、矢量化的空間配準與已有矢量數(shù)據(jù)的坐標轉(zhuǎn)換,以及衛(wèi)星資料投影轉(zhuǎn)換;在氣象災害本體知識庫基礎(chǔ)上開發(fā)面向應(yīng)用的本體知識管理引擎,為業(yè)務(wù)運行所需的聯(lián)合查詢、抽取和轉(zhuǎn)換提供解析服務(wù)。

子課題3:氣象災害大數(shù)據(jù)的降維與災害識別研究進展

目前本子課題已經(jīng)完成60%。

1)針對超高維數(shù)據(jù),提出一種穩(wěn)健的,無模型假設(shè)的,基于區(qū)間分位數(shù)的超高維特征篩選方法,從理論上和數(shù)值模擬上驗證了所提出方法的優(yōu)良性質(zhì)。

2)針對超高維數(shù)據(jù),基于條件分布函數(shù)與無條件分布函數(shù)之間的相互聯(lián)系,提出一種快速的超高維特征篩選方法,從理論上和數(shù)值模擬上驗證了所提出方法的優(yōu)良性質(zhì)。

3)針對社交網(wǎng)絡(luò)平臺上的超高維海量文本數(shù)據(jù),提出一種災害信息挖掘算法,能夠有效快速地提取災害相關(guān)信息,并對不同的災害類別利用所搜集網(wǎng)絡(luò)平臺信息進行了災害類別信息挖掘。此外,還從網(wǎng)絡(luò)內(nèi)容的發(fā)布、傳播、分享等方面展開研究,分析了促使網(wǎng)絡(luò)信息傳播的核心因素。

4)針對全國近50年霧霾能見度數(shù)據(jù),創(chuàng)立混合效應(yīng)廣義高斯過程函數(shù)回歸模型,對二十個代表性城市能見度進行建模和估計,并進行預測研究。實例和模擬分析結(jié)果表明,模型不僅能夠很好地刻畫能見度和影響因子的復雜相關(guān)關(guān)系,而且能夠較大程度地提高預測效果。

5)針對中國161個城市的空氣質(zhì)量數(shù)據(jù),以PM2.5濃度為主要研究對象,創(chuàng)立函數(shù)型數(shù)據(jù)懲罰似然聚類方法,加入工業(yè)煙(粉)塵排放量等人類活動因素作為輔助聚類變量,通過Logistic模型和混合模型進行雙層建模,提高聚類準確性和穩(wěn)健性。聚類結(jié)果有助于各城市根據(jù)自身經(jīng)濟形勢和氣候條件等因素制訂對應(yīng)的環(huán)境治理措施。

子課題4:氣象災害的經(jīng)濟社會影響評估研究進展

目前本子課題已經(jīng)完成70%。

1)基于GIS平臺,初步建立了城市內(nèi)澇數(shù)據(jù)庫,主要包括系統(tǒng)數(shù)據(jù)庫、基礎(chǔ)地圖數(shù)據(jù)庫、內(nèi)澇點數(shù)據(jù)庫、氣象和水文數(shù)據(jù)庫、實況災情數(shù)據(jù)庫等。

2)基于城市內(nèi)澇數(shù)據(jù)庫,構(gòu)建了城市不同區(qū)域(如居民區(qū)、商業(yè)區(qū)或根據(jù)匯排水概化的區(qū)域等)不同等級內(nèi)澇(按內(nèi)澇水深分級)、不同重現(xiàn)期下(5、10、15、20、30、50、100年一遇)致災臨界面雨量(也稱為致洪閾值),建立針對行人、車輛、建筑物、商業(yè)和居民社區(qū)財產(chǎn)等不同承災體的內(nèi)澇脆弱性評估模型,建立不同區(qū)域各類承災體暴露度和脆弱性評估模型,開展城市暴雨內(nèi)澇災害風險評估。評估不同區(qū)域內(nèi)澇風險等級,可能出現(xiàn)積水的區(qū)域或地段、水深、承災體數(shù)量和價值量,以及相應(yīng)的經(jīng)濟損失。

3)采用Haimes & Jiang(2001)、Santos, Haimes & Lian et al.(2006)、吳先華等(2012, 2014)提出的非正常投入產(chǎn)出模型(IIOM 模型),從災害沖擊減少產(chǎn)業(yè)最終需求入手,通過投入產(chǎn)出表的技術(shù)矩陣所表達的產(chǎn)業(yè)間關(guān)聯(lián)關(guān)系,計算了災害影響下計劃產(chǎn)出與災后產(chǎn)出值之差。

4)基于 Web GIS 實現(xiàn)“人機交互式”數(shù)據(jù)采集;通過統(tǒng)計方法確定災損率曲線,計算災害的直接經(jīng)濟損失;利用投入產(chǎn)出模型計算災害的間接經(jīng)濟損失。采用“所見即所得”的思路,只需要輸入降雨量的實況數(shù)據(jù),便可即時計算城市各易澇點的直接和間接經(jīng)濟損失,提供災害經(jīng)濟損失的空間分布,自動生成各易澇點的災損和防御對策報告。該系統(tǒng)有助于提高政府部門的災害應(yīng)急管理能力,為類似災害的經(jīng)濟損失評估提供典型范例。

子課題5:氣象災害應(yīng)急決策的生成與評價研究進展

目前本子課題已經(jīng)完成70%。

1)在災前,以臺風為例針對臺風預報的不確定性,提出了集成案例推理(Case-Based Reasoning, CBR)和前景理論的兩階段臺風災害應(yīng)急方案生成和調(diào)整方法。對于氣象災害事件的態(tài)勢感知,運用系統(tǒng)動力學,對氣象災害事件的演化路徑及過程進行了研究,并對政府如何根據(jù)氣象災害事件的演化路徑提出了初步的對策建議。

2)在災后,基于系統(tǒng)動力學,建立了考慮市民恐慌程度和損失率的雙目標函數(shù)模型,對當前臺風應(yīng)急預案的執(zhí)行效果進行了評價,并提出了三個臺風災害應(yīng)急策略。在災后,基于進化算法和多目標優(yōu)化理論,提出了一系列的多目標優(yōu)化算法對應(yīng)急過程進行動態(tài)優(yōu)化,提高了應(yīng)急效率。

3)日益頻發(fā)的城市暴雨內(nèi)澇災害已成為快速城鎮(zhèn)化建設(shè)中急需應(yīng)對的嚴峻挑戰(zhàn);但當前與暴雨內(nèi)澇相關(guān)的氣象數(shù)據(jù)、災情數(shù)據(jù)和社會經(jīng)濟數(shù)據(jù)等尚未能有效融合,不能快速有效地生成內(nèi)澇災害應(yīng)急決策方案,這成為災害應(yīng)急管理的障礙。本子課題從城市暴雨內(nèi)澇災害大數(shù)據(jù)融合的幾個方面入手,分別評述了大數(shù)據(jù)的本體技術(shù)、數(shù)據(jù)融合方法、數(shù)據(jù)降維與災害識別、災害的社會經(jīng)濟損失評估,以及應(yīng)急決策的生成與評估方法等相關(guān)理論與實踐進展,并對未來研究進行了展望。最后指出,在大數(shù)據(jù)融合背景下開展城市暴雨內(nèi)澇災害的應(yīng)急管理研究,具有豐富的理論和實踐價值。

②調(diào)查研究及學術(shù)交流情況(調(diào)研數(shù)據(jù)整理運用、文獻資料收集整理、學術(shù)會議、學術(shù)交流、國際合作等);

1)調(diào)研數(shù)據(jù)整理運用

一是針對新浪微博平臺上的微博信息,利用爬蟲等數(shù)據(jù)抓取軟件,抓取搜集了幾種主要災害信息數(shù)據(jù)。

二是調(diào)研了農(nóng)業(yè)部種植業(yè)管理司公布的災情數(shù)據(jù)庫。災情數(shù)據(jù)庫由農(nóng)業(yè)部種植業(yè)管理司和農(nóng)業(yè)部信息中心合作開發(fā),數(shù)據(jù)庫來源于《中國統(tǒng)計年鑒》及《中國農(nóng)業(yè)統(tǒng)計資料》。 災情數(shù)據(jù)庫收錄了1949年至今分省、分年度、分災種的受災、成災、絕收的面積數(shù)據(jù)共2.3萬條。

三是開展了臺風災害案例分析和數(shù)據(jù)收集,已經(jīng)完成了自1949年以來分省、分年度、分災種的受災、成災、絕收的面積數(shù)據(jù)、成災率、受災率、絕收率的統(tǒng)計工作,收集并整理了國內(nèi)外相關(guān)文獻2000余篇。同時,還積極開展了國際合作,到美國俄克拉荷馬州立大學進行了為期半年的國際交流合作,與該校的Gary.Yen教授開展有目標優(yōu)化算法及其在應(yīng)急管理中的應(yīng)用,取得了較好的成績。

四是2017年7月5日-20日,帶領(lǐng)研究人員到福建省漳州市馬洋溪調(diào)研洪澇災害損失情況,收集整理了該洪澇災害的相關(guān)數(shù)據(jù),并將調(diào)研資料整理成學術(shù)論文一篇,在《災害學》上發(fā)表。

2)文獻資料收集整理

目前本課題組已查閱并收集了本體構(gòu)建、大數(shù)據(jù)融合、大數(shù)據(jù)降維、災害損失評估以及氣象災害應(yīng)急管理等相關(guān)研究的國內(nèi)外文獻。

3)學術(shù)會議

作為大會程序委員會主席,與中國“雙選法”學會共同舉辦、承辦了“第十九屆中國管理科學學術(shù)年會——綠色發(fā)展與管理科學”(地點:南京信息工程大學)。

課題首席專家召集,每月召開一次課題進展研討會。

4)學術(shù)交流

一是2017年9月到清華大學經(jīng)濟管理學院做訪問學者,導師為陳國青教授,擬積極參加團隊活動,深入學習大數(shù)據(jù)融合的方法。

二是作為特邀專家,參加了美國UNCP舉辦的“Disaster risk analysis(2017)”以及國內(nèi)的“2017應(yīng)急管理與金融工程”等學術(shù)會議。

三是作為會議分會場主席,2018年6月13-17日參加了臺灣銘傳大學承辦的DEAIC2018國際會議。

四是邀請北卡羅萊納大學彭布洛克分校衛(wèi)國教授、美國新墨西哥州立大學王通會教授、美國賓夕法尼亞州高等教育系統(tǒng)滑石分校林益教授、田納西大學金明洲教授、寧波大學鐘昌標教授、溫莎大學王運通教授、北京化工大學李想教授、四川大學胡知能教授、江蘇省社會科學院經(jīng)濟研究所所長胡國良研究員、南京農(nóng)業(yè)大學鐘甫寧教授等10余位專家來校進行學術(shù)交流。

5)國際合作

繼續(xù)與美國的UNCP(University of North Carolina at Pembroke)的Guo WEI教授、美國的UNR(University of Nevada-Reno)的Shunfeng SONG教授合作、法國里昂大學終身副教授Yeming Gong博士開展共同研究,撰寫研究論文。合作內(nèi)容主要包括:

一是共同研發(fā)基于格點的災害大數(shù)據(jù)融合算法研究(與Guo WEI教授合作)。

二是共同研發(fā)基于社交媒體大數(shù)據(jù)的災害預警方法研究(與Shunfeng SONG教授合作)。

三是研發(fā)針對霧霾災害的多階段網(wǎng)絡(luò)DEA模型(與法國里昂大學終身副教授Yeming Gong博士合作)。

四是氣象災害大數(shù)據(jù)的降維與災害識別研究(與Guo WEI教授合作)。

以上這些合作,為后續(xù)進一步的深入研究提供了很好的方法基礎(chǔ)。

③成果宣傳推介情況(成果發(fā)布會、《工作簡報》報送情況、國家社科基金專刊投稿及采用情況等);

1)李廉水教授與吳先華教授合作撰寫的專報《基于大數(shù)據(jù)融合提升災害應(yīng)急管理能力的政策建議》,被教育部社會科學司采納,并已呈遞給有關(guān)領(lǐng)導參閱。

2)李廉水教授、王會軍院士、吳先華教授合作撰寫的調(diào)研報告《以數(shù)據(jù)融合為基礎(chǔ),全面提升災害應(yīng)急管理能力》在中國科學技術(shù)協(xié)會內(nèi)部刊物《科技工作者建議》2017年發(fā)表。

④研究中存在的主要問題、改進措施,研究心得、意見建議;

1)研究中存在的主要問題1:氣象災害本體是實現(xiàn)“基于氣象災害本體的氣象災害大數(shù)據(jù)語義檢索模型”的核心技術(shù)。氣象災害本體明確界定了氣象災害概念及其之間相互語義關(guān)系,可以消除氣象災害數(shù)據(jù)格式不統(tǒng)一和數(shù)據(jù)內(nèi)容歧義的問題。然而氣象災害本體無法解決概念的同義詞集問題、一詞多義(多義詞)和多詞一義(同義詞)問題,因此需要借助當前通用的概念本體庫SUMO和同義詞集Wordnet,對兩大本體庫進行融合,構(gòu)建涵蓋SUMO本體概念與Wordnet同義詞集映射關(guān)系的集成本體庫。然而,SUMO本體概念與Wordnet同義詞集涉及的概念和同義詞數(shù)量龐大,語義關(guān)系復雜,如何建立SUMO本體概念與Wordnet同義詞集之間映射關(guān)系是后續(xù)面臨的主要問題。

改進措施:全面研讀國內(nèi)外相關(guān)的研究文獻和技術(shù)文檔,梳理出本體概念與同義詞集之間建立映射關(guān)系的理論、方法、技術(shù)和工具,從而解決如何建立SUMO本體概念與Wordnet同義詞集之間映射關(guān)系的問題。

2)研究中存在的主要問題2:如何設(shè)計動態(tài)尋優(yōu)子空間算法,進行特征提取與選擇,實現(xiàn)氣象災害大數(shù)據(jù)的維數(shù)約簡;在此基礎(chǔ)上建立典型氣象災害數(shù)據(jù)的深度學習模型,實現(xiàn)災害的分類識別。

改進措施:利用統(tǒng)計學上的相關(guān)分析、灰色關(guān)聯(lián)度分析、關(guān)聯(lián)規(guī)則挖掘等方法,主要用于篩選各類氣象災害的影響因素,采用主成分分析(PCA)、線性判別分析(LDA)和最大邊緣準則(MMC)三種全局統(tǒng)計子空間算法,用于設(shè)計動態(tài)尋優(yōu)子空間方法,結(jié)合氣象災害數(shù)據(jù)的行業(yè)特性,進行特征提取與選擇,實現(xiàn)氣象災害大數(shù)據(jù)維數(shù)約簡。利用模糊聚類等統(tǒng)計方法,用于測試氣象災害的數(shù)據(jù)結(jié)構(gòu)特征;采用泛函分析和數(shù)理統(tǒng)計方法,用于推導數(shù)據(jù)分布統(tǒng)計量與典型激活函數(shù)的關(guān)聯(lián)性;利用智能優(yōu)化算法,如粒子群優(yōu)化算法、螢火蟲算法、模擬退火算法、遺傳算法等,用于搜索最優(yōu)層數(shù),設(shè)定深度學習算法層數(shù)的閾值等等。在這些研究的基礎(chǔ)上,建立典型氣象災害數(shù)據(jù)的深度學習模型,實現(xiàn)災害的分類識別。

3)研究中存在的主要問題3:在數(shù)據(jù)的搜集和整理方面有所欠缺,對氣象災害的實時數(shù)據(jù)、災后重建數(shù)據(jù)、管理方面的數(shù)據(jù)搜集得不夠全面,在維度和深度上都需要進一步加強,從而使得在數(shù)據(jù)分析應(yīng)用方面能夠有更好的效果。

改進措施:擬通過我校與中國氣象局、各省級氣象局的渠道,加大溝通力度,爭取獲得更多的一線災害數(shù)據(jù),確保研究的真實性和可靠性。采取現(xiàn)場調(diào)研方式獲取第一手的基礎(chǔ)地理信息數(shù)據(jù),充分利用臺站資料、預報資料和遙感數(shù)據(jù),及時與相關(guān)部門聯(lián)系獲取最新的基礎(chǔ)地理信息數(shù)據(jù)。

⑤其他需要說明的問題。

無。

二、研究成果情況

①代表性成果簡介(基本內(nèi)容、主要觀點、學術(shù)價值、社會影響等);

1)研究成果1(基于大數(shù)據(jù)融合提升災害應(yīng)急管理能力的政策建議)介紹:

主要內(nèi)容:數(shù)據(jù)“碎片化”影響防災救災決策準確性,主要體現(xiàn)在:一是災害管理數(shù)據(jù)采集和使用分散,二是災害管理數(shù)據(jù)未形成統(tǒng)一標準,三是數(shù)據(jù)孤島、數(shù)據(jù)閑置和數(shù)據(jù)不足等現(xiàn)象并存。國外基于數(shù)據(jù)共享的災害應(yīng)急管理經(jīng)驗值得借鑒,一是災害數(shù)據(jù)庫互聯(lián)共享,二是大數(shù)據(jù)技術(shù)應(yīng)用于災害應(yīng)急管理系統(tǒng),三是以社區(qū)為中心,開展災害防御和基礎(chǔ)數(shù)據(jù)精準數(shù)據(jù)采集,四是以。ㄖ荩闃屑~,構(gòu)建災害應(yīng)急管理三級聯(lián)動體系。

主要觀點:一是大力發(fā)展大數(shù)據(jù)融合技術(shù),二是以數(shù)據(jù)融合為突破口,全面規(guī)劃智慧城市建設(shè),推進和協(xié)調(diào)政府部門的數(shù)據(jù)開放和數(shù)據(jù)融合,三是以數(shù)據(jù)開放共享為導向,建立和加強“社區(qū)防災”為中心的災害管理理念。

學術(shù)價值:災害數(shù)據(jù),包括預報數(shù)據(jù)、災情數(shù)據(jù)和社會統(tǒng)計數(shù)據(jù)三大類,具有體量浩大、模態(tài)繁多、生成快速和價值巨大但密度很低的大數(shù)據(jù)特征,但目前這些數(shù)據(jù)的歸屬分割、標準迥異、互不相融,呈現(xiàn)“碎片化”特征,難以滿足在發(fā)生災害的緊急情景下的應(yīng)急決策需要,甚至成為應(yīng)急決策的障礙。大數(shù)據(jù)技術(shù)和應(yīng)用的蓬勃發(fā)展,使得多元異構(gòu)的災害數(shù)據(jù)的快速融合成為可能。本研究具有較高的學術(shù)價值。

社會影響:引入災害大數(shù)據(jù)融合方法,篩選高風險點、高敏感行業(yè)和部門,發(fā)展大數(shù)據(jù)融合背景下災害應(yīng)急決策管理技術(shù),能夠為災害的實時評估及應(yīng)急決策提供理論和方法支持,為災害應(yīng)急管理提供強有力的決策支持。

2)研究成果2(基于FCA的氣象災害本體構(gòu)建)介紹:

主要內(nèi)容:從氣象災害相關(guān)的學術(shù)文獻和新聞報道抓取數(shù)據(jù),利用 ICTCLAS 系統(tǒng)提取關(guān)鍵詞,經(jīng)過修正后形成領(lǐng)域術(shù)語;接著從術(shù)語集和文本集中生成形式化背景,導入ConExp中自動生成概念格和 Hasse圖,形成領(lǐng)域術(shù)語層次關(guān)系;最后錄入本體管理工具 Protégé中構(gòu)建本體,生成本體的可視化圖形和 OWL代碼文件。

主要觀點:在大數(shù)據(jù)應(yīng)用背景下,需要對海量、多源、異構(gòu)的氣象大數(shù)據(jù)進行融合,構(gòu)建領(lǐng)域術(shù)語規(guī)范,促進氣象大數(shù)據(jù)融合。

學術(shù)價值:該研究成果對領(lǐng)域本體構(gòu)建方法進行了新的探索,即在基本的構(gòu)建本體過程中,考慮以非結(jié)構(gòu)化的氣象災害大數(shù)據(jù)作為數(shù)據(jù)源,并引入主題詞表以實現(xiàn)主題詞表與概念格詞匯的相互修正,確保了領(lǐng)域本體術(shù)語的完善性與準確性。

社會影響:通過將基于概念形式分析(FCA)的本體構(gòu)建方法引入鮮有人涉足的氣象災害領(lǐng)域,借助本體技術(shù),為氣象災害領(lǐng)域構(gòu)建規(guī)范化術(shù)語體系,幫助計算機更好地理解氣象災害術(shù)語,在真正意義上促進各氣象部門的數(shù)據(jù)共聯(lián)、共通、共享,實現(xiàn)從信息孤島到信息網(wǎng)絡(luò)的轉(zhuǎn)變。

3)研究成果3(國內(nèi)外大數(shù)據(jù)研究前沿、熱點與合著模式的圖譜分析)介紹:

基本內(nèi)容:以可視化圖譜的方式全面直觀展示當前新興的熱點主題——大數(shù)據(jù)的國內(nèi)外研究全貌,為氣象災害大數(shù)據(jù)研究提供前瞻指引和奠定基礎(chǔ)。本文融合Web of Science和中國知網(wǎng)中“大數(shù)據(jù)”研究文獻數(shù)據(jù),借助CiteSpaceII可視化分析軟件繪制出國內(nèi)外大數(shù)據(jù)領(lǐng)域的科學知識圖譜——作者、國家和機構(gòu)的科研合作網(wǎng)絡(luò),關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò),文獻共被引聚類網(wǎng)絡(luò),揭示出國內(nèi)外大數(shù)據(jù)研究概貌。

主要觀點:研究發(fā)現(xiàn),國內(nèi)大數(shù)據(jù)方面科研社區(qū)較多,但規(guī)模較小,而國際大數(shù)據(jù)科研社區(qū)較少,但規(guī)模較大,規(guī)模最大研究社區(qū),達到30多人。國家和機構(gòu)之間的科研合作極少,國際TOP30科研機構(gòu)中,大部分為美國高校,中國機構(gòu)較少。國內(nèi)外大數(shù)據(jù)研究都涉及的熱點有:基于大數(shù)據(jù)的云計算;基于MapReduce和Hadoop的海量數(shù)據(jù)分布式處理研究;大數(shù)據(jù)在數(shù)據(jù)挖掘、社會網(wǎng)絡(luò)、互聯(lián)網(wǎng)金融、識別與預測等領(lǐng)域的應(yīng)用研究。而國內(nèi)涉及較少的研究熱點有:大數(shù)據(jù)模型和算法研究、大數(shù)據(jù)分類研究和大數(shù)據(jù)相關(guān)系統(tǒng)研究。

學術(shù)價值:“大數(shù)據(jù)”是國家戰(zhàn)略布局的新興前沿產(chǎn)業(yè),早在2015年8月,國務(wù)院為推動我國大數(shù)據(jù)產(chǎn)業(yè)持續(xù)健康發(fā)展,發(fā)布《促進大數(shù)據(jù)發(fā)展行動綱要》。目前Web of Science核心庫顯示,2005-2015期間有4288篇與大數(shù)據(jù)相關(guān)的文獻,中國知網(wǎng)期刊數(shù)據(jù)庫顯示2000-2015期間,國內(nèi)學者發(fā)表了16,798篇大數(shù)據(jù)方面的文獻。然而目前利用科學知識圖譜全面解讀國內(nèi)外大數(shù)據(jù)領(lǐng)域知識基礎(chǔ)、科研合作、研究熱點與前沿的文獻還相對較少。該研究成果通過全面展示國內(nèi)外大數(shù)據(jù)研究的主要科研團隊、發(fā)文國家和機構(gòu),以及他們之間的合作情況,同時展示出國內(nèi)外大數(shù)據(jù)研究的熱點主題、前沿熱點與領(lǐng)域核心知識基礎(chǔ)。一方面,可以為讀者和研究人員展示當前大數(shù)據(jù)領(lǐng)域研究的全貌,為他們今后的研究方向和選題提供一定的參考和借鑒,另一方面,通過國內(nèi)外大數(shù)據(jù)研究概況進行一個對比分析,可以促進我國大數(shù)據(jù)研究體系的完善。

4)研究成果4(基于網(wǎng)頁空間進化算法的暴雨災害主題爬蟲策略)介紹:

基本內(nèi)容:對于鏈接主題相關(guān)性分析,提出了評價鏈接潛在價值的三個目標:鏈接指向網(wǎng)頁的主題相關(guān)度,鏈接的錨文本相關(guān)度和網(wǎng)頁的PageRank值。針對單目標優(yōu)化算法解決爬蟲問題難以獲得最優(yōu)加權(quán)因子和易于陷入局部最優(yōu)的缺點,首次將多目標優(yōu)化算法引入主題爬蟲,提出了一種基于多目標優(yōu)化的網(wǎng)頁空間進化(WSE)算法。WSE算法通過計算測試鏈接與鏈接庫中鏈接的最短距離,并將其與鏈接庫中所有鏈接的平均距離進行比較來更新鏈接庫。另外,針對多目標優(yōu)化中Pareto最優(yōu)解的選取問題,提出了一種最近最遠候選解法(NFCS)。最后,以暴雨災害為主題,在相同的實驗環(huán)境下,運行WSE算法與文獻中的寬度優(yōu)先搜索(BFS)算法、最佳優(yōu)先搜索(OPS)算法和模擬退火(SA)算法。實驗結(jié)果表明,WSE算法相比其他三種算法明顯提高了主題爬蟲的效果,因此WSE算法是一種有效的主題爬蟲策略。

主要觀點:主題爬蟲是垂直搜索引擎技術(shù)的基礎(chǔ)和核心,垂直搜索引擎中的數(shù)據(jù)全部來自于爬蟲的抓取,如何高效全面的收集氣象災害高質(zhì)量的網(wǎng)頁是氣象災害主題爬蟲問題研究的重點和難點。

學術(shù)價值:首次將多目標優(yōu)化算法引入主題爬蟲,提出了一種基于多目標優(yōu)化的網(wǎng)頁空間進化(WSE)主題爬蟲算法。該項研究成果對于高效、全面抓取互聯(lián)網(wǎng)上與氣象災害大數(shù)據(jù)相關(guān)的非結(jié)構(gòu)化和半結(jié)構(gòu)化網(wǎng)頁提供了強有力的幫助。

社會影響:隨著“井噴式”增長的網(wǎng)民和幾近同步增長的網(wǎng)頁,如何保證人們在海量信息中迅速獲取所需信息成為一個巨大的挑戰(zhàn)。本研究成果有助于人們從海量的網(wǎng)頁大數(shù)據(jù)中高效抓取主題相關(guān)的網(wǎng)頁。

5)研究成果5(寧波市城市內(nèi)澇風險評估數(shù)據(jù)庫與仿真模型建設(shè))介紹:

基本內(nèi)容:收集、分析寧波市臺風/典型暴雨降水、臺風大風等氣象因子歷年數(shù)據(jù),構(gòu)建臺風/典型暴雨(致災因子)綜合影響強度指數(shù);采用GIS技術(shù),綜合考慮受災地區(qū)地理孕災因子海拔高度、地形標準、江河水網(wǎng)密度,社會經(jīng)濟孕災因子,包括人口密度、單位面積GDP、農(nóng)業(yè)密集程度、主要經(jīng)濟行業(yè)發(fā)展指標等因素,構(gòu)建孕災環(huán)境暴露性指數(shù)及承載體脆弱性指數(shù);收集、分析寧波市歷年災情數(shù)據(jù)時空分布數(shù)據(jù)(包括人員傷亡、經(jīng)濟損失、房屋倒塌、受災成災面積),構(gòu)建臺風災損度指數(shù)。進而構(gòu)建寧波市臺風/典型暴雨基本災情數(shù)據(jù)庫及災損評價指數(shù)數(shù)據(jù)庫,為后續(xù)研究提供數(shù)據(jù)支撐。開發(fā)了寧波市城市暴雨內(nèi)澇仿真模型,主要服務(wù)于防止氣象災害—強對流或者暴雨帶來的城市內(nèi)澇發(fā)生。比如通過模擬一次15毫米的降雨過程,可以通過計算機周密的運算,得出該地區(qū)積水量能達到多少。這套軟件具有“暴雨來臨前預測”和“突發(fā)暴雨隨時監(jiān)測”的雙重功能。預測功能主要指,在暴雨來臨前,提前預測出未來哪天將會出現(xiàn)降水以及降水分布情況,再運用數(shù)值預報中的多類預報產(chǎn)品,合理地將全市劃分為眾多“網(wǎng)格”,按照區(qū)域分塊,利用仿真系統(tǒng)預測出哪個“網(wǎng)格”區(qū)域內(nèi)會出現(xiàn)積水,這樣可以提前通知排水部門做好準備,利用城市排水系統(tǒng)將雨水排出。此外,結(jié)合寧波市氣象臺新啟用的“短時臨近預報綜合業(yè)務(wù)平臺”,采用WEB GIS(網(wǎng)絡(luò)地理信息系統(tǒng))與氣象數(shù)據(jù)庫的架構(gòu),使雷達、閃電定位、TJ-WRF數(shù)值預報產(chǎn)品等各類氣象資料在實時地理位置上可直觀顯示,進一步強化了預報預警的精細化程度。

社會影響:基于 Web GIS 實現(xiàn)“人機交互式”數(shù)據(jù)采集;通過統(tǒng)計方法確定災損率曲線,計算災害的直接經(jīng)濟損失;利用投入產(chǎn)出模型計算災害的間接經(jīng)濟損失。采用“所見即所得”的思路,只需要輸入降雨量的實況數(shù)據(jù),便可即時計算城市各易澇點的直接和間接經(jīng)濟損失,提供災害經(jīng)濟損失的空間分布,自動生成各易澇點的災損和防御對策報告。該系統(tǒng)有助于提高政府部門的災害應(yīng)急管理能力,為類似災害的經(jīng)濟損失評估提供典型范例。

②階段性成果清單(請?zhí)顚懜郊﨓XCEL表格)。

見附件。

三、下一步研究計劃

子課題1:氣象災害大數(shù)據(jù)的本體構(gòu)建研究

1)2018.07-2019.07:氣象災害數(shù)據(jù)的自動語義標注。提煉氣象災害數(shù)據(jù)的類型和屬性,運用數(shù)據(jù)挖掘方法明確各因素之間的相互關(guān)系,采用本體和元數(shù)據(jù)技術(shù)構(gòu)建氣象災害本體概念模型MDEOM。構(gòu)建基于“名稱—屬性—屬性值—約束”四元組的氣象災害知識詞表,采用線性規(guī)劃和本體學習等方法進行語義推理,實現(xiàn)氣象災害數(shù)據(jù)的自動語義標注。

2)2019.08-2020.07:構(gòu)建大數(shù)據(jù)環(huán)境下的氣象災害本體。整合氣象災害知識術(shù)語類,通過本體學習、支持向量機等技術(shù)自動構(gòu)建氣象災害本體。整合氣象災害的概念庫、實例庫和本體庫,建立氣象災害大數(shù)據(jù)標準體系,構(gòu)建大數(shù)據(jù)環(huán)境下的氣象災害本體。

子課題2:氣象災害大數(shù)據(jù)的融合研究

1)2018.07-2019.07:設(shè)計氣象災害大數(shù)據(jù)的標準編碼體系。從大數(shù)據(jù)的編碼、坐標系統(tǒng)、空間范圍、存儲格式、精度和分辨率等方面,對多源異構(gòu)數(shù)據(jù)進行標準化處理,為不同類型的數(shù)據(jù)設(shè)計相應(yīng)的編碼體系標準,設(shè)計大數(shù)據(jù)的標準編碼體系。

2)2019.08-2020.07:研究數(shù)據(jù)融合處理的算法。多源異構(gòu)大數(shù)據(jù)的標準化處理,包括社會經(jīng)濟類、災情類非空間屬性數(shù)據(jù)、氣象類空間大數(shù)據(jù)、Web等離散數(shù)據(jù)的標準化處理。研究數(shù)據(jù)融合處理的算法,包括對非空間屬性數(shù)據(jù)的網(wǎng)格化技術(shù)、衛(wèi)星資料幾何校正算法、多源網(wǎng)格化軟、硬數(shù)據(jù)融合的通用算法研究。

子課題3:氣象災害大數(shù)據(jù)的降維與災害識別研究

1)2018.07-2019.07:氣象災害大數(shù)據(jù)的約簡研究。采用多種大數(shù)據(jù)降維的算法,比較分析各種算法的優(yōu)缺點,設(shè)計一種混合的氣象災害大數(shù)據(jù)降維算法,并以城市暴雨災害為例對方法進行驗證。

2)2019.08-2020.07:氣象災害的分類識別研究。根據(jù)統(tǒng)計學和機器學習等方法,將遙感影像、Web數(shù)據(jù)和社會調(diào)研數(shù)據(jù)相結(jié)合,研發(fā)災害分類識別的模型和方法,并以暴雨洪澇等氣象災害為例進行驗證。

子課題4:氣象災害的經(jīng)濟社會影響評估研究

1)2018.07-2019.07:構(gòu)建災損率曲線、EC+IIOM。在數(shù)據(jù)采集和融合的基礎(chǔ)上,測算各高風險點的災損率曲線;開發(fā)最終需求各項的面板數(shù)據(jù)模型,構(gòu)建EC+IIOM模型。

2)2019.08-2020.07:構(gòu)建MD+CGE模型。設(shè)計CGE的基準情景、設(shè)計函數(shù)及方程、處理數(shù)據(jù)及參數(shù)、采用通用數(shù)學建模系統(tǒng)編程,構(gòu)建MD+CGE模型,并評估氣象災害給關(guān)聯(lián)產(chǎn)業(yè)和部門帶來的經(jīng)濟影響。

子課題5:氣象災害應(yīng)急決策的生成與評價研究

1)2018.07-2019.07:應(yīng)急決策方案的快速生成研究。開展包括案例推理、規(guī)則推理的方法研究,基于案例推理、規(guī)則推理和Web GIS集成的氣象災害應(yīng)急決策方案研究等。

2)2019.08-2020.07:應(yīng)急決策方案的動態(tài)評估研究。開展包括前景理論的原理和方法,前景理論在氣象災害應(yīng)急決策領(lǐng)域的應(yīng)用研究,氣象災害大數(shù)據(jù)應(yīng)急決策評估指標體系的設(shè)計研究,基于前景理論的應(yīng)急決策方案的動態(tài)評估模型研究等,最后以城市暴雨災害為例對方法進行驗證。

(課題組供稿)

(責編:孫爽、閆妍)
RM新时代APP官网