RM新时代APP官网

舊版網(wǎng)站入口

站內(nèi)搜索

11&ZD189 蕭國政、姬東鴻:項(xiàng)目簡報(bào)-第12期--2017

2017年12月14日10:58來源:全國哲學(xué)社會科學(xué)工作辦公室

基于本體演化和事件結(jié)構(gòu)的語義網(wǎng)模型研究

——子課題“面向事件的本體結(jié)構(gòu)資源建設(shè)”新的階段性成果

以武漢大學(xué)蕭國政、姬東鴻為首席專家的國家社會科學(xué)基金重大招標(biāo)項(xiàng)目《基于本體演化和事件結(jié)構(gòu)的語義網(wǎng)模型研究》(項(xiàng)目批準(zhǔn)號:11&ZD189),2017年第一季度主要抓了三件事:1、進(jìn)一步系統(tǒng)梳理和總結(jié)現(xiàn)有成果(包括數(shù)據(jù)等),組織部分力量和精力結(jié)集出版和組織發(fā)表成果; 2、部分子課題側(cè)重升級和應(yīng)用拓展;3、在學(xué)科交叉、學(xué)科前沿和社會服務(wù)方面做新的探索。由于本課題涉及學(xué)校多、人員多,發(fā)揮首席專家和子課題組的共同作用,是本項(xiàng)目扎實(shí)推進(jìn),保持前沿、高端、重大的主要措施之一。本期簡報(bào)著重報(bào)告第一子課題組舊年的基礎(chǔ)和新的進(jìn)展,以便領(lǐng)導(dǎo)和專家掌握我們的工作狀況。

子課題一的目標(biāo)是:建立涵蓋實(shí)體(屬性、屬性值)、事件及其上下位關(guān)系的基礎(chǔ)本體結(jié)構(gòu),建立涵蓋事件和事件鏈的語義標(biāo)注資源,通過在本體結(jié)構(gòu)中增加事件和事件鏈的描述,豐富本體結(jié)構(gòu)的內(nèi)涵,為文本的深度語義標(biāo)注、上下文理解和語義查詢及推理奠定基礎(chǔ)。前期的研究工作已完成了對“事件”內(nèi)涵的界定,簡單事件結(jié)構(gòu)描寫以及外延事件類別描寫。近半年來,在首席專家的指導(dǎo)和參與下,該子課題在事件本體建構(gòu)及其應(yīng)用研究方面取得的階段性新成果匯報(bào)如下。

在理論探索上,主要有三個方面的進(jìn)展:

一是關(guān)于事件研究的價(jià)值,課題組突破了語句形式的局限,以事件作為語義研究對象和觀察視角,對事件元素、事件框架、事件關(guān)系、事件本體與篇章事件結(jié)構(gòu)進(jìn)行分析和本體建構(gòu),探索篇章的語義分析、語義理解,以服務(wù)于大規(guī)模的語義計(jì)算。

二是關(guān)于事件的性質(zhì)和特點(diǎn)。研究發(fā)現(xiàn)作為語義研究對象的事件,具有以下五個基本特點(diǎn):1)事件是一種基本語言單位,詞、短語、句子各個不同層級的語言單位中都存在事件;2)事件遵循統(tǒng)一的結(jié)構(gòu)規(guī)則,同類事件具有統(tǒng)一的內(nèi)部結(jié)構(gòu)規(guī)則;3)事件的跨語法實(shí)體的嵌套性和遞歸性,復(fù)雜事件由多個簡單事件構(gòu)成,事件組合構(gòu)成具有因果、條件、目的等語義關(guān)系的遞歸結(jié)構(gòu);4)篇章中的事件演化,沿著一定的拓?fù)浣Y(jié)構(gòu)推進(jìn),主要有向心結(jié)構(gòu)、離心結(jié)構(gòu)、三角形結(jié)構(gòu)、菱形結(jié)構(gòu)和蝶形結(jié)構(gòu);5)事件具有全息結(jié)構(gòu)。總之,從要素與整體、靜態(tài)構(gòu)成和動態(tài)組合多個方面對“事件”進(jìn)行了全方位的理論思考。

三、關(guān)于事件關(guān)系和事件運(yùn)算,發(fā)現(xiàn)以事件知識為基本內(nèi)容的語義分析和語義推理研究,還需要定義一些基本的事件本體公理,而這些描寫為運(yùn)算規(guī)則的事件公理可以直接用于事件語義分析和推理。在事件類屬關(guān)系方面,對事件之間的領(lǐng)屬關(guān)系和聚合關(guān)系進(jìn)行了邏輯運(yùn)算規(guī)則的描寫。在事件鏈方面,運(yùn)用邏輯運(yùn)算規(guī)則對事件的原因關(guān)系、結(jié)果關(guān)系、條件關(guān)系和時(shí)序關(guān)系進(jìn)行了描寫。在事件拓?fù)浣Y(jié)構(gòu)方面,分別對構(gòu)成離心拓?fù)浣Y(jié)構(gòu)、向心拓?fù)浣Y(jié)構(gòu)、三角形拓?fù)浣Y(jié)構(gòu)和菱形拓?fù)浣Y(jié)構(gòu)的事件進(jìn)行了邏輯運(yùn)算規(guī)則的描寫。

在事件語義資源建設(shè)上,在定義事件由六元組(即E (B, P, T, Sp, N, S))構(gòu)成的基礎(chǔ)上,基于特定領(lǐng)域的真實(shí)文本建立了部分領(lǐng)域的事件本體知識庫,目前主要完成了物流、軍事、刑事訴訟三個領(lǐng)域的事件本體構(gòu)建的第一期工作。

以物流領(lǐng)域?yàn)槔,事件本體知識建構(gòu)的語言材料主要來源于物流領(lǐng)域的相關(guān)文獻(xiàn)、標(biāo)準(zhǔn)規(guī)定、專業(yè)教材和物流專業(yè)詞典,具體方法是先從文檔信息中篩選事件詞條,然后通過同義詞詞林?jǐn)U展詞條,最終得到了一個包含960條詞條,95個概念節(jié)點(diǎn)的物流事件概念集。以物流活動的相關(guān)流程和時(shí)空特征為主要線索,對該概念集中的事件概念進(jìn)行分析歸類,得到了六個事件概念類別,分別是:倉儲事件、裝卸事件、運(yùn)輸事件、審核和貨損事件、包裝事件、綜合事件。同理,以各大軍事網(wǎng)站、同義詞詞林、軍事新聞報(bào)道為語料來源,構(gòu)建了總詞數(shù)為2749個的軍事領(lǐng)域事件本體,以中國刑法法典、各種刑事司法參考書、刑事案件新聞報(bào)道、中國裁判文書網(wǎng)為語料來源,構(gòu)建了總詞數(shù)接近1000的刑事訴訟領(lǐng)域事件本體。

基于事件的理論探索和本體資源建構(gòu),是語義網(wǎng)和語言信息處理智能化的重要基礎(chǔ),應(yīng)用前景廣闊,同時(shí)對于詞典編撰、語言教學(xué)系統(tǒng)開發(fā)、深度機(jī)器學(xué)習(xí)、智能人機(jī)交互以及情報(bào)分析等都有著令人期待的應(yīng)用價(jià)值。

(課題組供稿)

(責(zé)編:王瑤)
RM新时代APP官网