精华内容
下载资源
问答
  • 2019-01-04 23:06:04

    事件、事件抽取与事理图谱

        人类社会是一个静态事物进行动态活动所创造形成的世界,人类的命题记忆是以“事件”为存储单位的,存储的是组成事件的概念及其之间的关系以及事件及其之间的关系,以事件作为知识的基本单元更能反映客观世界的知识,特别是知识的动态性,从认知心理学的角度来看,事件更符合人类的理解与思维习惯。知识库是机器实现认知智能的根本前提之一,如何让机器能够以一种更为接近于人脑知识结构体系的方式武装自己,是信息抽取以及知识工程领域一直致力攻克的方向。目前,以“事件”为核心开展信息抽取、语言资源建设、事理图谱建设等相关工作是新的制高点,本文主要以“事件”为核心,对事件、事件抽取、事件关系抽取、事理图谱相关的知识概念进行了简要的介绍。

    一、事件
        事件是什么,有多种定义,从不同的学科角度可以得到不同的答案。哲学上,公元前伟大的哲学家亚理斯多德认为,事件是可以感知的、相对独立的、运动的存在,是一种非静态的概念,一个典型的事件是一个行为的序列或者一系列状态的改变,是随着时间变化的具体事实;在认知学科上,斯坦福大学著名教授zacks[2001]提出,事件是被旁观者所观察到的在现实世界所产生的行为,可以通过时空结构来理解。有趣的是,这位教授还将事件与动作进行了区分,即动作是行为者刻意的行为,动作一定是事件而事件不都能称为动作,动作是客观的,而事件是被观察者观察得到的。语言学方面,Chung[1985]年提出事件结构,认为“事件是谓词、谓词发生的时间段、谓词发生的情况或者条件三个部分组成的术语”;Putejovsky[2000]提出以基础谓词为中心的事件理论;在信息领域,最早由美国国防高级研究计划委员会DARPA举办的Topic Detection and Track(话题检测与追踪)会议,将事件定义成“特定时间、特定地点发生的事情”,一个话题由多个事件组成;在本体研究领域,事件则是在指在某个特定时间和环境下发生的由若干角色参与并表现出若干动作特征的一类事情。
        通过以上的介绍我们可以看到,不同领域对事件的定义存在差异,并且体现了该领域所关注的实际问题。哲学和认知学科中更加关注事件的本源和概念,语言学领域更注重从词法和句法层面探究事件的语法结构和语义;信息领域则更关注事件在信息处理中的应用,包括事件的识别、获取以及事件应用;本体领域则更关注更细粒度的事件表示,力求从表示、事件关系、事件与概念本体之间的关系做体系的分析。而在这些存在差异的理解当中,也存在着一个共同之处,即都认为事件是人类知识中重要的组成部分,世界是由动态事件组成的,而且都在时间的刻画和表示形式上不断钻研。

    二、事件抽取
        事件抽取(event extraction)是信息抽取领域中重要的一个组成部分。目前关于事件抽取这一任务相关的技术评测主要包括MUC、ACE、TDT、TAC-KBP、BioNLP等,其中由美国DARPA于1987-1997年举办的MUC(Message Understanding Conferences)消息理解会议,任务包括命名实体识别、模板关系抽取等,其中的场景模板(Scenario Template)填充任务涉及事件抽取;作为MUC的后继者,由美国国家标准与技术研究所NIST先后在1999年至2008年举办的ACE(Automatic Content Extraction)系列评测,其中的事件探测与识别VDR任务涉及事件抽取;2009年ACE由TAC(Text Analysis Conference )正式接棒,ACE成为TAC的一个子任务;由DARPA资助举办的TDT(Topic Detection and Track)话题检测与追踪会议于1998年到2004年举办,起源于早期的事件检测与追踪项目EDT(Event Detection and Tracking)是以事件作为核心的评测会议之一,主要关注话题的产生与变化;BioNLP是一个生物文本挖掘评测项目,其中包括生物事件的抽取任务。
        事件抽取,就这个任务而言,目前可以分成两种,即元事件(meta event)抽取和主题事件(topic event)抽取。元事件由Filatova[2004]等人提出,表示一个动作的发生或状态的变化,由表示动作的动词或名词来驱动,包括参与该动作行为的主要成分(如时间、地点、 人物等)。目前学界和工业界谈论事件抽取,大多还是指元事件抽取,ACE是这类事件抽取的代表,ACE对参与评测的事件进行了定义,即事件由事件触发词(Trigger)和描述事件结构的元素(argument)组成。所谓事件触发词,即表示事件发生的核心词,多为动词或名词。元素(argument)又称为事件论元,表示事件的参与者、时间、地点等属性信息。ACE2015定义了8种事件类别(life, movement,conflict,contact等)和33种子事件类别(born, marry,injury, transport,attack等),每种事件类别对应唯一的事件模板,如子事件born,事件模版(template)包括person,time-within,place等。这样,事件抽取就变成了一个事件识别和事件元素识别的任务,后者事件元素识别即根据预先设定的事件模板,抽取相应的元素,类似于一种槽填充任务,也常称作为论元识别。就元事件抽取而言,目前主流的技术包括基于模式匹配、基于机器学习、基于神经网络等的事件抽取方法,其中基于神经网络的事件抽取方法将事件抽取转换成一个有监督的多元分类任务,具体包括句子篇章级事件抽取、基于联合模型、融合外部资源的神经网络事件抽取方法等。
        主题事件包括一类核心事件或活动以及所有与之直接相关的事件和活动,可以由多个元事件片段组成,与元事件抽取最大的不同在于,主题事件中所包含的多个元事件信息通常都分散于一个或多个文档当中,往往需要确定描述同一主题事件的文档集合,并将这些分散的缘事件进行组合。与元事件的抽取方法不同,主题事件的抽取方法一般需要借助事件表示或者本体框架作为理论支持,从技术上主要分为基于事件框架和基于本体的主题事件抽取两种。而其中的主题事件框架,代表性的有M. Minsky[1974]提出的“Framework for Representing Knowledge”,事件框架描述了一种由不同侧面刻画形成的分类体系,这些侧面描述了事件的不同信息。事件本体是一个与事件框架相关的概念,来源于知识工程和人工智能领域,与形式化描述领域词汇之间相似关系的本体类似,事件本体描述了事件体系中的概念、关系、层次结构以及实例。如Chen[2004]所提出的Domain 、Category 、Event 、Extended Concepts四层本体事件模型,其中每个Domain下包括多个领域Category,Category下一组事件集合组成,即对应事件层,Extended Concepts层定义了事件概念和对象概念。

    三、事件关系抽取
        目前关于领域事件抽取的工作大体还是沿着元事件抽取这种方法,如金融领域中常见的并购事件抽取,往往首先需要定义并购事件的事件结构,即触发词如“收购”、“并购”等,并购的论元结构,包括并购方、被并购方、并购金额、并购时间、并购状态、并购地点等,领域事件中的抽取精度随着事件结构的复杂度上升而下降,这也是目前领域事件知识库构建的难点之一。元事件抽取集中于单个事件类型的事件信息抽取,忽略事件之间的关系,主题事件抽取则更关注多个事件类型之间在话题上的一种变化,事实上,事件关系识别是信息抽取领域与事件抽取相关的另一个任务,目前关于事件关系相关的工作代表性的包括Framnet、TDT、脚本(script)、叙事性事件链(narrative event chain)
        由Charles J. Fillmore[2003]提出的Framenet是与事件相关的一项重要工作,严格上来说,它与事件关系不直接相关,而是一种词汇语义描述框架。Framenet也称为框架语义学(Frame Semantics),该理论力求通过定义和描述事件、关系、实体以及参与者等的框架来对词义进行系统的描述和解释。Frame框架是整个Framet的核心,也是词语的刻画方法,每个Frame框架中有多个框架元素,这些元素描述了这个frame的一些结构化信息,例如Caustion是Framnet中的一个框架,这个框架可以被cause.v, cause.n,make.v这几个词使用,该框架定义的框架元素包括原因主体(cause)、影响主体(Affected)、影响(Effect),这几个元素对“造成”这个词框架的意义进行了描述。此外,各个框架之间也存在着多种有向关系类型,包括继承关系、透视关系、总分关系、先后关系、起始关系、致使关系、使用关系、参照关系等。例如,“赠送 ”是 “给予 ”的子框架,“聊天”是 “说话”的子框架,“昂首阔步”是 “走路” 的子框架。这些框架之间的关系,描绘出了现实世界中语义的整体概念信息。从项目首页的介绍中我们可以看到,目前Frament定义了超过1200个Frame框架、1.3W个词语、1W余个框架元素、超过1800个框架关系以及超过20W的标注句子。这些资源对于我们构建事件本体并定义事件间关系具有很大的借鉴意义。
        TDT评测是更接近于话题事件抽取的一个工作,该评测细分成报道切分(story segmentation)、话题跟踪(story tracking)、话题检测(story detection)、首次报道检测(new event detection)以及关联检测(link detection)共5个子任务,这5个子任务都更加关注话题之间在时间信息上的一种变化。
         Scripts,又称script理论,最早由Silvan Tomkins[1954]提出作为affect theory理论的一个扩展,后期由Schank[1997]进一步发展,并进一步称为框架理论的一个延伸,旨在描述知识结构,尤其是对符合事件序列的表示上。关于script,目前有多种定义,代表性有Eramus[2010]所定义的“a set of expectations about what will happen next in a well-understood situation”,从构成上来说,一个脚本由一个为了完成特定目标而进行的一系列的动作或事件所形成的框架,其中的动作或事件在某些场合下也被称作场景(scene)。餐厅脚本(Restaurant script)是脚本理论中的经典例子,如“tom finds a free place, sits, waits for the waiter to take his order and finally eats his meal”,其中的”find place”,“sit”,”wait”,“eat”等动作构成了“餐厅就餐”这个脚本事件。
        Chambers[2008]在scripts的基础上进一步提出了叙事性事件链(narrative event chain)这个概念,认为这是一种新的知识结构化表示方式,叙事性事件链由一系列的叙事性事件(narrative event)按照时序组合形成,narrative event是一个包含事件event和事件参与者的元组。进一步的,在这个工作的基础上,先后提出了叙事性事件链自动抽取以及叙事性事件链预测等任务,相关的评测包括TimeML系列。TimeML是在一个关于问答系统的AQUAINT 项目里首次被提出来,从 TimeML的标注形式来看,(Subordination Link)标签用来描述文本中两个事件之间的关系。TimeML评测主要还是集中在对时序关系事件的识别,大致任务分成两部分,一是识别两个事件实体,其次是判定两个事件之间的时序关系。而到了后期,事件之间的因果关系(Causality)逐步进入研究视野,Wolff [2007]提出了动态事件模型,将因果概念分成CAUSE, ENABLE and PREVENT三个子概念类型。具有代表性的因果关系标注语料库有Palmer et al[2005]提出的PropBank 以及Prasad et al[2007]提出的Penn Discourse Treebank (PDTB),前者标注了动词与动词,动词与从句(clause)之间的因果关系,后者标注了从句(clause)之间的因果关系,两个因果关系标注语料库进一步推动了事件因果关系抽取技术的发展,Zhao[2017]是在因果关系抽取上一个代表性工作。

    四、事理图谱
        有了事件,事件之间的关系,再以一种组织体系进行表示,就可以构建起一个事件知识库。事实上, Chambers[2008]所提出的叙事性事件链(narrative event chain)这个概念已经很接近于事理图谱的概念,到后期,随着知识图谱的发展,以事件为核心进行知识组织表示的方式先后被提出。代表性的,Glavas and Snajder [2015]提出了eventgraphs的概念,事件图谱事以事件为基础信息的新型结构化表示方式,图谱中的节点表示事件提及(individual mentions of events),节点之间的边表示事件提及之间的时间(temporal)关系和指代(coreference)关系,并提出了一个包含三个阶段的端到端图谱自动构建系统和标注语料库EvExtra;Li[2018]进一步提出事件演化图谱(event evolutionary graph)的概念,定义为由抽象事件演化模式组成的知识库。在借鉴以上具有启发性的工作基础上,我们进一步将事理图谱的概念进行拓展,我们认为:“事理图谱是以“事件”为核心的新一代动态知识图谱,结构上具有抽象概念本体层和实例等多层结构;构成上包括静态实体图谱和动态事件逻辑图谱两部分;功能上注重描述事件及实体在时空域上的丰富逻辑事理关系(顺承、因果、反转、条件、上下位、组成等);应用上可通过抽象、泛化等技术实现类人脑的知识建模、推理与分析决策。”。当然,事件图谱也好,事件网络也行,事理图谱也好,从本质上来说,这只是一个知识的结构化表示方式。而就事理图谱的未来发展而言,如何进一步确定和构建一个灵活可为机器所利用的知识组织体系,一种更为合适的事件表示方法,一套从抽象概念层的事件逻辑表示和泛化框架,一个将事理逻辑与静态知识融合共通的运作方式等问题,将是信息抽取、知识工程领域中需要攻克的难题。

    五、总结
        事件,是人类的命题记忆的组织单元,也是信息时代的一种信息承载方式。作为信息抽取领域的一项重要任务,事件抽取技术已经取得了一定的发展,关于事件本身的本体理论研究、事件抽取技术以及事件关系抽取技术的研究、以事件为中心进行的知识库研究、以事件作为知识表示的应用研究等都在如火如荼地进行,对于事件的应用需求也日益剧烈,为了实现这一目标,需要学界和业界共同努力。以事件为核心的势力图谱将是未来知识图谱中的一个制高点,我们在知识图谱和事理图谱上开展了一些基础和推进性的工作,欢迎大家关注我们的公众号Datahorizon以及我们的工作,新的2019已经来临,让我们携手并进,共同推进技术升级以及应用落地。

    参考文献

    [1]Zacks[1985], Zacks, J. M., & Tversky, B. (2001). Event structure in perception and conception. Psychological Bulletin, 127, 3-21

    [2]Chung[1985], Chung & Timberlake, Argument Structure and Grammatical Relations: A Crosslinguistic Typology,1985,214

    [3]Putejovsky[2000], J. Putejovsky .“Type Coercion and Lexical Selection”, in ), Semantics and the Lexicon, Williamson T. 2000.

    [4]Eramus[2010], Erasmus, et al . The potential of using script theory in consumer behaviour research. Journal of Family Ecology and Consumer Sciences

    [5]Chen[2004],Chen, et al,2004 ,Multi-level Definitions and Complex Relations in Extended-HowNet, Workshop on Chinese Lexical Semantics,

    [6]Minsky[1974], Marvin Minsky. A Framework for Representing Knowledge… MIT-AI Laboratory Memo 306, June, 1974.

    [7]Wolff [2007],Wolff, P. Representing causation. Journal of Experimental Psychology: General, 136, 82-111

    [8]Palmer et al[2005], The Proposition Bank: An Annotated Corpus of Semantic Roles,Computational Linguistics,2005

    [9]Prasad et al[2007],Rashmi Prasad et al,The Penn Discourse Treebank 2.0 Annotation Manual. The PDTB Research Group. December 17, 2007.

    [10]Charles J. Fillmore[2003], Filmore. Background to Framenet[J].International Journal of Lexicography,2003,16(3):235- 250.

    [11]Chambers[2008],Chambers and Jurafsky. Unsupervised Learning of Narrative Event Chains. ACL- 08

    [12]Schank[1977],Roger C Schank and Robert P Abelson. Scripts, plans, goals, and understanding: An inquiry into human knowledge structures (artificial intelligence series). 1977.

    [13]Glavas and Snajder[2015],Construction and evaluation of event graphs,graphs, natural language processing,Volume 21, Issue 4

    [14]Zhao et al[2017] Sendong Zhao, et al, Constructing and embedding abstract event causality networks from text snippets. In WSDM, pages 335–344. ACM, 2017

    [15]Li et al.[2018]Zhongyang Li, Xiao Ding and Ting Liu∗,Constructing Narrative Event Evolutionary Graph for Script Event Prediction, IJCAI,2018

    [16]Filatova[2004], Filatova, E., Hatzivassiloglou, V.: Event-based Extractive Summarization. In: Proceedings of ACL 2004 Workshop on Summarization

    文章为原创,如有转载,请注明出处。
    作者简介:
    刘焕勇,中国科学院软件研究所,主要从事信息抽取、社会计算、知识图谱与事理图谱相关研发工作。如有自然语言处理、知识图谱、事理图谱、社会计算、语言资源建设等问题或合作,可联系作者:
    1、我的github项目介绍:https://liuhuanyong.github.io
    2、我的csdn博客:https://blog.csdn.net/lhy2014
    3、about me:刘焕勇,中国科学院软件研究所,lhy_in_blcu@126.com

    更多相关内容
  • 事件行销创造话题.doc

    2021-09-29 21:15:39
    事件行销创造话题.doc
  • 喷枪豪宅事件创造
  • 计算机行业事件点评:汽车与ICT融合将创造海量市场
  • 计算机行业事件点评:汽车与ICT融合将创造海量市场.pdf
  • 计算机行业事件点评:汽车与ICT融合将创造海量市场-200226.rar
  • 计算机行业事件点评:汽车与ICT融合将创造海量市场-200226.pdf
  • 你的客户可能正在选车,也可能正在购房,还可能刚有了小孩,所有的这些客户需求都可以通过业务事件进行分析得出,为银行提供销售产品服务并创造利润的机会。本文和大家探讨个性化、智能的银行渠道中,银行基于事件的...
  • 我在之前的文章中提出过“软件项目也是人类社会生产关系的范畴,只不过我们所创造的劳动成果看不见摸不着而已”。所以我们可以借鉴物流跟踪的思路来开发软件项目,把复杂过程拆解为一个个步骤、子过程、状态,这和...
  • 棋牌游戏与事件对策

    2021-01-15 05:08:02
    在阐述离散事件动态系统(DEDS)特点与方法的基础上,应用DEDS的有关理论为象棋博弈过程建模,并提出了事件对策的概念与形式框架,探讨了事件对策理论在战争模拟中的应用,为迅速发展的机器博弈研究创造了良好的理论条件.
  • 在线警察数据库 ... 这为搜索警察、犯罪数据和特定时间发生的事件创造了最具互动性的方式。 展示器:JSP、JavaScript、MySQL、HTML、CSS、DBMS 该项目是使用 apache 服务器和 netbeans 在 JSP 页面中设计的。
  • 该命令创造了一个名为Mylog的日志,这个事件源自”JobDUE”,”JobDone”和”Remark”。管理员权限只是为了创造日志,剩下的操作其它用户都可以操作。你现在可以为你的日志添加新的记录了。 代码如下:Write-EventLog...
  • JQuery的事件处理机制在JQuery框架中起着重要的左右,它就像电视机的开关,我们打开电视机的开关才能看到各个电视台精彩的节目,那么我们使用JQuery的事件处理机制就可以创造我们自定义的行为,比如说提交、改变样式...
  • Nodibot 创造戏剧性的IRC机器人。 基于。 他所做的事情: “无意中”侮辱或称赞加入的人 半随机回复邮件 跟别人说再见 React基于不同事件变好或变坏的“情绪” 要求: npm install
  • 我们不仅限于官方学校活动,还创造机会增加对 NUS 内任何有趣和丰富的事物的参与和认识。 目标: 新加坡国立大学的一站式服务(例如 CCA 欢迎茶会、社区服务计划、特别研讨会、业余爱好者活动,甚至是您在 Utown ...
  • 本文从对ICT的当前趋势的概述开始,并采用SD Logic的观点,旨在分析用户在电子文化价值共创过程中的参与度,并提出概念化的理论模型以阐明相互作用在用户和文化组织之间发生的事件导致上下文价值的(共同)创造。...
  • 以科学发明创造问题为实验材料,通过行为实验和事件相关电位(ERP)技术,探讨了情绪对创造性问题解决中原型启发的影响.结果发现:正性情绪组成绩显著高于控制组,负性情绪组显著低于控制组,情绪的高低唤醒度之间...
  • 一次成功的事件营销

    2020-12-17 07:28:26
    一次成功的事件营销可能不会让你取代另一个成功者,但一次成功的事件营销却可以给你带来新的生命力和创造...该文档为一次成功的事件营销,是一份很不错的参考资料,具有较高参考价值,感兴趣的可以下载看看
  • 前面我用for循环创建了div,每个div中有各自的数据以及同样的布局 效果图如下: 部分代码如下: 现在,我希望在点击每...然而,根据一般的写法,按钮点击事件:(’#…’).onclick或者是获取值:document.getEle...

    前面我用for循环创建了div,每个div中有各自的数据以及同样的布局

    效果图如下:
    在这里插入图片描述
    部分代码如下:
    在这里插入图片描述

    现在,我希望在点击每个div里的发表按钮时,能在js里获取{{problem.pro_id}}以及{{problem.user_name}}这两个参数,然后进行传递,写入数据库等等操作

    然而,根据一般的写法,按钮点击事件:(’#…’).onclick或者是获取值:document.getElementById 全部都只对第一个div有效

    也就是我点击按钮,只有第一个div里的按钮可以点击,其他div里的按钮点击无响应
    获取值我也只能获取第一个div里的{{problem.pro_id}}以及{{problem.user_name}}

    这显然不符合我们的需求

    解决方法如下:

     <script>
            var btn=document.getElementsByTagName('button')
            for(var i=0;i<btn.length;i++){
                (function(n){
                    btn[n].onclick=function(){
    
                        alert(n);
                    }
                })(i);
            }
    </script>
    

    上述代码中,var btn=document.getElementsByTagName(‘button’)自动帮我们查找页面所有的button按钮,并返回一个列表给我们,此时,btn[n]便依次代表我们从上到下的div里的各个按钮,btn[0]代表第一个div里的按钮,btn[1]代表第二个div里的按钮,依次类推…

    而我要传递的第一个数值,{{problem.pro_id}}其实是从1开始,每次加一的,代表着div的编号,我们这里直接用n+1进行代替,不再多写方法获取了

    但我们还有一个参数需要获取,就是{{problem.user_name}}
    在这里插入图片描述

    如图,我把它写在了< a >标签下,如果你是写在了其他标签下,照着我的方法也一样的获取

    对上面< script >中的代码略作修改

     <script>
            var btn=document.getElementsByTagName('button')
            var a=document.getElementsByClassName('user-name')
            for(var i=0;i<btn.length;i++){
                (function(n){
                    btn[n].onclick=function(){
                        var user_name = a[n].innerText;
                        alert(user_name);
                    }
                })(i);
            }
    </script>
    

    重点注意其中的代码;var a=document.getElementsByClassName(‘user-name’),原理与 var btn=document.getElementsByTagName(‘button’)类似,它搜寻html页面中所有class名为user-name的标签,获取标签的内容,返回一个列表给我们

    而var user_name = a[n].innerText;就是获取对应排号为n的,class为user-name的标签的字段内容(我是用的< a >标签,用innerText,其他的标签不一定,但百度一下就可以有),当点击div里的按钮时,会有alert提示值,让我们便于矫正。这样我们就可以获取到不同div里的值了

    另外,n这个数的选取要注意:
    在这里插入图片描述
    如图,我有多个标签class名为user-name,但只有{{problem.user_name}}这一个数据是我所需要的,如何具体选取,这里不多赘述

    ok,这不就行了吗,要的就是这个效果

    传送门:Django 仿ajax传递数据(Django第十篇)

    展开全文
  • 事件图谱的构建、推理与应用

    千次阅读 2021-07-13 00:52:39
    点击上方蓝字关注我们事件图谱的构建、推理与应用胡志磊1,2,3,靳小龙1,2,3,陈剑赟4,黄冠利51中国科学院网络数据科学与技术重点实验室,北京 1001902中国科学院计算技...

    点击上方蓝字关注我们


    事件图谱的构建、推理与应用

    胡志磊1,2,3, 靳小龙1,2,3, 陈剑赟4, 黄冠利5

    1 中国科学院网络数据科学与技术重点实验室,北京 100190

    2 中国科学院计算技术研究所,北京 100190

    3 中国科学院大学计算机科学与技术学院,北京 100049

    4 北京市信息技术研究所,北京 100091

    5 北京电子科技职业学院,北京 100176

     

     摘要近些年,知识图谱的构建技术得到了极大的发展,构建好的知识图谱已经被应用到众多领域。在此基础上,研究者将目光从知识图谱转向事件图谱。事件图谱以事件为核心,准确地描述了事件信息以及事件之间的关联关系。基于此,总结了事件图谱在构建、推理与应用方面的关键技术,主要包括事件抽取、事件信息补全、事件关系推断以及事件预测技术。给出了事件图谱的具体应用场景,并且针对事件图谱研究中存在的挑战,对未来的研究趋势进行了展望。

    关键词知识图谱 ; 事件图谱 ; 事件知识 ; 事件抽取 ; 事件推理

    论文引用格式:

    胡志磊, 靳小龙, 陈剑赟, 等. 事件图谱的构建、推理与应用[J]. 大数据, 2021, 7(3): 80-96.

    HU Z L, JIN X L, CHEN J Y,  et al. Construction, reasoning and applications of event graphs[J]. Big Data Research, 2021, 7(3): 80-96.


    1 引言

    随着信息技术的飞速发展,目前整个社会已经迈入了大数据时代。大数据时代下每时每刻都在产生庞大的数据。在庞大数据的背后,蕴含着众多有价值的信息。但是由于数据种类繁多、数据量庞大,难以高效、准确地获取有用的信息。为了更加高效地获取数据背后的信息,提高获取信息的效率,研究人员开始研究并使用自动化的工具从原始数据中抽取有价值的信息。这种自动化的技术被称为信息抽取技术,可以极大地提高工作效率,节省时间。与此同时,由于信息抽取技术逐渐走向成熟,一种新的数据组织形式逐渐形成,实现了知识互联,适应了用户的认知需求,其被称为知识图谱。

    知识图谱的概念由Google公司在2012年正式提出,目的是提高搜索引擎的性能,提供更加友好的搜索结果。随后知识图谱在学术界受到了极大的关注,其构建技术也在飞速发展。目前,知识图谱已经被广泛地应用到知识问答、智能搜索、个性化推荐、软件复用、政府治理等多个领域。随着技术的不断发展,现有研究内容已经从知识图谱的实体识别、关系抽取技术扩展到了事件图谱的构建与推理技术。事件图谱刻画了现实世界中发生的事件,对事件信息进行了准确描述。事件图谱中蕴含众多事件知识,事件知识的特点是拥有众多维度,例如时间维度、逻辑维度、关系维度等。

    本文对现有的关于事件知识的研究做了总结,从事件图谱的构建、推理与应用3个方面阐述了相关技术的研究现状。最后,本文展望了事件图谱的发展方向。

    2 知识图谱与事件图谱

    知识图谱本质上是一种语义网络,包含实体以及实体之间的关系。实体是知识图谱中最基本的概念,一个实体代表了现实世界中的一个事物或者一个概念。关系代表的是实体和实体之间的关联。另外,知识图谱中的属性代表的是实体具有的某个特征,其描述了实体的相关信息。知识图谱刻画了现实世界中的事物以及事物之间的各种关系,其主要表示形式是三元组,包括属性三元组和关系三元组。知识图谱存储了结构化数据,适合对数据进行搜索和推理,已经在知识问答、智能搜索等方面发挥了重要的作用。

    事件是文本中包含的一种信息,其定义为在某个特定的时间以及特定的地点,由多个相关角色参与的一件事情或者一组事情。随着知识图谱技术的发展,越来越多的研究者开始关注一种特殊的基于事件的知识图谱,即事件图谱。在此基础上,本文将事件图谱定义为:一种以事件为中心,用来描述事件信息以及事件之间各种关系的图谱。事件图谱和知识图谱主要的不同点是事件图谱主要的研究对象是事件,描述了与事件相关的知识、事件的演变过程以及事件间的关联关系。而知识图谱主要的研究对象是实体,主要描述的是实体属性以及实体之间的关系。在事件图谱中,图的节点表示事件,图上的连边表示事件之间的时序、因果、顺承、包含等关系。事件图谱示例如图1所示,图1展示了收购事件、股价上涨事件和股价下跌事件的事件论元以及事件之间的关联关系。从图1中可以看到,收购事件的收购方是公司A,被收购方是公司B,收购金额是350亿美元,收购时间是2020年10月27日。另外,由于收购事件导致了股价上涨事件和股价下跌事件的发生,因此收购事件分别与股价上涨事件、股价下跌事件之间具有因果关系以及隐含的时序关系。

    图1   事件图谱示例

    在事件图谱的构建、推理与应用的过程中,需要用到多种智能化信息处理技术,核心技术主要包括事件抽取技术、信息补全技术、关系推断技术以及事件预测技术。面对开放网络上的文本数据,首先要做的任务是事件抽取。事件抽取技术可以从非结构化的文本数据中提取出与事件有关的信息,并将信息以结构化的形式呈现出来。而信息补全技术是利用事件图谱中已有的知识,推理补全事件图谱中缺失的事件论元知识。关系推断技术则是利用文本中的信息来推断出事件之间的共指、时序以及因果等关系。最后,事件预测技术被用来预测未来可能发生的事件,分析事件的演变趋势。构建好的事件图谱具有广阔的应用场景,主要包括热点事件检测、事件脉络分析以及未来事件预测等。

    3 事件抽取

    事件是文本中包含的一种特殊信息,事件抽取就是从非结构化的文本数据中抽取与事件有关的各种角色,将信息用结构化数据表示。按照确定事件类别的方法,事件抽取可以被分为限定域事件抽取和开放域事件抽取。

    3.1 限定域事件抽取

    限定域事件抽取是指在进行抽取任务之前,已经确定好了相应的目标事件类型和相应的结构。另外,限定域事件抽取任务还会给出一些标注数据。因为事件标注较为复杂,需要耗费一定的人力物力,所以数据集规模一般较小。在事件抽取领域中较为常用的标准数据集是ACE 2005语料库。关于限定域事件抽取的研究较多,目前研究主要采用的是深度学习方法,几种代表性的神经网络方法如下。

    (1)基于注意力机制的方法

    在进行事件抽取时,许多研究者使用了注意力机制,以此来提升神经网络模型的效果。注意力机制是一种仿生技术,借鉴了人类的选择性注意行为。选择性注意行为是指人类在进行观察时,视觉会快速扫描全局图像,从而确定要重点关注的内容,抑制或忽略其他无关的信息。研究者受此启发,提出了深度学习中的注意力机制,核心目标就是在众多信息中选择对于当前任务来说最关键的信息。

    ACE 2005语料库给出了每个事件的事件触发词和事件论元。但是之前的研究者并没有充分利用数据集中的标注信息,更多地依赖句子的语义信息,忽略了被标注的论元信息。因此,Liu S等人提出了一种新的方法,利用论元信息来加强对触发词的识别和分类。该方法将句子中的单词信息、上下文的单词信息、上下文的实体信息结合起来,组成单词的触发词候选项。他们还采用了一种有监督的注意力机制更加深入地提取句子中的有效信息,句子中的事件触发词会比其他上下文单词获得更多的注意。最后该方法使用了一个多分类的神经网络模型完成事件抽取任务,充分利用了语料库中被标注的论元信息。

    上述方法将句子中的多个事件视为独立事件,只是利用单个句子内部的信息来检测事件。但是句子中表达的事件是相互关联的,单纯地利用句子内部的信息不能很好地区分某些事件。因此Chen Y等人提出了一种分层的基于门控注意力机制的偏差标记网络,目的是融合句子和文档的信息,从而进行多事件识别和抽取。该方法采用了一种新的思路,将事件抽取看作一种序列标注问题。模型中首次添加了一个层次化的基于循环神经网络(recurrent neural network,RNN)的标签层来捕捉所有事件的依赖关系,同时设计了一种偏差目标函数来增强触发标签对模型的影响。除此之外,为了充分利用事件候选项的上下文信息,该方法采用了一种基于门控的多层次注意力机制,可以自动提取句子和文档中的信息,并进行动态的集成。该方法充分利用了事件之间的关联关系,融合了文档信息来增强事件识别的结果。可以看到,基于注意力机制的方法实现了对信息的有效提取,使得事件识别更加准确。

    (2)基于预训练模型的方法

    一般来说,为了更好地训练神经网络模型,需要为模型提供大规模的标注数据。但是构建大规模的标注数据耗时耗力,难以满足要求。相比之下,大规模未标注的语料却很容易构建。为了利用大量的未标注数据,研究人员提出了预训练模型。预训练模型可以从大规模的语料中提取隐含的语义信息,学习到更好的通用语义表示向量,从而提高下游任务的表现。

    Yang S等人针对现有远程监督事件抽取方法中存在的问题,将目光转向预训练的语言模型,希望利用从大规模语料库中学习到的知识表示向量来提高模型的性能。其设计了一种基于预训练语言模型的事件抽取(pre-trained language model based event extractor,PLMEE)模型。该模型的结构如图2所示。他们将事件抽取看作由两个子任务组成,两个子任务分别是触发词抽取和论元抽取,并提出了以预训练语言模型为基础的触发词抽取器和论元抽取器。基于预训练模型的方法会使事件的语义表示更加精确。但是现有的方法将事件抽取看作两个子任务,构建的是流水线模型,存在明显的错误传递问题。

    (3)基于图神经网络的方法

    过去几年深度学习技术兴起,以神经网络为代表的技术被用来提取欧氏空间中的数据特征。但是现实世界中还有众多场景使用的是非欧氏空间数据,其中具有代表性的就是图数据。图数据被广泛应用在多种场景,如电子商务的推荐系统、知识图谱的在线推理等。但是图数据结构复杂性较高,之前的神经网络方法无法直接被使用。因此,研究人员借鉴了卷积神经网络、循环神经网络以及深度自动编码器的思想,设计了一种专门用来处理图结构数据的神经网络,即图神经网络。图卷积神经网络(graph convolutional network, GCN)是指在图数据中应用卷积操作,其核心思想是学习到一种函数对节点进行表示。通过函数变换,一个节点自身的特征可以结合其临近节点的特征,从而生成节点新的表示。

    图2   PLMEE模型结构

    在事件抽取、关系抽取等任务中,一般利用词嵌入等方法将输入序列转换为连续的向量,并没有使用句子的结构信息。为了在神经网络中引入句法结构特征,Nguyen T等人提出了一个基于句法依存树的GCN模型用于事件抽取。在GCN中,每个节点的卷积向量是由相邻节点的表示向量计算出来的,可以作为该节点的唯一特征进行分类。另外,模型中通过对当前单词的卷积向量以及句子中提到的实体进行池化操作,克服实体指称无法捕捉的问题。池化操作聚合了卷积向量,从而为事件类型预测生成了单个向量表示。该方法在事件抽取中引入了GCN模型,将句法依存树上的信息进行聚合,首次利用了句子中的结构信息。

    除此之外,Liu X等人设计了一个新的联合多事件抽取(jointly multiple events extraction,JMEE)框架。该框架利用基于注意力机制的图卷积神经网络进行建模,并通过引入句法依存树中的句法捷径弧来增强信息流,以此来提升在一个句子中抽取多个事件的效果。使用句法捷径弧可以减少将信息流从一个节点转换到目标节点的转换次数。与基于序列的模型相比,该方法会使在同一个句子中从一个事件触发词跳到另一个事件触发词的跳数明显减少。GCN会利用输入的句法捷径弧,聚合目标节点一阶邻居的信息,为每个节点学习到其句法上下文的表示。之后,模型通过自注意力机制进行信息聚合,保留了多个事件之间的信息,用于抽取事件触发词和论元。基于图神经网络的方法有效地利用了句法依存树中包含的信息。但是基于图神经网络的模型的计算量比较大,且只适用于对构建好的静态图进行处理。

    (4)其他神经网络方法

    除了上述方法,还有众多方法被应用到事件抽取任务中,也取得了良好的效果。例如,Liu J等人设计了一种新的基于对抗模仿的知识蒸馏方法,目的是从句子中获取知识来进行事件抽取。该方法首先构建了一个教师模块,充分利用标注数据来学习知识表示,之后建立相应的学生模块用于测试。在训练过程中,鉴别器通过检测教师模块和学生模块的输出来区分两者。同时,学生模块会尽可能地模仿教师模块,生成与教师模块相似的向量来迷惑鉴别器。该方法有效地完成了知识蒸馏,得到的新模型参数量少,且性能接近复杂模型。

    Hong Y等人利用具有自我调节机制的生成式对抗网络来完成事件抽取任务,提高事件抽取的性能。一般来说,生成模型产生的虚假特征往往来自语义上的伪相关上下文,在训练过程中神经网络可能会错误地、不自觉地保留记忆,从而产生虚假的特征。因此该模型采用了一种双通道自调节的学习策略来调节学习过程,还添加了一对生成判别模型。在自学习过程中,生成模型被用来生成虚假特征,而判别模型被用来消除错误。该方法减轻了虚假特征对结果的影响,提升了事件抽取的效果。

    3.2 开放域事件抽取

    开放域事件抽取和限定域事件抽取的不同是事件类型不需要预先指定。因此,开放域事件抽取一般没有人工标注数据,主要使用无监督的方法。这种方法主要基于统计的思想,当事件触发词和事件论元相似时,其表达的事件类型也相似。在此过程中,聚类方法和概率模型的使用较为广泛。

    开放域事件抽取的目标是抽取所有类型的事件,不对事件类型进行限定,有更高的事件覆盖率。Araki J 等人提出了一种基于远程监督的自动生成训练数据的方法,不依赖人工标注的数据。该方法利用WordNet进行远程监督,以此来生成高质量的事件分类数据。之后,生成的数据被用来对事件判别器进行训练。该方法可以生成大量的训练数据,但是训练数据的准确程度无法保证,会导致判别器的结果较差。

    除此之外,目前贝叶斯图形模型(Bayesian graphical model)被用于对开放域事件进行结构化的表示,但是这种方法假定所有的单词都是由单个事件产生的,具有一定的局限性。因此Wang R等人提出了一种基于生成式对抗网络的事件抽取模型,称之为对抗神经事件模型(adversarial-neural event model, AEM)。该模型使用狄利克雷分布对事件进行建模,并利用生成器网络捕捉潜在事件。该模型可以用来处理不同长度的文档,适用范围比较广泛。另外,Naik A 等人将对抗域自适应(adversarial domain adaptation,ADA)框架应用到开放域的事件触发词识别任务中。该方法是一个无监督的过程,不需要目标域的标记数据,实验结果显示了该框架的有效性。

    事件抽取技术是用于构建事件图谱的基础技术,影响着后续任务的精度,是极其重要的。针对这一任务,研究者提出了众多新方法。研究者期望通过不断探索,设计出更多适合此任务的神经网络,不断提高事件抽取的准确率。虽然目前已有的方法取得了不错的结果,但是该领域的评估标准还不是很明确,所使用的标准数据集规模也比较小。未来需要进一步明确评估标准,提出规模更大的标准数据集用于研究。

    4 事件信息补全

    事件抽取技术主要用于获取事件知识,但是事件抽取的结果往往是不完整的,存在部分论元缺失、论元抽取不准确等情况。为了对事件抽取的结果进行补全,就需要用到信息补全技术。信息补全技术依托于相应的事件图谱,根据图谱中的相关知识对缺失的知识进行补全。目前,信息补全和链接预测也是知识图谱领域的研究热点,但是研究者们主要关注二元关系事实。二元关系事实通常表示为三元组,即(头部实体,关系,尾部实体)。而在事件图谱当中,存在众多的多元关系事实。多元关系事实一般通过引入虚拟实体分解为多个三元组,例如Freebase中的复合值类型(compound value type, CVT)实体。目前研究者已经开展了对多元关系推理的研究,提出了一些方法。而这些多元关系推理方法可以应用在事件信息补全任务中,多元关系事实的预测对于事件图谱的补全具有重要意义。

    在将实体转换为多个三元组实体的过程当中,Wen J等人认为在转换过程中会造成结构信息的丢失,可能导致链接预测不准确。因此他们提出了一种基于翻译的方法m-TransH来对这些实例进行建模。在该方法中,关系(二元关系或多元关系)是由对应于该类型关系的一系列角色到其值的映射来定义的,每个特定的映射都是此关系的一个实例。但是m-TransH并没有考虑在同一多元关系事实中各成分之间的相关性。在此基础上,Zhang R C等人提出了一种新颖的相关性关联嵌入(r elatedness affiliated embedding, RAE)模型,还提出了一种可伸缩实例重构(scalable instance reconstruction, SIR)算法。RAE通过对各成分之间的相关性进行互补建模,进一步改进了m-TransH方法。这里的相关性是指两个值在共同实例中共同参与的可能性。

    而Guan S P等人并没有对多元关系事实进行分解,而是将每个多元关系事实表示为一组角色-值对。他们提出了一种对多元关系数据进行链接预测的方法NaLP,该方法对同一多元关系事实中所有角色值对的相关性进行了建模。在该方法中,他们认为一个角色与其值是紧密相连的,因此应该绑定在一起。同样地,如果在同一个组中的所有角色-值对都紧密相关,就假定这组角色-值对很有可能构成有效的关系事实。基于上述假设,NaLP方法中包含两个关键组件,分别是角色值对嵌入和相关性评估。对于给定的关系事实,需要首先学习到角色-值对的嵌入表示,再在相关性评估组件中计算角色-值对的成对相关性。之后还需要估计关系事实的整体相关性,获得最终的评估得分,并用于计算损失函数。该方法有效地建模了多元关系事实中角色和值之间的相关性,充分利用了多元关系事实中的内部信息。另外,由于公开可用的多元关系数据集有限,他们基于Wikidata中的原始数据构建了一个实用的多元关系数据集WikiPeople。

    Guan S P等人还进一步提出了神经网络模型NeuInfer,用于对多 元关系事实进行知识推断。NeuInfer不仅可以用于推断整个事实的未知元素,还可以用于新型任务,进行灵活知识推断。该模型使用的事实是由主要三元组以及任意数量的辅助描述组成的。他们假设一个有效事件的主三元组是有效的,而不管其有没有辅助描述。另外,每个辅助描述都与主三元组相关,可以作为主三元组的某个特征。该模型首先对主三元组的有效性进行评估,得到相应的有效性得分。之后再对主三元组与描述信息的兼容性进行评估,得到兼容性得分。最后,模型将有效性得分和兼容性得分的加权和作为最终的分数。该方法主要利用了事实中的主三元组以及辅助描述,可以根据部分知识进行知识推理。

    在事件信息补全的过程中,不仅需要对二元关系事实进行补全,还需要对多元关系事实进行补全。目前多数研究者认为将多元关系事实分解为多个三元组会导致多元关系事实内部的关系信息丢失,可能会加剧信息补全精度不够高的问题。因此,上述方法都将多元关系事实看作一个整体,保留了原有数据的信息。目前用于事件信息补全的方法还比较少,补全精度还不够高,需要进行深入研究。

    5 事件关系推断

    对于一篇给定的文本,文本中存在多个事件。与此同时,事件之间有可能是相互关联的,可能存在多种关系。事件关系推断技术则利用文本中的信息来推断事件之间的关系,主要包括共指关系、时序关系以及因果关系等。早期基于规则的方法实现简单,但依赖于人工制定的规则,实用性不高。随着深度学习技术的发展,众多深度学习方法被应用到关系推断任务中,本文简要介绍了相关的方法。

    5.1 事件共指关系

    事件共指关系指的是给定描述事件的文本,如果两个事件指向同一个事件实例,则这两个事件之间存在共指关系。当文本中的多个事件指向一个事件实例时,则多个事件组成了一个共指事件链。在共指事件链中的任意两个事件都具有共指关系。事件共指关系可以分为文档内事件共指和跨文档事件共指。进行事件共指关系的推断有助于计算机更好地理解事件发展的脉络,对于综合全局信息、推测事件演变、预测未来事件具有重要的意义。

    Zeng Y T等人提出了一种新的基于事件转述和论元感知语义嵌入的EPASE模型。该模型会在特定事件的上下文中识别深层次的转述关系,并且可以涵盖更多情况的事件转述。另外,由于自变量角色的嵌入被编码为事件嵌入,无须依赖固定数量和类型的自变量,因此该模型具有良好的可伸缩性。该方法首次将转述关系引入了事件共指任务,通过句子中的完整语义信息来识别句子之间的转述关系,充分利用了上下文信息。该方法有效地将自注意力机制和特殊事件的标识结合起来,只对选取的特定事件进行关注,排除了文本中噪声信息的干扰。

    5.2 事件时序关系

    事件时序关系是指两个事件发生的先后关系。时间是事件的一个天然属性,事件发生时间的不同揭示了事件之间存在的先后关系。通过对时序关系的分析可以获取事件从开始到结束的演化过程,有助于对未来事件进行预测。事件时序关系抽取是自然语言处理领域中的重要研究方向,受到了越来越多研究者的关注。

    Cheng F等人提出了一个基于双向长短期记忆的神经网络模型进行时序关系抽取。该方法使用了句子的依存路径,将词向量、词性向量和依存关系向量拼接,并将拼接后的向量作为模型输入的向量。在此基础上,为了解决跨句子实体之间不存在依存路径的问题,假设两个相邻的句子共享一个根节点。通过在模型中加入多种特征,该方法的实验结果取得了有效的提升。Han R J等人为了解决在事件抽取和事件时序关系识别两阶段任务中存在的误差传递问题,提出了一种联合学习方法,同时进行事件抽取以及时序关系识别。他们在两个子任务中共享了事件表达,利用结构化约束和整数线性规划来优化问题,提升了事件表达效果,缓解了误差传递的问题。另外,他们还提出了深度结构化学习框架的方法,利用递归神经网络学习事件的时序关系表示,同时采用结构化支持向量机(structured support vector machine, SSVM)进行预测。该方法在多个数据集上取得了优秀的结果,作者还通过消融实验进行了广泛的误差分析。

    在此基础上Han R J等人还指出,之前的方法中只利用了例如硬约束的结构化知识,同时因为训练数据有限,进行时序关系分类时会引起偏差。因此他们提出了一个新的框架,通过概率领域知识构建的分布约束来增强深度神经网络的性能。新的方法还将拉格朗日松弛方法应用到时序关系抽取任务中,取得了最优性能。Wang H Y等人设计了一种新的联合约束学习框架,利用时间和子事件关系之间的逻辑约束对模型进行正则化。同时,他们设计了新的事件复合结构,用来描述事件提及之间的关系结构。

    5.3 事件因果关系

    事件因果关系是指两个事件之间的因果联系,是一种复杂的语义关系。通过对事件因果关系进行分析,事件发生的前因后果会更加清晰。清晰的因果关系有助于进一步认识事件发展的过程,使得事件推理与事件预测更加准确,可以避免风险、提高收益,为决策者提供有力的支持。事件因果关系识别在事件预测中的重要性,吸引了众多学者对其进行研究。

    因为在事件关系推断任务中缺少标准数据集,所以Caselli T等人提出了一个用于事件时序和因果关系检测的数据集ESC(event storyline corpus)。ESC数据集的构建为之后的研究提供了便利。针对文档级事件因果关系的识别任务,Gao L等人建模了粗粒度和细粒度的文档级因果结构,在ESC数据集上取得了不错的效果。他们设计了丰富的特征进行事件因果关系识别,包括词法特征、因果潜在特征、句法特征,还利用事件共指链接将效果较差的句间预测问题转换为句内预测问题。最后,他们使用整数线性规划的方法来进行文档级全局推理,用来抽取文档中所有事件对的因果关系。该方法专门用于对事件因果关系进行识别,但是其并没有对因果关系的方向进行区分。

    Liu J等人还利用外部知识来提升事件的表示,设计了一种事件提及屏蔽机制来挖掘历史数据中存在的因果关系。该方法将ConceptNet的知识引入了原有文本数据中,扩展了已有事件,涵盖了更多的信息。另外,为了处理数据中新出现的事件,该方法利用事件提及屏蔽机制来发现因果关系模式,增加对上下文信息的关注。最后,模型对两个组件做了权衡,用来充分发挥两个组件的优点。实验结果显示,该方法效果显著,在跨主题应用中也展现出很强的鲁棒性。

    事件关系推断用于对事件之间的关系进行判断,在此基础上可以对事件图谱进行完善,更好地刻画事件之间的关系。之前研究者主要利用规则的方法进行事件关系推断,现在已经引入了深度学习的方法,取得了不错的效果。但是总体来说,目前对事件关系推断技术的研究还不够充分,尤其是事件因果关系这一方面。在事件因果关系的研究领域中缺少明确的任务定义以及足够的标准数据集,这就需要研究人员在此领域中投入更多的精力,广泛开展研究。

    6 事件预测

    事件预测主要指的是根据历史事件来预测未来发生的事件。对未来事件进行准确预测具有十分重要的意义,既可以减少突发事件带来的损失,也可以针对未来事件做出相应的应对部署,为整个社会带来巨大的经济效益。但与此同时,对未来事件进行预测是十分困难的,需要面临很多的问题。这是因为对于许多事件来说,很难知道其发生的机制以及其背后的原因。随着大数据时代的来临,相关数据的规模不断扩大,为事件预测的研究提供了基础。因此,众多研究者开始探索如何进行事件预测,提出了众多有意义的方法。后文主要介绍脚本事件预测技术和基于图卷积网络的事件预测技术。

    脚本事件预测技术根据给出故事的上下文来推断出故事的结尾。在这一任务当中,事件是用脚本结构描述的,即利用脚本描述事件的参与者、事件类型、事件触发词等多个元素,之后利用现有脚本对未来的事件进行预测。脚本事件预测是由Chambers N等人在2008年提出的,需要在候选事件列表中选择最有可能发生的事件,利用填空式的评估标准来评估模型,这种思路被称为统计脚本学习。Chambers N等人设计了点互信息(pointwise mutual information,PMI)来计算事件对之间的关系。

    目前脚本事件预测任务广泛使用的评测方法是多选项完形填空(multiple choice narrative cloze,MCNC),该方法是由Granroth-Wilding M等人提出的。在MCNC任务中,完整的事件链中存在某处缺失,给定多个候选的后续事件,模型需要从多个候选项中选择最符合逻辑的一项内容。Granroth-Wilding M等人采用深度学习的方法,设计了一种神经网络来对事件链进行建模。他们设计了一个EventComp模型,使用孪生神经网络(siamese network)代替原有的PMI。模型结构包含3层,分别是输入层、论元组合层和事件组合层。最终,训练后的模型与统计学习方法相比取得了极大的进步,证明深度学习方法在这一领域是有效的。

    上述方法对事件对之间的关系进行了建模,并取得了不错的效果,但是文本中事件之间丰富的连接信息并没有被充分地利用。正因如此,研究者开始利用图的方法对事件之间的连接信息进行建模。在事件构成的图中,图的节点表示单个事件,节点之间的边表示事件之间的关系。Li B等人提出了一种众包的构建事件图的方法。另外,Glavaš G等人提出了一种从文本中构建事件图的有效方法。在此基础上,Li Z Y等人提出了一种新的方法来充分利用事件之间稠密的连接信息。该方法首先构建了叙事事理图谱,之后基于事理图谱进行网络表示学习,最后再利用得到的表示向量预测后续事件,模型结构如图3所示。具体来说,在构建叙事事理图谱的过程中,首先需要抽取脚本事件链条,之后利用抽取出来的链条构建图谱。在构建好事理图谱之后,模型每次会从中抽取一个子图,学习并更新所选子图上的事件表示。其中每个子图都包括故事上下文、所有候选事件的节点以及这些节点之间的有向边。该方法通过构建好的事理图谱来学习事件表示,有效地利用了事件之间的关系。但是构建事理图谱的过程较为复杂,构建好的图谱规模较大,每次只能选取一个子图来更新子图上的事件表示。

    图3   SGNN模型结构

    基于 图卷积网络的事件预测技术主要指的是在时序知识图谱上利用图卷积网络进行推理的技术。时序知识图谱主要由四元组构成,是在原有知识图谱的三元组上添加了时间维度得到的。通过引入时间维度,时序知识图谱可以更好地描述事件信息。因此对时序知识图谱的未来状态进行推理就是对未来的事件进行预测。

    Han Z等人提出了一种全新的图霍克斯神经网络(graph Hawkes neural network,GHNN)。该神经网络首次利用霍克斯过程进行建模,主要用于捕捉过去事件对未来事件的影响。通过捕捉时序知识图谱上潜在的动态关系,该神经网络可以用于对大规模时序多关系型数据进行分析,更加准确地对未来某一时刻发生的事件进行预测。与此同时,Jin W等人提出了一种新的循环事件网络(recurrent event network,RE -NET)来预测将要发生的事件。该网络主要分为两个部分,一部分是对历史事件的信息进行循环编码,另一部分是对时序相邻事件的信息进行聚合。RE-NET充分利用了历史事件的信息、时序相邻事件的信息以及同时发生事件的信息。通过聚合多种信息,该方法给出了所有事件的联合概率分布,用来预测未来事件发生的概率。基于图卷积网络的事件预测方法可以利用历史数据中蕴含的信息,捕捉到历史事件对未来事件的影响。但是目前这种方法的准确率还比较低,需要开展进一步的研究。

    对事件预测的研究是十分重要的,其具有广阔的应用场景,事件预测是对事件图谱的高级应用。目前在脚本事件预测任务中已经有了相对清晰的评测方法,研究者也提出了许多方法对事件链以及事件图进行建模。除此之外,研究者还提出了基于图卷积网络的事件预测方法,采用新的方法对将来的事件进行预测。总体来说,研究者对事件预测的关注度较高,期待取得更多的研究进展。

    7 事件图谱的应用场景

    目前,知识图谱已经被应用到各行各业,成为人工智能技术的重要组成部分。但是知识图谱具有一定的局限性,只能描述与实体相关的知识。而现实世界中存在着大量的事件,事件是日常生活中不可或缺的一部分,充分利用与事件相关的知识会更加真实、具体地刻画现实世界。因此,事件知识构成的事件图谱具有广阔的应用前景。将事件图谱应用到人工智能技术中可以使产品的智能化水平更高,更加方便人们的生产和生活。具体来说,事件图谱主要有热点事件检测、事件脉络分析以及未来事件预测等应用场景。

    7.1 热点事件检测

    事件图谱可以用于对热点事件进行检测。热点事件发生突然,会在短时间内形成,而且时时刻刻在发生变化,传统的方法难以应对。而采用与事件图谱相关的分析技术可以对网络上的舆论内容进行分析,实时地捕捉热点事件。另外,还可以对行业热点、地域热点事件进行检测,从多个方面展现热点事件。该技术可以被应用到媒体机构中,将检测到的热点事件实时地推送给用户,让用户在第一时间获得更多的热点资讯。

    7.2 事件脉络分析

    事件图谱的另一重要应用场景是事件脉络分析。针对特定的事件,事件图谱可以利用事件之间的关系,对事件的前因后果进行关联,形成事件发展的脉络,并展示给用户。具体来说,可以将事件图谱与搜索引擎结合,当用户对感兴趣的事件进行搜索时,就可以得到事件发生的来龙去脉,清晰地反映事件发展的脉络,极大地提高知识检索的效率,给用户提供更多的便利。

    7.3 未来事件预测

    事件图谱还可以在未来事件预测方面发挥重要的作用。通过分析历史事件的发展过程,可以预测未来可能发生的事件。在金融领域,可以基于历史事件掌握行业动态,预测行业发展的趋势。这样就能够准确地把握市场发展动向,针对市场的变化做出相应的调整。在舆情预警方面,可以在现阶段发生事件的基础上预测未来可能会发生的事件,对事件的演化过程做出预测。一旦事件发生不良演变或者有不可控的趋势,监测系统可以及时发出预警,由相关部门第一时间介入处理。未来事件预测在现实生活中有重要的作用,可以做到预测预警,及时规避风险,创造出巨大的社会价值。

    8 事件图谱的研究展望

    目前,在研究者的共同努力下,对事件图谱的研究取得了不错的进展,越来越多的学者开始关注这一领域。对事件图谱的研究有助于人们进一步了解事件的发展历程以及事件背后的影响因素,可以更加容易地获取知识,提高生产效率。虽然事件图谱具有广阔的应用场景,但是现在对事件图谱相关技术的研究还不够深入,距离事件图谱的大规模应用还有很长的路要走,还面临很多新的挑战。未来事件图谱可向以下几个方向发展。

    (1)提升事件抽取与事件推理的精度

    目前事件抽取的准确率还不够高,而事件抽取是事件图谱构建的基础,只有从文本中准确地抽取出事件知识,才能推动后续技术的发展,因此需要进一步提升事件抽取的准确率。之后是事件推理,虽然研究者对其进行了众多有意义的探索,但是目前提出的方法也存在准确率低、限制条件多等问题。正因如此,需要继续进行广泛的研究,不断提高事件推理的精度,进行更加准确的事件预测。

    (2)自动构建事件抽取与事件关系推断数据集

    目前在事件抽取与事件关系推断的研究中,缺少数据集是一个严重的问题。数据集的匮乏制约了事件抽取与事件关系推断技术的发展。因此,未来应当关注数据集的构造方法,目标是实现自动化地构建高质量的数据集。自动构建高质量的事件抽取、事件关系推断数据集具有重要的意义,是未来技术发展的重要方向。

    (3)广泛开展事件时序、因果关系研究

    在事件图谱中,事件之间的时序关系和因果关系占据重要的地位,但是目前对其进行的研究还不够多。只有获取到准确的时序关系以及因果关系,才能推断出事件的发展历程,实现对事件的溯源。另外,事件预测的研究也离不开事件时序关系以及因果关系的支撑。因此,广泛开展事件时序、因果关系研究是十分必要的,也是十分有意义的,需要研究人员的共同努力。

    (4)研究事件间关系可信性的界定方法

    事件之间的关系是事件图谱的重要组成部分,反映了复杂事件背后的关联关系。在事件推理的过程中,必然要用到事件之间的关系。而事件之间的关系是否可信、如何界定事件间关系的可信性是个十分重要的问题,对事件推理技术的发展有重要的影响。因此事件间关系的可信性的界定方法值得研究者关注,需要在深入研究的基础上提出较为合理的界定方法。

    (5)深入研究复杂事件的推理

    目前事件推理研究的内容大多是简单事件,缺乏对复杂事件的研究。为了更好地利用事件图谱,对复杂事件的研究是不可或缺的。因为现实世界中的事件错综复杂,不再是单一的简单事件,所以未来需要开展对复杂事件的研究,挖掘复杂事件之间的关联。只有这样才能不断提高事件推理技术的水平,最终实现对事件的智能分析。

    9 结束语

    事件图谱中包含大量的事件知识,现代社会智能化水平的提升需要事件图谱的辅助。事件图谱中的事件涉及的维度较多,导致事件图谱的构建与推理具有一定的难度。基于事件图谱的重要性,研究人员已经开始对这一领域展开积极的探索,推动着该领域的快速发展。本文简单介绍了知识图谱和事件图谱,从事件图谱的构建、推理与应用方面对事件图谱的研究现状做了总结。之后,本文给出了事件图谱具体的应用场景,并展望了事件图谱的研究方向。

    目前,事件图谱是自然语言处理领域中的前沿研究方向。为了更好地发挥事件图谱的价值,利用事件图谱服务社会,需要更多研究者进行深入研究。希望本文可以为事件图谱相关的研究提供一些帮助。

    作者简介

    胡志磊(1996-),男,中国科学院计算技术研究所博士生,主要研究方向为知识图谱、信息抽取、自然语言处理。

    靳小龙(1976-),男,博士,中国科学院计算技术研究所研究员,主要研究方向为知识工程、知识计算、知识图谱。

    陈剑赟(1977-),女,博士,北京市信息技术研究所高级工程师,主要研究方向为智能信息处理、系统工程。

    黄冠利(1975-),女,博士,北京电子科技职业学院基础学院数学部副教授,主要研究方向为计算数学、智能信息处理。

    联系我们:

    Tel:010-81055448

           010-81055490

           010-81055534

    E-mail:bdr@bjxintong.com.cn 

    http://www.infocomm-journal.com/bdr

    http://www.j-bigdataresearch.com.cn/

    转载、合作:010-81055537

    大数据期刊

    《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,并被评为2018年、2019年国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。

    关注《大数据》期刊微信公众号,获取更多内容

    展开全文
  • 点击上方“3D视觉工坊”,选择“星标”干货第一时间送达本文介绍了CVPR 2020中关于事件相机(Event Camera)的相关研究。所列举的论文由CVPR录取论文中通过关键字搜索得到...

    点击上方“3D视觉工坊”,选择“星标”

    干货第一时间送达

    本文介绍了CVPR 2020中关于事件相机(Event Camera)的相关研究。所列举的论文由CVPR录取论文中通过关键字搜索得到,难免会有遗漏;同时由于涉及具体的方向较多,粗略学习可能理解不到位,难免产生错误。望阅读推送的朋友能够指出遗漏和错误。附原文打包下载,

    公众号后台回复「CVPR2020_Event_Camera」,即可获得网盘下载链接。

    1、降噪

    Event Probability Mask (EPM) and Event Denoising Convolutional Neural Network (EDnCNN) for Neuromorphic Cameras

    使用"Event probability mask (EPM)"表述一个事件点是否为噪声,是一个概率。同时提出了一个衡量事件相机降噪效果的指标:Relative Plausibility Measure of Denosing (RPMD);同时提出了一个降噪网络:Event Denosing CNN (EDnCNN);同时给出了一个降噪数据集:DVSNOISE20。

    2、去模糊与超分辨率

    2.1 Joint Filtering of Intensity Images and Neuromorphic Events for High-Resolution Noise-Robust Imaging

    文章提出了一个全新的优化框架,guided event filtering (GEF)。这个框架结合了普通相机和事件相机的数据,估计运动参数与导向滤波、超分辨率等任务,同时这个框架后续可以用于特征跟踪等任务。其基本思想是事件相机积累图的边缘,和传统图像的梯度,理论上是相同的。文中同样采用RPG提出的最大化对比度的方式进行运动参数估计,只是修正了目标函数,加入了灰度图像的梯度,减小了事件噪声的影响。

    2.2 Learning Event-Based Motion Deblurring

    文章提出了一个新型的端到端的去运动模糊的架构,在两大重要指标上达到了state-of-art;并提出一种方向性事件滤波方法,生成了更加清晰锐利的边缘信息。

    2.3 Learning to Super Resolve Intensity Images from Events
    由于事件相机的分辨率相对较低,文章提出了第一个直接有事件相机数据重建超分辨率图像的端到端的神经网络。

    2.4 EventSR: From Asynchronous Events to Image Reconstruction, Restoration, and Super-Resolution via End-to-End Adversarial Learning

    文章提出了一个网络,用于将低分辨率的事件相机图像,转为高分辨率的数据。整个网络具有三个阶段:重建、修复和超分辨率处理。重建部分采用单事件相机数据,通过网络得到图像数据,之后对重建后的图像进行修复、提升质量,在家通过超分辨率网络进行放大。网络在训练的过程中没有完整的图像作为ground truth,是一个无监督的学习过程。

    3. 光流与运动

    3.1 Single Image Optical Flow Estimation with an Event Camera

    文章通过一张图片和对应的事件相机数据,对图像中的场景进行光流估计。文章提出了基于事件的亮度一致性约束(event-based brightness constancy constraint)对光流和事件数据的关系进行编码,同时提出图像模糊模型,能够处理模糊图像下的光流估计问题。从结果上看,超过了现有的 PWC-Net, FlowNet, SelFlow 等方法。

    3.2 Learning Visual Motion Segmentation using Event Surfaces

    文章提出了一个图卷积神经网络,用事件数据流对运动物体进行分割。首先将一段事件数据流生成物体的点云图,之后获得速度、边界等参数,从而能够进行3D运动分割、运动物体跟踪等任务。

    4. 其他主题

    4.1 3D人体位姿捕捉

    EventCap: Monocular 3D Capture of High-Speed Human Motions using an Event Camera

    本文提出了EventCap——第一个使用单目事件相机捕捉人体3D运动的方法。方法输入完整的图像序列,和对应的事件相机的数据,通过异步混合运动捕捉阶段,再进行细化,得到完整的人体3D位姿。

    4.2 运动参数全局最优解

    Globally Optimal Contrast Maximisation for Event-based Motion Estimation

    RPG曾经提出了利用事件相机数据,估计相机运动参数的一个框架,这个框架采用最大化对比度或其他目标函数,来估计运动参数。然而这个框架中需要对运动参数有一个初步的估计,如果距离真值较远,只能获得局部最优解,而不是全局最优解。本文提出了计算全局最优解的方法,采用了branch-and-bound(BnB)思想。文章从数学角度推算了方法的边界。这种方法的计算效率远低于直接优化获得局部最优解,但得到的质量还是不错。

    4.3 视频流转Events数据

    Video to Events: Recycling Video Datasets for Event Cameras

    RPG提出的一个将视频转成事件相机输出的一个网络,网络可以将一段儿视频转成对应的DVS输出,代码已开源:https://github.com/uzh-rpg/rpg_vid2e。通过该网络,可以将现有的大量视频数据集,转成对应的event数据,更好地方便learning。可以看出,RPG在learning的路上越走越远,已经不满足于模拟器、仿真器等这些相对低效的手段获取数据,而是直接从现有数据集转化。

    本文仅做学术分享,如有侵权,请联系删文。

    推荐阅读:

    重磅!3DCVer-学术论文写作投稿 交流群已成立

    扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

    同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

    ▲长按加微信群或投稿

    ▲长按关注公众号

    3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近1000+星球成员为创造更好的AI世界共同进步,知识星球入口:

    学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

     圈里有高质量教程资料、可答疑解惑、助你高效解决问题

    展开全文
  • ROS教程二-------在自己键盘上控制小海龟移动 1. 首先启动ros。$ roscore2.启动小海龟。$ rosrun turtlesim turtlesim_node 3.用电脑的左右光标键控制小海龟移动。$rosrun turtlesim turtle_teleop_key 4....
  • 时间,空间和实物(事件)三个要素构成一个场景。改变其中任何一个要素都会进入到一个新的场景,同时另外两个要素也会随之发生改变。从产品的角度来看,三个要素的改变都可以让一个产品从一个现有的场景进入到另一个...
  • FluentMediator :shuffle_tracks_button: 我们不需要您将依赖项添加... 您在这里可以很有创造力! 它支持异步方法和可取消标记参数,您可以追加多个步骤,选择一个以返回消息。 一个例子: services . AddFluentMedia
  • 在axure8中,触发事件和自定义事件可能是初学者不太了解的东东。下面就我个人对这两个动作(action)的理解,下面对这两个放在“动作”面板中的两个“特殊”事件,做一个阐述。如图二者的相同点有以下两点:1. 二者都...
  • [基础]Vue绑定事件详讲-事件修饰符通过修饰符解决...在JavaScript中冒泡事件是最长处理的事件,先写一段代码,手动创造一个冒泡事件。 新建一个文件Demo20.html 修改模板 template 部分,在最外层增加一个 <div&
  • jQuery 事件

    千次阅读 2016-07-16 22:53:40
    一、事件模型  jQuery 事件方法会触发匹配元素的事件,或将函数绑定到所有匹配元素的某个事件。触发实例:  $("button#demo").click()  上面的例子将触发 id="demo" 的 button 元素的 click 事件。  绑定实例: ...
  • ACE事件类型及模板

    千次阅读 2019-01-02 15:02:25
    事件类型及子类型 每个事件类型和子类型都有自己的一组潜在参与者角色,用于在其范例范围内出现的实体。在某些情况下,潜在事件是否可标记的问题将取决于是否存在填充某些角色的实体。(对于代词和明确描述的名词回...
  • *比如鼠标点击按钮的过程,首先鼠标按下,就会产生一个鼠标左键按下事件(这个可以看成是一个外部鼠标中断事件,由电脑硬件外部中断产生的或者以勾子函数的形式形成的,即事件也可以自己创造了),而这个事件是一个...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 103,698
精华内容 41,479
关键字:

创造的事件