精华内容
下载资源
问答
  • 关系抽取事件抽取

    2021-03-11 12:47:53
    关系抽取 概念 从文本中识别出两个实体(或多个实体)之间存在的事实上的关系 意义 搜索引擎发现和关联知识的重要渠道 知识库构建与知识关联的基础性手段 支持问答系统、推荐系统等应用的有力工具 形式化表达 二元...

    关系抽取

    概念

    从文本中识别出两个实体(或多个实体)之间存在的事实上的关系

    意义

    • 搜索引擎发现和关联知识的重要渠道
    • 知识库构建与知识关联的基础性手段
    • 支持问答系统、推荐系统等应用的有力工具

    形式化表达

    二元组<subject, objects> 适合特定领域关系抽取
    三元组<subject, predicate, object> 适合多类型关系抽取
    多元组<subject, predicate, object, time>

    抽取方法

    规则
    模式
    机器学习



    事件抽取

    概念

    事件是信息的一种表现形式,其定义为特定的人、物,在特定时间和特定地
    点相互作用所产生的客观事实.

    基本要素

    事件触发词:表示事件发生的核心词,多为动词或名词
    事件类型:与触发词相对应,往往可以通过触发词分类加以识别
    事件元素:事件的参与者,主要由实体、时间等组成.
    事件元素角色:事件元素在事件中充当的角色.

    展开全文
  • 参考:读书笔记:关系抽取事件抽取 关系抽取 定义:自动识别实体之间具有的某种语义关系。根据参与实体的多少可以分为二元关系抽取(两个实体)和多元关系抽取(三个及以上实体)。 通过关注两个实体间的语义...

    目录

    实体抽取(实体命名,NER)

    关系抽取

    关系抽取方法

    事件抽取及方法


    实体抽取(实体命名,NER)

    参考:实体关系抽取一

    参考:HMM、CRF、LSTM+CRF

    参考:读书笔记:关系抽取和事件抽取

    关系抽取

    定义:自动识别实体之间具有的某种语义关系。根据参与实体的多少可以分为二元关系抽取(两个实体)和多元关系抽取(三个及以上实体)。

    通过关注两个实体间的语义关系,可以得到(arg1, relation, arg2)三元组,其中arg1和arg2表示两个实体,relation表示实体间的语义关系。(比如通过Hanlp分析工具可以得到句子中各词之间的语义关系)

    抽取数据源分类:

    1. 面向结构化文本的关系抽取:包括表格文档、XML文档、数据库数据等

    2. 面向非结构化文本的关系抽取:纯文本

    3. 面向半结构化文本的关系抽取:介于结构化和非结构化之间

    抽取范围分类:

    1. 句子级关系抽取:从一个句子中判别两个实体间是何种语义关系
    2. 语料(篇章)级关系抽取:不限定两个目标实体所出现的上下文

    抽取领域分类:

    1. 限定域关系抽取:在一个或者多个限定的领域内对实体间的语义关系进行抽取,限定关系的类别,可看成是一个文本分类任务
    2. 开放域关系抽取:不限定关系的类别

    关系抽取方法

    限定域关系抽取方法:

    • 基于模板的关系抽取方法:通过人工编辑或者学习得到的模板对文本中的实体关系进行抽取和判别,受限于模板的质量和覆盖度,可扩张性不强。(自己做的法院文书属于基于模板的抽取)

    • 基于机器学习的关系抽取方法:将关系抽取看成是一个分类问题

    其中,基于机器学习的关系抽取方法又可分为 有监督 和 弱监督。

    有监督的关系抽取方法:

    • 基于特征工程的方法:需要显示地将关系实例转换成分类器可以接受的特征向量

    • 基于核函数的方法:直接以结构树为处理对象,在计算关系之间距离的时候不再使用特征向量的内积而是用核函数

    • 基于神经网络的方法:直接从输入的文本中自动学习有效的特征表示,端到端

    弱监督的关系抽取方法:不需要人工标注大量数据。

    距离监督:用开放知识图谱自动标注训练样本,不需要人工逐一标注,属弱监督关系抽取的一种。

    开放域关系抽取方法:

    不需要预先定义关系类别,使用实体对上下文中的一些词语来描述实体之间的关系。

    事件抽取及方法

    定义:从描述事件信息的文本中抽取出用户感兴趣的事件并以结构化的形式呈现出来。

    步骤:首先识别出事件及其类型,其次要识别出事件所涉及的元素(一般是实体),最后需要确定每个元素在事件中所扮演的角色。

    事件抽取相关概念:

    • 事件指称:对一个客观发生的具体事件进行的自然语言形式的描述,通常是一个句子或句群
    • 事件触发词:指一个事件指称中最能代表事件发生的词,是决定事件类别的重要特征,一般是动词或名词
    • 事件元素:事件中的参与者,主要由实体、时间和属性值组成
    • 元素角色:事件元素在相应的事件中扮演什么角色
    • 事件类别:事件元素和触发词决定了事件的类别(类别又定义了若干子类别)

    限定域事件抽取:在进行抽取之前,预先定义好目标事件的类型及每种类型的具体结构(包含哪些具体的事件元素),通常会给出一定数量的标注数据。

    限定域事件抽取方法:

    • 基于模式匹配的方法:对某种类型事件的识别和抽取是在一些模式的指导下进行的(步骤:模式获取、模式匹配)
      • 有监督的事件模式匹配:模式的获取完全基于人工标注的语料
      • 弱监督的事件模式匹配:不需要对语料进行完全标注,只需要人工对语料进行一定的预分类或者制定少量种子模式
    • 基于机器学习的方法
      • 有监督事件抽取方法:将事件抽取建模成一个多分类问题
        • 基于特征工程的方法:需要显示地将事件实例转换成分类器可以接受的特征向量,研究重点在于怎样提取具有区分性的特征
        • 基于神经网络的方法:自动从文本中获取特征进而完成事件抽取,避免使用传统自然语言处理工具带来的误差累积问题
      • 弱监督事件抽取方法:不需要人工大量标注样本,但需要给出具有规范语义标签(事件类别、角色名称等)的标注训练数据
        • 基于Bootstrapping的事件抽取:利用少部分人工标注的数据自动生成大规模标注数据(高置信度抽取结果会作为训练样本,然后再训练,不断迭代)
        • 基于Distant Supervison的事件抽取:完全自动生成事件标注样本,利用结构化的事件知识库直接在非结构化文本中回标训练样本

    开放域事件抽取:在进行事件识别之前,可能的事件类型以及事件的结构都是未知的,因此该任务通常没有标注数据,主要基于无监督的方法和分布假设理论。

    分布假设理论:如果候选事件触发词或者候选事件元素具有相似的语境,那么这些候选事件触发词倾向于触发相同类型的事件,相应的候选事件元素倾向于扮演相同的事件元素。

    开放域事件抽取方法:

    • 基于内容特征的事件抽取方法
    • 基于异常检测的事件抽取方法

    事件关系抽取,以事件为基本语义单元,实现事件逻辑关系的深层检测和抽取,包括:

    • 事件共指关系抽取
    • 事件因果关系抽取
    • 子事件关系抽取
    • 事件时序关系抽取

    总结:

    组织和构建同时包含实体、实体关系、事件、事件关系的事件知识图谱得到了越来越多的关注。

    展开全文
  • 读完赵军主编的《知识图谱》第六章和第七章,对关系抽取事件抽取简单做一下笔记。 关系抽取 定义:自动识别实体之间具有的某种语义关系。根据参与实体的多少可以分为二元关系抽取(两个实体)和多元关系抽取...

    读完赵军主编的《知识图谱》第六章和第七章,对关系抽取和事件抽取简单做一下笔记。

     

    关系抽取

     

    定义:自动识别实体之间具有的某种语义关系。根据参与实体的多少可以分为二元关系抽取(两个实体)和多元关系抽取(三个及以上实体)。

     

    通过关注两个实体间的语义关系,可以得到(arg1, relation, arg2)三元组,其中arg1和arg2表示两个实体,relation表示实体间的语义关系。

     

    根据处理数据源的不同,关系抽取可以分为以下三种:

    • 面向结构化文本的关系抽取:包括表格文档、XML文档、数据库数据等
    • 面向非结构化文本的关系抽取:纯文本
    • 面向半结构化文本的关系抽取:介于结构化和非结构化之间

    根据抽取文本的范围不同,关系抽取可以分为以下两种:

    • 句子级关系抽取:从一个句子中判别两个实体间是何种语义关系
    • 语料(篇章)级关系抽取:不限定两个目标实体所出现的上下文

    根据所抽取领域的划分,关系抽取又可以分为以下两种:

    • 限定域关系抽取:在一个或者多个限定的领域内对实体间的语义关系进行抽取,限定关系的类别,可看成是一个文本分类任务
    • 开放域关系抽取:不限定关系的类别

     

    限定域关系抽取方法:

    • 基于模板的关系抽取方法:通过人工编辑或者学习得到的模板对文本中的实体关系进行抽取和判别,受限于模板的质量和覆盖度,可扩张性不强
    • 基于机器学习的关系抽取方法:将关系抽取看成是一个分类问题

    其中基于机器学习的关系抽取方法又可分为 有监督 和 弱监督。

    有监督的关系抽取方法:

    • 基于特征工程的方法:需要显示地将关系实例转换成分类器可以接受的特征向量
    • 基于核函数的方法:直接以结构树为处理对象,在计算关系之间距离的时候不再使用特征向量的内积而是用核函数
    • 基于神经网络的方法:直接从输入的文本中自动学习有效的特征表示,端到端

    弱监督的关系抽取方法:不需要人工标注大量数据。

    距离监督:用开放知识图谱自动标注训练样本,不需要人工逐一标注,属弱监督关系抽取的一种。

     

    开放域关系抽取方法:

    不需要预先定义关系类别,使用实体对上下文中的一些词语来描述实体之间的关系。

     

    总结:

    限定域关系抽取是目前研究的主流方向。

    传统的基于模板的关系抽取方法可扩展性差,基于机器学习的关系抽取方法是目前研究的热点。

    基于有监督学习的关系抽取需要人工标注大量训练数据,耗时费力,基于弱监督学习的关系抽取得到了越来越多的关注。

     

    事件抽取

     

    定义:从描述事件信息的文本中抽取出用户感兴趣的事件并以结构化的形式呈现出来。

    步骤:首先识别出事件及其类型,其次要识别出事件所涉及的元素(一般是实体),最后需要确定每个元素在事件中所扮演的角色。

     

    事件抽取相关概念:

    • 事件指称:对一个客观发生的具体事件进行的自然语言形式的描述,通常是一个句子或句群
    • 事件触发词:指一个事件指称中最能代表事件发生的词,是决定事件类别的重要特征,一般是动词或名词
    • 事件元素:事件中的参与者,主要由实体、时间和属性值组成
    • 元素角色:事件元素在相应的事件中扮演什么角色
    • 事件类别:事件元素和触发词决定了事件的类别(类别又定义了若干子类别)

     

    限定域事件抽取:在进行抽取之前,预先定义好目标事件的类型及每种类型的具体结构(包含哪些具体的事件元素),通常会给出一定数量的标注数据。

    限定域事件抽取方法:

    • 基于模式匹配的方法:对某种类型事件的识别和抽取是在一些模式的指导下进行的(步骤:模式获取、模式匹配)
      • 有监督的事件模式匹配:模式的获取完全基于人工标注的语料
      • 弱监督的事件模式匹配:不需要对语料进行完全标注,只需要人工对语料进行一定的预分类或者制定少量种子模式
    • 基于机器学习的方法
      • 有监督事件抽取方法:将事件抽取建模成一个多分类问题
        • 基于特征工程的方法:需要显示地将事件实例转换成分类器可以接受的特征向量,研究重点在于怎样提取具有区分性的特征
        • 基于神经网络的方法:自动从文本中获取特征进而完成事件抽取,避免使用传统自然语言处理工具带来的误差累积问题
      • 弱监督事件抽取方法:不需要人工大量标注样本,但需要给出具有规范语义标签(事件类别、角色名称等)的标注训练数据
        • 基于Bootstrapping的事件抽取:利用少部分人工标注的数据自动生成大规模标注数据(高置信度抽取结果会作为训练样本,然后再训练,不断迭代)
        • 基于Distant Supervison的事件抽取:完全自动生成事件标注样本,利用结构化的事件知识库直接在非结构化文本中回标训练样本

     

    开放域事件抽取:在进行事件识别之前,可能的事件类型以及事件的结构都是未知的,因此该任务通常没有标注数据,主要基于无监督的方法和分布假设理论。

    分布假设理论:如果候选事件触发词或者候选事件元素具有相似的语境,那么这些候选事件触发词倾向于触发相同类型的事件,相应的候选事件元素倾向于扮演相同的事件元素。

    开放域事件抽取方法:

    • 基于内容特征的事件抽取方法
    • 基于异常检测的事件抽取方法

     

    事件关系抽取,以事件为基本语义单元,实现事件逻辑关系的深层检测和抽取,包括:

    • 事件共指关系抽取
    • 事件因果关系抽取
    • 子事件关系抽取
    • 事件时序关系抽取

     

    总结:

    组织和构建同时包含实体、实体关系、事件、事件关系的事件知识图谱得到了越来越多的关注。

    转载于:https://www.cnblogs.com/cyandn/p/10915394.html

    展开全文
  • 机器语言理解与交互是人工智能的基本挑战,五大任务助力 (机器阅读理解、面向推荐的对话、语义解析、关系抽取事件抽取) 知识是机器语言理解与交互的重要基础 关系抽取是知识获取的重要方式 知识图谱 2. 评测...

    关系抽取

    1. 评测背景:知识是机器语言理解与交互的重要基础

    • 机器语言理解与交互是人工智能的基本挑战,五大任务助力 (机器阅读理解、面向推荐的对话、语义解析、关系抽取、事件抽取)
    • 知识是机器语言理解与交互的重要基础
    • 关系抽取是知识获取的重要方式
      知识图谱

    2. 评测任务:schema约束下的SPO抽取任务

    任务描述:

    • 抽取输入句子中所有符合schema约束的SPO三元组
    • 输入:预定义schema& 句子
    • 输出:SPO三元组
      任务特色:挑战关系抽取模型较难解决的问题
    • 重叠关系抽取问题
    • 复杂关系抽取问题

    3. 评测数据集 DuIE2.0 面向真实业务场景的schema

    数据生成

    • DuIE1.0 根据query log 统计筛选
    • 知识库:百度知识图谱数据
    • 语料:百度百科+百度信息流
      候选生成
    • 基础候选:SPO粒度远监督
    • 候选扩召:schema粒度远监督+并列结构pattern
      众测标注:
    • 训练集&开发集 :单副本判断题标注+单论review
    • 测试集:双副本填空题标注+两轮review
    • DuIE2.0,48个关系类型,5个复杂关系类型

    4. 2019基线系统:基于BI-LSTM的pipeline模型

    模型结构

    • Pipeline结构:先关系分类,在进行s/o 标注
    • Embedding层:词语,词性,位置
    • 编码层:Bi-LSTM
    • 关系分类输出层:多标签sigmoid
      存在问题
    • Pipeline没有利用关系分类,S/O 标注两个子任务之间的联系,且存在错误传递,效果不易优化
    • 采用Bi-LSTM作为编码器,不易并行处理,训练/预测效率低,且特征抽取效果不如预训练模型
    • s/o标注子任务采用简单的BIO 标注,不易直接处理复杂关系的问题。

    5。2020的基线系统:基于ERNIE的E2E标注模型

    • 一步解决关系重叠关系的抽取问题
    • BI-LSTM编码器->ERNIE预训练模型
    • 简单BIO标注策略->新型BIO标注策略

    事件抽取

    事件:在特定时空下(时间,空间),由一个或多个角色(事件主体)主题开展的一系列活动

    事件抽取Event Extraction,EE :

    事件要素的结构化抽取,具体的,是从非结构化的自然语言文本中识别事件及其类型,抽取其事件的元素的技术
    事件抽取常用Pipeline

    • 1⃣️触发词识别
    • 2⃣️事件类型识别
    • 3⃣️论元抽取
      句子:2017年10月31日,宋仲基,宋慧乔在首尔举行婚礼
      事件类型:结婚 触发词:举行婚礼 时间:地点:男主:女主:
      研究价值:
    • 更具研究价值,更加复杂的应用场景
    • 应用:信息分发,舆情分析,金融事件分析,对话系统

    事件抽取的主流方法:

    • Pipeline-based (trigger+arg)
    • Joint-Based (trigger+arg)同时联合出发词和论元,相互验证

    事件抽取的评测任务:

    任务描述:通过给定目标事件类型和角色类型集合句子,识别句中的目标事件,并根据论元角色集合抽取事件所对应的论元

    • 输入:包含事件信息的一个或多个连续的句子
    • 输出: 属于预先定义的事件类型,类型的论元结果
      数据集特点:
    • 一个句子包括多触发词
    • 多值论元角色
    • 面向真实应用场景构建
      事件schema 定义
    • 65个事件类型+121论元角色
      评估方法
    • F1=(2PR)/(P+R)

    Baseline 模型

    • 基于序列标注的触发词抽取模型
    • 基于序列标注论元抽取模型
      [1]https://mp.weixin.qq.com/s?__biz=MzUxNzk5MTU3OQ==&mid=100002954&idx=1&sn=6ccf514c3649b58d7bd96eb1de29d1e6&scene=19#wechat_redirect
    展开全文
  • 1.关系抽取之远程监督算法综述 该文章介绍了PCNN、基于远程监督的关系抽取、多实例学习等。关系抽取之远程监督算法
  • 事件抽取是理解语言的一个重要基础,在金融领域尤其有用。在应用NLP技术前,很多金融从业人员真的是靠人盯新闻、公告。你想想,从那么长的一篇新闻或公告中找出一些风险信号或营销机会真的是费时费力。借助NLP技术从...
  • 小编在此整理出了一份事件抽取、关系抽取、命名实体识别、Few-Shot以及在模型中使用GCN和其他一些感兴趣相关论文的列表,希望可以为需要的小伙伴提供便利吖~ (深夜整理,就不放链接了/(ㄒoㄒ)/~~) 事件抽取 Cross-...
  • 事件抽取

    千次阅读 2020-05-11 23:41:45
    命名实体识别、关系抽取事件抽取是NLP中信息抽取的主要任务。 事件抽取是把含有事件信息的非结构化文本以结构化的形式呈现出来,在自动文摘、自动问答、信息检索等领域有着广泛的应用。近些年来 ,事件抽取一直吸引...
  • 分不清事件抽取和命名实体抽取,二者有什么关系吗?或者他们之间有什么区别?
  • 重磅!ACL2020 官方放榜啦!传送门: https://acl2020.org/program/accepted/小编在此整理出了一份事件抽取、关系抽取、命名实体识别、Few-Sho...
  • 事件抽取和金融事件图谱构建方向的一些探索,主要包括特征表示、训练数据生成和扩展、多事件协同抽取、篇章级事件抽取、事件关系抽取这几个重要的研究方向,并附上相关的9篇论文,非常经典,值得细品。
  • 小编整理了其中有关事件抽取、关系抽取、NER、以及与NLP问题相关的Few-Shot和Zero-Shot 相关论文题目,希望能对大家的研究有一点帮助嗷! 事件抽取 What the Role Is vs. What Plays the Role: Semi-Supervised ...
  • 事件抽取 主会 A Method for Building a Commonsense Inference Dataset based on Basic Events Affective Event Classification with Discourse-enhanced Self-training Biomedical Event Extraction as ...
  • 事件抽取 Hierarchical Chinese Legal event extraction via Pedal Attention Mechanism Is Killed More Significant than Fled? A Contextual Model for Salient Event Detection Joint Event Extraction ...
  • 知识抽取-事件抽取

    千次阅读 2020-01-08 11:29:10
    文章目录事件抽取事件识别和抽取事件检测和追踪事件识别和抽取理解基于模式匹配的方法基于弱监督基于统计 - 传统机器学习Pipeline ...与关系抽取相比,事件抽取同样需要从文本中抽取 谓语(predicat...
  • Accepted Papers: Main Conference​coling2020.org和以往一下,小编对他们做了如下分类整理~事件抽取Hierarchical Chinese Legal event extraction via Pedal Attention MechanismIs Killed More Significant than ...
  • 实体关系抽取入门

    千次阅读 2019-03-13 16:52:39
    信息抽取的主要任务有:命名实体识别、实体关系抽取事件抽取、实体消歧。关系抽取(Relation Extracion,RE)是其中的重要子任务之一,主要目的是从文本中识别实体并抽取实体之间的语义关系。实体关系抽取解决了原始...
  • 人工智能-自然语言处理(NLP)-应用场景:知识抽取/信息抽取(Information Extraction)
  • 信息抽取主要包括3项子任务:实体抽取、关系抽取事件抽取,而关系抽取是信息抽取领域的核心任务和重要环节.实体关系抽取的主要目标是从自然语言文本中识别并判定实体对之间存在的特定关系,这为智能检索、语义分析...
  • 事件事件抽取与事理图谱

    万次阅读 2019-01-04 23:06:04
    事件事件抽取与事理图谱 &amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;人类社会是一个静态事物进行动态活动所创造形成的世界,人类的命题记忆是以“事件”为存储单位的,存储的是组成事件的概念及其...
  • 一、 关系抽取综述 ... 信息抽取是自然语言处理中非常重要的一块内容,包括实体抽取(命名实体识别,Named Entity Recognition)、关系抽取(Relation Extraction)和事件抽取(Event Extraction)。  ...
  • 中文复合事件抽取

    千次阅读 2019-03-11 19:05:47
    chinese compound event extraction,中文复合事件抽取,包括条件事件、因果事件、顺承事件、反转事件事件抽取,并形成事理图谱。 关于项目 目前,知识图谱在学术界如火如荼地进行,但受限于知识图谱各个环节中的...
  • 本联合模型不仅避免了基于流水线模型进行事件抽取产生的误差传播问题和要素重叠问题,而且捕捉了事件触发词和事件要素、要素角色之间的依赖关系。本研究提出的方法在国际评测任务ACE2005中文事件抽取数据集上进行...
  • 信息抽取技术:实体抽取、消歧、关系抽取事件抽取 事件抽取:现有kg主要以实体为核心,缺少事件知识 事件和事物是n对n关系,人们以事件为单位来认知世界 事件抽取与事件图谱的意义:丰富现有的知识图谱,支撑其他...
  • 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,...人类社会是一个静态事物进行动态活动所创造形成的世界,人类的命题记忆是以“事件”为存储单位的,存储的是组成事件的概念及其之间的关系以及事件及...
  • 事件抽取依赖实体抽取和关系抽取 相较于实体抽取和关系抽取事件抽取难度更大 实体抽取:1992年10月3日,奥巴马,米歇尔,三一联合基督教堂 关系抽取:夫妻关系:奥巴马,米歇尔 事件抽取:事件类型:结婚事件,...

空空如也

空空如也

1 2 3 4 5 ... 16
收藏数 301
精华内容 120
关键字:

事件关系抽取