精华内容
下载资源
问答
  • 而解析则描述了回答这样的一个问题的过程:两条不同记录是否指向了同一个真实实体? 尽管实体解析的定义描述的是两条记录之间的关系,但事实上,这个定义也可以被延伸到一个更大的记录集合上,相应的,该过程的...

    实体解析 (EntityResolution)

    实体解析(ER)是一种用于判断两条记录是否指向同一事物的过程。实体这个术语描述了过程的目标是真实世界的事物,比如某个人,地点或者物品。 而解析则描述了回答这样的一个问题的过程:两条不同记录是否指向了同一个真实实体?

    尽管实体解析的定义描述的是两条记录之间的关系,但事实上,这个定义也可以被延伸到一个更大的记录集合上,相应的,该过程的输出则聚合了指向同一实体的所有记录的子集/簇。在这样的上下文中,ER的定义也可以解释为:“识别并整合所有定义同一真实世界实体的记录的过程”(Benjelloun,Garcia-Molina, Menestrina, et al., 2009)。

    在虚拟的IT世界中,实体被表现成一系列实体特征,称之为属性。 而所有属性的值的组合则提供了关于该特定实体的信息。其中一部分的特征,它们的值的组合将唯一确定某个实体,这样的属性集被称为身份记录 作为现实中的个人,常见的属性有姓名,家庭住址,生日等。而身份记录属性则是那些常常被用作识别该人的数据, 比如指纹,驾照以及出身证明。再举一个商品的例子,它的属性则通常包括型号,尺寸,生产厂家,或者通用产品码,后者也正是该产品的身份属性。

    引用, 则是指某个特定实体的属性集合(译者:比如数据库中的某一行记录,便是某个特定实体的一个引用,它包含了该实体的一个属性子集。可以将该书中的引用理解为记录)。当两个不同引用指向了同一实体,便被称为共通引用( Chen,Kalashnikov, Mehtra, 2009)或者是一致引用(Benjelloun,et al., 2009)。 为了方便后面的描述,我们在本书中将指向同一实体的不同引用统称为等价引用

    引用属性的完整性,准确性,时效性,可信度,一致性,可行性以及许多其他方面都对实体解析的过程以及结果造成影响。这也是实体解析与另一相关领域,信息质量(IQ)密不可分的一个重要原因。

    在接下来的讨论中,我们还会做出一个重要的假设:唯一引用假设。即任何一个引用,在真实世界里有且只有一个对应实体。因为在实际中,常常会出现这样的情况: 某一个引用所指向的实体有歧义。举例来说,销售人员在写订单时,他已经有了预想要购买的产品,然而在填写关于产品需求的描述时,可能信息是不完全的。这导致采购人员在购买产品时无法断定应该购买哪件产品。

    展开全文
  • 就数据库而言,实体往往指某类事物的集合。...一对一(如一个学生对应一个档案,一个档案对应一个学生); 一对多,多对一; 多对多; 数据库中一对一的实现方式: (1)唯一外键方式:A和B任...

    就数据库而言,实体往往指某类事物的集合。 把每一类数据对象的个体称为实体。
    数据库中:E-R图也称实体-联系图(Entity Relationship Diagram),提供了表示实体类型、属性和联系的方法,用来描述现实世界的概念模型。

    实体之间的关系有
    一对一;
    一对多,多对一;
    多对多;
    数据库中一对一的实现方式:如一个学生对应一个档案,一个档案对应一个学生。学生表为A表,档案表为B表)
    (1)唯一外键方式:在A和B任意一表中添加唯一外键(注意是添加完外键后,再点唯一键,进行设置)具体方式点此
    (2)主键关联方式:当A和B的主键相同时,我们就认为是一组数据。(注意是“我们就认为”,数据库中并没有提供主键关联的约束方式。)
    (3)中间关系表:创建一张新表作为中间关系表,两个列分别记录A和B,并且每一列的取值中,值均不能重复(即将这两列均设置为唯一外键,注意:将这两列“既设置为主键,又设置为外键”的方式不能实现该功能,因为可能会出现一列相等而另一列不相等的情况)。

    数据库中多对一、一对多的实现方式:(如一个班级对应多个学生)
    (1)在多的一方添加外键:在学生表中添加一列,记录该学生是哪一个班的,该列设置成外键,取值为班级表的主键。
    (2)建立中间表:创建一个新表,该表至少有两列,分别记录学生和班级。学生列要设置成为“外键+唯一键”,以防有两行数据的学生列的值一样(防止一个学生有两个班级的情况出现)。班级列不必设置成唯一键,设置成为外键即可,因为不同学生可以有一样的班级。

    数据库中多对多实现方式:(学生和课程:一个学生可以选多门课,一门课可以由多个学生选)
    实现方式就一种!!!建立中间关系表:新建一张表,一列记录学生,一列记录课程。两列均为外键,一列取值为学生表中的唯一标识,一列取值为课程中的唯一标识。两列不用设置成为唯一键,因为每一列中均可有重复,但不能有两行数据在两列上完全重复。所以将两列均设置成为主键+外键(即联合主键+外键)

    展开全文
  • 实体

    千次阅读 2019-04-06 20:48:00
    cook:实体集,厨师(假设每厨师都有编号,可以认为是某个饭店内部的厨师集) food :实体集,食物。有 名称name 和 第次被制作的时间time 两属性 cook_food : 联系集,哪个厨师做了哪个食物 弱实体集weak ...

    一张图讲解 弱实体集:

    图的含义:

    cook:实体集,厨师(假设每个厨师都有编号,可以认为是某个饭店内部的厨师集)
    food :实体集,食物。有 名称name 和 第一次被制作的时间time 两个属性
    cook_food : 联系集,哪个厨师做了哪个食物

    弱实体集weak entity set

    定义:

    没有足够的属性以形成主码的实体集
    解释:图中的food就是弱实体集,名称和第一次被制作的时间都不足以唯一确定一个元组,即没有主码。因为食物名称可能重合,制作时间也可能相同。

    相对地,有主码的实体集称为强实体集strong entity set,如cook,主码为cook_id。

    弱实体集与强实体集关联才有意义
    这个强实体集被称为标识identifying属主实体集owner entity set
    将弱实体集与标识实体集相联的联系称为标识性联系identifying relationship,在E-R图中用 双菱形 表示
    我们称弱实体集存在依赖于标识实体集,标识实体集拥有弱实体集。

    例如:图中cook_food为标识性联系
    cook是标识实体集
    food存在依赖于cook,cook拥有food。

    分辨符discriminator(部分码)

    弱实体集没有可以充当主码的属性,它用分辨符来区分属性集合。
    在实体集中用 虚下划线 标识(图中蓝色虚线)

    food的分辨符是由 name、time 组成。

    为什么可以区别:对于一个厨师来说,时间和名称唯一标识了一个食物
    (请不要钻牛角尖说同时做两个名字一样的菜,没意思)

    弱实体集的主码

    标识实体集的主码 + 分辨符
    food的主码为{ cook_id, name , time }

    展开全文
  • 实体消歧

    千次阅读 2019-04-19 20:38:20
    一般来说,由于自然语言存在较多的一词多义(相同的实体指称不同的上下文中可以指向知识库中的不同实体)或多词一义(知识库中的同一个实体在文本中有不同的指称)的现象,实体识别的结果很难直接加入到知识图谱...
    • 研究背景概述

      • 一般来说,由于自然语言存在较多的一词多义(相同的实体指称在不同的上下文中可以指向知识库中的不同实体)或多词一义(知识库中的同一个实体在文本中有不同的指称)的现象,实体识别的结果很难直接加入到知识图谱当中。必须要对实体识别的结果进行消歧,才能带到无歧义的实体信息。
      • 应用领域
        • 知识图谱构建(实体识别)、信息检索、问答系统等
    • 任务分类

      • 一般来说,实体消歧系统可以按照目标实体(知识库)是否给定分为基于聚类的消歧系统和基于实体链接的消歧系统;也可以按照是否为结构化文本进行划分。
      • 按是否给定知识库分类(非结构化文本)
        • 基于聚类的消歧系统
          • 定义:目标实体列表(知识库)未给定,以聚类的方式对实体指称进行消歧。指向同一个目标实体的指称被聚类一个簇。
          • 消歧过程
            • 对于每一个实体指称,抽取特征(上下文词、实体、概念、类别),形成特征向量
            • 计算实体指称间的相似度
            • 采用聚类算法对实体指称项聚类,使得每个簇都指向同一个目标实体
          • 按照实体指称项相似度计算方式,可以将消歧系统分为三类
            • 基于表层特征的相似度计算
              • 词袋子模型,将文本的每个术语表示向量形式,如TF-IDF等,然后使用余弦等计算相似度
              • 缺点:没有考虑上下文之间的语义关联
            • 基于扩展特征的相似度计算
              • 使用知识资源扩展实体指称项的特征表示,例如wikipedia的infobox等。这些扩展的属性信息还可以提供更准确的实体指称项信息,例如邮箱,电话等。
            • 基于社会化网络的相似度计算
              • 基于上下文中的不同实体指称构建语义关系,通常是基于图的方法,能够充分利用结构化的语义关系只是。
              • 缺点是不能充分的利用上下文中的其他信息
        • 基于实体链接的实体消歧系统
      • 按文本结构
        • 区别在于实体指称项的文本表示
        • 半结构化文本消歧
          • 有语境上下文辅助消歧
        • 结构化文本消歧
          • 缺少上下文,主要依赖于字符串比较和实体关系信息完成消歧
          • 现在主要有利用实体流行度和上下文实体联合消歧的方法、网页检索。
    • 评测

      • WePS评测
        • 针对基于聚类的命名实体识别进行评测
        • 评价指标
          • 纯净度
            • $ Purity=\sum_i \frac{|C_i|}n \max_jPrecision(C_i,L_j) $
              • 其中,单个聚类的准确率定义如下:
                • $ Precision(C_i,L_j)=\frac{|C_i \cap L_j|}{C_i} $
              • CiC_i表示第 i 个簇,LjL_j指第 j 个准确的聚类结果,公式2表示CiC_i划分到最可能的聚类结果下时,链接成功的实体指称所占的比例。
          • 倒纯净度
          • F值
      • TAC KBP 评测
        • 针对基于实体链接的实体的方法进行评测
        • 要求对于知识库中没有的实体需要进行聚类,将同一实体的不同指称项聚类到一起
        • 评测指标
          • micro-average accuracy
            • Micro=qQσ[L(q),C(q)]QMicro=\frac {\sum_{q\in Q} \sigma[L(q),C(q)]}{|Q|}
            • 其中,Q是所有查询的集合,L(q)L(q)是实体链接系统基于查询q给出的目标实体ID,C(q)C(q)是查询q的准确目标实体,σ\sigma函数判断两个ID是否一致,是则为1,否为0。
    • 参考文献

      • 赵军 知识图谱
    展开全文
  • Java实体类(entity)作用

    万次阅读 多人点赞 2018-05-17 17:17:10
    对java实体类的众多理解:A ....把相关信息一个实体类封装后,我们程序中可以把实体类作为参数传递,更加方便。C. 说白了就是为了让程序员对数据库操作的时候不用写SQL语句 D. 就是一个数据库生成一个...
  • 数据库设计--实体关系图(ERD)

    万次阅读 多人点赞 2015-08-01 15:15:17
    1、E-R图的定义 实体关系图:简记E-R图是指以实体、关系、属性三基本概念概括数据的基本结构,从而描述静态数据结构的...实体关系图表示在信息系统中概念模型的数据存储。 –百度百科 2.1E-R图表示法(Chen’s模型)
  • 目录写最前、 强实体与弱实体的定义1. 强实体2. 弱实体百度百科中的解释《数据库系统课程》中的解释总结起来 写最前 数据库设计是困难的,其原因之就在于我们很难去完全把握实体的定义。是不是实体、该不该...
  • 命名实体识别

    千次阅读 2018-10-23 14:46:04
    NER是NLP中项基本任务,就是从文本中识别出命名性指称项,为关系抽取等任务做铺垫,在信息抽取、信息检索、机器翻译、问答系统等多种自然语言处理技术中必不可少的组成部分。 命名实体识别研究的命名实体一般分为3...
  • NLP之中文命名实体识别

    万次阅读 2018-09-25 18:45:47
    MUC-6中首次使用了命名实体(named entity)这术语,由于当时关注的焦点是信息抽取(information extraction)问题,即从报章等非结构化文本中抽取关于公司活动和国防相关活动的结构化信息,而人名、地名、组织...
  • 实体—联系模型

    千次阅读 2018-06-25 01:36:53
    实体—联系(E-R)数据模型概述 该数据模型基于对现实世界的这样种认识:世界由组称为实体的基本对象及这些对象间的联系组成,该模型是种语义模型,模型的语义方面主要体现模型力图去表达数据的意义。...
  • 实体对齐调研综述

    千次阅读 2019-04-19 20:27:48
    必须要对实体识别的结果进行消歧,才能带到无歧义的实体信息。 应用领域 知识图谱构建(实体识别)、信息检索、问答系统等 任务分类 一般来说,实体消歧系统可以按照目标实体是否给定分为基于聚...
  • 开发过程中,有时因数据库设计者未考虑周到,业务实体一个属性没有对应的字段,因此需要数据库一个字段,又由于此字段要求不可为空,并且开发阶段,测试数据不多,有时是drop掉了原来的,增加了一个...
  • 实体关系抽取综述

    万次阅读 2018-06-11 16:14:01
    实体关系抽取作为信息抽取领域的重要研究课题,其主要目的是抽取句子中已标记实体对之间的语义关系,即在实体识别的基础上确定无结构文本中实体对间的关系类别,并形成结构化的数据以便存储和取用。 从用户需求层面...
  • 关系型数据库中实体之间的关系

    千次阅读 2018-06-20 20:47:00
     如果实体集()A 中的每一个实休(就是每行记录),在实体集B中只有一条数据与它对应,  反之实体集B 中的每一个实体,在实体A中只有一条数据与它对应  这样的实体关系主是一对一关系  实例:  员工、员工...
  • E-R实体关系介绍

    千次阅读 2018-11-06 17:28:39
    E-R图也称实体-联系图(Entity Relationship Diagram),提供了表示实体类型、属性和联系的方法,用来描述现实世界的概念模型。 它是描述现实世界关系概念模型的有效方法。是表示概念关系模型的种方式。用“矩形框...
  • 视频演示:http://u.115.com/file/f223235faf演示重点说明一个演示中,我们通过使用两个一对多的关系建立了LINQ to SQL中的伪多对多关系,之所以之为伪关系,只是表示它并非是真正意义上的多对多关系。...
  • spring 实体类 注解

    千次阅读 2016-04-27 11:58:04
    每个持久化POJO类都是一个实体Bean, 通过类的定义中使用 @Entity 注解来进行声明。 声明实体Bean @Entity public class Flight implements Serializable {  Long id;  @Id  public Long ...
  • 数据库设计之实体E-R图

    万次阅读 2013-07-07 01:11:41
    1、用户实体对象 2、主题实体对象 3、论坛实体对象 4、回复主题实体对象
  • HanLP分词命名实体提取详解

    千次阅读 2019-01-11 11:01:46
    分享篇大神的关于hanlp分词命名实体提取的经验文章,文章中分享的内容略有段时间(使用的hanlp版本比较老),最新版的hanlp已经出来了,也可以去看看新版的hanlp这方面有何提升! 文本挖掘是抽取有效、新颖...
  • 实体集与属性

    千次阅读 2018-03-25 21:47:43
    7.71使用实体集与属性考虑使用附加属性电话号码的实体设置指导(图7.17 a)可以很容易地认为,手机是一个独立的实体,带有属性的电话号码和位置;位置可能是手机所在的办公室或家庭,移动电话(手机)可能会被“移动...
  • Entity Framework 实体框架综述

    千次阅读 2012-12-18 01:06:25
    Entity Framework 实体框架综述 ... 、产生背景  它是随着面向对象的...业务实体在内存中表现为对象,数据库中表现为关系数据。内存中的对象之间存在关联和继承关系,而数据库中,关系数据无法直接表达多对
  • 一文了解命名实体识别

    千次阅读 2020-09-04 20:25:53
    导读:从1991年开始,命名实体识别逐渐开始走进人们的视野,各评测会议...1991年Rau等学者首次提出了命名实体识别任务,但命名实体(named entity,NE)作为一个明确的概念和研究对象,是1995年11月的第六届MUC...
  • 微服务调用及共用实体类怎么解决

    千次阅读 2019-09-10 19:26:39
    调用服务一般是customer里写个接口,接口里写上producer中controller里的方法(注意路径也要与controller中的一致),然后让其他类通过这个接口调用另一个服务的方法。 但这里有个问题:如果调用服务者要用到被...
  • EJB 3.0 开发指南之实体Bean()

    千次阅读 2005-03-08 14:15:00
    一个实体bean不需要实现Home接口或者Remote、Local接口。 实体Bean通过EntityManager产生、查找、和持久层结合、从持久层收回等操作。 JBoss的EJB3.0架构Hibernate之上。 注释: @Entity:如果你要建立一个实体...
  • 本文将更深入的研究当你输入一个网址的时候,后台到底发生了一件件什么样的事~1. 首先嘛,你得浏览器里输入要网址:2. 浏览器查找域名的IP地址导航的第一步是通过访问的域名找出其IP地址。DNS查找过程如下:* ...
  • 基于HanLP分词的命名实体提取

    万次阅读 热门讨论 2017-11-03 17:43:57
    文本挖掘是抽取有效、新颖、...工程领域,招投标文件里的这些实体信息至关重要。利用自然语言处理技术从形式各异的文件中提取出这些实体,能有效提高工作效率和挖掘实体之间的潜在联系。文本预处理1、文本清洗目前,
  • 《程序设计综合训练实践报告》 此项目为图书信息管理系统,是一个采用了mysql+mybatis框架+java编写的maven项目
  • 云客Drupal源码分析之实体Entity概述

    千次阅读 2017-04-14 11:44:09
    软件开发领域听说“实体Entity”是不是有点蒙圈不知道说什么呢?我们经常有听过实体经济,但软件里面实体什么鬼?这名词怎么来的?和那有什么关系么?drupal里面实体好像还很重要,甚至有人说drupal...
  • 为了重新回顾我写的消息系统架构,我需要重新读一下数据库系统概念的前三章,这里简单的做一个笔记,方便自己回顾 基本概念 实体-联系(E-R)数据模型基于对现实世界的这样一种认识:世界由一组称为实体的基本...
  • 数据库实体联系模型与关系模型

    千次阅读 2020-03-02 19:11:33
    数据库设计是指根据用户的需求,具体的数据库管理系统上,设计数据库的结构和建立数据库的过程。例如,编程微课是在线编程教育项目,该项目涉及到课程、学生、老师、学习资料等数据,这些数据都要被存储下来,...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 100,442
精华内容 40,176
关键字:

在一个实体表的信息称