精华内容
下载资源
问答
  • 结构化数据和非结构化数据、半结构化数据的区别

    万次阅读 多人点赞 2019-03-05 22:10:06
    计算机信息化系统中的数据分为结构化数据和非结构化数据、半结构化数据结构化数据 结构化数据,是指由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理...

    计算机信息化系统中的数据分为结构化数据和非结构化数据、半结构化数据

     

    结构化数据

    结构化数据是指由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理

    也称作行数据,一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的

     比如:

    id

    name

    gender

    phone

    address

    1

    张一

    female

    3337899

    湖北省武汉市

    2

    王二

    male

    3337499

    广东省深圳市福田区

    3

    李三

    female

    3339003

    广东省深圳市南山区

     

    非结构化数据

    非结构化数据,是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片、HTML、各类报表、图像和音频/视频信息等等

    非结构化数据更难让计算机理解。

     

    半结构化数据

    半结构化数据,是结构化数据的一种形式,虽不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此,也被称为自描述的结构。

    常见的半结构数据有XML和JSON,比如:

    <person>
    
        <name>A</name>
    
        <age>13</age>
    
        <gender>female</gender>
    
    </person>
    

     

    展开全文
  • 结构化数据、半结构化数据和非结构化数据

    万次阅读 多人点赞 2017-02-04 18:23:03
    结构化数据、半结构化数据和非结构化数据结构化数据结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。...

    结构化数据、半结构化数据和非结构化数据

    结构化数据

    结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。举一个例子:

    id		name	age		gender
    1		lyh		12		male
    2		liangyh	13		female
    3		liang	18		male
    

    所以,结构化的数据的存储和排列是很有规律的,这对查询和修改等操作很有帮助。但是,显然,它的扩展性不好(比如,我希望增加一个字段,怎么办?)。

    半结构化数据

    半结构化数据是结构化数据的一种形式,它并不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此,它也被称为自描述的结构。

    半结构化数据,属于同一类实体可以有不同的属性,即使他们被组合在一起,这些属性的顺序并不重要。

    常见的半结构数据有XML和JSON,对于对于两个XML文件,第一个可能有

    <person>
    	<name>A</name>
    	<age>13</age>
      	<gender>female</gender>
    </person>
    

    第二个可能为:

    <person>
    	<name>B</name>
    	<gender>male</gender>
    </person>
    

    从上面的例子中,属性的顺序是不重要的,不同的半结构化数据的属性的个数是不一定一样的。有些人说半结构化数据是以树或者图的数据结构存储的数据,怎么理解呢?上面的例子中,<person>标签是树的根节点,<name><gender>标签是子节点。通过这样的数据格式,可以自由地表达很多有用的信息,包括自我描述信息(元数据)。所以,半结构化数据的扩展性是很好的。

    非结构化数据

    顾名思义,就是没有固定结构的数据。各种文档、图片、视频/音频等都属于非结构化数据。对于这类数据,我们一般直接整体进行存储,而且一般存储为二进制的数据格式。

    展开全文
  • 结构化数据

    千次阅读 2018-12-25 10:24:17
      结构化数据:拥有多种数据类型的数据。   序列化:将结构化的数据变成数据流的格式,即变为一个字符串或二进制流。   结构化数据处理工具:实现数据序列化及反序列化(从数据流中还原出原来的结构化数据)。...

      结构化数据:拥有多种数据类型的数据。
      序列化:将结构化的数据变成数据流的格式,即变为一个字符串或二进制流。
      结构化数据处理工具:实现数据序列化及反序列化(从数据流中还原出原来的结构化数据)。如下:

      1)XML

    <user>
        <name>Li Zhang</name>
        <id>890</id>
        <email>lizhang@gmail.com</email>
    </user>"	
    

      2)JSON

    {
        ""name"":""Li Zhang"",
        ""id"":""890"",
        ""email"":""lizhang@gmail.com"",
    }
    

      3)Protocol Buffer

    数据格式定义文件:
    message user{
        optionial string name =1;
        required int32 id = 2;
        repeated string email = 3;
    }
    

    Protocol Buffer格式的数据与XML和JSON的区别

    • Protocol Buffer格式化的数据是二进制流, 是不可读的。
    • XML和JSON的所有信息包含在内,反序列化时不需要额外信息。
    • Protocol Buffer反序列化时,需要预先定义的数据格式。
    • Protocol Buffer序列化出来的数据比XML格式数据小3到10 倍,解析速度要快20到100倍。
    展开全文
  • 关于结构化、半结构化、非结构化数据的理解

    万次阅读 多人点赞 2018-08-06 11:36:03
    记得在课上,老师说,结构化数据就是我们关系数据库里的表,剩下的都是半结构化和非结构化数据,好比XML文档就是半结构化数据,WORD文档就是非结构化数据,大数据就是半结构化和非结构化数据。心中一直有一个疑问?...

    记得在课上,老师说,结构化数据就是我们关系数据库里的表,剩下的都是半结构化和非结构化数据,好比XML文档就是半结构化数据,WORD文档就是非结构化数据,大数据就是半结构化和非结构化数据。心中一直有一个疑问?难道大数据不应该包含结构化数据吗?实在学习数据库这门课时,就对这几个概念有所混淆,所幸今天在书中发现了比较清晰的解释,记录下来,方便以后参考。

    1.结构化数据

    定义:业界指关系模型数据,即以关系数据库表形式管理的数据

    简析:虽然专业角度上看,结构化就是关系模型的说法并不准确,但针对目前业内现状,还是定义为关系模型最为妥善,因为它准确的代表了我们传统上最熟悉的企业业务数据。

    2.半结构化数据

    定义:非关系模型的、有基本固定结构模式的数据,例如日志文件、XML文档、JSON文档、Email等。

    3.非结构化数据

    定义:没有固定模式的数据,如WORD、PDF、PPT、EXL,各种格式的图片、视频等。

    简析:区分半结构化与非结构化的意义在于,对两者的处理方法是不同的,非结构化数据大多采用内容管理方法,而半结构化数据基本没有有效的管理方法。

    总结

    (1)结构化、半结构化、非结构化其实是按照数据格式分类

    (2)严格讲,结构化与半结构化数据都是有基本固定结构模式的数据

    (3)半结构与非结构化数据与目前流行的大数据之间只是有领域重叠的关系,本质讲两者并无必然联系。

    (4)业界有将大数据认同为半结构/非结构化数据,是因为大数据技术最初是在半结构化数据领域发挥作用,其本质是将数据处理技术与数据格式混淆,是不正确的。

     

     

    参考文献:

    何小朝. 纵横大数据[M]. 电子工业出版社, 2014.

     

    原创文章,转载标明出处,感恩。

    展开全文
  • 一、 结构化数据 结构化数据:即以关系型数据库表形式管理的数据 二、半结构化数据结构化数据:非关系模型的,有基本固定结构模式的数据,例如日志文件、XML 文档、JSON 文档、Email 等 三、非机构化数据 非结构...
  • 数据结构分类 结构化数据:具有域名与域值,可用二维表表示。例如关系数据库和CSV文档 半结构数据:具有域值和域名,但每一笔数据的字段可能...半结构化和非结构化数据只有转换成结构化数据才可以让机器学习。 ...
  • 结构化数据、非结构化数据以及半结构化数据是对存储形式的一种数据类型分析,有助于企业细分行业案例,帮助存储合作伙伴更好地解决应用实施方案。 定义 结构化数据,即行数据,存储在数据库里,可以用二维表结构来...
  • 这些数据根据结构分类被划分为三种,它们分别是结构化数据、非结构化数据、半结构化数据。在这篇文章中我们就简单地给大家介绍一下这三种数据的相关知识。 首先我们说一下结构化数据,结构化的数据是指可以使用关系...
  • 在实际应用中,我们会遇到各式各样的数据库如nosql非关系数据库(memcached,redis,mangodb),RDBMS关系数据库(oracle,mysql等),还有一些其它的数据库如hbase,在这些数据库中,又会出现结构化数据,非结构化...
  • 1.结构化数据(先有结构,再有数据): 是指由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。也称作行数据,一般特点是:数据以行为单位,一行数据表示一...
  • 结构化数据和非结构化数据是大数据的两种类型,这两者之间并不存在真正的冲突。客户如何选择不是基于数据结构,而是基于使用它们的应用程序:关系数据库用于结构化数据,大多数其他类型的应用程序用于非结构化数据。...
  • 结构化数据 和 非结构化数据

    千次阅读 2017-11-12 22:18:45
    结构化数据结构化数据也称作行数据,是可以由二维表结构来逻辑表达和实现的数据, 对于表结构的每一列,都有着清晰的定义。例如: 非结构化数据结构化数据是不方便用数据库二维逻辑表来表现的数据,它们的特点是...
  •  结构化数据类型包括预定义的数据类型、 格式和结构的数据, 常见的比如关系型数据库中数据表里的数据。  半结构化数据,具有可识别的模式并可以解析的文本数据文件, 比如XML数据文件。 准结构化数据,具有不...
  • 结构化数据结构化数据的区别

    千次阅读 2019-01-18 16:16:02
    结构化数据结构化数据的区别
  • 结构化数据和非结构化数据解析

    千次阅读 2017-11-11 12:32:29
    我们生活中的数据总体分为两种:结构化数据和非结构化数据结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。 非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等磁盘上的文件
  • 结构化数据和非结构化数据

    千次阅读 2018-12-20 17:37:41
    (1)结构化数据,简单来说就是数据库。结合到典型场景中更容易理解,比如企业ERP、财务系统;医疗HIS数据库;教育一卡通;政府行政审批;其他核心数据库等。这些应用需要哪些存储方案呢?基本包括高速存储应用需求...
  • 结构化数据 结构化数据是数据的数据库。(即,行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据) 我们可以清楚的看到能够形式化存储在数据库中,每一个列都有具体的含义。 如下图所示: 非结构化数据 ...
  • 结构化数据 **  结构化数据可以使用关系型数据库来表示和存储,如MySQL、Oracle、SQL Server等,表现二维形式的数据。可以通过固有键值获取相应信息。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每...
  • 在信息社会,信息可以...结构化数据属于非结构化数据,是非结构化数据的特例。 定义:  结构化数据:即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。 非结构化数据:包括所有格式的办公文档...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 120,989
精华内容 48,395
关键字:

结构化数据