精华内容
下载资源
问答
  • 结构化数据、半结构化数据和非结构化数据

    万次阅读 多人点赞 2017-02-04 18:23:03
    结构化数据、半结构化数据和非结构化数据结构化数据结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。...

    结构化数据、半结构化数据和非结构化数据

    结构化数据

    结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。举一个例子:

    id		name	age		gender
    1		lyh		12		male
    2		liangyh	13		female
    3		liang	18		male
    

    所以,结构化的数据的存储和排列是很有规律的,这对查询和修改等操作很有帮助。但是,显然,它的扩展性不好(比如,我希望增加一个字段,怎么办?)。

    半结构化数据

    半结构化数据是结构化数据的一种形式,它并不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此,它也被称为自描述的结构。

    半结构化数据,属于同一类实体可以有不同的属性,即使他们被组合在一起,这些属性的顺序并不重要。

    常见的半结构数据有XML和JSON,对于对于两个XML文件,第一个可能有

    <person>
    	<name>A</name>
    	<age>13</age>
      	<gender>female</gender>
    </person>
    

    第二个可能为:

    <person>
    	<name>B</name>
    	<gender>male</gender>
    </person>
    

    从上面的例子中,属性的顺序是不重要的,不同的半结构化数据的属性的个数是不一定一样的。有些人说半结构化数据是以树或者图的数据结构存储的数据,怎么理解呢?上面的例子中,<person>标签是树的根节点,<name><gender>标签是子节点。通过这样的数据格式,可以自由地表达很多有用的信息,包括自我描述信息(元数据)。所以,半结构化数据的扩展性是很好的。

    非结构化数据

    顾名思义,就是没有固定结构的数据。各种文档、图片、视频/音频等都属于非结构化数据。对于这类数据,我们一般直接整体进行存储,而且一般存储为二进制的数据格式。

    展开全文
  • 结构化数据和非结构化数据、半结构化数据的区别

    万次阅读 多人点赞 2019-03-05 22:10:06
    计算机信息化系统中的数据分为结构化数据和非结构化数据、半结构化数据。 结构化数据 结构化数据,是指由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理...

    计算机信息化系统中的数据分为结构化数据和非结构化数据、半结构化数据

     

    结构化数据

    结构化数据是指由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理

    也称作行数据,一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的

     比如:

    id

    name

    gender

    phone

    address

    1

    张一

    female

    3337899

    湖北省武汉市

    2

    王二

    male

    3337499

    广东省深圳市福田区

    3

    李三

    female

    3339003

    广东省深圳市南山区

     

    非结构化数据

    非结构化数据,是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片、HTML、各类报表、图像和音频/视频信息等等

    非结构化数据更难让计算机理解。

     

    半结构化数据

    半结构化数据,是结构化数据的一种形式,虽不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此,也被称为自描述的结构。

    常见的半结构数据有XML和JSON,比如:

    <person>
    
        <name>A</name>
    
        <age>13</age>
    
        <gender>female</gender>
    
    </person>
    

     

    展开全文
  • 关于结构化、半结构化、非结构化数据的理解

    万次阅读 多人点赞 2018-08-06 11:36:03
    记得在课上,老师说,结构化数据就是我们关系数据库里的表,剩下的都是半结构化和非结构化数据,好比XML文档就是半结构化数据,WORD文档就是非结构化数据,大数据就是半结构化和非结构化数据。心中一直有一个疑问?...

    记得在课上,老师说,结构化数据就是我们关系数据库里的表,剩下的都是半结构化和非结构化数据,好比XML文档就是半结构化数据,WORD文档就是非结构化数据,大数据就是半结构化和非结构化数据。心中一直有一个疑问?难道大数据不应该包含结构化数据吗?实在学习数据库这门课时,就对这几个概念有所混淆,所幸今天在书中发现了比较清晰的解释,记录下来,方便以后参考。

    1.结构化数据

    定义:业界指关系模型数据,即以关系数据库表形式管理的数据

    简析:虽然专业角度上看,结构化就是关系模型的说法并不准确,但针对目前业内现状,还是定义为关系模型最为妥善,因为它准确的代表了我们传统上最熟悉的企业业务数据。

    2.半结构化数据

    定义:非关系模型的、有基本固定结构模式的数据,例如日志文件、XML文档、JSON文档、Email等。

    3.非结构化数据

    定义:没有固定模式的数据,如WORD、PDF、PPT、EXL,各种格式的图片、视频等。

    简析:区分半结构化与非结构化的意义在于,对两者的处理方法是不同的,非结构化数据大多采用内容管理方法,而半结构化数据基本没有有效的管理方法。

    总结

    (1)结构化、半结构化、非结构化其实是按照数据格式分类

    (2)严格讲,结构化与半结构化数据都是有基本固定结构模式的数据

    (3)半结构与非结构化数据与目前流行的大数据之间只是有领域重叠的关系,本质讲两者并无必然联系。

    (4)业界有将大数据认同为半结构/非结构化数据,是因为大数据技术最初是在半结构化数据领域发挥作用,其本质是将数据处理技术与数据格式混淆,是不正确的。

     

     

    参考文献:

    何小朝. 纵横大数据[M]. 电子工业出版社, 2014.

     

    原创文章,转载标明出处,感恩。

    展开全文
  • 说明半结构化和非结构化,需要对比结构化、半结构化和非结构化。 结构化传统上指关系型的数据,如:电子表格的数据,关系数据库的数据,“1,北京,1000万” 半结构化是相对结构化的,首先半结构化有明确的结构定义...

    首先概念是相对的,并非绝对的。
    说明半结构化和非结构化,需要对比结构化、半结构化和非结构化。

    结构化传统上指关系型的数据,如:电子表格的数据,关系数据库的数据,“1,北京,1000万”

    半结构化是相对结构化的,首先半结构化有明确的结构定义,其次它不是结构化,如:XML、JSON,FIX,SWIFT,XBRL,HL7等等,当然还有更复杂的格式数据,只要其有完整的结构定义,一般都叫半结构化。

    非结构化,相对前面两者而言,就是没有完整的结构定义的数据,如:随意书写的文章,一个任意格式的编辑的图片

    作者:杜绍森
    链接:https://www.zhihu.com/question/371576359/answer/1017164626
    来源:知乎

    展开全文
  • 结构化数据还是非结构化数据?结构化数据还是非结构化数据? 目前国内20%的大数据是易于统计使用的结构化数据(存储在数据库里,可以用二维表结构来逻辑表达实现的数据,如数字、符号等),80%是非结构化数据(所有格式...
  • 结构化与半结构化与非结构化数据 1.结构化数据 结构化的数据是指可以使用关系型数据库表示存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。例子:...
  • 结构化数据 非结构化数据Unstructured data is found everywhere. In fact, most individuals and organization conduct their lives around unstructured data. Like Structured Data the unstructured may be ...
  • 我们会遇到各式各样的数据库如nosql非关系数据库(memcached,redis,mangodb),RDBMS关系数据库(oracle,mysql等),还有一些其它的数据库如hbase,在这些数据库中,又会出现结构化数据,非结构化数据,半结构化...
  • 结构化、非结构化和半结构化数据

    万次阅读 2018-02-25 22:23:44
    一直对结构化、非结构化和半结构化数据三个数据类型的概念有点模糊不清,今天特意花点时间网上查找了一番,继而,来此处进行一通总结。 ** 结构化数据 ** 结构化数据可以使用关系型数据库来表示和存储,如...
  • 结构化数据就是我们关系数据库里的表,剩下的都是半结构化和非结构化数据,好比XML文档就是半结构化数据,WORD文档就是非结构化数据。 1.结构化数据 定义:业界指关系模型数据,即以关系数据库表形式管理的数据 简析...
  • 结构化与非结构化

    2020-12-06 03:43:47
    非结构化则是抛弃了元数据这一独立部分,将元数据和物理数据不区分进行存放,混合在一起。形成所谓nosql. 这种情况下要直接执行sql由于缺少了元数据,执行起来就很困难,因此需要在外部再外挂一个
  • 结构化、半结构化和非结构化问题

    千次阅读 2017-11-15 14:59:00
    结构化程度是指对某一决策...按照决策问题的结构化程度不同把决策问题分成结构化问题、半结构化问题和非结构化问题三种类型。 1).结构化决策问题 结构化决策问题相对比较简单、直接,其决策过程和决策方法有固...
  • 结构化 VS 非结构化

    千次阅读 2016-01-25 17:25:33
    非结构化信息则隐性包含了掌握着企业命脉的关键,隐含着许多提高企业效益的机会。 非结构化数据 非结构化数据库是指其字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子...
  • 结构化、半结构化、非结构化数据

    千次阅读 2019-02-18 09:58:49
    1.结构化数据 定义:业界指关系模型数据,即以关系数据库表形式管理的数据 简析:虽然专业角度上看,结构化就是关系模型的说法并不准确,但针对目前业内现状,还是定义为...3.非结构化数据 定义:没有固定模式...
  • 结构化数据、半结构化数据和非结构化数据结构化数据结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。...
  • 2、非结构化数据优势3、非结构化数据采集4、非结构化数据查询5、非结构化数据存储 一、结构化数据 1、结构化数据是什么? 结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度...
  • 概念 结构化数据:即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。 ...它一般是自描述的,数据的...非结构化数据:不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文
  • 文章目录一、非结构化数据的定义二、非结构化处理的重要性三、非结构化处理的方法和手段 一、非结构化数据的定义 非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的...
  • 记得在课上,老师说,结构化数据就是我们关系数据库里的表,剩下的都是半结构化和非结构化数据,好比XML文档就是半结构化数据,WORD文档就是非结构化数据,大数据就是半结构化和非结构化数据。心中一直有一个疑问?...
  • 非结构化数据:包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。 半结构化数据:就是介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 22,027
精华内容 8,810
关键字:

结构化非结构化