精华内容
下载资源
问答
  • 结构化数据和非结构化数据、半结构化数据的区别

    万次阅读 多人点赞 2019-03-05 22:10:06
    计算机信息化系统中的数据分为结构化数据和非结构化数据、半结构化数据。 结构化数据 结构化数据,是指由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理...

    计算机信息化系统中的数据分为结构化数据和非结构化数据、半结构化数据

     

    结构化数据

    结构化数据是指由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理

    也称作行数据,一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的

     比如:

    id

    name

    gender

    phone

    address

    1

    张一

    female

    3337899

    湖北省武汉市

    2

    王二

    male

    3337499

    广东省深圳市福田区

    3

    李三

    female

    3339003

    广东省深圳市南山区

     

    非结构化数据

    非结构化数据,是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片、HTML、各类报表、图像和音频/视频信息等等

    非结构化数据更难让计算机理解。

     

    半结构化数据

    半结构化数据,是结构化数据的一种形式,虽不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此,也被称为自描述的结构。

    常见的半结构数据有XML和JSON,比如:

    <person>
    
        <name>A</name>
    
        <age>13</age>
    
        <gender>female</gender>
    
    </person>
    

     

    展开全文
  • 结构化数据、半结构化数据和非结构化数据

    万次阅读 多人点赞 2017-02-04 18:23:03
    结构化数据、半结构化数据和非结构化数据结构化数据结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。...

    结构化数据、半结构化数据和非结构化数据

    结构化数据

    结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。举一个例子:

    id		name	age		gender
    1		lyh		12		male
    2		liangyh	13		female
    3		liang	18		male
    

    所以,结构化的数据的存储和排列是很有规律的,这对查询和修改等操作很有帮助。但是,显然,它的扩展性不好(比如,我希望增加一个字段,怎么办?)。

    半结构化数据

    半结构化数据是结构化数据的一种形式,它并不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此,它也被称为自描述的结构。

    半结构化数据,属于同一类实体可以有不同的属性,即使他们被组合在一起,这些属性的顺序并不重要。

    常见的半结构数据有XML和JSON,对于对于两个XML文件,第一个可能有

    <person>
    	<name>A</name>
    	<age>13</age>
      	<gender>female</gender>
    </person>
    

    第二个可能为:

    <person>
    	<name>B</name>
    	<gender>male</gender>
    </person>
    

    从上面的例子中,属性的顺序是不重要的,不同的半结构化数据的属性的个数是不一定一样的。有些人说半结构化数据是以树或者图的数据结构存储的数据,怎么理解呢?上面的例子中,<person>标签是树的根节点,<name><gender>标签是子节点。通过这样的数据格式,可以自由地表达很多有用的信息,包括自我描述信息(元数据)。所以,半结构化数据的扩展性是很好的。

    非结构化数据

    顾名思义,就是没有固定结构的数据。各种文档、图片、视频/音频等都属于非结构化数据。对于这类数据,我们一般直接整体进行存储,而且一般存储为二进制的数据格式。

    展开全文
  • 非结构化数据

    2012-09-28 18:08:10
    oracle非结构化数据存储,很好的资料,希望能给大家带来帮助,谢谢
  • 关于结构化、半结构化、非结构化数据的理解

    万次阅读 多人点赞 2018-08-06 11:36:03
    记得在课上,老师说,结构化数据就是我们关系数据库里的表,剩下的都是半结构化和非结构化数据,好比XML文档就是半结构化数据,WORD文档就是非结构化数据,大数据就是半结构化和非结构化数据。心中一直有一个疑问?...

    记得在课上,老师说,结构化数据就是我们关系数据库里的表,剩下的都是半结构化和非结构化数据,好比XML文档就是半结构化数据,WORD文档就是非结构化数据,大数据就是半结构化和非结构化数据。心中一直有一个疑问?难道大数据不应该包含结构化数据吗?实在学习数据库这门课时,就对这几个概念有所混淆,所幸今天在书中发现了比较清晰的解释,记录下来,方便以后参考。

    1.结构化数据

    定义:业界指关系模型数据,即以关系数据库表形式管理的数据

    简析:虽然专业角度上看,结构化就是关系模型的说法并不准确,但针对目前业内现状,还是定义为关系模型最为妥善,因为它准确的代表了我们传统上最熟悉的企业业务数据。

    2.半结构化数据

    定义:非关系模型的、有基本固定结构模式的数据,例如日志文件、XML文档、JSON文档、Email等。

    3.非结构化数据

    定义:没有固定模式的数据,如WORD、PDF、PPT、EXL,各种格式的图片、视频等。

    简析:区分半结构化与非结构化的意义在于,对两者的处理方法是不同的,非结构化数据大多采用内容管理方法,而半结构化数据基本没有有效的管理方法。

    总结

    (1)结构化、半结构化、非结构化其实是按照数据格式分类

    (2)严格讲,结构化与半结构化数据都是有基本固定结构模式的数据

    (3)半结构与非结构化数据与目前流行的大数据之间只是有领域重叠的关系,本质讲两者并无必然联系。

    (4)业界有将大数据认同为半结构/非结构化数据,是因为大数据技术最初是在半结构化数据领域发挥作用,其本质是将数据处理技术与数据格式混淆,是不正确的。

     

     

    参考文献:

    何小朝. 纵横大数据[M]. 电子工业出版社, 2014.

     

    原创文章,转载标明出处,感恩。

    展开全文
  • 结构化数据还是非结构化数据?结构化数据还是非结构化数据? 目前国内20%的大数据是易于统计使用的结构化数据(存储在数据库里,可以用二维表结构来逻辑表达实现的数据,如数字、符号等),80%是非结构化数据(所有格式...

      结构化数据还是非结构化数据?

    45bc04031de009ed8776b86696daffdd.png

    结构化数据还是非结构化数据?

      目前国内20%的大数据是易于统计使用的结构化数据(存储在数据库里,可以用二维表结构来逻辑表达实现的数据,如数字、符号等),80%是非结构化数据(所有格式的文档、报表、图像和音频/视频信息等)。例如,工行数据仓库有360多TB的结构化数据,非结构化数据59个PB,后者是前者的200倍。

      由于非结构化数据处理起来难度较高,因此,多数公司基本上只分析结构化数据,而忽略了花重金保存下来的大多数非结构化数据。处理非结构化数据的基本思路就是“结构化”。以文档处理为例,系统可以在网上抓取、分析消费者的评论(正面的、负面的),甚至对用户行为做出预测。在图像识别方面,“谷歌大脑”经过充分的自学习,能够记忆并识别特定的概念。比如,给“谷歌大脑”看10000张关于“猫”的图片,它就能判断并记住猫的特征,可以辨别出猫。类似的图像识别技术也可以用在卫星图像识别上。其他还有音频、视频等,大数据时代不只是数字化,更需要结构化。

      对于已经具备大数据部署能力的企业,未来可以采集、读取、录入社交媒体数据、网络日志、语音视频数据等非结构化数据,通过结构化使之可用,并实现数据的实时性,在此基础上与自己的用户建立互动联系,用“活”大数据,更好地挖掘大数据的价值。

    f81a6049f47a1a589abb725a1ab7b1be.png

    结构化数据还是非结构化数据?

    展开全文
  • 又如:日期,字母,数字[2]等非结构化数据。不方便用二维表结构逻辑表示的数据。例如:电子邮件,网页,图像,音频,视频[3]等半结构化数据。介于完全结构化数据和完全非结构化数据之间的数据。例如:HTML[4]文档,...
  • 结构化数据、半结构化数据和非结构化数据结构化数据结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。...
  • 2、非结构化数据优势3、非结构化数据采集4、非结构化数据查询5、非结构化数据存储 一、结构化数据 1、结构化数据是什么? 结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度...
  • 据 IDC 预测,2018 年到 2025 年之间,全球产生的数据量将会从 33 ZB 增长到 175 ZB, 复合增长率达到 27%,其中超过 80% 的数据都会是处理难度较大的非结构化数据。预计到 2030年全球数据总量将达到 3,5000EB。随着...
  • 又如:日期,字母,数字[2]等非结构化数据。不方便用二维表结构逻辑表示的数据。例如:电子邮件,网页,图像,音频,视频[3]等半结构化数据。介于完全结构化数据和完全非结构化数据之间的数据。例如:HTML[4]文档,...
  • 一、 结构化数据 结构化数据:即以关系型数据库表形式管理的数据 二、半结构化数据 半结构化数据:非关系模型的,有基本...非结构化数据:没有固定模式的数据,如 WORD、PDF、PPT、EXL,各种格式的图片、视频等 ...
  • 随着大数据的流行,非结构化数据正变得越来越多、越来越大、越来越快。但是非结构化面临着种种巨大的风险,只有将这些风险进行化解,才能够保证非结构化数据始终得到有效的利用。潮数科技拥有多款针对非结构化数据的...
  • 计算机信息化系统中的数据分为结构化数据和非结构化数据和半结构化数据。 结构化数据 结构化数据,是指由二维表结构来表达逻辑和实现的数据,严格的遵循数据格式与长度规范,主要通过关系型数据库进行管理和存储。 ...
  • 结构化数据 非结构化数据Unstructured data is found everywhere. In fact, most individuals and organization conduct their lives around unstructured data. Like Structured Data the unstructured may be ...
  • 非结构化数据是指结构化数据以外的数据,数据结构不固定,无法使用关系数据库存储,只能够以各种类型的文件形式存放。 非结构化数据通常无法直接知道其内容,必须通过对应的软件才能打开浏览。数据库也只能将它
  • 数据结构分类 结构化数据:具有域名与域值,可用二维表表示。例如关系数据库和CSV...非结构化数据:不具有域值和域名,例如文章,声音,视频 半结构化和非结构化数据只有转换成结构化数据才可以让机器学习。 ...
  • 非结构化数据 像图片、声音、视频等等。这类信息我们通常无法直接知道他的内容,数据库只能将它们保存在一个BLOB字段中,以后很难检索其内容。 结构化数据 行数据,存储在数据库中,可以用二维表结构来逻辑表达...
  • (2)非结构化数据库,其字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成的数据库,用它不仅可以处理结构化数据(如数字、符号等信息)而且更适合处理非结构化数据(全文文本、图象、声音、...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 16,074
精华内容 6,429
关键字:

非结构化数据