精华内容
下载资源
问答
  • 关系模型和多维模型

    2021-05-14 12:14:38
    数据集市在很大程度上是根据特地的主题需求而创建的,服务的对象通常是某一个部门,一旦了解需求,就可以把数据集市创建成一个最优的星形结构,而数据仓库与此有很大的不同,数据仓库是为企业数据模型服务的,根据...

    关系模型和多维模型是数据库设计广泛使用的模型。

    一,模型的特征

    关系模型通过使用主键和外键在不同表的数据行之间建立关联,具有很强的灵活性,是建立操作性数据库(ODS)和数据仓库的最佳方法。在设计关系模型时,最基本的要求是满足关系型数据库设计的三个范式:

    • 第一范式是原子性,数据库表的每一列都是不可分割的原子数据项。
    • 第二范式是属性完全依赖于主键,表中的所有列,都必须完全依赖于主键,由主键唯一标识所有属性列,对于不完全依赖于主键的列,会出现数据冗余,需要拆分成表。
    • 第三范式是指属性不能传递依赖于主属性,即属性不依赖于其它非主键属性,如果某一属性A依赖于非主键属性B,而非主键属性B依赖于主键pk,那么属性A就是间接依赖于主键pk,这被称作传递依赖于主属性。对传递依赖进行范化,需要将传递依赖的属性拆分成表。

    这三个设计范式使得关系模型包含的数据是非冗余的,数据被分解成最低标准的粒度。在需要访问某个数据时,可以通过表与表之间关系,间接获得数据。

    多维模型的核心是星形连结,之所以称为星形,是因为它的表示是以一张数据表(称作事实表)为中心,周围围绕着其他数据表(称作维度表)。多维模型的最大优点是高效的访问性能,但是灵活性不好。事实表包含大量的数据,用于表示出现一个事物,维度表用来描述事物的属性,最常见的维度是时间维度,用于表示事物出现的时间。事实表和维度表通过公共的字段来连结,这个字段通常是整数类型,在维度表中称作主键,在事实表中称作外键。
    多维模型的数据是根据特定的主题集成到一起的,当访问某个数据时,只需要很少的关联,甚至可以直接访问到。

    二,模型适用的场景

    数据仓库绝对适合使用关系模型,关系模型可以给数据仓库的设计带来灵活性,而多维方法需要星形连接、事实表和维度表,因此,多维方法只适合数据集市,而不适合数据仓库。

    数据集市在很大程度上是根据特定的主题需求而创建的,服务的对象通常是某一个部门,一旦了解主题的需求,就可以把数据集市创建成一个最优的星形结构,而数据仓库与此有很大的不同,数据仓库是为企业数据模型服务的,根据企业而不是部门而创建的。数据仓库服务很多主题的需求,服务的对象是整个公司,而不是特定的部门。正因为如此,数据仓库对于任何一个主题而言,性能和便捷都不是最优的。

    三,模型的区别

    多维模型设计的最大优点是访问的高效性,但是灵活性不足,而关系模型的最大优点是设计的灵活性,但是访问的高效性。另一个重要的区别是设计的范围不同,多维模型适用于小范围的,特定主题的数据,而关系模型适合于大范围的,多种主题的数据。

    关系模型存储的是最低粒度的数据,通过关系支持用户的数据需求。用户可以根据关系模型中的数据,获得不同粒度级别的数据。而多维模型存储的粒度是有限低的,无法向下钻取,获得更详细的数据。
    数据集市是服务于一个特定部门,为特定主题的数据分析需求而创建的数据结构。由于数据仓库是整个企业的数据中心,而数据集市是根据某个部门的特定主题创建的数据库,因此,可以从数据仓库中抽取数据创建数据集市。

    展开全文
  • 普遍认为在数据仓库的设计方法中关系模型是“Inmon”方法而多维模型是“Kimball”方法。先来看下关系模型,关系型数据以一种称为“标准化”的形式存在。数据标准化是指数据库设计会使数据分解成非常低的粒度级,标准...

    数据仓库中广泛采用的数据库设计模型有两种:关系型和多维型。普遍认为在数据仓库的设计方法中关系模型是“Inmon”方法而多维模型是“Kimball”方法。

    先来看下关系模型,关系型数据以一种称为“标准化”的形式存在。数据标准化是指数据库设计会使数据分解成非常低的粒度级,标准化数据以一种孤立模式存在,这种情况下对数据表里的数据关系要求很严格。一般遵循3NF范式。采用关系型设计的数据库一般具有较强的灵活性和多功能性(可以支持数据的多种视图)。

    再来看下多维模型,多维模型一般有星型模式、雪花模式、混杂模式(又叫星系模式)。多维模型设计的最大优点在于访问的高效性。

    两种模型的区别

    作为数据仓库设计的基础,星形连接和关系型结构两者之间存在很多不同。最重要的区别是在灵活性和性能方面。关系模型具有高灵活性,但是对用户来说在性能方面却不是很理想的。多维模型在满足用户需求方面是非常高效的,但是灵活性不好。

    另一重要区别在于设计的范围不同。必然地,多维设计只能在有限的范围内进行,也就是说,数据库设计只能在一组请求过程下得到最优化。如果所有不同组请求全部加入到设计当中,最优化变得毫无意义。

    当使用关系模型时,在性能方面没有特别的优化方法。既然关系模型要求数据以最低粒度级存储,那么就可以无限制地添加新数据。很显然,添加数据到关系模型永远也不会停止。正因为这样,关系模式适合大范围数据(如一个企业模型),而多维模型适用于小范围数据(如一个部门或甚至一个子部门)。

    区别的起源:

    关系环境是通过起源数据模型设计出来的。多维模型是根据最终用户的请求塑造的。换句话说,关系模型通过纯数据模型和其他模式设计,而多维模型通过处理请求塑造。

    在适用性方面:由于关系模型通过抽象数据形成,所以模型自身非常灵活。但这种灵活性,对于直接数据访问的执行却不是最优化的。如果想得到一个高性能的关系模型,最佳方法是从模型中抽取出数据,并重新构造一种适合于快速访问的模式。

    多维模型在直接访问数据方面是快速而高效的。从体系结构观点来看,在数据仓库设计基础方面关系模型是更好地支持数据仓库的模式,其原因是,数据仓库需要根据不同的议程和多种观察数据的方式来支持许多不同的用户组。也就是说,数据仓库对于访问已给定的用户并不是最佳的。相反,数据仓库可以以多种方式支持多个不同的用户。

    关系模式,数据以最低粒度级和标准化形式存储;关系表间的关系已经定义好并且包含一个含有外键的关键字表;新表可以对关系表中的基本数据集定义新的汇总和筛选标准;也就是说可以很简单以一种形式创建关系表,再以另一种形式重新塑造这些表,这样做对于数据仓库环境来说是非常理想的。

    此外,关系模式支持将来未知的需求、支持适度变化的需求方面具有多维模型无法比拟的优势。

    因此根据上面讨论过的原因可以看出:关系模型对数据仓库是理想的基础,而星形连接对于数据集市是最佳的。

    独立集市和从属集市的区别:

    独立集市是指直接通过历史应用创建的数据集市。建立独立数据集市不需要有“全局思想”考虑。

    与独立数据集市相对应的是从属数据集市。从属数据集市是利用来自数据仓库的数据建立的。它的数据源不依赖与历史数据或操作型数据,只依赖于数据仓库。总之,从属数据集市要求有预先的计划、长期的观察、全局的分析和企业各不同部门对需求分析的合作与协调。

    建立多个独立数据集市后,很快用户就会发现数据集市之间的信息不统一,也不同步,而且每增加一个数据集市就会出现不断增长的细节数据冗余的问题,需要大量的资源来建立接口程序,维护这些程序也变成了负担。因此独立数据集市不适合与解决企业中的信息问题。

    当然,如果企业采用了从属数据集市,并在建立任何数据集市之前先创建了一个数据仓库,那么,独立数据集市固有的哪些体系结构方面的问题就不会出现了。

    换句话说,独立数据集市表示的是不需要顾及全局及全景的一个短期的、有限范围的解决方法。另一方面,从属数据集市则要求一个长期和全局的展望。但是独立数据集市不能为企业信息提供一个坚实的基础,而从属数据集市确能为信息决策提供了一个真正的长期基础。

    总结:数据仓库中数据库设计推荐采用关系模式设计方法,而数据集市推荐采用多维模型设计方法,其中数据集市推荐采用从属型的数据集市构建方法。

    参考自:William H.Inmon.Data Warehouing. Fourth Edition

    展开全文
  • 关系型数据库详细介绍 Dream__Boy 多维数据库详细介绍 多维数据库(Multi Dimensional Database,MDD)可以简单地理解为:将数据存放在一个n维数组中,而不是像关系数据库那样以记录的形式存放。因此它存在大量...

    多维数据库&关系型数据库详细介绍

    Dream__Boy

    多维数据库详细介绍

    多维数据库(Multi Dimensional Database,MDD)

    可以简单地理解为:

    • 将数据存放在一个n维数组中,而不是像关系数据库那样以记录的形式存放。
    • 因此它存在大量稀疏矩阵,人们可以通过多维视图来观察数据。

    多维数据库增加了一个时间维,与关系数据库相比,它的优势在于可以提高数据处理速度,加快反应时间,提高查询效率。


    目前有两种MDD 的OLAP产品:基于多维数据库的MOLAP和基于关系数据库的ROLAP。ROLAP建立了一种新的体系,即星型结构。
    MDD并没有公认的多维模型,也没有像关系模型那样标准地取得数据的方法(如SQL、API等)。基于MDD的OLAP产品,依据决策支持的内容使用范围也有很大的不同。
    在低端,用户使用基于单用户或小型LAN的工具来观察多维数据。这些工具的功能性和实用性可能相当不错,但由于受到规模的限制,它们不具备OLAP的所有特性。这些工具使用超立方结构,将模型限制在n维形态。当模型足够大且稀疏数据没有控制好时,这种模型将会不堪一击。这些工具使用数据库的大小是以MB来计量的,而不是以GB计量的,因此只能进行只读操作,且具备有限的复杂计算。
    在高端,OLAP工具用4GL提供了完善的开发环境、统计分析、时间序列分析、财政报告、用户接口、多层体系结构、图表等许多其他功能。尽管不同的OLAP工具都使用了它们自己的多维数据库,但它们在不同程度上也利用了关系数据库作为存储媒体。因为关系数据库和OLAP工具同时在高端服务器上处理,所以速度和效率仍然很快。
    纯多维数据库引擎也被开发出来。尽管这些工具缺乏4GL及充分的开发环境,但却有比高端MDD工具所使用的数据库更为复杂的数据库。这些工具也具有统计分析、财务分析和时间序列分析等功能,并有自己的API,允许其对前端的开发环境开放。

     

    关系型数据库详细介绍

     

    关系型数据库的定义

    关系数据库,是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。现实世界中的各种实体以及实体之间的各种联系均用关系模型来表示。关系模型是由埃德加·科德于1970年首先提出的,并配合“科德十二定律”。现如今虽然对此模型有一些批评意见,但它还是数据存储的传统标准。标准数据查询语言SQL就是一种基于关系数据库的语言,这种语言执行对关系数据库中数据的检索和操作。 关系模型由关系数据结构、关系操作集合、关系完整性约束三部分组成。

    关系型数据库的十二准则

    全关系系统应该完全支持关系模型的所有特征。关系模型的奠基人埃德加·科德具体地给出了全关系系统应遵循的基本准则。
    准则0
    一个关系形的关系数据库管理系统必须能完全通过它的关系能力来管理数据库。
    准则1
    信息准则 关系数据库管理系统的所有信息都应该在逻辑一级上用表中的值这一种方法显式的表示。
    准则2
    保证访问准则 依靠表名、主码和列名的组合,保证能以逻辑方式访问关系数据库中的每个数据项。
    准则3
    空值的系统化处理 全关系的关系数据库管理系统支持空值的概念,并用系统化的方法处理空值。
    准则4
    基于关系模型的动态的联机数据字典 数据库的描述在逻辑级上和普通数据采用同样的表述方式。
    准则5
    统一的数据子语言 一个关系数据库管理系统可以具有几种语言和多种终端访问方式,但必须有一种语言,它的语句可以表示为严格语法规定的字符串,并能全面的支持各种规则。
    准则6
    视图更新准则 所有理论上可更新的视图也应该允许由系统更新。
    准则7
    高级的插入、修改和删除操作 系统应该对各种操作进行查询优化。
    准则8
    数据的物理独立性 无论数据库的数据在存储表示或访问方法上作任何变化,应用程序和终端活动都保持逻辑上的不变性。
    准则9 数据逻辑独立性 当对基本关系进行理论上信息不受损害的任何改变时,应用程序和终端活动都保持逻辑上的不变性。
    准则10
    数据完整的独立性 关系数据库的完整性约束条件必须是用数据库语言定义并存储在数据字典中的。
    准则11
    分布独立性 关系数据库管理系统在引入分布数据或数据重新分布时保持逻辑不变。
    准则12
    无破坏准则 如果一个关系数据库管理系统具有一个低级语言,那么这个低级语言不能违背或绕过完整性准则。

    展开全文
  • 数据仓库多维数据模型概念介绍

    千次阅读 2019-11-15 16:16:44
    操作数据库主要考虑的是事务处理,一般采用E-R模型进行建模。 数据仓库主要面向分析,设计数据仓库时应该需要简明的、面向主题的模式,便于OLAP,通常使用多维数据建模。 多维数据模型 将数据看做数据立方...

    操作性数据库与数据仓库区别

    操作型数据库主要考虑的是事务型处理,一般采用E-R模型进行建模。

    数据仓库主要面向分析,设计数据仓库时应该需要简明的、面向主题的模式,便于OLAP,通常使用多维数据建模。

    多维数据模型

    将数据看做数据立方形式,满足用户从多角度、多层次进行数据查询和分析的需要而建立起来的基于事实和维的数据库模型。多维数据模型采用多维结构文件进行数据存储,并有索引及相应元数据管理文件与数据相对应。

    • 粒度:数据仓库中数据单元的详细程度和级别
    • 维度:分析数据的角度
      • 维属性:一个维通常通过一组属性进行描述,如时间维包含了年份、季度、月份、日期等维属性
      • 维成员:不同维层次的取值组合,如某年某月某日属于时间维的一个维成员
    • 事实/度量:数据仓库中的信息单元,用于存放数据。

    常见的基于关系数据库的多维数据模型

    星形模式、雪花模式、事实星座模式

    • 星形模式

    • 雪花模式:

    • 事实星座模式:

    星形模式、雪花模式、事实星座模式之间的区别:

     

    展开全文
  • (星形模式是一种多维的数据关系,它由一个事实表(Fact Table)和一组维表(Dimension Table)组成。每个维表都有一个维作为主键,所有这些维的主键组合成事实表的主键。事实表的非主键属性称为事实(Fact),它们...
  • 专业数据仓库面临的一个问题是数据仓库中数据库设计的基本模型选取问题。广泛采用的数据库设计模型有两种,关系型和...多维模型有利于短期数据仓库,但这种方法使用的数据仓库的范围有限。 一、关系模型 二、多维模
  • 普遍认为关系型是“Inmon”方法,而多维模型是“Kimball”方法 Inmon建模理论 关系模型 自上向下,基于业务需求分析的结果 Kimball建模理论 多维模型 自下向上,从业务数据入手,建立数据模型 2. 关系模型与多维...
  • 多维数据模型

    万次阅读 2018-09-18 15:04:33
    一、从关系表和电子表格到数据立方体 数据仓库和数据仓库技术基于多维数据模型。这个模型把数据看成是数据立方体形式。多维数据模型围绕中心主题组织,该主题用事实表表示。事实是数值度量的。 数据立方体允许以...
  • 数据仓库多维数据模型设计

    万次阅读 多人点赞 2017-11-09 18:14:59
    建设数据模型既然是整个数据仓库建设中一个非常重要的关键部分,那么,怎么建设我们的数据仓库模型就是我们需要解决的一个问题。这里我们将要详细介绍如何创建适合自己的数据模型。 数据仓库建模方法 大千世界,...
  • OLAP和多维数据模型

    万次阅读 多人点赞 2017-11-09 15:56:36
    它具有FASMI(Fast Analysis of Shared Multidimensional Information),即共享多维信息的快速分析的特征。 其中F是快速性(Fast),指系统能在数秒内对用户的多数分析要求做出反应; A是可分析性(A...
  • 一、数据仓库 与 传统数据库 区别、 二、数据仓库系统体系结构、 三、多维数据模型、 1、星型模式、 2、雪片模式、 3、事实星座、 四、在线分析处理、 五、多维数据分析操作
  • 基于多维数据模型的OLAP

    千次阅读 2017-02-13 11:18:22
    前面的一篇文章——数据仓库的多维数据模型中已经简单介绍过多维模型的定义和结构,以及事实表(Fact Table)和维表(Dimension Table)的概念。多维数据模型作为一种新的逻辑模型赋予了数据新的组织和存储形式,而...
  • 多维数据模型总结和归纳

    千次阅读 2019-04-26 13:59:57
    Mondrian本身是不存储数据的,通过MDX语句(一个类似于SQL的查询语言)来获取数据,Mondrian 运行的时候要连数据库,并且还要有一个数据模型配置文件(Mondrian叫schema),其实就是一个取数据的规则;由此可知...
  • 星型模型和olap多维数据库

    千次阅读 2020-02-06 10:14:35
    而olap多维数据库是真实存在的一种数据形式,源自星型模型,通过星型模型的构建理念得到的事实表和维度表关联之后的数据集合, 它具备许多不同的分析角度的维度,方便分析人员进行不同维度、不同需求的数据分析。 ...
  • 数据仓库_多维数据模型

    千次阅读 2014-11-18 09:21:18
    1.数据仓库需要简明的、面向主题的模式,便于联机数据分析。最流行的数据仓库数据模型多维数据模型。这种模型可以以星形模式、雪花模式、或事实星座模式形式存在 2.星
  • 多维数据模型的设计

    千次阅读 2017-11-04 15:34:00
    多维数据模型的设计概述 一、维表、事实表 二、星型模式(star schema) 三、雪花模式(snowflake schema) 四、事实星座模式(Fact Constellation)或星系模式(galaxy schema) 五、度量:分类与计算 六、多维数据...
  • 数据仓库多维数据模型基本概念

    万次阅读 2017-07-13 13:49:52
    这三者就是数据仓库多维数据模型建模的模式. 上图所示就是一个标准的星形模型。 雪花形就是在维度下面又细分出维度,这样切分是为了使表结构更加规范化。雪花模式可以减少冗余,但是减少的那点空间和...
  • 文章目录 一、前言二、数据仓库的定义三、数据仓库的特点四、数据仓库的作用五、数据仓库的架构六、数据仓库的要求七 、数据仓库分层八、数据仓库... 九、数据流向十、数据仓库模型设计基础10.1 维度数据模型10.2 ...
  • 关系型数据库 特点 基于单一关系模型,结构化存储,有完整性约束 通过二维表建立数据之间的联系 采用结构化查询语言(SQL)做数据读写 操作保存数据的一致性 优点 通过事务处理保持数据的一致性 数据更新的开销很小...
  • OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。 OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。OLTP 系统强调数据库内存...
  • 本文提出了一种新的深度学习分类模型——随机多模型深度学习(RMDL),该模型在诸多领域都达到了最佳效果。RMDL通过整合一系列深度学习框架解决了寻找既能使模型体系结构最优,又能提高模型鲁棒性、准确率的问题。...
  • 星型模型和雪花型模型比较

    千次阅读 2018-05-14 10:54:58
    我们常见的关系型数据库,一般是对数据进行CRUD操作,主要用来记录数据,对数据本身的业务含义并不关心,而数据仓库重点是为了关注数据与数据之间的业务含义,我们需要对数据进行分析,为了保证分析的准确和有效,...
  • 但不得不承认多维数据模型是数据仓库的一大特点,也是数据仓库应用和实现的一个重要的方面,通过在数据的组织和存储上的优化,使其更适用于分析的数据查询和获取。 多维数据模型的定义和作用  
  • 维度模型是数据仓库领域的 Ralph Kimball 大师所倡导的,他的 The Data warehouse Toolkit-The Complete Guide to Dimensional Modeling 是数据仓库工程领域最流行的数据仓库建模的经典。 维度建模从分析决策的需求...
  • 关系型数据库的不足

    千次阅读 2018-03-30 11:24:43
    (1)关系数据库所采用的二维表格数据模型不能有效地处理多维数据,不能有效处理互联网应用中半结构化和非结构化的海量数据,如Web页面、电子...关系型数据库勉强可以应付上万次SQL查询,但硬盘I/O往往无法承担上万...
  • 44, No.10, 1402−1407Acta Psychologica Sinica DOI: 10.3724/SP.J.1041.2012.0 1402(西南大学数学与统计学院, 重庆 400715)基于因子分析和单维项目反应理论的多维项目反应理论是测量理论的新发展方向之一。...
  • 星型模型/雪花模型/星座模型多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 20,859
精华内容 8,343
关键字:

关系型多维模型分类