精华内容
下载资源
问答
  • 更多相关内容
  • 雪花模型去除了冗余,设计复杂,可读性差,关联的维度表多,查询效率低,但是可扩展性好。 星型模型冗余度高,设计简单,可读性高,关联的维度表少,查询效率高,可扩展性低。

    根据事实表和维度表之间的关系,我们将常见的模型分为星型模型和雪花模型。

    雪花模型去除了冗余,设计复杂,可读性差,关联的维度表多,查询效率低,但是可扩展性好。
    星型模型冗余度高,设计简单,可读性高,关联的维度表少,查询效率高,可扩展性低。

    一、星型模型
    星型模型:当所有的维度表都是和事实表直接相连的时候,整个图形看上去就像是一个星星,我们称之为星型模型。星型模型是一种非正规化的架构,因为多维数据集的每一个维度都和事实表直接相连,不存在渐变维度,所以有一定的数据冗余,因为有数据的冗余,很多的统计情况下,不需要和外表关联进行查询和数据分析,因此效率相对较高。
    在这里插入图片描述

    二、雪花模型
    雪花模型:当有多个维度表没有直接和事实表相连,而是通过其它的维度表,间接的连接在事实表上,其图形就像是一个雪花,因此我们称之为雪花模型,雪花模型的优点是减少了数据冗余,在进行数据统计或分析的时候,需要和其他的表进行关联。
    在这里插入图片描述

    三、区别
    星型模型和雪花模型最根本的区别就是,维度表是直接连接到事实表还是其他的维度表。
    1)星型模型因为数据的冗余所以很多统计查询不需要做外部的连接,因此一般情况下效率比雪花模型要高。
    2)星型模型不用考虑很多正规化的因素,设计和实现都比较简单。
    3)雪花模型由于去除了冗余,有些统计就需要通过表的连接才能产生,所以效率不一定有星型模型高。
    4)正规化也是一种比较复杂的过程,相应的数据库结构设计、数据的ETL、以及后期的维护都要复杂一些。因此在冗余可以接受的前提下,实际运用中星型模型使用更多,也更有效率。
    在这里插入图片描述

    展开全文
  • 在数据仓库的建设中,一般都会围绕着星型模型和雪花模型来设计表关系或者结构。下面我们先来理解这两种模型的概念。 (一)星型模型图示如下: 星型模是一种多维的数据关系,它由一个事实表和一组维表组成。每个...

    在数据仓库的建设中,一般都会围绕着星型模型和雪花模型来设计表关系或者结构。下面我们先来理解这两种模型的概念。

    (一)星型模型图示如下:

    image

    星型模是一种多维的数据关系,它由一个事实表和一组维表组成。每个维表都有一个维作为主键,所有这些维的主键组合成事实表的主键。强调的是对维度进行预处理,将多个维度集合到一个事实表,形成一个宽表。这也是我们在使用hive时,经常会看到一些大宽表的原因,大宽表一般都是事实表,包含了维度关联的主键和一些度量信息,而维度表则是事实表里面维度的具体信息,使用时候一般通过join来组合数据,相对来说对OLAP的分析比较方便。

    (二)雪花模型图示如下: image

    当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星型模型的扩展。它对星型模型的维表进一步层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的 "层次 " 区域,这些被分解的表都连接到主维度表而不是事实表。雪花模型更加符合数据库范式,减少数据冗余,但是在分析数据的时候,操作比较复杂,需要join的表比较多所以其性能并不一定比星型模型高。

    (三)星型模型和雪花模型的优劣对比:

    属性星型模型雪花模型
    数据总量
    可读性容易
    表个数
    查询速度
    冗余度
    对实时表的情况增加宽度字段比较少,冗余底
    扩展性

    (四)应用场景

    星型模型的设计方式主要带来的好处是能够提升查询效率,因为生成的事实表已经经过预处理,主要的数据都在事实表里面,所以只要扫描实时表就能够进行大量的查询,而不必进行大量的join,其次维表数据一般比较少,在join可直接放入内存进行join以提升效率,除此之外,星型模型的事实表可读性比较好,不用关联多个表就能获取大部分核心信息,设计维护相对比较简答。

    雪花模型的设计方式是比较符合数据库范式的理念,设计方式比较正规,数据冗余少,但在查询的时候可能需要join多张表从而导致查询效率下降,此外规范化操作在后期维护比较复杂。

    (五)总结

    通过上面的对比,我们可以发现数据仓库大多数时候是比较适合使用星型模型构建底层数据Hive表,通过大量的冗余来提升查询效率,星型模型对OLAP的分析引擎支持比较友好,这一点在Kylin中比较能体现。而雪花模型在关系型数据库中如MySQL,Oracle中非常常见,尤其像电商的数据库表。在数据仓库中雪花模型的应用场景比较少,但也不是没有,所以在具体设计的时候,可以考虑是不是能结合两者的优点参与设计,以此达到设计的最优化目的。

    展开全文
  • 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行...星型模型雪花模型,应该..

    在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。

    当所有维表都直接连接到“ 事实表”上时,整个图解就像星星一样,故将该模型称为星型模型。

     

    这个模型不设计指标表,只是维度表和事实数据表,事实表里就是埋点日志,日志表头含有维度字段作为主键。

     

    星型模式是多维的数据关系,它由事实表和维表组成。

    每个维表中都会有一个维作为主键,

    所有这些维的主键结合成事实表的主键。

    事实表的非主键属性称为事实,它们一般都是数值或其他可以进行计算的数据。

     

    星型模型与雪花模型,应该是数仓面试者最喜欢提的问题,也是比较容易理解的概念。

    1.星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定的冗余,例图如下:

    星型模型

    2.当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星型模型的扩展。它对星型模型的维表进一步层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的 "层次 " 区域,这些被分解的表都连接到主维度表而不是事实表。如图 2,将地域维表又分解为国家,省份,城市等维表。它的优点是 :通过最大限度地减少数据存储量以及联合较小的维表来改善查询性能。雪花型结构去除了数据冗余。

    雪花模型

    一般在互联网公司推崇星型模型,使用便利方便

     

    这里的数据冗余,我举例说明一下,不是数据重复,而是数据冗余。

    比如地域维度,星型模型会记录中国-广东省-深圳市,中国-广东省-广州市,中国和广东省就是所说的数据冗余

    而雪花模型,会分成多个维度表去记录,一个国家维度表,中国,一个省份维度表,写广东省,一个城市维度表,写深圳市、广州市,这样子每个数据都只记录一次,而不是像星型模型那样子前面几列有重复的情况。

    这就是所说的数据冗余。

    雪花模型分得太细了,没必要,

    一张地域表直接维护国家、省份、广州几个同样是地域类型的维度即可。

     

    参考:

    https://blog.csdn.net/qq_28666081/article/details/104686822

    https://www.jianshu.com/p/43f3dffc2b69

    展开全文
  • 星型模型和雪花模型的应用场景 从现在项目中看 大部分 Fact 和 Dimnsn 的关联关系都是 星型的 ,有很少量的是采用了雪花型的 。 至于什么模式适用什么场景很难有一个可靠的规则去决定,主要裁决与模型的运行效率 和...
  • 数据仓库的星型模型和雪花模型 星型模型 星型模型是维度模型最简单的形式,也是数据仓库以及数据集市开发中使用最广泛的形式。 星型模式由事实表和维度表组成,一个星型模式中可以有一个或多个事实表,每个事实表...
  • 星型模型和雪花模型

    2019-02-01 14:39:14
    文章目录星型模型雪花模型优点星型模型和雪花模型的对比1) 数据优化2)业务模型3)性能4) ETL总结 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型个雪花模型,在设计逻辑型...
  • 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的数据模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。 当所有维表都...
  • 数据仓库的建设中,一般都会围绕着星型模型和雪花模型来设计表关系或者结构。下面我们先来理解这两种模型的概念。 一.销售数据仓库星型模型如下: 星型模是一种多维的数据关系,它由一个事实表和一组维表组成。...
  • 一、概述在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。当所有维表都...
  • 一、概述在数据仓库的建设中,一般都会围绕着星型模型...比如:销售数据仓库中的星型模型image.png三、雪花模型雪花模型:当有一个或多个维度表没有直接连接到事实表上,而是通过其他维度表连接到事实表上时,其图解...
  • 星型模型/雪花模型/星座模型在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行...
  • 在实际工作中多维分析的商业智能解决方案,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。 星型模型 ...
  • 在数据仓库设计中,一般表结构设计有两种方式:星形模型和雪花模型
  • 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。 在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。 当所有维表都直接...
  • 数仓建模—雪花模型和星型模型

    万次阅读 2021-11-21 10:10:24
    雪花模型和星型模型 前面我们在学习数仓建模—建模方法论的时候提到了雪花模型和星型模型以及星座模型的这个概念,但是也对这个概念进行了一定的解释,但是那一片是为了介绍方法论,所以重点还是在方法论上面,这...
  • 理解数据仓库中星型模型和雪花模型 原创三劫散仙 最后发布于2017-07-06 18:32:27 阅读数 18910 收藏 展开 在数据仓库的建设中,一般都会围绕着星型模型和雪花模型来设计表关系或者结构。下面我们先来理解这两种模型...
  • 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。 一、星型模型 当...
  • 星型模型和雪花模型 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。 ...
  • 根据事实表和维度表的关系,可将常见的模型分为星型模型和雪花模型。在数据仓库的建设中,一般都会围绕着这两种模型来设计表关系或者结构。那么什么是事实表和维度表呢?在维度建模中,将度量称为“事实” ,将环境...
  • 一文让你了解星型模型雪花模型、星座模型相关的知识。
  • 表与表之间的关系 星型模型雪花模型:事实表关联了维度表,但是维度表关联了其他的表(国家,省市)。...所以在数仓的设计中,雪花模型不如星型模型流行。 地域维表 国家a GDP 国家b GDP 国家a 省份...
  • 在数据仓库的建设中,一般都会围绕着星型模型和雪花模型来设计表关系或者结构。下面我们先来理解两种模型的概念。 星型模型图如下: 星型模型:是一种使用关系型数据库实现多维度分析空间的模式,用星型模型可以...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 4,125
精华内容 1,650
关键字:

星型模型和雪花模型

友情链接: 69454679.rar