精华内容
下载资源
问答
  • 在本文中,我们探索了种新的,在曲率坐标中的紧凑恒星的静态,球对称带电各向异性流体模型。 我们考虑了杜尔加帕尔第五解决方案[1]的度量电势g44,它具有特定的电场强度E和各向异性系数Δ的物理可接受表达式,分别...
  • 模型雪花模型星型模型是所有维度表都是连接在个事实表上面,雪花模型是将维度表拆分地更加详细,是多层次的。在星型模型的维度表里面,一张维度表储存了众多存在冗余的信息,为什么冗余,在哪里冗余,我想了...

    星形模型

    雪花模型

    星型模型是所有维度表都是连接在一个事实表上面,雪花模型是将维度表拆分地更加详细,是多层次的。

    在星型模型的维度表里面,一张维度表储存了众多存在冗余的信息,为什么冗余,在哪里冗余,我想了一个简单的例子。

    地域维表

    国家a    GDP

    国家b    GDP

    国家a    省份a    GDP

    国家a    省份b    GDP

    国家a    省份c    GDP

    国家a    省份a    市级a    GDP

    国家a    省份a    市级b    GDP

    国家a    省份a    市级c    GDP

    在雪花模型的表中,是这样

    国家表

    国家a    GDP

    国家b    GDP

    国家a省份表

    省份a    GDP

    省份b    GDP

    省份c    GDP

    国家a省份a市表

    市级a    GDP

    市级b    GDP

    市级c    GDP

    这样有一部分信息只需要存储一次,减少了冗余信息。

    在现有的多维数据仓库的商业智能解决方案中,根据维度表和事实表的关系,在实施过程中,维度设计会映射到 一组关系表,可以把数据库模型分为星型模型和雪花模型,下面我们分别看一下这两种不同的模型。

    星型模型:

    中央表包含事实数据,多个表以中央表为中心呈放射状分布,它们通过数据库的主键和外键相互连接,是一种使用关系数据库实现多维分析空间的模式,其基本形式必须实现多维空间,以使用关系数据库的基本功能。同时星型模型也是一种非正规化的模型,多维数据集的每一个维度直接与事实表连接,没有渐变维度,所以存在冗余数据。在星型模型中,只需要扫描事实表就可以进行查询,主要的数据都在庞大的事实表中,所以查询效率较高,同时每个维度表和事实表关联,非常直观,很容易组合出各种查询。

    雪花模型:

    雪花模型在星型模型的基础上,维度表进一步规范化为子维度表,这些子维度表没有直接与事实表连接,而是通过其他维度表连接到事实表上,看起来就像一片雪花,故称雪花模型。也就是说雪花模型是星型模型的进一步扩展,将其维度表扩展为更小的维度表,形成一种层次。这样就通过最大限度的减少数据存储量以及联合较小的维度表来改善查询性能,且去除了星型模型中的冗余数据。

    星型模型和雪花模型的特点比较:

    星型模型

    雪花模型

    特点

    非正规化;

    多维数据集中的每一个维度都与事实表连接(通过主键和外键);

    不存在渐变维度;

    有冗余数据;

    查询效率可能会比较高;

    不用过多考虑正规化因素,设计维护较为简单

    正规化;

    数据冗余少;

    有些数据需要连接才能获取,可能效率较低;

    规范化操作较复杂,导致设计及后期维护复杂;

    当然是实际开发的过程中,可以在数据仓库架构中同时使用这两种模型的混合体。比如中间处理层,可以用雪花模型降低冗余度,在数据集市层,采用星型模型方便提取数据,提高查询效率

    展开全文
  • 网站seo优化之星模型

    2020-12-21 09:41:29
    模型是在关系数据库设计-关系数据SEO模型中广泛使用的实体。在关系数据模型中,实体及其连接的集合构成了数据库模型,它更适合于在线事务处理。但是,数据仓库要求模型必须面向主题且简洁,这有助于在线数据的...

    星形模型是在关系数据库设计-关系数据SEO模型中广泛使用的实体。在关系数据模型中,实体及其连接的集合构成了数据库模型,它更适合于在线事务处理。但是,数据仓库要求模型必须面向主题且简洁,这有助于在线数据的分析。当前,多维数据模型是数据仓库数据模型的最常见形式。典型形式包括星形模型,事实星座模型,雪花模型等。最典型的模型是星形模型。数据库中包含海量数据,事实(即,没有冗余数据表)等,包括一组辅助表,即维表。

    展开全文
  • 模型和雪花模型

    2018-01-29 14:54:58
    、概述 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。 当所有维...

    一、概述

    在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。

    当所有维表都直接连接到" 事实表"上时,整个图解就像星星一样,故将该模型称为星型模型,如图 1 。

    星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定的冗余 ,如在地域维度表中,存在国家 A 省 B 的城市 C 以及国家 A 省 B 的城市 D 两条记录,那么国家 A 和省 B 的信息分别存储了两次,即存在冗余。

    图1. 销售数据仓库中的星型模型

    当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星型模型的扩展。它对星型模型的维表进一步层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的 " 层次 " 区域,这些被分解的表都连接到主维度表而不是事实表。如图 2,将地域维表又分解为国家,省份,城市等维表。它的优点是 : 通过最大限度地减少数据存储量以及联合较小的维表来改善查询性能。 雪花型结构去除了数据冗余。

    图 2. 销售数据仓库中的雪花型模型

    星型模型因为数据的冗余所以很多统计查询不需要做外部的连接,因此一般情况下效率比雪花型模型要高。 星型结构不用考虑很多正规化的因素,设计与实现都比较简单。雪花型模型由于去除了冗余,有些统计就需要通过表的联接才能产生,所以效率不一定有星型模型高。正规化也是一种比较复杂的过程,相应的数据库结构设计、数据的 ETL、以及后期的维护都要复杂一些。 因此在冗余可以接受的前提下,实际运用中星型模型使用更多,也更有效率。

    二、使用选择

    星形模型(Star Schema)和雪花模型(Snowflake Schema)是数据仓库中常用到的两种方式,而它们之间的对比要从四个角度来进行讨论。

       1.数据优化

    雪花模型使用的是规范化数据,也就是说数据在数据库内部是组织好的,以便消除冗余,因此它能够有效地减少数据量。 通过引用完整性,其业务层级和维度都将存储在数据模型之中。

    相比较而言,星形模型实用的是反规范化数据。 在星形模型中,维度直接指的是事实表,业务层级不会通过维度之间的参照完整性来部署。

    ▲图2 星形模型

      * 2.业务模型*

    主键是一个单独的唯一键(数据属性),为特殊数据所选择。在上面的例子中,Advertiser_ID就将是一个主键。外键(参考属性)仅仅是一个表中的字段,用来匹配其他维度表中的主键。在我们所引用的例子中,Advertiser_ID将是Account_dimension的一个外键。

    在雪花模型中,数据模型的业务层级是由一个不同维度表主键-外键的关系来代表的。而在星形模型中,所有必要的维度表在事实表中都只拥有外键。

      * 3.性能*

    第三个区别在于性能的不同。 雪花模型在维度表、事实表之间的连接很多,因此性能方面会比较低。 举个例子,如果你想要知道Advertiser 的详细信息,雪花模型就会请求许多信息,比如Advertiser Name、ID以及那些广告主和客户表的地址需要连接起来,然后再与事实表连接。

    而星形模型的连接就少的多,在这个模型中,如果你需要上述信息,你只要将Advertiser的维度表和事实表连接即可。

       4.ETL

    雪花模型加载数据集市,因此ETL操作在设计上更加复杂,而且由于附属模型的限制,不能并行化。

    星形模型加载维度表,不需要再维度之间添加附属模型,因此ETL就相对简单,而且可以实现高度的并行化。

       总结

    雪花模型使得维度分析更加容易,比如"针对特定的广告主,有哪些客户或者公司是在线的?"星形模型用来做指标分析更适合,比如"给定的一个客户他们的收入是多少?"
    ps:简单的来说,星形模型就是只有一级关联, 也就是维度表跟主表都有直接的关联,查询的时候使用join的次数比较少,所以运算比较快。尔雪花模型是关系又产生了关系,关系网比较复杂,查询的时候使用的join次数比较多,所以运算比较慢,但是占用存储比较少,也就是使用时间换空间。

    展开全文
  • 数据仓库雪花模型VS模型 、概述 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是...

    数据仓库雪花模型VS星形模型

    一、概述

    在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。

    当所有维表都直接连接到“ 事实表”上时,整个图解就像星星一样,故将该模型称为星型模型,如图 1 。

    星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定的冗余,如在地域维度表中,存在国家 A 省 B 的城市 C 以及国家 A 省 B 的城市 D 两条记录,那么国家 A 和省 B 的信息分别存储了两次,即存在冗余。

    图1. 销售数据仓库中的星型模型

     

    当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星型模型的扩展。它对星型模型的维表进一步层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的 " 层次 " 区域,这些被分解的表都连接到主维度表而不是事实表。如图 2,将地域维表又分解为国家,省份,城市等维表。它的优点是 : 通过最大限度地减少数据存储量以及联合较小的维表来改善查询性能。雪花型结构去除了数据冗余。

    图 2. 销售数据仓库中的雪花型模型

     

    星型模型因为数据的冗余所以很多统计查询不需要做外部的连接,因此一般情况下效率比雪花型模型要高。星型结构不用考虑很多正规化的因素,设计与实现都比较简单。雪花型模型由于去除了冗余,有些统计就需要通过表的联接才能产生,所以效率不一定有星型模型高。正规化也是一种比较复杂的过程,相应的数据库结构设计、数据的 ETL、以及后期的维护都要复杂一些。因此在冗余可以接受的前提下,实际运用中星型模型使用更多,也更有效率。

    二、使用选择

    星形模型(Star Schema)和雪花模型(Snowflake Schema)是数据仓库中常用到的两种方式,而它们之间的对比要从四个角度来进行讨论。

    1.数据优化

    雪花模型使用的是规范化数据,也就是说数据在数据库内部是组织好的,以便消除冗余,因此它能够有效地减少数据量。通过引用完整性,其业务层级和维度都将存储在数据模型之中。


    ▲图1 雪花模型

    相比较而言,星形模型实用的是反规范化数据。在星形模型中,维度直接指的是事实表,业务层级不会通过维度之间的参照完整性来部署。

    ▲图2 星形模型

    2.业务模型

    主键是一个单独的唯一键(数据属性),为特殊数据所选择。在上面的例子中,Advertiser_ID就将是一个主键。外键(参考属性)仅仅是一个表中的字段,用来匹配其他维度表中的主键。在我们所引用的例子中,Advertiser_ID将是Account_dimension的一个外键。

    在雪花模型中,数据模型的业务层级是由一个不同维度表主键-外键的关系来代表的。而在星形模型中,所有必要的维度表在事实表中都只拥有外键。

    3.性能

    第三个区别在于性能的不同。雪花模型在维度表、事实表之间的连接很多,因此性能方面会比较低。举个例子,如果你想要知道Advertiser 的详细信息,雪花模型就会请求许多信息,比如Advertiser Name、ID以及那些广告主和客户表的地址需要连接起来,然后再与事实表连接。

    而星形模型的连接就少的多,在这个模型中,如果你需要上述信息,你只要将Advertiser的维度表和事实表连接即可。

    4.ETL

    雪花模型加载数据集市,因此ETL操作在设计上更加复杂,而且由于附属模型的限制,不能并行化。

    星形模型加载维度表,不需要再维度之间添加附属模型,因此ETL就相对简单,而且可以实现高度的并行化。

    总结

    雪花模型使得维度分析更加容易,比如“针对特定的广告主,有哪些客户或者公司是在线的?”星形模型用来做指标分析更适合,比如“给定的一个客户他们的收入是多少?”

     

     

    展开全文
  • 、概述 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。 当所有维...
  • 模型 雪花模型 星型模型是所有维度表都是连接在个事实表上面,雪花模型是将维度表拆分地更加详细,是多层次的。 在星型模型的维度表里面,一张维度表储存了众多存在冗余的信息,为什么冗余,在哪里冗余...
  • 在构建数据仓库的维度建模中,一般有三种模式。星型模型/雪花模型/星座模型在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型... 星型架构是种非正规化的结构,多维数据集的每个维度...
  • 为了得到种有效的高精度点提取算法,直接将高斯分布作为敏感器像能量分布的做法已经不能满足实现甚高精度敏感器的要求,因此必须研究实际敏感器像能量分布模型。使用了偏正态分布来描述高精度敏感器...
  • 星型模型如下图所示星型模型星模型:当所有维度表连接到事实表上的时候,整个图就像个星星,故称之为星型模型。星型架构是种非正规化的结构,多维数据集的每个维度都直接与事实表相连,不存在渐变维度,所以...
  • 、概述在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。当所有维表都...
  • 星型模式 vs 雪花模型

    2016-04-06 14:00:18
    个多维数据模型由多个多维数据模式表示,每个多维数据模式都是由个事实表和组维表组成的。多维模型最常见的是形模式。在形模式中,事实表居中,多个维表呈辐射状分布于其四周,并与事实表连接。 在...
  • 、概述在数据仓库的建设中,一般都会围绕着星型模型和雪花模型来设计表关系或者结构。下面我们先来理解这两种模型的概念。二、星型模型星型模型:是种非正规化的结构,多维数据集的每个维度都直接与事实表相来...
  • 每个维表中都会有个维作为主键,所有这些维的主键结合成事实表的主键。事实表的非主键属性称为事实,它们一般都是数值或其他可以进行计算的数据。在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可...
  • 、星型模型星型模型:是种多维的数据关系,它由个事实表(Fact Table)和组维表(Dimension Table)组成。每个维表都有个维作为主键,所有这些维的主键组合成事实表的主键。事实表的非主键属...
  • 种基于星型拓扑结构的柔性工作流模型,夏盛明,尹宝林,工作流技术在企业办公自动化系统中日益得到广泛应用,使用工作流技术能够极大地提高企业的办事效率。企业的业务流程具有变化性,
  • 二、数据模型的分类数据模型的分类有大宽表、模型、雪花模型等。这些不同种类的模型只在数据冗余度和查询性能上有区别,并无正确与错误之分。如果用户侧重高性能,则选用大宽表,若追求最小的数据冗余,则选用雪...
  • 、星型模式、 二、星型模式 缺点、 三、雪片模型、 四、星型模型 雪片模型 折衷方案、 五、事实群模型 ( 仅做了解 )、 六、度量、
  • 前言 今天给大家分享下数仓中的模型设计,个好的数仓项目首先看一下它的架构以及他所用到的模型,它们使用的模型也都是非常巧妙的,好了,我们话不说到直接开始。、维度建模基本概念 维度模型是数据仓库领域大师...
  • 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。... 星型架构是种非正规化的结构,多维数据集的每个维度都直接与事实表相连接,不...
  • NABCD模型——

    2019-04-15 10:49:00
    NABCD模型——遇 我们项目是个面向希望有新奇体验的用户的社交软件,致力于打造不一样的有趣的社交。 发表后周预计用户量:1000人  N:(Need,需求) 目前主流社交软件由于时间原因体量越来越大,各种繁琐...
  • 每个数据仓库都包含个或者多个事实数据表。事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行。事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以...
  • 建设数据模型既然是整个数据仓库建设中个非常重要的关键部分,那么,怎么建设我们的数据仓库模型就是我们需要解决的个问题。这里我们将要详细介绍如何创建适合自己的数据模型。数据仓库建模方法大千世界,表面看...
  • 新智元报道 来源:GitHub作者:Google Research 编辑:肖琴【新智元导读】谷歌AI团队终于开源了...昨天,谷歌在GitHub上发布了备受关注的“最强NLP模型”BERT的TensorFlow代码和预训练模型,不到天时间,已经获...
  • 它必须集中于某问题领域,例如航空服务、顾客收益等。 数据仓库也有有趣的一面,那就是数据库本身是稳定增长的。数据没有被删除,也不发生变更。我们不需要将冗余数据置于数据库之外(因为加入仓库中的数据经过了...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,100
精华内容 440
关键字:

一星模型