精华内容
下载资源
问答
  • 事实表和维度表
    2022-04-07 13:01:29

    1.事实表
    事实表中的每行数据代表一个业务事件(下单、支付、退款、评价等)。“事实”这个术语表示的是业务事件的度量值(可统计次数、个数、件数、金额等),例如,订单事件中的下单金额。
    每一个事实表的行包括:具有可加性的数值型的度量值、与维表相连接的外键、通常具有两个和两个以上的外键、外键之间表示维表之间多对多的关系。
    每个数据仓库都包含一个或者多个事实数据表,事实表是对分析主题的度量,它包含了与各维度表相关联的外键,并通过连接(Join)方式与维度表关联。

    事实表的度量通常是数值类型,且记录数会不断增加,表规模迅速增长。例如,现存在一张订单事实表,其字段Prod_ id(商品id)可以关联商品维度表、TimeKey(订单时间)可以关联时间维度表等。

    2.维度表
    维度表:一般是对事实的描述信息。每一张维表对应现实世界中的一个对象或者概念。 例如:用户、商品、日期、地区等。
    维表的特征:
    维表的范围很宽(具有多个属性、列比较多)
    跟事实表相比,行数相对较小:通常< 10万条
    内容相对固定:编码表
    维度表可以看作用户分析数据的窗口,维度表中包含事实数据表中事实记录的特性,有些特性提供描述性信息,有些特性指定如何汇总事实数据表数据,以便为分析者提供有用的信息。

    维度表包含帮助汇总数据的特性的层次结构,维度是对数据进行分析时特有的一个角度,站在不同角度看待问题,会有不同的结果。例如,当分析产品销售情况时,可以选择按照商品类别、商品区域进行分析,此时就构成一个类别、区域的维度。维度表信息较为固定,且数据量小,维度表中的列字段可以将信息分为不同层次的结构级。

    更多相关内容
  • 事实表和维度表

    2021-09-18 16:20:14
    事实表和维度表,能够描述一个完整的业务事件。 例如:昨天早上张三 在某个电商平台 花费了 6000 买了一部手机。 那么描述这个事件,需要三个维度,分别是时间维度(昨天早上),商家维度(电商平台),商品维度...

    事实表和维度表,能够描述一个完整的业务事件。

    例如:昨天早上张三 在某个电商平台 花费了 6000 买了一部手机。

    那么描述这个事件,需要三个维度,分别是时间维度(昨天早上),商家维度(电商平台),商品维度(手机)。

    表的分类

    事实表(动词)

    比如,整个魔方就是事实表

    事实表的每行数据代表一个业务事件(下单,支付,退款,评价等),
    这个术语表示的是业务事件的度量值(可以统计次数,个数,金额等)。

    维度表(名词)

    一般是对事实的描述信息,每一张维度表,对应现实世界的一个对象或者概念,例如,用户,商品,日期,地区等。

    维度表的特征:
    范围很宽,具有多个属性,列比较多
    和事实表相比,行数比较小
    内容相对固定,编码表

    维度表就是对事实表的分类方法

    比如,魔方中的每个面

    展开全文
  • 优质资源分享 ...所谓的事实表和维度表技术,指的就是如何构造一张事实表和维度表,是的事实表和维度表,可以涵盖现在目前的需要方便后续下游数据应用的开发。 **事实表,就是一个事实的集合

    🚀 优质资源分享 🚀

    学习路线指引(点击解锁)知识定位人群定位
    🧡 Python实战微信订餐小程序 🧡进阶级本课程是python flask+微信小程序的完美结合,从项目搭建到腾讯云部署上线,打造一个全栈订餐系统。
    💛Python量化交易实战💛入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统

    所谓的事实表和维度表技术,指的就是如何和构造一张事实表和维度表,是的事实表和维度表,可以涵盖现在目前的需要和方便后续下游数据应用的开发。

    **事实表,就是一个事实的集合。**事实来自业务过程的度量,基本上以数量值表示。事实表行对应一个事实,一个事实对应一个物理可以观察的事件,例如,再零售事件中,销售数量与总额是数据事实,与销售事件不相关的度量不可以放在同一个事实表里面,如员工的工资。

    事实表是实际发生的度量,对应的,这些度量我们可以分为三中类型:可加、半可加、不可加。可加性度量可以按照与事实表关联的任意维度汇总。半可加度量可以对某些维度汇总,但不能对所有维度汇总。差额是常见的半可加事实,除了时间维度之外,它们可以跨越所有维度进行加法操作。不可加度量,比如比率,任何维度都不能直接相加。因此对于不可加度量,我们要尽可能的把不可加度量拆分为可加度量,例如比率,我们可以分别存储他们的分子和分母,使其转为可加度量。

    对于事实表,还有一类值NULL,需要我们去校验和保证,对于事实表的度量,我们可以允许存在NULL,不过对于一些外键,则不能存在空值,否在会导致违反参照完整性的情况发生,我们可以赋予默认的代理键来表示未知或者NULL的情况。

    参照的完整性要求关系中不允许引用不存在的实体。与实体完整性是关系模型必须满足的完整性约束条件,目的是保证数据的一致性。参照完整性又称引用完整性。

    如果一个度量出现在多个事实表里面,我们还需要保证,多个事实表汇总到同一个维度的时候,度量的值相等,并且命名尽量相同,这就是一致性事实。一致性事实可以保证数据口径的一致和取数方便。如何保证数据事实的一致性呢?如何保证多张事实表相同字段相同?这里建议有两个,一是字段名称相同,二是开发完成的时候,可以对表数据的值比对,并且可以起一个数据校验的任务,定时校验比对,如果有问题就告警。

    简单的,我们可以大概分为事务事实表,周期快照事实表,累计快照事实表,无事实的事实表。

    • 事务事实表:事务事实表的一行对应空间或者时间上某点的度量事件。即流水行数据。
    • 周期快照事实表:周期快照事实表中的每一行汇总了发生在某一标准周期,例如某一天的多个事实。即按某个维度轻度汇总的数据。
    • 累计快照事实表:累积快照事实表的行汇总了发生在过程开始和结束之间可预测步骤内的度量事件。也就是记录整一个业务过程,如下单,包含下单时间,支付时间,赔付时间等。
    • 无事实的事实表:有一些事件是没有事实的,事实包含多个度量,也就是部分事件没有度量,只有维度,例如某天学生参加的课程。

    三种事实表的比较

    接下来说说维度表的一些要点,维度表包含单一的主键列。维度表的主键可以作为与之关联的任何事实表的外键,当然,维度表行的描述环境与事实表行完全对应。

    维度表开发过程中有下面几个点。

    • 维度代理键,维度表中会包含一个列,表示唯一主键,该主键不是操作型系统的自然键,如果采用自然键,需要多个维度行表示,另外,维度的自然键可能由多个源系统建立,这些自然键可能会出现兼容性问题。所以这里可以对代理键做一些处理,具体可以看业务形态,如果源系统已经保证了唯一,直接应用也是没有问题的。
    • 退化维度,有时,维度除了主键外没有其他内容,例如订单表里面的发票维度只有发票号,没有其他的信息,那么我们可以将这个维度放入事实表里面,这个就是退化维度。
    • 一致性维度,当不同的维度表的属性具有相同列名和领域内容时,称维度具有一致性。利用一致性维度属性与每一个事实表关联,可将来自不同事实表的信息合并到同一个报表里面。

    我们整理了维度表和事实表之后,我们需要形成一个总线矩阵。总线矩阵用于设计数据仓库架构的基本工具,矩阵的行表示业务过程,列代表维度。矩阵中的点表示维度与给定的业务过程是否存在关系,如下图。

    数据仓库总线矩阵

    形成这样的一个架构之后,我们的数据仓库的结构分层,和里面的数据表设计完成了,就可以进行同步和开发了。

    参考资料:数据仓库(8)数仓事实表和维度表技术

    展开全文
  • 学习PowerBI,不只是为了解决Excel中处理不了的问题,更不能还用Excel的思维来玩Power BI,碰到不少人问我,为什么要在PowerBI中创建维度表?Excel都不用建维度表,难道PowerBI还不如Excel吗?Excel中是不用建维度表...

    学习PowerBI,不只是为了解决Excel中处理不了的问题,更不能还用Excel的思维来玩Power BI,碰到不少人问我,为什么要在PowerBI中创建维度表?Excel都不用建维度表,难道PowerBI还不如Excel吗?

    Excel中是不用建维度表,但是你能在Excel中解决这个问题吗?如果想在Excel中解决,现在也可以用Power Pivot来处理,同样要涉及到维度表的构建。

    分析一个简单的问题,维度表确实不是必须的,但这是你进行更复杂分析的基础,也是建立模型思维的基础,如果你想在数据分析的道理上走下去,难道这个基础都不想学会?当你分析得数据越来越多时,你会越发知道维度表的好处。

    当然维度表不是PowerBI所独有的,维度表和事实表是数据建模的基础,在其他的数据分析软件中同样是需要的,这里再简单说一下二者的特征。

    维度表

    就是将分析的维度单独创建的一个表,比如要按产品分析,就把产品名称单独调出来作为一个表在,这个表就是产品维度表。

    维度表中不应该有需要计算的数据,如果有,应该把它移到事实表中。

    有的人虽然建了维度表,但制作图表的时候并不用,依然全部用事实表中的字段,那建维度表还有什么用呢?为了记住用维度表,你可以把维度表称为过滤器表,或者切片器表。

    平时最常用的维度表,就是日期表。对时间序列分析时,日期表非常好用,通过日期表,你也可以理解维度表的作用。

    事实表

    事实表中的每一行都应该是一条记录,比如有100次销售记录,则理想情况下,销售表应包含100行。

    不要尝试在一个表中混合多个事实,如果需要分析采购和销售,可以有两个事实表,有一个用于销售的事实表,另一个采购的事实表。

    避免在事实表之间创建关系,多个事实表可以通过维度表建立关系。

    微信公众号"PowerBI星球"中回复"PowerBI",获取《七天入门Power BI》电子书,帮你轻松上手PowerBI。

    精彩推荐

    展开全文
  • 数据仓库--事实表和维度表

    千次阅读 2018-07-31 23:06:08
    1.数据仓库与操作型数据库的区别 ...最明显的区别是:操作型数据库主要是用来支撑即时操作,对数据库的性能质量要求都比较高,为了防止“garbage in,garbage out”,通常设计操作型数据库的...
  • 这样的不仅包含了维度列(用户 商品)还包含了度量列(数量),是事实表事实表中一般不包含维度列的具体信息。 如,此销售事实表事实表并没有展示用户的具体信息。 2 维度表 维度表主要用来展示某一维度...
  • 事实表维度表基本解释
  • 前面我们介绍了数仓建模—数仓开发规范,我们也介绍了事实表和维度表你可以参考数仓建模—事实表和数仓建模—维度表,但是我们的数仓设计其实很大一部分就是在设计维度表和事实表,所以我们这里就单独再看一下事实表和...
  • 事实表维度表设计

    2017-07-26 14:01:44
    事实表维度表设计
  • 数据仓库架构中的中央,它包含联系事实维度表的数字度量值键。事实数据包含描述业务(如银行事务或产品销售)内特定事件的数据。 维度表 数据仓库中的,其条目描述事实数据中的数据。维度表包含创建...
  • 事实表和维度表的定义

    万次阅读 2018-08-26 23:29:46
    也就是说事实表是多个维度表的一个交点。而维度表是分析事实的一个窗口。   首先介绍下数据库结构中的星型结构,该结构在位于结构中心的单个事实数据中维护数据,其它维度数据存储在维度表中。每个维度表事实...
  • 什么是事实表和维度?什么是维度和度量?

    万次阅读 多人点赞 2021-04-18 08:29:42
    写在前面 本文隶属于专栏《100个问题搞定大数据理论体系》,该专栏为笔者原创,引用请注明来源,不足...事实表包含了与各维度表相关联的外键,并通过join方式与维度表关联。事实表的度量通常是数值类型, 且记录数会
  • 数仓之事实表和维度表(一)

    千次阅读 2018-12-27 16:47:53
    事实表: 事务事实表:(-&amp;amp;gt;明细事实表-&amp;amp;gt;聚合事实表) ...明细事实表(单事件事实表,流程事实表): 一般位于DWD层,该层事实表设计不进行聚合,汇总等动作,仅做数据规范化...
  • 1个典型的例子是,把逻辑业务比作1个立方体,产品维、时间维、地点维分别作为不同的坐标轴,而坐标轴的交点就是1个...事实表是数据仓库结构中的中央,它包括联系事实维度表的数字度量值键。事实数据包括描写...
  • 文章目录1 数仓分层1.1 基本分层模型1.2 数据集市数据仓库2 数仓理论2.1 范式理论2.2 关系建模和维度建模2.2.1 关系建模2.2.2 维度建模2.2.2.1 维度建模的三种模型2.3 维度表和事实表2.3.1 维度表2.3.2 事实表 ...
  • 事实表维度表

    千次阅读 2021-08-26 15:49:19
    文章目录前言一、事实表1.2、事实表的特征1.3、事实表的类型1.3.1、...2.3、维度表的好处三、维度表 vs 事实表3.1、事实表和之间的主要区别3.2、对比项关注我的公众号【宝哥大数据】,更多干货 前言 事实表包含系统
  • 数据仓库-事实表和维度表的设计

    万次阅读 2018-05-28 11:01:05
    最明显的区别是:操作型数据库主要是用来支撑即时操作,对数据库的性能质量要求都比较高,为了防止“garbage in,garbage out”,通常设计操作型数据库的都要遵循几个范式的约束,除非少数情况下为了性能进行妥协...
  • 一个典型的例子是,把逻辑业务比作一个立方体,产品维、时间维、地点维分别作为不同的坐标轴,而坐标轴的交点就是一个...每个维度表事实数据直接相关,且通常通过一个键联接到事实数据中。星型架构是数据仓...
  • 维度表示你要对数据进行分析时所用的一个量,比如你要分析产品销售情况,你可以选择按类别来进行分析,或按区域来...下面是两个常见的维度表结构:产品维度表:Prod_id, Product_Name, Category, Color, Size, Pri...
  • 刚开始系统地接触数据仓库,关于事实表维度表的概念关系,找了CSDN博客园很多文章,都讲得太抽象、术语多,越看越懵,一直在想它们的从属关系或对应关系。反而知乎上的一篇让我豁然开朗: 事实表维度表 最后...
  • BI中的事实表和维度表

    千次阅读 2017-09-22 21:08:26
    并且这些数字信息可以汇总,以提供有关单位作为历史的数据,每个事实数据包含一个由多个部分组成的索引,该索引包含作为外键的相关性维度表的主键,而维度表包含事实记录的特性。 事实数据不应该包含描述性
  • 事实表:数据聚合后依据某个维度生成的结果事实表是用来储存主题的主干内容的,以日常工作内容举例,工作量可能具有如下属性:工作日期,人员,工作时长,加班时长,工作性质,是否外勤,工作内容,审核人,...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 70,591
精华内容 28,236
关键字:

事实表和维度表

友情链接: imwtallation.zip