精华内容
下载资源
问答
  • 维度表和事实

    2021-01-04 21:29:58
    维度表和事实 一、维度表 维度表:一般是对事实的描述信息。每一张维对应现实世界中的一个对象或者概念。 例如:用户、商品、日期、地区等。 维的特征: 维的范围很(具有多个属性、列比较多) 跟事实...

    维度表和事实表

    一、维度表

    维度表:一般是对事实的描述信息。每一张维表对应现实世界中的一个对象或者概念。 例如:用户、商品、日期、地区等。

    维表的特征:

    • 维表的范围很宽(具有多个属性、列比较多)
    • 跟事实表相比,行数相对较小:通常< 10万条
    • 内容相对固定:编码表

    二、事实表

    事实表中的每行数据代表一个业务事件(下单、支付、退款、评价等)。“事实”这个术语表示的是业务事件的度量值(可统计次数、个数、金额等),例如,订单事件中的下单金额。

    每一个事实表的行包括:具有可加性的数值型的度量值、与维表相连接的外键、通常具有两个和两个以上的外键、外键之间表示维表之间多对多的关系。

    事实表的特征:

    • 非常的大
    • 内容相对的窄:列数较少
    • 经常发生变化,每天会新增加很多。

    1)事务型事实表

    以每个事务或事件为单位,例如一个销售订单记录,一笔支付记录等,作为事实表里的一行数据。一旦事务被提交,事实表数据被插入,数据就不再进行更改,其更新方式为增量更新。

    2)周期型快照事实表

    周期型快照事实表中不会保留所有数据,只保留固定时间间隔的数据,例如每天或者每月的销售额,或每月的账户余额等。

    3)累积型快照事实表

    累计快照事实表用于跟踪业务事实的变化。例如,数据仓库中可能需要累积或者存储订单从下订单开始,到订单商品被打包、运输、和签收的各个业务阶段的时间点数据来跟踪订单声明周期的进展情况。当这个业务过程进行时,事实表的记录也要不断更新。

    展开全文
  • 数据仓库之维度表和事实

    千次阅读 2020-05-30 20:03:57
     维的范围很(具有多个属性、列比较多)  跟事实相比,行数相对较小:通常< 10 万条  内容相对固定:编码 时间维度表: 2 事实 事实中的 每行数据代表一个业务事件(下单、支付、退款、评价等...

    1 维度表
    维度表:一般是对事实的 描述信息。每一张维表对应现实世界中的一个对象或者概念。
    例如:用户、商品、日期、地区等。
    维表的特征:
     维表的范围很宽(具有多个属性、列比较多)
     跟事实表相比,行数相对较小:通常< 10 万条
     内容相对固定:编码表
    时间维度表:
    在这里插入图片描述
    2 事实表
    事实表中的 每行数据代表一个业务事件(下单、支付、退款、评价等)。“事实”这
    个术语表示的是业务事件的 度量值(可统计次数、个数、件数、金额等),例如,订单事
    件中的下单金额。
    每一个事实表的行包括:具有可加性的数值型的度量值、与维表相连接的外键、通常具
    有两个和两个以上的外键、外键之间表示维表之间多对多的关系。
    事实表的特征:
     非常的大
     内容相对的窄:列数较少
     经常发生变化,每天会新增加很多。
    1 )事务型事实表
    以 每个事务或事件为单位,例如一个销售订单记录,一笔支付记录等,作为事实表里的
    一行数据。一旦事务被提交,事实表数据被插入,数据就不再进行更改,其更新方式为增量
    更新。
    2 )周期型快照事实表
    周期型快照事实表中 不会保留所有数据, 只保留固定时间间隔的数据,例如每天或者
    每月的销售额,或每月的账户余额等。
    3 )累积型快照事实表
    累计快照事实表用于跟踪业务事实的变化。例如,数据仓库中可能需要累积或者存储
    订单从下订单开始,到订单商品被打包、运输、和签收的各个业务阶段的时间点数据来跟踪
    订单声明周期的进展情况。当这个业务过程进行时,事实表的记录也要不断更新。
    在这里插入图片描述

    展开全文
  • 我不是做技术的,我强行回答一下:数据仓库每张的搭建,主要依赖于这个在整个数据仓库中的作用相关意义。首先要清楚这个的存在是为了解决那些问题,什么角色使用,怎么保证使用者尽可能好的体验解决问题。从...

    我不是做技术的,我强行回答一下:

    数据仓库每张表的搭建,主要依赖于这个表在整个数据仓库中的作用和相关意义。首先要清楚这个表的存在是为了解决那些问题,什么角色使用,怎么保证使用者尽可能好的体验解决问题。

    从以上所提到的角度去看待问题,拆解以下几点因素:

    1、拆表情况下多张数据表的查询SQL的编写难度有多大,是否会出现为了数据提取需要关联多张表,并且需要提前知道各个表之间的关联关系。如果使用这个数据的人员较多,每个人都需要先了解所需要多张表的关联关系,然后才进行数据查询,这样是不是维度沟通成本较高,查询体验下降,影响使用者的工作效率?

    2、多表关联查询的使用频次有多高,将重复高频的事情简化,是不是更好?

    3、查询体验上需要考虑多表关联之后的查询性能问题,如果一张表的内容过度,是否影响查询速度?

    4、多表关联的合理性,不同的数据维度和内容与订单表关联,是不是会存在违背常理的坑存在。比如,数据字段的对应关系是一对一,还是多对多,是否会让使用者忽略查询数据时候的过滤限制条件。

    5、数据的安全问题,每张数据表的安全范围不同,合并成同一张表是面临的是更大的权限开放。比如订单表可能仅需要让一部分人员知晓订单信息,并不想让他们知道供应商信息。

    2018-03-01-暂时想到这么多。

    展开全文
  • 宽表和窄表的区别

    2020-12-17 14:32:14
    一、宽表 (1)宽表:从字面意义上讲就是字段比较多的数据库表。通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。由于把不同的内容都放在同一张表存储,宽表已经不符合三范式的模型设计规范,随之...

    一、宽表
    (1)宽表:从字面意义上讲就是字段比较多的数据库表。通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。由于把不同的内容都放在同一张表存储,宽表已经不符合三范式的模型设计规范,随之带来的主要坏处就是数据的大量冗余,与之相对应的好处就是查询性能的提高与便捷。这种宽表的设计广泛应用于数据挖掘模型训练前的数据准备,通过把相关字段放在同一张表中,可以大大提高数据挖掘模型训练过程中迭代计算时的效率问题。(一句话,空间换时间,便于训练迭代、减少表关联数量,修改少量数据时不需要该多张表)

    (2)“宽表”特点:一个表就是一个class,每个字段就是一个filed,操作简单。但不便扩展。

    二、窄表
    (1)窄表:严格按照数据库设计三范式。尽量减少数据冗余,但是缺点是修改一个数据可能需要修改多张表。

    (2)“窄表”特点:方便扩展,能适应各种复杂的数据结构(树形、继承等),无论有多少配置,都不用修改表结构。但代码逻辑可能需要包装一下

    展开全文
  • 有这样需求,消息发来是有站点名,但与需要mysql中维度表join出站名名的三字码(唯一标识符)。 flink版本1.6.3,maven配置如下: <dependency> <groupId>com.google.guava</groupId> ...
  • 宽表: 从字面意义上讲就是字段比较多的数据库表。通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。由于把不同的内容都放在同一张表存储,宽表已经不符合三范式的模型设计规范,随之带来的主要...
  • 一个例子搞懂宽表和窄表的区别

    万次阅读 多人点赞 2018-11-13 11:28:45
    宽表:从字面意义上讲就是字段比较多的数据库表。通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。由于把不同的内容都放在同一张表存储,宽表已经不符合三范式的模型设计规范,随之带来的主要坏处...
  • 宽表和数仓dws层

    千次阅读 2019-09-23 14:06:59
    宽表 意思是 把很多的 维度、指标都合到一个表里,需要冗余,为了后续数据统计方便 宽表由于把不同的内容都放在同一张表存储,宽表已经不符合三范式的模型设计规范,随之带来的主要坏处就是数据的大量冗余,与之相...
  • 数据仓库每张的搭建,主要依赖于这个在整个数据仓库中的作用相关意义。首先要清楚这个的存在是为了解决那些问题,什么角色使用,怎么保证使用者尽可能好的体验解决问题。从以上所提到的角度去看待问题,拆解...
  • 宽表和窄表的建设该如何选择? 这个问题相信纠结了很多从是数据库开发、数据仓库开发后台开发人员;单单考虑这个问题,难给出一个绝对的答案;本人从事数据仓库开发工作到现在已经有一年半时间了,对于这个问题,...
  • 宽表和窄表的建设该如何选择

    千次阅读 2014-03-27 16:28:12
    宽表和窄表的建设该如何选择? 这个问题相信纠结了很多从是数据库开发、数据仓库开发后台开发人员;单单考虑这个问题,难给出一个绝对的答案;本人从事数据仓库开发工作到现在已经有一年半时间了,对于这个问题...
  • 宽表和窄表的建设该如何选择?

    千次阅读 2015-03-12 11:38:44
    这个问题相信纠结了很多从是数据库开发、数据仓库开发和后台开发人员;单单考虑这个问题,难给出一个绝对的答案;...设计销售领域的订单事实,该事实应该包含哪些维度和度量?事实和维该分别如何去设计?
  • 解读宽表

    2015-12-08 11:57:00
    宽表和窄表的建设该如何选择? 这个问题相信纠结了很多从是数据库开发、数据仓库开发后台开发人员;单单考虑这个问题,难给出一个绝对的答案;事实上任何东西都没有绝对的说法。 考虑这样的一个问题,一个公司有...
  • 扒一扒某厂如何构建新零售领域中用户画像的大宽表。字数不多,就600字。用户画像系统的维度表构建画像大维表是...子画像又可以分为宽表和纵表,是两种不同的标准:维度宽表示例,有value的概念:维度纵表示例,没有...
  • 解耦-大宽表

    千次阅读 2017-08-31 19:42:12
    所谓宽表就是,基于某个实体分析对象而建立的一个逻辑数据体系,由实体的维度、描述信息、以及基于这个实体一系列度量组成。它是一个逻辑的概念,在物理实现中不可能就针对一个实体对象建立一个大宽表。因为这样,...
  • 解耦宽表体系

    千次阅读 2012-03-09 17:10:36
    所谓宽表就是,基于某个实体分析对象而建立的一个逻辑数据体系,由实体的维度、描述信息、以及基于这个实体一系列度量组成。它是一个逻辑的概念,在物理实现中不可能就针对一个实体对象建立一个大宽表。因为这样,...
  • 维度建模以分析决策的需求为出发点构建模型,一般有较好的大规模复杂查询的响应性能,更直接面向业务,典型的代表是我们比较熟知的星形模型,常用就是事实表关联很多维度表、退化维度形成宽表、根据某主题下的业务...
  • ​群友爆料,经常面试会遇到面试官问宽表优缺点的问题,问法也是有所... 在数据仓库建设中,组织相关相似数据,采用明细宽表,复用关联计算,减少数据扫描,提高明细数据表的易用性 在汇总数据层,加...
  • 与事实想对应,比如一个 “销售统计” 就是一个 事实,而 “销售统计” 里面统计数据的来源离不开 “商品价格”,“商品价格” 就是销售统计的一个维度表。事实数据和维度数据的识别必须依据具体的...
  • 0x00 前言本篇的主题是关于数据模型的规范化反规范化的讨论,其实也是一种常见的维度建模的设计业务使用便捷性的冲突。问题:在设计数据表的时候,是一个宽表好,还是多个维度表好?0x01...
  • 首先将宽表变成长表,用pd.melt() 其中主要参数有 id_vars:不需要被转换的列名 var_values:需要被转换的列名,如果剩下的列名都需要被转换,则可以忽略不写; var_namevalue_name对应转换的自定义列名 ...
  • 问题:在设计数据表的时候,是一个宽表好,还是多个维度表好?0x01 讨论本话题的原始讨论在github上,本文只选取部分给大家参考:https://github.com/dantezhao/data-group/issues/1回答一:数据仓库每张表的搭建,...
  • 统计各个主题对象的当天行为,服务于DWT 层的主题宽表,以及一些业务明细数据, 应对特殊需求(例如,购买行为,统计商品复购率) DWS层表设计原则 通过外键获取相关的度量值,整合多个dwd事实表度量值构成新表。 ...
  • 数据仓库架构中的中央,它包含联系事实与维度表的数字度量值键。事实数据包含描述业务(如银行事务或产品销售)内特定事件的数据。 维度表 数据仓库中的,其条目描述事实数据中的数据。维度表包含创建维度...
  • 七 HBase结构设计

    2015-08-27 11:18:00
    HBase 中的表可以设计为高表(tall-narrow table) 宽表(flat-wide table)。 高表 : 列少而行多。 宽表 : 行少而列多。 根据之前介绍的 KeyValue 信息的筛选粒度信息,用户应当尽量将需要查询的维度或...
  • 所谓的宽表就是字段比较多的表,包含的维度层次比较多,造成冗余也比较多,毁范式设计,但是利于取数统计 若符合这两个条件,我们可以说数据库设计的比较好.当然这是两个泛泛而谈的指标。为了达到数据库设计规范化...

空空如也

空空如也

1 2 3 4 5
收藏数 92
精华内容 36
关键字:

维度和宽表