精华内容
下载资源
问答
  • 维度-父子维度宽表维度   1 父子维度   父子维度即自引用结构,好处是可以建立不固定深度的树形结构,非常的灵活。   2 宽表维度   类似日期维度,固定了各个层级,然后通过“层次结构”来建立各个层级间...

    维度-父子维度改宽表维度

     

    1          父子维度

    父子维度即自引用表结构,好处是可以建立不固定深度的树形结构,非常的灵活。

     

    2          宽表维度

    类似日期维度,固定了各个层级,然后通过“层次结构”来建立各个层级间的关系。对于OLAP系统来说,统一的结构具有更强的可读性,可分析性,所以在很多时候我们都会将父子维度转换成宽表

     

    3          例,以地区为例,可以分省-市-区-街道、省-市-县-镇-村等等,使用父子表可以很方便的解决这样的数据结构

    父子维度表结构如下:

    Create table Area(
             areaIdint primary key identity(1,1),
             areaName varchar(100),
             parentAreaId int
    )


    但是在多维分析中,如果使用父子维度的话,我们无法确定第三级是区还是县,第四级是街道还是镇,这将给分析带来很大的困扰

     

    而如果采用宽表的话,我们将会固定各个层级,如省-市-区县-街道镇,有所取舍,目的是利于分析,如下

    Create table Area(
             areaId int primary key identity(1,1),
             pvAkey varchar(50), --省
             pvName varchar(100),
             ctAkey varchar(50), --市
             ctName varchar(100),
             ctyAkey varchar(50), --区县
             ctyName varchar(100),
             townAkey varchar(50), --街道镇
             townName varchar(100)
    )


    转换成宽表后,我们可以建立各种层次结构以便于分析,两种结构如下图


    变成宽表如下




    展开全文
  • 维度表、事实宽表

    千次阅读 2020-09-29 16:04:13
    BI平台分为事实、维,然后两种聚合成一个宽表,其实这个宽表就是指标。 https://blog.csdn.net/qq_28666081/article/details/104686822   一、维度表:数据仓库中的,其条目描述事实数据中的...

    数据仓库一般拿来搭建BI平台,

    BI平台分为事实表、维表,然后两种表聚合成一个宽表,其实这个宽表就是指标表。

    https://blog.csdn.net/qq_28666081/article/details/104686822

     

    一、维度表:数据仓库中的表,其条目描述事实数据表中的数据。维度表包含创建维度所基于的数据。

    二、事实表:也叫事实数据表,就是app埋点日志,主要特点是含有大量的数据,并且这些数据是可以汇总,并被记录的。

    在互联网行业里,就是app埋点日志!日志里前面是一些时间、机型的维度,后面是一些可汇总的度量值!

    每个数据仓库都包含一个或者多个事实数据表。

    事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,

    事实数据表通常包含大量的行。事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据。

    每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键的相关性维度表的主键,而维度表包含事实记录的特性。事实数据表不应该包含描述性的信息,也不应该包含除数字度量字段及使事实与维度表中对应项的相关索引字段之外的任何数据。

    包含在事实数据表中的“度量值”有两种:一种是可以累计的度量值,另一种是非累计的度量值。最有用的度量值是可累计的度量值,其累计起来的数字是非常有意义的。用户可以通过累计度量值获得汇总信息,例如。可以汇总具体时间段内一组商店的特定商品的销售情况。非累计的度量值也可以用于事实数据表,但汇总结果一般是没有意义的,例如,在一座大厦的不同位置测量温度时,如果将大厦中所有不同位置的温度累加是没有意义的,但是求平均值是有意义的。

    一般来说,一个事实数据表都要和一个或多个维度表相关联,用户在利用事实数据表创建多维数据集时,可以使用一个或多个维度表。

    举例:银行对存款记账,A表中存放实际数据,包括账号、所属机构号、存款金额等,

    B表存放机构号和机构名称的对应关系。

    则A是事实表,B是维表。

     

    度量值,是跟维度放在一起说的,维度,维度的度量值。

     

    三、宽表:

    维度和指标值加起来的才叫宽表,不是把一个时间字段拆成时、分、秒拆多几个字段就叫宽表了,数据库建表没有规定多少个字段为宽啊!有些博客写的根本就是误导大家!

    举个反例:

    迷之误导:这人写,因为字段变多了,所以称为宽表,原来的成为窄表。???这人是来搞笑的吧。字段表多了就叫宽表?多一两个叫宽表有啥意义?

    https://blog.csdn.net/weixin_42464054/article/details/92804781

     

    百度百科的解释:

    宽表从字面意义上讲就是字段比较多的数据库表。

    通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。

    需要维度和指标!而不是机械得认为把维度拆多了,就叫宽表!这个说法才是对的。

    https://baike.baidu.com/item/%E5%AE%BD%E8%A1%A8/19942837?fr=aladdin

     

    展开全文
  • 目录0 来自知乎的一个简单解释1 维2 维度3 维度表4 事实5 星型模式结构示意图 0 来自知乎的一个简单解释 1 维 维是关于一个组织想要...维度表和事实通过主键外键联系在一起,形成星型,也称为“星型模式”; 对

    0 来自知乎的一个简单解释

    在这里插入图片描述

    1 维

    维是关于一个组织想要记录的视角或观点。

    参考: 维的百度百科.

    2 维度

    1. 维度是对数据进行分析时采取的一个角度。比如分析产品销售情况,可以按类别来分析,也可以按区域来分析,于是类别和区域就是构成了两个维度;
    2. 每个维度可以有子维度;

    3 维度表

    1. 维度表是对每个维至少使用一个表来存放维的层次、成员类别等维的描述信息;
    2. 维度表和事实表通过主键和外键联系在一起,形成星型,也称为“星型模式”;
    3. 对层次复杂的维,为避免冗余数据占用过大的存储空间,可以使用多个表描述,即“雪花型模式”;
    4. 维度表示例(产品维度表):Prod_id,Product_Name,Category,Color,Size,Price

    在这里插入图片描述
    特性

    1. 记录数少,上千左右;
    2. 大多是文字信息;
    3. 信息具有层次结构;
    4. 只有一个主键;
    5. 信息可修改;

    4 事实表

    1. 事实表用来存储数据和维关键字,是依据某些维度数据聚合后生成的结果表;
    2. 事实表示例:
      在这里插入图片描述

    特性

    1. 大量数据行,存储TB级;
    2. 主要是数值,少量文字或多媒体;
    3. 有和维度表连接的外键;
    4. 主要是静态数据和聚集数据;

    5 星型模式结构示意图

    在这里插入图片描述

    展开全文
  • 维度表和事实

    千次阅读 2021-01-04 21:29:58
    维度表和事实 一、维度表 维度表:一般是对事实的描述信息。每一张维对应现实世界中的一个对象或者概念。 例如:用户、商品、日期、地区等。 维的特征: 维的范围很(具有多个属性、列比较多) 跟事实...
  • 数据建模-大宽表和事实+维度的区别

    千次阅读 2021-03-31 11:29:28
    什么是大宽表? 基于事实,冗余业务常用的维度以及标签,通过一张对外提供赋能。 优点:1.用户使用方便,通过一张以及对应标签、维度的筛选就可以得到对应的数据。 缺点:1.如果遇到废弃字段、新增字段、...
  • Hive_维度表和事实

    2021-08-19 17:58:28
    1. 维度表 维度表:一般是对事实的描述信息。每一张维对应现实世界中的一个...维的范围很(具有多个属性、列比较多) 跟事实相比,行数相对较小:通常< 10万条 内容相对固定:编码 时间维度表: ...
  • 数据仓库之维度表和事实

    千次阅读 2020-05-30 20:03:57
     维的范围很(具有多个属性、列比较多)  跟事实相比,行数相对较小:通常< 10 万条  内容相对固定:编码 时间维度表: 2 事实 事实中的 每行数据代表一个业务事件(下单、支付、退款、评价等...
  • 数仓建模—维度表

    2021-10-09 10:11:30
    前面我们介绍了数仓建模中的事实,具体可以见数仓建模—事实,除了事实之外,我们也提到了宽表,可以看数仓建模—宽表的设计,今天我们介绍一下数仓中的维度表,以及在维度表设计开发过程中,容易遇到的一些...
  • 数仓之事实表和维度表(一)

    千次阅读 2018-12-27 16:47:53
    事实: 事务事实:(-&amp;amp;gt;明细事实-&amp;amp;gt;聚合事实) 记录的是事务层面的事实,保存的是最原子的数据,也叫做“原子事实”。事务事实中的数据在事务事件发生后产生,数据的粒度...
  • 文章目录1 数仓分层1.1 基本分层模型1.2 数据集市数据仓库2 数仓理论2.1 范式理论2.2 关系建模和维度建模2.2.1 关系建模2.2.2 维度建模2.2.2.1 维度建模的三种模型2.3 维度表和事实2.3.1 维度表2.3.2 事实 ...
  • 宽表与窄 宽表:从字面意义上讲就是字段比较多的数据库。 窄:严格按照数据库设计三范式。尽量减少数据冗余,但是缺点是修改一个数据可能需要修改多张表 魔百和 魔百和基于家庭宽带网络,通过“魔百和”定制...
  • 有这样需求,消息发来是有站点名,但与需要mysql中维度表join出站名名的三字码(唯一标识符)。 flink版本1.6.3,maven配置如下: <dependency> <groupId>com.google.guava</groupId> ...
  • 一个例子搞懂宽表和的区别

    万次阅读 多人点赞 2018-11-13 11:28:45
    通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库。由于把不同的内容都放在同一张存储,宽表已经不符合三范式的模型设计规范,随之带来的主要坏处就是数据的大量冗余,与之相对应的好处就是查询...
  • 数仓维度建模之维度表设计(基础概念一) 1、事实&度量 对业务过程的度量称为事实 2、维度是什么 1)维度定义 在维度建模中,将度量称为“事实”,将环境描述为“维度”,维度是用于分析事实所需要的多样环境 2...
  • 数仓模型之维度表技术 维度表概念 ...维通常较,扁平型非规范,包含大量的低粒度的冗余文本属性 主键的分类 ​ 代理键:代理键是不具有业务含义的键。在Kimball的维度建模领域里,是强烈推荐使
  • 宽表和概念优缺点 宽表: 从字面意义上讲就是字段比较多的数据库。通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库。由于把不同的内容都放在同一张存储,宽表已经不符合三范式的模型设计...
  • 宽表和的区别

    2020-09-11 10:32:09
    宽表就是字段比较多的,包含的维度层次比较多,造成冗余也比较多,毁范式设计,但是利于取数统计,而窄往往对于OLTP比较合适,符合范式设计原则
  • 【HBase】HBase 宽表和

    千次阅读 2019-07-09 16:59:17
    HBase 中的可以设计为高(tall-narrow table) 宽表(flat-wide table): 宽表是指很多列较少行,即列多行少的,一行中的数据量较大,行数少; 高是指很多行较少列,即行多列少,一行中的数据量较少,...
  • 通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库。由于把不同的内容都放在同一张存储,宽表已经不符合三范式的模型设计规范,随之带来的主要坏处就是数据的大量冗余,与之相对应的好处就是查询...
  • 宽表

    千次阅读 2019-06-21 09:57:33
    通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库。由于把不同的内容都放在同一张存储,宽表已经不符合三范式的模型设计规范,随之带来的主要坏处就是数据的大量冗余,与之相对应的好处就是查询...
  • 宽表和数仓dws层

    千次阅读 2019-09-23 14:06:59
    宽表 意思是 把很多的 维度、指标都合到一个表里,需要冗余,为了后续数据统计方便 宽表由于把不同的内容都放在同一张存储,宽表已经不符合三范式的模型设计规范,随之带来的主要坏处就是数据的大量冗余,与之相...
  • 概要 CNN在进行卷积操作的时候,可以认为是输入图像(Input)与卷积核(Kernel)的对应加权求和...维度就是图像的通道数,想象一个通道为3的RGB图像,维度=3。也可以把input想象成一个立方体,有长宽高属性,如下图...
  • 维度建模以分析决策的需求为出发点构建模型,一般有较好的大规模复杂查询的响应性能,更直接面向业务,典型的代表是我们比较熟知的星形模型,常用就是事实关联很多维度表、退化维度形成宽表、根据某主题下的业务...
  • 可以按照事实关联的任意维度汇总。 2,半可加事实:可以按照某些维度汇总。例如差额,或者新增额,对于时间就只能是筛选条件不能用作维度。 3,不可加事实:例如比率。比较好的做法是仓库中存入...
  • 宽表和的建设该如何选择

    千次阅读 2014-03-27 16:28:12
    宽表和的建设该如何选择? 这个问题相信纠结了很多从是数据库开发、数据仓库开发后台开发人员;单单考虑这个问题,难给出一个绝对的答案;本人从事数据仓库开发工作到现在已经有一年半时间了,对于这个问题...
  • 商品维度表主要是将商品SKU、商品一级分类、商品二级分类、商品三级分类、商品品牌表和商品SPU退化为商品。 -- dwd-业务数据-创建商品维度表(全量) DROP TABLE IF EXISTS `dwd_dim_sku_info`; CREATE ...
  • 维度数据

    2021-03-07 11:24:13
    为了后续将订单、订单明细等数据进行实时ETL拉,需要提前将一些维度数据加载一个高性能存储中。此处,选择Redis作为商品维度、商品分类维度、门店维度、运营组织机构维度存储。先一次性将所有MySQL中的维度数据...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 35,592
精华内容 14,236
关键字:

维度和宽表