精华内容
下载资源
问答
  • 大数据、人工智能、数仓、数据治理 数据仓库 按照传统的定义,数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。
  • 数仓建模

    千次阅读 2020-04-19 15:29:51
    大数据的数仓建模是通过建模的方法更好的组织、存储数据,以便在 性能、成本、效率和数据质量之间找到最佳平衡点。一般主要从下面四点考虑 访问性能:能够快速查询所需的数据,减少数据I/O 数据成本:减少不必要的...

    1.数据仓库建模的目的?

    为什么要进行数据仓库建模?大数据的数仓建模是通过建模的方法更好的组织、存储数据,以便在 性能、成本、效率和数据质量之间找到最佳平衡点。一般主要从下面四点考虑

    访问性能:能够快速查询所需的数据,减少数据I/O
    数据成本:减少不必要的数据冗余,实现计算结果数据复用,降低大数 据系统中的存储成本和计算成本 
    使用效率:改善用户应用体验,提高使用数据的效率
    数据质量:改善数据统计口径的不一致性,减少数据计算错误 的可能性,提供高质量的、一致的数据访问平台
    

    2.常见的数据建模方法

    数据仓库本质是从数据库衍生出来的,所以数据仓库的建模也是不断衍生发展的。从最早的借鉴数据库的范式建模,到逐渐提出维度建模,Data Vault模型,Anchor模型等等,越往后建模的要求越高,越需满足3NF,4NF等。但是对于数据仓库来说,目前主流还是维度建模,会夹杂着范式建模。

    数据仓库建模方法论可分为:范式建模、维度建模、Data Vault模型、Anchor模型。

    3.常见四种建模方法的建模步骤与演示
    3.1.范式建模(E-R模型)
    将事物抽象为“实体”、“属性”、“关系”来表示数 据关联和事物描述;实体:Entity,关系:Relationship,这种对数据的抽象 建模通常被称为ER实体关系模型
    ER模型是数据库设计的理论基础,当前几乎所有的OLTP系统设计都采用ER模型建模的方式,且该建模方法需要满足3NF。Bill Inom提出的数仓理论,推荐采用ER关系模型进行建模,BI架构提出分层架构,数仓底层ods、dwd也多采用ER关系模型就行设计。
    但是逐渐随着企业数据的高增长,复杂化,数仓全部使用ER模型建模显得越来越不合时宜。为什么呢,因为其按部就班的步骤,三范式等,不适合现代化复杂,多变的业务组织。
    E-R模型建模的步骤(满足3NF)如下:

     抽象出主体         (教师,课程)
    梳理主体之间的关系   (一个老师可以教多门课,一门课可以被多个老师教)
    梳理主体的属性    (教师:教师名称,性别,学历等)
    画出E-R关系图
    

    3.2.维度建模

       维度建模,是数据仓库大师Ralph Kimball提出的,是数据仓库工程领域最流行的数仓建模经典。
      维度建模以分析决策的需求出发构建模型,构建的数据模型为分析需求服务,因此它重点解决用户如何更快速完成分析需求,同时还有较好的大规模复杂查询的响应性能。维度建模是面向分析的,为了提高查询性能可以增加数据冗余,反规范化的设计技术。
    
      Ralph Kimball提出对数据仓库维度建模,并且将数据仓库中的表划分为事实表、维度表两种类型。
    

    3.2.1.事实表

      在ER模型中抽象出了有实体、关系、属性三种类别,在现实世界中,每一个操作型事件,基本都是发生在实体之间的,伴随着这种操作事件的发生,会产生可度量的值,而这个过程就产生了一个事实表,存储了每一个可度量的事件。
    

    以电商行业为例:电商场景:一次购买事件,涉及主体包括客户、商品、商家,产生的可度量值 包括商品数量、金额、件数等

    事实表根据粒度的角色划分不同,可分为事务事实表、周期快照事实表、累积快照事实表。注意:这里需要值得注意的是,在事实表的设计时,一定要注意一个事实表只能有一个粒度,不能将不同粒度的事实建立在同一张事实表中。
    
    事务事实表,用于承载事务数据,通常粒度比较低,它是面向事务的,其粒度是每一行对应一个事务,它是最细粒度的事实表,例如产品交易事务事实、ATM交易事务事实。
    周期快照事实表,按照一定的时间周期间隔(每天,每月)来捕捉业务活动的执行情况,一旦装入事实表就不会再去更新,它是事务事实表的补充。用来记录有规律的、固定时间间隔的业务累计数据,通常粒度比较高,例如账户月平均余额事实表。
    累积快照事实表,用来记录具有时间跨度的业务处理过程的整个过程的信息,每个生命周期一行,通常这类事实表比较少见。
    

    3.2.2.维度表
    维度,顾名思义,业务过程的发生或分析角度。比如从颜色、尺寸的角度来比较手机的外观,从cpu、内存等较比比较手机性能维。维度表一般为单一主键,在ER模型中,实体为客观存在的事物,会带有自己的 描述性属性,属性一般为文本性、描述性的,这些描述被称为维度。
    比如商品,单一主键:商品ID,属性包括产地、颜色、材质、尺寸、单价等, 但并非属性一定是文本,比如单价、尺寸,均为数值型描述性的,日常主要的维度抽象包括:时间维度表、地理区域维度表等

    案例:某电商平台,经常需要对订单进行分析,以某宝的购物订单为例,以维度建 模的方式设计该模型
    涉及到事实表为订单表、订单明细表,维度包括商品维度、用户维度、商家维度、区域维 度、时间维度
    商品维度:商品ID、商品名称、商品种类、单价、产地等
    用户维度:用户ID、姓名、性别、年龄、常住地、职业、学历等
    时间维度:日期ID、日期、周几、上/中/下旬、是否周末、是否假期等

    维度分为:

    (1)退化维度(DegenerateDimension)

    在维度类型中,有一种重要的维度称作为退化维度,亦维度退化一说。这种维度指的是直接把一些简单的维度放在事实表中。退化维度是维度建模领域中的一个非常重要的概念,它对理解维度建模有着非常重要的作用,退化维度一般在分析中可以用来做分组使用。

    (2)缓慢变化维(Slowly Changing Dimensions)

    维度的属性并不是始终不变的,它会随着时间的流逝发生缓慢的变化,这种随时间发生变化的维度我们一般称之为缓慢变化维(SCD)。比如员工表中的部门维度,员工的所在部门有可能两年后调整一次。
    3.2.3.维度建模模型的分类
    维度建模按数据组织类型划分可分为星型模型、雪花模型、星座模型。
    (1)星型模型

    星型模型主要是维表和事实表,以事实表为中心,所有维度直接关联在事实表上,呈星型分布。

    (2)雪花模型

    雪花模型,在星型模型的基础上,维度表上又关联了其他维度表。这种模型维护成本高,性能方面也较差,所以一般不建议使用。尤其是基于hadoop体系构建数仓,减少join就是减少shuffle,性能差距会很大。
    

    尖叫提示:所以由上可以看出

     星型模型和雪花模型主要区别就是对维度表的拆分
    对于雪花模型,维度表的涉及更加规范,一般符合3NF,有效降低数据冗余,维度表之间不会相互关联,但是
    而星型模型,一般采用降维的操作,反规范化,不符合3NF,利用冗余来避免模型过于复杂,提高易用性和分析效率,效率相对较高。
    

    (3)星座模型

     星座模型,是对星型模型的扩展延伸,多张事实表共享维度表。数仓模型建设后期,大部分维度建模都是星座模型。
    

    3.2.4. 维度建模步骤

    维度建模步骤:选择业务过程->声明粒度->确定维度->确定事实。旨在重点解决数据粒度、维度设计和事实表设计问题。

    声明粒度,为业务最小活动单元或不同维度组合。以共同粒度从多个组织业务过程合并度量的事实表称为合并事实表,需要注意的是,来自多个业务过程的事实合并到合并事实表时,它们必须具有同样等级的粒度。
    3.3 DataVault模型

          Data Vault是Dan Linstedt发起创建的一种模型方法论,Data Vault是在ER模型的基础上衍生而来,模型设计的初衷是有效的组织基础数据层,使之易扩展、灵活的应对业务的变化,同时强调历史性、可追溯性和原子性,不要求对数据进行过度的一致性处理。同时设计的出发点也是为了实现数据的整合,并非为数据决策分析直接使用。
          Data Vault模型是一种中心辐射式模型,其设计重点围绕着业务键的集成模式。这些业务键是存储在多个系统中的、针对各种信息的键,用 于定位和唯一标识记录或数据
    

    Data Vault模型包含三种基本结构 :

    中心表-Hub :唯一业务键的列表,唯一标识企业实际业务,企业的业务主体集合 
    链接表-Link: 表示中心表之间的关系,通过链接表串联整个企业的业务关联关系 
    卫星表- Satellite: 历史的描述性数据,数据仓库中数据的真正载体
    

    3.3.1 中心表-Hub

    3.3.2 链接表-Link

    3.3.3 卫星表- Satellite

    3.3.4 Data Vault模型​​​​​​建模流程

    梳理所有主要实体 
    将有入边的实体定义为中心表 
    将没有入边切仅有一个出边的表定义为中心表 
    源苦衷没有入边且有两条或以上出边的表定义为连接表 
    将外键关系定义为链接表
    

    尖叫提示:Hub想像成人体的骨架,那么Link就是连接骨架的韧带组织, 而satelite就是骨架上的血肉。 Data Vault是对ER模型更近一步的规范化,由于对数据的拆解和更偏向于基础数据组织,在处理分析类场景时相对复杂, 适合数仓低层构建,目前实际应用场景较少

    3.4Anchor模型

     Anchor是对Data Vault模型做了更近一步的规范会处理,初衷是为了 设计高度可扩展的模型,核心思想是所有的扩张只添加而不修改,于 是设计出的模型基本变成了k-v结构的模型,模型范式达到了6NF
    由于过度规范化,使用中牵涉到太多的join操作,目前木有实际案例,仅作了解
    

    4.四种模型总结
    以上为四种基本的建模方法,当前主流建模方法为:ER模型、维度模型

    ER模型常用于OLTP数据库建模,应用到构建数仓时更偏重数据整合, 站在企业整体考虑,将各个系统的数据按相似性一致性、合并处理,为 数据分析、决策服务,但并不便于直接用来支持分析。缺陷:需要全面梳理企业所有的业务和数据流,周期长,人员要求高。
    维度建模是面向分析场景而生,针对分析场景构建数仓模型;重点关注快 速、灵活的解决分析需求,同时能够提供大规模数据的快速响应性能。针对性 强,主要应用于数据仓库构建和OLAP引擎低层数据模型。优点:不需要完整的梳理企业业务流程和数据,实施周期根据主题边界而定,容易快速实现demo
     数仓模型的选择是灵活的,不局限于某一种模型方法
    数仓模型的设计也是灵活的,以实际需求场景为导向
    模型设计要兼顾灵活性、可扩展,而对终端用户透明性
    模型设计要考虑技术可靠性和实现成本
    

    5.常用建模工具

    建模工具,一般企业以Erwin、powerdesigner、visio,甚至Excel等为主。也有些企业自行研发工具,或使用阿里等成熟套装组件产品。

    展开全文
  • 数仓建模实战(建模流程) 前面我们介绍了PdMan,也就是CHINER,当然也介绍了二者的关系,前面主要介绍了CHINER有哪些功能,可以参考数仓建模—建模工具PDMan(CHINER) 入门介绍,但是没有实际的演示案例,今天我们就...

    数仓建模实战(建模流程)

    前面我们介绍了PdMan,也就是CHINER,当然也介绍了二者的关系,前面主要介绍了CHINER有哪些功能,可以参考数仓建模—建模工具PDMan(CHINER) 入门介绍,但是没有实际的演示案例,今天我们就通过一个小的案例来演示一下。

    我们今天演示的是一个OneID的例子,其实前面我们也讲过了怎么去做OneID,具体可以参考数仓建模—OneID落地实践

    业务建模

    因为我们这个例子其实和我们真实的业务系统没有多大关系,也就是说这个项目是一个由数据服务部门发现的一个项目,所以它的业务背景没有那么复杂,而且我们前面写了大量的文章来说明OneID,所以这里可以参考一下前面的文章

    数仓建模—ID Mapping(上)

    数仓建模—ID Mapping(下)

    数仓建模—OneID落地实践

    我们只需要知道一点就可以了,那就是我们做OneID的目的是为了打通更多的数据,从而更加全面准确的去刻画一个用户或者业务对象。

    当然这里我们需要了解

    展开全文
  • 数仓建模—建模流程

    万次阅读 2020-12-05 19:45:32
    物理建模(建表) 综合现实的大数据平台、采集工具、etl工具、数仓组件、性能要求、管理要求等多方面因素,设计出具体的项目代码,完成数仓的搭建。 建模的过程 假设我们现在在构建一张订单表 从多个维度进行统计组合...

    建模流程

    其实就是业务模型->概念模型->逻辑模型->物理模型的这样一个流程,下面我们详细解释一下各个模型阶段都要做什么

    业务建模(需求沟通)

    • 根据业务部门进行划分,理清部门之间的关系,然后将各个部门的具体业务程序化,与业务部门开会协商出需求的指标、保存年限、维度等等。
    • 总体来讲,就是要知道他们需要哪些指标以及他们能提供哪些数据
    • 业务建模的时间最长,而且与公司实际的业务环境息息相关,因此在这里需要根据实际生产环境和业务需求确认好数据仓库使用的工具和平台。

    主要解决业务层面的分解和程序化。搞清楚系统边界,确定好主题域

    • 因此,业务建模阶段其实是一次和业务人员梳理业务的过程,在这个过程中,不仅能帮助我们技术人员更好的理解业务,另一方面,也能够发现业务流程中的一些不合理的环节,加以改善和改进。

    概念建模|领域建模(画图想好怎么做)

    • 将业务模型抽象化,分组合并类似的概念,细化概念,抽象出实体与实体之间的联系,理清各组概念之间的联系。
    • 说白了就是画图,把指标需要的哪些数据封装到一个实体里,实体与实体之间的关联等等用ER图表示出来。
    • 先画出局部ER图,最后再综合画出全局ER图。

    主要是对业务模型进行抽象处理,生成领域概念模型

    展开全文
  • 数仓建模的思路步骤

    2021-03-29 17:24:53
    通过最近的学习与工作总结,针对不同层级的数仓建模特点,记录数仓建模实战中的一些思路与步骤。涉及到的数仓分层有:ODS层、DWD层、DWS层/DWT层、ADS层,其中ODS层属于业务数据库贴源层,存放的数据与业务系统源表...

    背景

    通过最近的学习与工作总结,针对不同层级的数仓建模特点,记录数仓建模实战中的一些思路与步骤。涉及到的数仓分层有:ODS层、DWD层、DWS层/DWT层、ADS层,其中ODS层属于业务数据库贴源层,存放的数据与业务系统源表保持一致,所以此处不做讲解。

    DWD层建模思路与步骤

    dwd层是以业务过程为驱动进行建模,dwd层需要构建维度模型,采用星型模型构建,呈现的形态为星座模型。

    dwd层建模步骤

    选择业务过程->声明粒度->确认维度->确认事实

    选择业务过程

    • 如何选择业务过程?

    梳理业务系统的业务流程,整个业务流程中产生用户行为的操作可以记为一个业务过程

    • 需要遵循的原则?

    挑选感兴趣的业务线,如下单业务、支付业务、退单业务,每个业务线对应一张事实表。

    中小型公司:一般涉及的业务表在50张以下,这时候尽可能选择所有业务线。

    大公司:一般涉及的业务表比较多,有的大公司涉及的业务表多达1000张左右,这时候需要根据业务需求选择对应的业务线。

    • 实例
    电商业务流转图

    上图中业务流转是:用户进入首页,通过搜索商品或者点击营销活动查看商品列表,当看到自己喜欢的商品后就会点击查看对应商品详情,发现这个商品还不错(哈哈性价比好高啦)一键点击加入购物车,然后继续买买买看看看,当想买的商品全部加入购物车后就提交订单进入支付页面,打开支付宝完成订单支付,忙完这一切终于可以满怀期待的等待宝贝送到家门口了。几天后快递送到了家门口,怀着好奇的心理打开了包裹,发现有的商品好喜欢啦果断收藏好评,但有的商品就有点不满意啦干脆直接退了吧。

    通过上面的业务流转可以梳理的业务过程有:搜索商品   加入购物车   提交订单   支付    退单   收藏     评价 ,每个业务过程通过记录到一张事实表中存放,这样就完成了业务流转抽象到事实表的过程。

    声明粒度

    • 什么是数据粒度?

    数据粒度指数仓的数据中保存数据的细化程度,通过声明粒度可以精确定义事实表中每一行表示什么意思。

    • dwd层该如何声明数据粒度?

    dwd层按照最小粒度进行划分,以满足上层各种数据需求取数。

    确认维度

    • 维度是什么?

    描述谁、何时、何处等信息,通过维度可以从不同角度看待事实

    • 确认维度的原则?

    根据维度建模中的星型模型进行维度退化,维度之间不会有关联关系,维度只会与事实表关联。如:会把商品表关联的非事实表信息退化到商品表中生成商品维度表(商品分类、商品品牌、商品其他属性等信息退化到商品表中)。

    后续需求中是否要分析相关维度的指标。如:后续的需求需要统计,哪个时间段的订单多,哪个地区的订单多,哪个用户的订单多,这时候需要关联的维度就有时间、地区、用户。

    下图为电商事实表与维度表之间的关联:

    左右两边是涉及的事实表,中间是所有的维度表,中间的次维表信息会退化到主维表中,这种设计方式就是基于星型模型进行维度建模

    电商事实表与维度表之间的关联

    确认事实

    • 什么是事实?

    指业务过程中的度量(个数、金额、次数、件数等这些可以累加的值),例如:订单金额、订单数量

    • 如何确定事实表中的度量有哪些?

    参照业务表中可以进行累加的值

    通过以上4个步骤最终得到的结果

    dwd层数据建模

    DWS层&DWT层建模的步骤与思路

    DWS层与DWT层统称为宽表层,设计思路相同,这两层主要是解决重复计算的问题。所有指标都统一进行计算,并将结果保存在该宽表中,这样就能有效避免数据的重复计算。

    • 需要建哪些宽表

    以维度为基准

    • 宽表里面的字段

    是站在不同维度的角度去看事实表,重点关注事实表聚合后的度量值。

    • DWS与DWT的区别

    DWS的聚合粒度是按天汇总,记录主题对象当天的汇总行为,如:某地区的当天下单金额,下单次数

    DWT的聚合粒度是一个比较长的周期,记录主题对象的累计行为,如:某地区最近7天(15天,30天)的下单次数、下单金额。

    ADS层

    报表层

     

    参考内容

    大数据数仓实战项目P163~P169:https://www.bilibili.com/video/BV1dD4y1d7wL?p=163

     

    展开全文
  • 数据仓库是为企业提供聚合,存储,投递,以及提供决策支持能提,数据仓库包含广泛数据并按照主题进行存储并且是在数据仓库流程过程中的一个部分。Willianm(Bill) H.Inmon提出过一个概念:”一个面向主题的,集成的,时间...
  • 数仓和业务建模对比总结 ...本文就是讲述关于数仓建模的一些理解和实践经验分享。从大到小进行设计。 2. 整体建模思路 在学术界,数仓整体建模思路有2大类,一种是Bill Inmon的自上而下。另外一种是Ral
  • 【数仓设计】数仓建模的四种方法

    千次阅读 2020-04-17 10:55:30
    大数据的数仓建模是通过建模的方法更好的组织、存储数据,以便在 性能、成本、效率和数据质量之间找到最佳平衡点。一般主要从下面四点考虑 访问性能:能够快速查询所需的数据,减少数据I/O 数据成本:减少不必要的...
  • 数仓建模面试部分

    2021-08-10 23:19:07
    难点:面对1000 + 张表进行建模,将业务梳理清楚,达到快速对任何指标的统计 ·分清事实表、维度表 1.1-1 放入接近总工程50%的时间了解需求——(产品经理-统计哪些指标),(业务人员-梳理核心业务) 1-2 将业务表...
  • 数据仓库与数仓建模

    千次阅读 2020-07-11 17:46:04
    1.数据仓库 1.1 什么是数据仓库 数据仓库,英文名为Data Warehouse,简写为DW或DWH。数据仓库,是一个面向主题的、集成的、随时间变化的、但...主题是指用户在构建数仓时考虑决策时所关注的重点方面,方便以后的数据.
  • 数仓入门基础-5-数仓建模

    千次阅读 2019-04-22 00:01:00
    从业中,数仓建模是一个数仓工程师需要的必备的能力,优秀的分层设计能够让整个数据体系更易理解和使用。所以想入行数仓数仓分层是需要补一补的,才能知道分层的意义。 很多人都不理解为什么分层,分层的意义是...
  • 在我们项目初期 我们首先要确定的就是 一个数仓建模的设计 建模也是整个数仓最核心的工作 数仓的好坏就取决于你的建模 数仓建模 四个步骤 1. 选择业务过程 2.声明粒度 3.确定维度 4.确定事实 我们在建模的...
  • 大数据数仓建模

    2020-10-16 19:55:39
            大数据项目之电商数仓(用户行为数据采集) 数据仓库简介       1.什么是数据库?     数据库(database)是按照数据结构来组织,存储和管理数据的建立在计算机存储设备上的仓库。    ...
  • 1.建模目标 数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。Linux的创始人Torvalds有一段关于“什么才是优秀程序员”的话:“烂程序员关心的是代码,好程序员关心的是数据结构和...
  • 数仓建模方法论

    2021-05-10 15:05:26
    1.数仓建模的理由 数据建模的主要目的是降低成本,提高数据的利用效率。尤其是大数据时代的到来,数据的多样化,巨量,更需要有效的有针对性数据建模方法。 大数据的数仓建模正是通过建模的方法,更好的组织、存储...
  • 全方位解读星型模型,雪花模型及星座模型背景1.星型模型2.雪花模型3.星座模型4.对比5....背景 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型,雪花型模型及星座模型。...
  • 注意,数仓建模主要就是将数据如何以数据库和表为单元,尽可能科学有效存储,方便后续的查询,分析,使用。在这个过程中,如何保证数据查询便捷性,性能,降低空间存储冗余度都是需要仔细考量的。 注
  • 数仓建模—事实表

    2021-09-23 15:52:13
    事实表 在ER模型中抽象出了有实体、关系、属性三种类别,在现实世界中,每一个操作型...数仓总线矩阵里每个业务过程都会生成至少一张事实表(识别业务过程的本质就是识别要构建的事实表),因为有可能一个原子事件涉及
  • 浅谈数仓建模及其方法论

    千次阅读 2019-09-21 11:44:18
    1.数仓的定义: 2.数据仓库和数据库的区别: 数仓的发展 1.简单报表阶段:这个阶段,系统的主要目标是解决一些日常的工作中业务人员需要的报表,以及生成一些简单的能够帮助领导进行决策所需要的汇总数据。这个...
  • 数仓建模—指标体系

    万次阅读 2020-12-09 21:57:09
    指标 指标,实际上就是一种度量。大到用于监控和评估商业进程的状态,小到衡量某个功能模块的情况,或者是自己的活动效果。 提起指标这个词,每个人似乎都可以说出几个指标,像经常在工作中会听到的日活、月活、...
  • 数仓建模与规范

    2021-09-22 15:52:19
    一、数仓基本概念 1、数据仓库定义 数据仓库定义有很多,我主要从它的应用和目的来说一下我的理解,数据仓库主要应用于OLAP(联机分析处理),这里的重点是分析,那分析什么呢? 传统的数据库主要应用是OLTP...
  • 数仓建模分层理论

    2020-12-12 10:58:40
    分层建设理论 简单点儿,直接ODS+DM就可以了,将所有数据同步过来,然后直接开发些应用层的报表,这是最简单的了;当DM层的内容多了以后,想要重用,就会再拆分一个公共层出来,变成3层架构...
  • 这里写目录标题一、数仓分层二、数仓建模2.1 ODS 层2.2 DWD 层2.3 DWS 层 (各个主题一天发生的事情)2.4 DWT 层 (从用户或商品产生到当前时刻发生的事情)2.5 ADS 层 一、数仓分层 ODS(原始数据层) 不做处理,...
  • 数仓建模的好处 1,性能:良好的模型能帮我们快速查询需要的数据,减少数据的IO吞吐 2,成本:减少数据冗余、计算结果复用、从而降低存储和计算成本 3,效率:改善用户使用数据的体验,提高使用数据的效率 4,...
  • 数仓建模或者分层,其实都是为了更好的去组织、管理、维护数据,所以当你站在更高的维度去看的话,所有的划分都是为了更好的管理。小到JVM 内存区域的划分,JVM 中堆空间的划分(年轻代、老年代、方法区等),大到...
  • 数仓建模方法论——ER建模方法

    千次阅读 2019-11-11 17:18:19
    #ER建模遇到的问题: (1)如果存在一个实体与其它实体之间存在两个或更多的一对多联系,很可能存在扇形陷阱问题。扇形陷阱问题可以通过改变实体间的联系次序,从而重新构建模型解决。 (2)如果在实体联系的通路上...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 5,061
精华内容 2,024
关键字:

数仓建模