精华内容
下载资源
问答
  • 基于TOPSIS的多维网络安全度量模型研究.pdf
  • 一、星型模式、 二、星型模式 缺点、 三、雪片模型、 四、星型模型 雪片模型 折衷方案、 五、事实群模型 ( 仅做了解 )、 六、度量





    一、星型模式



    星型模式多维数据模型 的表现形式 ;


    星型模式 展示 : 中间有一个表 , 称为 事实表 , 周围有很多小表 , 这些表称为 维表 ;


    以 “商品” 表为例 :

    • 事实表 : 描述商品的 时间 , 位置 , 供应商 , 零售价 , 商品颜色 等信息 ;
    • 维表 : 时间 对应的维表 包含 年 , 月 , 日 , 时 , 分 , 秒 等字段 ; 位置 维表有 国家 , 省份 , 地区 , 城市 , 街道 等字段信息 , 供应商 维表 有 公司名称 , 法人 , 税号 , 公司注册地点 等字段信息 ;
    • 事实表中的 度量 : 上述 零售价 , 商品颜色 没有与维表关联 , 是度量 ;




    二、星型模式 缺点



    星型模式 缺点 :



    1 . 星型模式 不支持 维 的层结构 ;

    • 单一维表 : 每个 维 只有一个维表 , 所有的 维层属性 都放在一个表中 , 没有进行规范化 ;
    • 单一维表 示例 : 以上述 “商品” 事实表的 时间 对应的维表 为例 , 将 年 , 月 , 日 , 时 , 分 , 秒 等字段放在同一个 维表 中 , 时间维 可以变成 多个维表 , 如只包含 年月日的维表 , 只包含 年 月 的维表 等 ;

    2 . 数据冗余 :

    • 数据冗余 : 每个 维表 都要表示所有的层 , 每个层有自己的属性 , 有很多数据冗余 ;
    • 数据冗余 示例 : 上述 时间维表 中每个商品 , 都要存储完整的 年 , 月 , 日 , 时 , 分 , 秒 数据 , 实际上商品的 年 , 月 , 等数据 , 很多商品都是相同的 , 只记录一次即可 , 不同所有的商品都记录年月 信息 , 因此产生了大量的冗余数据 ;

    3 . 不同维层属性名相同查询问题 :

    • 不同维层 , 有相同的属性 , 只能使用 换名 方式进行查询 ;
    • 不同维层 相同属性示例 : 如 商店 事实表中 , 城市 , 省份 , 国家 , 每个层级都有一个经理 Manager , 当 查询 Manager 属性时 , 直接将 城市经理 , 省份经理 , 国家经理 , 都查询出来了 , 无法查询单独一个级别的经理信息 ;




    三、雪片模型



    对于 维层次 复杂的维

    • 为了 避免 冗余数据占用过多空间
    • 为了 支持 不同维层 相同属性 查询

    使用多个维表 描述复杂的维 , 这样在 星型模型 的 星的角上 , 出现了分支 , 类似于雪花形状 , 因此这种变种的 星型模型 称为 “雪片模型” ;


    雪片模型示例 : 以 “商品” 表为例

    • 事实表 : 描述商品的 时间 , 位置 , 供应商 , 零售价 , 商品颜色 等信息 ;
    • 第一层维表 : 时间 对应的维表 包含 日 , 时 , 分 , 秒 等字段 ; 位置 维表有 城市 , 街道 等字段信息 , 供应商 维表 有 公司名称 , 法人 , 税号 , 公司注册地点 等字段信息 ;
    • 第二层维表 : 时间表的第一层维表的 日 , 又使用 第二层维表表示 , 该维表中有 年 , 月 , 日 , 三个维度的信息 ; 地区表 的第一层维表的 城市 , 使用第二层维表 表示 , 该第二层维表有 国家 , 省份 , 城市 , 三个维度的信息表示 ;
    • 事实表中的 度量 : 上述 零售价 , 商品颜色 没有与维表关联 , 是度量 ;

    雪片模型 优缺点 :

    • 雪片模型优点 : 雪片模型的维表是规范化的维表 , 雪片模型维表 易于维护 , 节省存储空间 ;
    • 雪片模型缺点 : 雪片模型 查询时 , 需要 进行较多的连接操作 , 影响系统性能 ;

    雪片模型 更好的 体现了 维层结构 ,

    • 对于专业的数据库 建模 设计人员 , 更容易理解 , 分析 ;
      - 对于 普通用户 来说 , 比较复杂 ;




    四、星型模型 雪片模型 折衷方案



    推荐采用一种 星型模型 和 雪片模型 折衷方案 , 将 星型模式 与 雪片模式 结合使用 ;

    • 大维表节省空间 : 针对 大维表 , 规范化 , 节省存储空间 ;

    • 小维表效率优先 : 对于 小维表 , 采用不规范化的形式 , 避免因为查询时 , 过多的表连接 , 引起性能降低 ;





    五、事实群模型 ( 仅做了解 )



    该模型 比 星型模式 , 雪片模型 更复杂 , 上述两个模型 , 只有一个事实表 , 但是 在事实群模型中 , 有多个事实表 , 两个事实表 , 可能公用一些维表 ;





    六、度量



    数据方体 中的度量 , 可以分为三种不同的类型 :

    • 分布型
    • 代数型
    • 整体型

    分布型 度量 :

    • 特点 : 可以累加 ;
    • 示例 : 求和 , 计数 , 求最小值 , 求最大值 ;

    代数型 度量 :

    • 特点 : 无法累计 ; 但是可以转换成 分布式 度量 ;
    • 示例 : 求平均值 , 无法累加 , 但是可以转成 先求和 , 然后再计算平均值 的 分布性 度量 ;

    整体型 度量 :

    • 特点 : 必须有所有的值才能计算 , 无法累加 ;
    • 示例 : 求中间值 , 求前 K K K 个最大值 , 排名 , 必须统计完整数据 , 才能计算出来 ;
    展开全文
  • 多维数据模型中维度、度量、层级理解 如何认识(看)对象? 当我们去看、去观测一个事物,一个对象的时候,总是不能回避的是观测方向、观测角度、观测属性、观测维度、观测特征等待。 角度,属性、方向、维度、...

    多维数据模型中维度、度量、层级理解

    本文只是对多维数据模型中维度、度量、层级理解的通俗理解,当然不止这些,还会涉及到更多具体细节的概念,本文对此不做介绍。

    1. 如何认识(看)对象?

    当人去看、去观测一个事物,一个对象的时候,总是不能回避的是观测方向。和观测角度、观测属性、观测维度、观测特征同义。
    角度,属性、方向、维度、特征这些都是同一概念,都是对象本身的属性。去看这个对象时,总是从一个或者多个属性来看这个对象。比如我们看一个在三维空间的一部手机,我们最直观的会看到它的长、宽、高。
    长、宽、高是三个手机的三个属性,每个属性有具体的数值。这三个角度,放到坐标系,分别对应三维空间的x, y, z轴,即我们是从三维角度去看这个手机,对这个手机有了三个维度的认识。
    如果你的认知只是三维,那你获得的信息,就只能是这个长宽高三个角度的信息,你对手机的认知就只是三维的东西。
    现在你的三维空间又有一个纸箱,你的认知是三维的,那么你看这个纸箱,只是长宽高三个维度。那么对你来说,纸箱和杯子又有什么区别呢?除了长宽高的值不同,再无不同。
    你说手机是黑色的,纸箱是灰色的。灰色黑色就是第四个维度,通过第四个维度来区别。你还说手机有操作系统,有界面,有电池,有app…你会列出很多不同的维度,当你用这些维度的时候,
    其实就是用这些维度,不同的角度去看手机,你现在使用多个维度去观看,认识手机了,就不仅限于长宽高三个维度了。
    所以说,我们是从维度、角度、方向去看去(看)对象的。
    当我们看一个人的时候,你会认识到他的姓名、年龄、事迹、历史地位、收入、性格、人品、是否有车、是否有保险、手机型号、贷款金额、走路姿势等等维度去更全面认识一个人,但我们基本上是仅凭几个特殊、特有维度来区别这个人和其他人。
    对于对象的认识可以是无穷维度的认识,但对象有区别于其他类别物体的特有维度,和维度值范围。

    2. 如何区别物体?

    个人认为:
    物体区别于物体的本质标准在于特有维度和维度值的范围。
    不同类,即便同类物品有自己特有的维度以及维度的固有范围。

    3. 度量、维度、层次、级别

    原始数据中,一条数据,可以看作为一个对象,该对象全是属性、维度,如下记录描述一些人的信息:
    科室 性别 工资
    A 男性 7000
    A 男性 8000
    B 女性 7500
    B 女性 9000
    B 男性 7000
    B 男性 8000
    A 女性 7500
    A 女性 9000
    C 男性 8000
    C 女性 7500
    C 女性 9000
    这三个属性都是对人的一种描述(可能还有其他属性,此处只列出3个属性),三个属性就是人的三个特征,三个维度。
    此时提出关注点和统计需求:
    统计A、C科室女性的的总工资,最高工资,最低工资,平均工资,工资方差。
    统计步骤:
    1.进行分组:把A、C科室女性叫到一起,即分到一个组。此处是根据两个属性:科室、姓别(两个维度)的值A、C,女性,进行限定,把她们分到一个组中。
    2.统计、计算:对这个组里所有人的工资属性进行计算,计算出总工资,最高工资,最低工资,平均工资,工资方差。
    维度就是人的三个属性:科室 性别 工资。
    度量是什么?
    是总工资,最高工资,最低工资,平均工资,工资方差。非常明显地看出,都是对工资这个属性上加了计算!是维度的测量。英文对应measure,就有测量的意思,测量什么?测量的是某个属性(维度),是我想关注和想看的一个属性。
    测量哪些对象的该属性呢?A、C科室女性。
    度量是可计算、比较、可比较、可测量的属性,工资是我们想看的属性,特征,维度。想看工资的什么统计量呢?想看工资的总、最高、最低、方差。
    度量也是维度,是我想关注的维度的测量统计。所以度量就是一个观测角度。本例中,我想通过收入角度去看(了解)这些人(人由科室 性别 工资三个维度构成)。

    层次和级别是什么?
    科室 A、C,性别女性是对科室和性别两个两个维度做了限制。两个维度有很多值,想看哪些人的工资呢?如果不做限制,就是所有人的,本例限定科室 A、C,性别女性。

    我们规定科室A、C为销售部门、B为技术部门。那么原需求可表述为:统计销售部门女性的总工资,最高工资,最低工资,平均工资,工资方差。
    A、C科室为销售部门起到了什么作用?是对科室属性中所有科室值A B C进行的一种划分(分组),把这种划分方式叫做:按科室职能划分。
    科室职能这种划分把所有科室分成了:销售部门、技术部门。把划分方式叫做层次划分,划分的依据是层次,依据科室职能层次划分。
    销售部门、技术部门是按照科室职能层次划分出来的的两个部分,叫做级别,即销售部门、技术部门两个级别。
    当然,科室还有其他层次的划分方式。
    概括地说,维度和度量的概念是:多维度多条件下观测维度的测量,多因素条件下的关注量的统计,或者说多因素多条件下综合、定位限定所聚焦的、关注的维度统计。
    关注的,想看的是某个维度的测量统计量,其他维度的层次、级别是对度量的测量范围的限定。
    度量具体值和其他维度具体值本身就是相互映射,相关的,存在一种映射关系 ,维度层级来做限定范围,映射的度量进行计算。

    当统计的对象是一条明细时:
    员工编号 科室 性别 工资
    01 A 男性 7000
    统计员工编号01,A科室性别女性的的总工资,最高工资,最低工资,平均工资,工资方差。
    本质和上述概念一致,是对一个人的工资的相关统计,计算。和多个人,多组人,没有本质区别。都是对要统计工资的人的人数和范围的限定。

    4. 数据库表设计上的体现

    设计FACT表时,如果Fact表只是最基础的聚合,其中group by dept, sex 是分组值,是观测维度。 where deptclass = '职能部门’是维度的限制条件,是层级的概念。
    sum(sal)、max(sal)等是度量的计算,是我关注的维度的计算。
    为什么有group by分组呢?因为我关注的是一个群体对象,群体记录的相关维度(度量)的统计,所以是要分组的,哪些群体呢?是要分层级的。
    。。。。。。。。。
    待完善。。。。。。

    5. Cube模型的体现

     。。。。。。。。。
     待完善。。。。。。
    

    7. 数学坐标系理解多维数据

     。。。。。。。。。
     待完善。。。。。。
    

    8. 指标的理解

    指标是不但具备自身的业务含义,更是组织和划分数据的方式。指标也是多因素条件下的关注量(的统计)。

    展开全文
  • 一、OLAP 核心技术、 二、OLAP 多维数据模型、 三、OLAP 多维数据模型 核心概念、 四、维、 五、维成员、 六、维层、 七、维层次、 八、维属性、 九、度量





    一、OLAP 核心技术



    OLAP 核心技术 :

    • 多维数据模型
    • 多维分析操作
    • 多维查询及展示
    • 数据方体技术




    二、OLAP 多维数据模型



    "用户数据视图" 概念 : 在数据分析时 , 用于面向分析的数据模型 , 用于为分析人员提供 多种观察数据的视角 , 和 面向分析的操作 ;


    "多维数据模型" 作用 : 多维数据模型数据仓库OLAP 联机分析处理基础 ;


    "多维数据模型" 表示 :

    • 多维数组 : 多维数据模型 的 数据结构 , 可以使用 多维数组 表示 ;
    • 实例 : 维度 1 1 1 , 维度 2 2 2 , ⋯ \cdots , 维度 n n n , 维度之间的交叉点 , 存放度量值 , 每个度量值由若干数据组成 ; 如 二维数据 , 维度 1 1 1 x x x 轴 , 维度 2 2 2 数据是 y y y 轴 , 每个 x , y x,y x,y 都可以定位一个度量值 ;

    "多维数据模型" 本质 : 多维数据模型 本质是 多维空间 , “维” 表示用户观察的对象 , 观察角度 , 多维空间中的 “点” 表示 度量 的值 ; OLAP 采用 “多维数据模型” ;


    "多维数据模型" 与 传统的关系数据模型不同 :

    • OLTP 关系数据模型 : 传统关系数据模型是二维的 , 关系数据库有一套 “关系-代数理论” , 有非常深厚的数学基础 ;
    • OLAP 多维数据模型 : 多维数据模型是 随着 OLAP 产品的流行出现 , 缺乏理论基础 , 目前没有统一的多维数据模型 ;

    "多维数据模型" 不同表示方式 :

    • 使用 “关系模型” 表示 多维数据模型 ;
    • 将 多维数据模型 形式化为 “多维空间” ;




    三、OLAP 多维数据模型 核心概念



    OLAP 多维数据模型 核心概念 :

    • 维成员
    • 维层
    • 维层次
    • 度量




    四、维



    "维" 简介 :

    • "维" 概念 : 人们 观察数据的 特定角度 , 事物的属性 ;
    • "维" 作用 : “维” 是商业活动的 基本要素 , 每个 “维” 有唯一的名称 , 如 时间维 , 地区维 等 ;

    "维" 示例 : 分析 商品销售 数据 , 涉及 商品的 时间 , 地区 , 就是维 ;

    • 时间维 : 商品在不同的时间的销售情况 ;
    • 地区维 : 商品在不同的地区的销售情况 ;




    五、维成员



    "维成员" 简介 :

    • 维 与 “维成员” : 是由若干 “维成员” 组成 ; 维的 一个取值 称为 “维成员” , 每个 “维成员” 都有一个名字 , 可以有 若干属性 描述 “维成员” 特征 ;
    • 多维层 “维成员” : 维 可能是 多层的 , 该 维 的 “维成员” 可以是 在不同 维层 上的取值组合 ;

    "维成员" 示例 :

    • "时间维" 示例 : 以 “时间维” 为例 , 时间维上有 100 100 100 个时间数据 , 每个时间数据都是一个 “维成员” ;
    • 3 3 3 个维层次 : “时间维” 有 : 年 , 月 , 日 , 三个层次 ;
    • 多维层 “维成员” : 每个时间数据 ( “维成员” ) 可以由 3 3 3 个维层的数据组成 , 如 2020 2020 2020 02 02 02 02 02 02 日 , 分别是 年 , 月 , 日 , 三个维层 的数据 ;
    • 单维层 “维成员” : 也可以只使用一个 维层 的数据 , 如 2020 2020 2020 年 , 只有一个维层的数据 ;
    • "维成员" 取值灵活 : “维成员” 取值 既可以使用 维 的全部维层数据 , 也可以只取一个维层的数据 , 也可以选择若干 维层 数据组合 ;




    六、维层



    "维层" 简介 :

    • "维层" 概念 : 观察数据时 , 除了从 某一角度 观察外 , 还需要 从 “不同细节程度” 去观察 , 这些 不同的细节程度 , 称为 “维层” ;

    • "维层" 示例 : 时间维 : 日 , 月 , 年 , 是时间维 的 维层 ; 地区维 : 街道 , 城市 , 省份 , 国家 , 是地区维的 维层 ;

    • "维层" 描述 : 维层 描述了 数据的 细节程度 , 抽象级别 , 每个维层都有一个名称 , 维层之间存在抽象级别决定关系 , 如上述地区维 , 国家下有很多省份 , 省份下有很多城市 , 城市下有很多街道 ;

    • "维层" 成员 : 每一个维层的具体取值 , 称为 维层成员 , 如 地区维 , 国家维层 , 有中国 , 美国 , 省份维层有 广东 , 浙江 ;

    • "维层" 本质 : 维层 本质上 是 对 维成员 的 组织分类方法 ;





    七、维层次



    "维层次" 简介 :

    • "维层次" 概念 : 若干 维层 可以构成 分类方法 , 在 维 中 , 可以有多个分类方法 , 每种分类方法叫做 “维层次” ;
    • "维层次" 示例 : 以 时间维 为例 , 按照 年 -> 季度 -> 月 -> 日 进行分类 , 这是一个维层次 , 也可以 按照 年 -> 月 -> 周 进行分类 , 这也是一个维层次 ; 上述是 时间维 的 两个维层次 ; 不同维层的组织方法 , 称为维层次 ;




    八、维属性



    "维属性" 简介 :

    • "维属性" 概念 : 维属性 用于 说明 维成员 具有的特征 ;

    • "维属性" 定义位置 : 维属性可以 定义在维成员上 , 也可以 定义在维层上 ; 如果将维属性 定义为维层上 , 那么该层次上的每个维成员都具有该属性 ;

    • "维属性" 定义示例 : 维成员 是 商店 , 为商店 定义 负责人 属性 , 可以直接在该 商店 维成员上定义 , 可以在 地区维 下定义该属性 , 如果在地区维 定义维属性 , 那么该地区所有的商店的负责人都是同一个人 ;





    九、度量



    "度量 " 简介 :

    • "度量" 概念 : 分析的 目标 或 对象 , 称为 度量 ;

    • "度量" 表示 : 度量一般有 名字 , 数据类型 , 单位 , 公式 等属性 ;

    • 输入 “度量” : 从业务活动中获取的值 ; 如 销售额 ;

    • 导出 “度量” : 经过计算得到的值 ; 如 利润 ;

    • 聚集计算 : 求和 , 求平均值 等操作 ;

    • 可累计型 “度量” : 可以沿 时间维 做聚集计算 , 称为 可累计型 的度量 , 如营业额 ;

    • 不可累计型 “度量” : 不能沿 时间维 做聚集计算 , 称为 不可累计型 的度量 , 如库存 , 不能将不同时间的库存累加起来 ;


    “度量” 多个 “维”交叉点 ;

    展开全文
  • 论文研究-基于水军信任惩罚的多维用户影响力度量模型.pdf, 社交网络用户影响力度量是意见领袖识别的必要前提,然而目前的度量模型忽略了多维影响因素以及水军群体对度量...
  • 针对可信度量现存问题,依据软件安全保护原则提出通过融合多方度量因子建立综合的可信度量模型――随机抽取划分序列策略模型。该模型兼顾了软件安全度需求系数、软件安全度评估系数及软件执行所需资源开销系数等多方...
  • 多维数据模型

    万次阅读 2018-09-18 15:04:33
    数据仓库和数据仓库技术基于多维数据模型。这个模型把数据看成是数据立方体形式。多维数据模型围绕中心主题组织,该主题用事实表表示。事实是数值度量的。 数据立方体允许以多维数据建模和观察,它由维和事实定义。...

    一、从关系表和电子表格到数据立方体

    数据仓库和数据仓库技术基于多维数据模型。这个模型把数据看成是数据立方体形式。多维数据模型围绕中心主题组织,该主题用事实表表示。实是数值度量的。

    数据立方体允许以多维数据建模和观察,它由维和事实定义。

    维是关于一个组织想要记录的视角或观点,每个维都有一个表与之相关联,称为维表

    事实表包括事实的名称或度量,一个n维的数据立方体叫做基本方体。给定一个维的集合,可构造一个方体的格,每个都在不同的汇总级或不同的数据子集显示数据,方体的格称为数据立方体。0维方体存放在最高层的汇总,称作顶点方体;存放在最底层汇总的方体则称为基本方体

    二、数据仓库的概念模型

    最流行的数据仓库概念模型:多维数据模型。这种模型可以是星型模式、雪花模式、或事实星座模式的形式存在。

    (1)星型模式(star schema):事实表在中心,周围围绕地连接着维表(每一维),事实表含有大量数据,没有冗余。

    维表location 中  city  和 country 属性重叠即属性冗余(造成空间浪费和数据不一致性)

    (2)雪花模式(snowflake schema):是星型模式的变种,其中某些维表是规范化(将冗余字段用新的表来表示)的,因而把数据进一步分解到附加表中,结果,模式图形成类似于雪花的形状。

    (3)事实星座模式(fact constellations):多个事实表共享维表,这种模式可看做星型模式集,因此称为星系模式(galaxy schema,星型模式的集合),或者事实星座(fact constellation)

    三、一种数据挖掘查询语言:DMQL

    DMQL首先包括定义数据仓库和数据集市的语言原语,这包括两种原语定义:一种是立方体定义,一种是维定义

    (1)立方体定义(事实表)

    define cube<cube_name>[<dimension_list>]:

    <measure_list>

    (2)维定义(维表)

    define dimension <dimension_name> as 

    (<attribute_or_subdimension_list>)

    (3)特殊案例(共享维表的定义)

    第一次作为维表定义''cube definition ''

    然后:define dimension<dimension_name> as 

                 <dimension_name_first_time>in cube

                 <cube_name_first_time>

    实例:使用DMQL定义星型模式

    define cube sales_star[time,item,branch,location]:

            dollars_sold=sum(sales_in_dollars),avg_sales=avg(sales_in_dollars),units_sold=count(*)

    define dimension time as (time_key,day,day_of_week,month,quarter,year)

    define dimesion item as (item_key,item_name,brand,type,supplier_type)

    define dimension branch as (branch_key,branch_name,branch_type)

    define dimension location as (location_key,street,city,province_or _state,country)

    实例:使用DMQL定义雪花型模式

    define cube sales_snowflake[time,item,branch,location]:

            dollars_sold=sum(sales_in_dollars),avg_sales=avg(sales_in_dollars),units_sold=count(*)

    define dimension location as (location_key,street,city(city_key,province_or _state,country)) 规范化,用新表去除冗余

    实例:使用DMQL定义事实星座模式

    define cube sales[time,item,branch,location]:

            dollars_sold=sum(sales_in_dollars),avg_sales=avg(sales_in_dollars),units_sold=count(*)

    define dimension time as (time_key,day,day_of_week,month,quarter,year) 第一次定义

    define dimesion item as (item_key,item_name,brand,type,supplier_type)

    define dimension branch as (branch_key,branch_name,branch_type)

    define dimension location as (location_key,street,city,province_or _state,country)

    define cube shipping[time,item,shipper,from_location,to_location]:

            dollar_cost=sum(cost_in_dollars),unit_shipped=count(*)

    define dimension time as time in cube sales   第二次可直接引用

    define dimension item as item in cube sales

    define dimension shipper as(shipper_key,shipper_name,location as location in cube sales,shipper_type)

    define dimension from_location as location in cube sales

    define dimension to_location  as location in cube sales

    四、度量的分类

    一个数据立方体的度量是一个数值函数,该函数可以对数据立方体的每一个点求职。度量可以根据其所用的聚类函数分为三类:

    分布的(distributive):将函数用于n个聚集值得到的结果和将函数用于所有数据得到的结果一样 count(),sum(),min(),max()

    代数的(algebraic):函数可以由一个带M个参数的代数函数计算(M为有界整数),而每个参数值都可以有一个分布的聚集函数求导 avg(),min_N(),standard_deviation()

    整体的(holistic):描述函数的子聚集所需的存储没有一个常数界。median(),mode(),rank()

    五、概念分层和多维数据模型上的OLAP操作

    (1)概念分层:一个概念分层定义一个映射序列,将不同的属性连接成一个整体。利于不同层次的数据进行汇总,按属性进行汇总。

    (2)多维数据模型上的OLAP操作

    上卷(roll-up):汇总数据,通过一个维 的概念分层向上攀升或者通过维规约

    下钻(drill-down):上卷的逆操作,由不太详细的数据到更详细的数据,可以通过沿维的概念分层向下或引入新的维来实现。

    切片和切块(slice and dice):投影和选择操作

    转轴(pivot):立方体的重定位,可视化,或将一个3维立方体转化为一个3维平面序列

    其他OLAP操纵:钻过(drill_across):执行涉及多个事实表的查询

                                   钻透(drill_through):使用关系SQL机制,钻到数据立方体的底层,到后端关系表

    六、数据仓库设计:

    如何设计有效的数据仓库,就需要进行需求分析,则需要构建一个商务分析框架

    (1)数据仓库设计的四种视图

    i:      自顶向下视图:允许我们选择数据仓库所需的相关信息

    ii:     数据源视图:揭示被操作数据库系统所捕获、存储和管理的信息

    iii:     数据仓库视图:有事实表和维表所组成

    iiii:    商务查询视图:从最终用户的角度透视数据仓库中的数据

    (2)数据仓库的设计过程

    i:      自顶向下法(由总体设计和规划开始:成熟)、自底向上法(以实验和原型开始:快速)或者两者结合的混合方法

    ii:     从软件过程的观点:瀑布式方法:在运行下一步前,每一步都进行结构化和系统的分析;

                                                   螺旋式方法:功能渐增的系统的快速产生,相继版本之间间隔很短

    iii:    典型的数据仓库设计过程

    选取待建模的商务过程;选取商务过程的粒度;选取用于每个事实表记录的维;选取将安放在事实表中的度量

    数据仓库服务器大部分都是关系数据库服务器。

    数据仓库也是数据库,但是是分离的数据库。

    (3)三种数据仓库模型

    企业仓库:搜集关于跨越整个组织的主题的所有信息

    数据集市:企业范围数据的一个子集,对于特定的客户是有用的:其范围限于选定的主题,比如一个商场的数据集市 

                          独立的数据集市 VS 非独立的数据集市(数据来自于企业的数据仓库)

    虚拟仓库:操作数据库上的一系列视图,只有一些可能的汇总图被物化

    (4)数据仓库开发- 一个推荐的方法

    七、OLAP  服务器类型

    (1)关系OLAP服务器(POLAP)

    使用关系数据库或扩展的关系数据库存放并管理数据仓库的数据,而用OLAP中间件支持其余部分

    包括每个DBMS 后端优化,聚集导航逻辑的实现,附加的工具和服务

    较大的可扩展性

    (2)多维OLAP服务器(MOLAP)

    基于数组的多维存储引擎(稀疏矩阵技术)

    能对预计算的汇总数据快速索引

    (3)混合OLAP服务器(HOLAP)

    结合上述两种技术,更大的使用灵活性

    (4)特殊的SQL服务器

    在星型和雪花模型上支持SQL查询

     

    展开全文
  • 数据仓库多维数据模型概念介绍

    千次阅读 2019-11-15 16:16:44
    操作性数据库与数据仓库区别 操作型数据库主要考虑的是事务型处理,一般采用E-R模型进行建模。 数据仓库主要面向分析,设计数据仓库时...多维数据模型采用多维结构文件进行数据存储,并有索引及相应元数据管理文...
  • 首先, 提出一种基于粒子群优化和四叉树空间划分的多维模式运动空间的构建方法, 为了定量描述多维模式的运动, 采用多维区间数度量多维模式类别变量; 然后, 定义一种多维区间T-S 模糊模型, 并以此构建多维运动模式的...
  • 数据仓库多维数据模型设计

    万次阅读 多人点赞 2017-11-09 18:14:59
    建设数据模型既然是整个数据仓库建设中一个非常重要的关键部分,那么,怎么建设我们的数据仓库模型就是我们需要解决的一个问题。这里我们将要详细介绍如何创建适合自己的数据模型。 数据仓库建模方法 大千世界,...
  • OLAP和多维数据模型

    万次阅读 多人点赞 2017-11-09 15:56:36
    它具有FASMI(Fast Analysis of Shared Multidimensional Information),即共享多维信息的快速分析的特征。 其中F是快速性(Fast),指系统能在数秒内对用户的多数分析要求做出反应; A是可分析性(A...
  • 所以,在建立多维模型之前,我们一般会根据需求首先详细的设计模型,应该包含哪些维和度量,应该让数据保持在哪个粒度上才能满足用户的分析需求   模型设计 合理的业务模型设计对ETL至关重要。  数据...
  • 可能很多人理解的数据仓库就是基于多维数据模型构建,用于OLAP的数据平台,通过上一篇文章——数据仓库的基本架构,我们已经看到数据仓库的应用可能远不止这些。但不得不承认多维数据模型是数据仓库的一大特点,也是...
  • 多维数据模型总结和归纳

    千次阅读 2019-04-26 13:59:57
    Mondrian本身是不存储数据的,通过MDX语句(一个类似于SQL的查询语言)来获取数据,Mondrian 运行的时候要连数据库,并且还要有一个数据模型配置文件(Mondrian叫schema),其实就是一个取数据的规则;由此可知...
  • 当选择宇宙学类型的对角线度量时,将采用电磁复合式麦麸ansatz,并对麦麸施加一定的限制。 研究了模型的共形协整Wheeler-DeWitt(WDW)方程。 在某些限制下,在台球壁形成的极限中发现了WDW方程的渐近解,这将问题...
  • 我就不展示了,下面基于ggplot做一张完善的图#首先提取前两轴坐标 point = scores(vare.mds) #将分组文件和得分文件合并 index = merge(design, point,by="row.names",all=F) 计算Stress值 Stress值是反映模型合适...
  • 多维数据模型的设计

    千次阅读 2017-11-04 15:34:00
    多维数据模型的设计概述 一、维表、事实表 二、星型模式(star schema) 三、雪花模式(snowflake schema) 四、事实星座模式(Fact Constellation)或星系模式(galaxy schema) 五、度量:分类与计算 六、多维数据...
  • 范式理论和多维模型

    2019-11-25 16:45:38
    多维数据模型 概念 维:是用于从不同角度描述事物特征的,用于选择和分组 度量: 数据的实际意义,常为一个数据值的统计指标 粒度:数据的细分层度,考虑到量度的聚合程度不同,一般采用“最小粒度原则” ...
  • 基于多维数据模型的OLAP

    千次阅读 2017-02-13 11:18:22
    前面的一篇文章——数据仓库的多维数据模型中已经简单介绍过多维模型的定义和结构,以及事实表(Fact Table)和维表(Dimension Table)的概念。多维数据模型作为一种新的逻辑模型赋予了数据新的组织和存储形式,而...
  • 在传统的应用场景下,企业都是利用关系型数据库来存储和管理业务数据...于是,OLAP(联机分析处理)应运而成,OLAP基于多维数据库和多维分析,存储的主要是信息数据,以基于大数据实现支持管理分析为主要目的。 OLAP是直
  • 浅谈多维模型

    2012-02-23 21:08:45
    因此在建立多维模型前,一般会根据需求首先详细的设计模型,确定好包含哪些维和度量,以及数据保持在哪个粒度上才能满足用户的分析需求。 星型模型-----事实表居中,多个维表呈辐射状分布四周通过主键和外键与事实表...
  • 通过多维数据模型的数据展示、查询和获取就是其作用的展现,但其真的作用的实现在于,通过数据仓库可以根据不同的数据需求建立起各类多维模型,并组成数据集市开放给不同的用户群体使用,也就是根据需求定制的...
  • 我们考虑内部空间为紧凑的爱因斯坦空间的Kaluza-Klein(KK)模型。 这些空间由背景物质(例如,单极形式场)稳定。 我们通过外部/我们空间的零压力和内部空间的任意压力的紧凑物质源(例如,引力质量系统)扰乱了...
  • 数据仓库多维数据模型基本概念

    万次阅读 2017-07-13 13:49:52
    这三者就是数据仓库多维数据模型建模的模式. 上图所示就是一个标准的星形模型。 雪花形就是在维度下面又细分出维度,这样切分是为了使表结构更加规范化。雪花模式可以减少冗余,但是减少的那点空间和...
  • ssas 度量值属性 In this article, a demonstration of the tabular model will try to related multidimensional cube design to the path forward Microsoft is giving used s with new versions of Analysis ...
  • 文章目录 一、前言二、数据仓库的定义三、数据仓库的特点四、数据仓库的作用五、数据仓库的架构六、数据仓库的要求七 、数据仓库分层八、数据仓库... 九、数据流向十、数据仓库模型设计基础10.1 维度数据模型10.2 ...
  • 利用正交多项式回归模型对时间序列进行多维形态特征表示, 分析特征维数对时间序列拟合效果的影响, 选取部分特征来描述序列的主要形态趋势, 提出了一种鲁棒性较强的形态特征相似性度量方法来近似度量时间序列, 且...
  • 定义半累加性行为 ...在很多业务方案中,半累加性度量值是非常常见的,它不在所有维度中统一进行聚合。...通过在多维数据集中添加半累加行为,可以为帐户类型属性的单个度量值或成员定义聚合方法。 如果多维
  • 集成的:数据仓库里面的数据都是经过ETL( Extract-Transform-Load 抽取-转换-加载)操作后被集中放到同一个数据源,数据仓库的数据是来自于各种不同的数据源。 随时间变化的:关键数据隐式或者显示地随时间变化...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 11,085
精华内容 4,434
关键字:

多维模型里的度量