精华内容
下载资源
问答
  • 水泥行业深度研究:六大维度下 坚定水泥板块投资.pdf
  • “十年的产品,百年的品牌”,五年前,想要做好企业,做好产品就行。如今,想经营好企业,必须塑造一个良好的品牌。...六大维度为品牌营销赋能,构建属于自己的品牌标签 一、市场扫描 (一)市场分析 1

    “十年的产品,百年的品牌”,五年前,想要做好企业,做好产品就行。如今,想经营好企业,必须塑造一个良好的品牌。市场已经从传统的满足刚需的模式,转变为精神满足的模式,我们只有将产品赋予了特殊意义,才能从同业竞争中脱颖而出,才能赋予更多的品牌价值。
    品牌营销流量矩阵
    品牌赋能的前提,必须要了解自己、了解市场、懂得对手、清楚用户才能形成合力,整合现有资源,找到品牌着力点,从而突破竞对围堵,贴近用户心理,造就属于自己的铁杆粉丝群体,构建品牌私域流量池。

    六大维度为品牌营销赋能,构建属于自己的品牌标签

    一、市场扫描
    (一)市场分析
    1.产品分析
    2.政治法律分析
    3.经济环境分析
    4.社会环境分析

    (二)竞争格局
    1.竞争对手发展目标
    2.竞争对手的营销策略
    3.品牌形象
    4.竞争对手的行为

    (三)品牌写真
    1.企业背景分析
    2.品牌形象分析
    3.品牌表现与传播力
    4.品牌动态分析

    (四)消费观察
    1.市场趋势分析
    2.用户消费属性分析
    3.用户需求分析
    4.用户消费习惯

    (五)企业战略分析
    1.品牌发展目标
    2.市场发展目标
    3.经营发展目标

    二、竞争策略
    (一)发现问题:SWOT分析法
    1.SO优势策略,领先内部优势抓住机会的策略
    2.WO策略,利用外部机会来改进内部弱点的战略
    3.WT补强策略,克服内部弱点和避免外部威胁的战略
    4.ST策略,利用企业的优势去避免或减轻外部威胁的战略

    (二)解决之道:
    1.三元素定位法:目标消费群,商品独特卖点,竞争对手在做什么。
    2.市场矩阵占位法:以矩阵图各象限确定左边,核定品牌市场占位
    3.A-B点定位法:品牌定位的调整改变与提升

    三、品牌定位策略
    (一)品牌核心价值
    1.功能性价值(USP)
    2.情感价值
    3.自我表达价值

    (二)品牌主张
    1.功能USP主张
    2.情感主张
    3.理念主张

    (三)品牌调性
    (四)功能定位策略
    (五)竞争定位策略
    (六)情感定位策略

    四、品牌整合营销策略
    1.品牌整合营销:统一企业目标和品牌传播形象
    2.营销目标:阶段工作目标
    3.策略原则:产品整合、价格体系规划、渠道规划策略
    4.品牌营销策略:价格策略、渠道策略、促销策略、营销活动

    五、品牌推广策略
    (一)品牌创意策略
    1.广告目标
    2.创意概念
    3.创意表现

    (二)品牌传播策略
    1.传播目标
    2.传播原则
    3.媒介组合及投资预算

    (三)品牌公关策略
    1.公关目标
    2.主题概念
    3.公关形式

    六、品牌营销策略
    (一)产品策略
    1.产品体系整合目标
    2.产品体系整合原则
    3.产品体系整合建议

    (二)价格策略
    1.价格体系规划目标
    2.价格体系规划原则
    3.价格体系规划建议

    (三)渠道策略
    1.渠道规划目标
    2.渠道规划原则
    3.渠道选择方式

    展开全文
  • 金融行业用户画像六大维度

    千次阅读 2019-12-19 16:19:52
    随着移动互联网时代的到来,金融服务从以产品为中心逐渐转向以消费者为中心。而金融消费主力人群也趋于年轻化,金融...一般而言,我们可以将用户画像信息分为维度,这些信息基本覆盖了相关的业务需求。当然,...

    随着移动互联网时代的到来,金融服务从以产品为中心逐渐转向以消费者为中心。而金融消费主力人群也趋于年轻化,金融行业无法像过去一样从对话就能了解年轻人的想法,而对于年轻人金融产品的需求出现多元化,更需要我们细分客户并为其开发设计产品。为此,金融企业需要借助用户画像,来完成了解客户、找到目标客户、触达客户这三个步骤。
    一般而言,我们可以将用户画像信息分为六个维度,这些信息基本覆盖了相关的业务需求。当然,用户画像的信息维度是复杂的,我们无法仅从获取的外部信息来完全了解客户内心世界,所以,我们需要借助一些场景因素,针对不同行业和场景的用户使用不同用户画像方法。下面的六个维度是一般金融企业用户画像所需的:

    (一)人口属性

    用于描述用户个人基本特征信息,帮助金融企业知道客户是谁?人口属性包括:姓名、性别、年龄、婚否、联系方式、住址等等。

    (二)信用属性

    用于描述用户收入情况、收入潜力和支付能力,帮助金融企业了解用户资产信用情况。信用属性包括:职业、学历、收入、资产、负债、信用评分等等。

    (三)消费特征

    用于描述客户主要消费习惯和消费偏好,用于寻找高频和高价值客户。帮助企业依据客户消费特点推荐相关金融产品和服务,转化率将非常高。消费特征包括:有车族、有房族、购物类型、购买周期、品牌偏好等等。为了便于筛选客户,可以参考客户的消费记录和语义场景,将客户直接定性为某些消费特征人群,例如差旅人群,境外游人群,3C控,奢侈品族,母婴用户,理财人群等等。

    (四)兴趣爱好

    用于描述客户的兴趣偏好,同时帮助企业了解客户消费倾向,定向进行精准营销活动。兴趣爱好和消费特征信息来源于已有的消费记录、位置信息和不同的语义场景等,比如通过客户在论坛中经常会询问有关科技产品的资讯,我们会通过对客户语义的挖掘分析,将其定义为“科技发烧友”。

    (五)社交信息

    用于描述用户的社交图谱、家庭成员、朋友圈,这些信息往往代表用户的消费预期和客户社会关系网,通过社交信息,可以尽可能完整的了解客户,以便为客户提供个性化的服务。

    (六)交互信息

    用于描述用户在社交媒体上的评论,这些信息往往代表客户真实的需求,具有实时性高、转化率高的特点。比如:客户在某论坛询问哪个理财产品收益高?我们通过对客户语义的挖掘分析,该客户有投资理财的需求,如果金融企业可以为客户实时推送相关收益高的理财产品信息,其必将具备蕴藏的商业价值。

    最后,我们需要将客户消费能力、信用额度等数据进行关联分析,这样可以更加准确的把握消费者,帮助金融企业更好优化产品设计、提高产品销售活跃率。

    展开全文
  • 详解维度建模

    2019-09-16 17:18:47
    0x01 什么是维度建模 维度模型是数据仓库领域另一位大师 Ralph Kimball 所倡导,他的《The DataWarehouse Toolkit-The Complete Guide to Dimensona Modeling,中文名《数据仓库工具箱》,是数据仓库工程领域最流行...

    前一篇已经对常用的几种数据模型做了简单的介绍,本篇主要对其中最常用的维度建模做一个深入的理解。

    0x01 什么是维度建模

    维度模型是数据仓库领域另一位大师 Ralph Kimball 所倡导,他的《The DataWarehouse Toolkit-The Complete Guide to Dimensona Modeling,中文名《数据仓库工具箱》,是数据仓库工程领域最流行的数仓建模经典。

    按照书中所讲,维度建模并不要求维度模型必须满足第3范式。数据库中强调的 3NF 主要是为了消除冗余。规范化的 3NF 将数据划分为多个不同的实体,每个实体构成一个关系表。比如说订单数据库,开始可能是每个订单中的一行表示一条记录,到后来为了满足 3NF会变成蜘蛛网状图,也许会包含上百个规范化表。而且对于 BI 查询来讲,规范化模型太复杂,用户会难以理解和记录这些模型的使用。 而维度建模解决了模式过分复杂的问题。

    我们换一种方式来解释什么是维度建模。学过数据库的童鞋应该都知道星型模型,星型模型在数据仓库的设计中可以为是一种典型的维度模型。我们在进行维度建模的时候会建一张事实表,这个事实表就是星型模型的中心,然后会有一堆维度表,这些维度表就是向外发散的星星。那么什么是事实表、什么又是维度表吗,下面会专门来解释。

    0x02 基本概念

    维度建模中有一些比较重要的概念,理解了这些概念,基本也就理解了什么是维度建模。

    为了便于理解,我们先假设一个业务场景:聊天! 比如短信聊天、软件聊天这些聊天场景。 下图是在聊天场景中我们设计的一个简单的星型模型,里面有三个最常用到的概念:事实表、维度表和度量值。

    1. 事实表

    发生在现实世界中的操作型事件,其所产生的可度量数值,存储在事实表中。从最低的粒度级别来看,事实表行对应一个度量事件,反之亦然。

    额,看了这一句,其实是不太容易理解到底什么是事实表的。书中就是这么写的,刚入门的时候看的时候一脸懵逼。

    回到前面的图,最中间那个chat表就是一个事实表,你可以理解他就是在现实中发生的一次操作型事件,我们每次给一个小伙伴发一条信息,就相当于是一个事实,它在表中的体现就是一条记录。

    我们可以回过头再看一下事实表的特征,在维度表里没有存放实际的内容,他是一堆主键的集合,这些ID分别能对应到维度表中的一条记录。

    2. 维度表

    每个维度表都包含单一的主键列。维度表的主键可以作为与之关联的任何事实表的外键,当然,维度表行的描述环境应与事实表行完全对应。 维度表通常比较宽,是扁平型非规范表,包含大量的低粒度的文本属性。

    我们的图中的围绕在chat表周围的四张表都属于维度表,这些表都有一个唯一的主键,然后在表中存放了详细的数据信息。

    3. 度量值

    度量值是什么?看一下chat表中最后一个字段:内容长度(content_length),它表示我们在短信中的发了多少个字。 度量值是对一次行为的度量,可以是一次短信的文本长度、一次电话的通话时间、一个订单的订单金额。

    0x03 实践

    下面我们将以聊天场景为例,详细讲一下维度建模的建模方式,并举例如果使用这个模型(这点还是很重要的)。

    一、业务场景

    假设我们在一家通信性质的公司工作,公司需要对业务进行建模,我们首先限定业务场景为聊天,这种场景会有下面几个要素:

    1. 一次聊天行为的发起需要有这几个个体的参与:发送消息者、接受消息者、时间、ip、设备。
    2. 一个用户可以给多个用户发消息,可以不同时间发很多条。

    好,基于这两点,我们来设计我们的模型。

    二、模型设计

    首先,我想一下如果不按照什么维度建模来设计,我们可以怎么做?

    如果是我,我会设计下面这张表。你信不信,我能列出来50个字段!

    如果按照维度建模的方式来设计的话,我们会得到这张表,也就是前面贴出来的。

    其实我个人认为怎么设计这种表都有其合理性,我们不论对错,单说一下两者的优缺点。

    先说我们的维度模型:

    1. 数据冗余小(因为很多具体的信息都存在相应的维度表中了,比如用户信息就只有一份)
    2. 结构清晰(表结构一目了然)
    3. 便于做OLAP分析(数据分析用起来会很开心)
    4. 增加使用成本,比如查询时要关联多张表
    5. 数据不一致,比如用户发起购买行为的时候的数据,和我们维度表里面存放的数据不一致

    再说我们这张大款表的优缺点:

    1. 业务直观,在做业务的时候,这种表特别方便,直接能对到业务中。
    2. 使用方便,写sql的时候很方便。
    3. 数据冗余巨大,真的很大,在几亿的用户规模下,他的订单行为会很恐怖
    4. 粒度僵硬,什么都写死了,这张表的可复用性太低。

    三、使用示例

    数据模型的建立必须要为更好的应用来服务,下面我先举一个例子,来切实地感受一下来怎么用我们的模型。

    需求:求出2017年在广东省每个市的男性分别给女性发过多少字。

    实现

    实现是不是很简单?然后还有各种上钻和下探的操作都可以基于这几张表来实现。

    0xFF 总结

    维度建模是一种十分优秀的建模方式,他有很多的优点,但是我们在实际工作中也很难完全按照它的方式来实现,都会有所取舍,比如说为了业务我们还是会需要一些宽表,有时候还会有很多的数据冗余。

    维度模型在很多开源的系统都中都有支持,比如Kylin,在建模的时候就是用的维度建模中的星型模型,当然在最新版本中也支持了雪花模型。

    展开全文
  • 我们提出了维度的静态和轴对称的braneworld,作为类似字符串的模型扩展。 对于微妙的翘曲功能,此方案提供了近乎麸皮的矫正。 通过改变整体宇宙学常数,我们获得了通过不同相位的光源。 该解决方案既针对弦的...
  • 数据质量评估的个主要维度 DAMA版权所有, 翻译修订by大数据庞涛13811850730 摘要 本文描述了评估数据质量的个方面,由英国DAMA工作组制作 定义评估数据质量的维度 背景 ‘数据质量维度’这个词已经被广泛的...

    数据质量评估的六个主要维度
    原文下载: https://download.csdn.net/download/bigdatapang/12125767

    	DAMA版权所有, 翻译修订by大数据庞涛13811850730
    

    在这里插入图片描述

    摘要
    本文描述了评估数据质量的六个方面,由英国DAMA工作组制作

    定义评估数据质量的维度

    背景

    ‘数据质量维度’这个词已经被广泛的在业内使用了很多年,然后一直没有一个统一的标准。

    数据质量从业者也总是感到困惑,而商业组织的领导们就更迷惑了。

    哲人苏格拉底说:智慧从定义术语开始。因此本文旨在定义关键质量维度并给出上下文,以便能形成大家一致的共识。

    卡尔·R·波普爵士说过:“我没有说定义事物不能帮助链接具体问题,但是我强调的是一个术语能否可以定义出来和大多数问题确实不相关”。基本上,大家相互理解是非常非常必需的。这再次强调了本文的维度定义是帮助我们如何交流数据质量,而不是为了说明数据本身的含义和如何展现。

    2012五月, DAMA UK 召集志愿者参加一个工作组来考虑出版和发布一些最佳实践,得到了大家的热烈响应,同时印证了本项工作的意义。

    其他数据管理职业组织也一直支持本项工作,如 Julian Schwarzenbach, Chair of the BCS Data Management Specialist Group和 Gary Palmer, charter member of IAIDQ to join the working group.

    目录

    定义评估数据质量的维度 1
    背景 1
    什么是数据质量维度? 3
    上下文 3
    应用 3
    如何使用数据质量维度指标 4
    六个核心数据质量维度 5
    完整性 6
    独特性 7
    时效性 (时序性) 7
    有效性 8
    准确性 9
    一致性 10
    术语表 12
    作者 12
    参考文献 13

    什么是数据质量维度?

    一个数据质量 (DQ)维度是数据管理从业者基于已有的一些标准用来评估和衡量数据质量的一个特征*方面。
    例如:

    • 测试数据有93%,还差7%,这是完整度;
    • 测试数据的准确度是84%

    一个DQ 维度不能和另外一个DQ维度类似和混淆。如:
    • 其他数据管理的方面如数据仓库重的维度或数据立方体中的维度;
    • 物理学中描述一个结构或物体的时间或空间维度

    上下文

    本文列出的最佳实践案例可以帮助数据质量从业者给他们的组织查看和描述他们的数据质量.

    本文定义了六个通用的标准的数据质量维度.这可以帮助在考量数据质量的时候消除不一致的理解,消除理解上的困惑.建议数据质量从业者采用这些维度和定义作为评估和描述数据质量的通用标准.当然,某些场景里不是所有的维度都能全部用的上.

    企业组织使用这些维度来评估贫乏的数据的冲击,从费用,声誉和法律法规等角度来看.

    应用

    本文提供了一个数据质量评估的检查列表,它不是一个强制性的列表.这个列表会根据不同的商业和工业需求而不同.

    为了帮助应用本文的这些评估维度,每个维度都给出了一个仔细设计的学院样例. 这样例是精心挑选出来的,具有普遍的应用意义.

    在尝试使用本文数据质量维度之前,这个组织需要为要评估的数据质量达成一致的质量规则. 这些规则基于这六个数据质量维度来开发,基于本组织的数据需求和如果不遵照这个质量规则会带来什么影响.比如:

    • 错误的和空缺的电子邮箱地址对任何一个市场活动都有巨大的影响;
    • 不精确的个人信息细节可能会导致丢失销售机会或者增加客户抱怨;
    • 货物可能被运算到错误的地址;
    • 不正确的产品测量数据会导致严重的运算问题,比如产品装不进卡车或者预定了过多的卡车;

    数据一般只有在能支持业务过程或者组织决策时才有真正的价值。大家共识的数据质量规则应该考虑到数据能提供的价值。如果确认这些数据在特定场景有重大价值,那么在该场景下需要更加严谨精确的数据质量规则。

    如何使用数据质量维度指标

    选择数据质量的维度和相关指标应该基于商业场景,需求,和风险水平等。注意每一个维度都有不同的权重,同时未来获得更准确的数据质量,特变需要确定每一个维度对于整体数据质量的影响有多少。

    一个典型的数据质量评估方法可以如下:
    确定哪一个数据项需要为了数据质量进行评估,典型的就是那些对于业务运行和管理报告起到关键作用的数据项。

    1. 评估应该哪一个数据质量维度以及相关权重;
    2. 对于每一个数据维度,数值定义和取值范围代表着数据质量好坏。请注意,一个数据集可能支持多种需求,可能还需要多种数据质量评估手段;
    3. 对数据项应用评估标准;
    4. 审查结果并且决定数据质量是不是可接受的;
    5. 数据清洗和数据处理过程优化(防止错误重复)
    6. 阶段性重复上述过程来监测数据质量趋势

    数据质量审计的结果可以判断出该数据支持特定商业场景的好与坏。要看数据是不是很好地支持特定的商业需求会需要多种不同的数据质量检查。如果一个商业需求不能够足够地反映到数据质量规则里,那么数据质量检查就不能提供有效地评估。同样的,当要重复做数据质量检查的时候,一定要看商业数据的需求是否与上次发生了改变。

    尽管大部分数据质量维度可以通过分析数据本身获得,但是准确评估数据只能通过下面两种:
    • 针对代表事实的数据进行评估,如员工何时考察一个项目;
    • 针对权威数据集进行评估,如通过投票列表来检查客户详情;

    在这里插入图片描述

    图1-不同数据维度应用的范例

    六个核心数据质量维度

    1. 完整性
    2. 独特性
    3. 时效性
    4. 有效性
    5. 准确性
    6. 一致性

    完整性

    主题 完整性
    定义 针对’百分百完整’获取数据的比例
    参考 定义什么是百分百完整的商业规则
    度量 非空/非奇异点数据的比例
    范畴 0-100% , 针对衡量的关键数据,记录,或数据集数据库等
    度量单位 百分比
    度量类型:
    • 描述型
    • 连续型
    • 离散型 描述型
    相关维度 有效性和准确性
    其他 如果一个数据项至关重要,要获取到100%的完整性, 有效性和准确性还将会检查数据是不是正确地获得了100%完整.
    举例 学校新生的父母需要完成一个调研表,包括健康状况,紧急联系方式,并确认姓名年龄家庭住址和学生生日等.

    场景:

    秋季学期第一个星期末,针对联系表做了一个数据分析’首要紧急联系人电话号码’.学校有300个学生,294个人有记录,所有完整性是294/300=98%
    编程逻辑 Count ‘First Emergency Contact Telephone Number’ where not blank in the Contact table/ count all current students in the Contact table.

    注脚: 1. 先考察关键数据的完整性, 非关键数据是否完整或许不那么重要

    独特性

    主题 独特性
    定义 如何唯一确定一件事至关重要
    参考 数据自身的度量,或它的对标数据项或数据库
    度量 分析真实世界和数据集里面的数据记录的可比性. 真实世界的事务可以由更可信的数据集或相关外部比对来决定.
    范畴 用单一数据集去比对所有数据集(译者加:看有没有重复或可被替代)
    度量单位 百分比
    度量类型
    • 描述型
    • 连续型
    • 离散型 离散型 (译者加: 男/女, 是/否等)
    相关维度 一致性
    其他 取决于环境因素
    举例 一个学校现有120的学生和380个以前的学生(总共500人).可是学生数据库显示有520个不同的学生的记录.这可能包括Fred Smith和Freddy Smith算成了不同的人,事实上学校只有一个叫Fred Smith. 这代表了500/520 x 100 = 96.2%的独特性.
    编程逻辑 (Number of things in real world)/(Number of records describing different things)
    外部参考 IAM 资产信息质量手册
    数据管理原理, Keith Gordon

    注脚: 1. 独特性就是首先要检查重复度有多少

    时效性 (时序性)

    主题 时效性
    定义 数据从时间的角度所反映的现实
    参考 真实世界记录事件的时间.
    度量 时间差
    范畴 任何数据项,记录,数据集和数据库
    度量单位 时间
    度量类型
    • 描述型
    • 连续型
    • 离散型 描述型和连续型
    相关维度 准确度,因为准确度肯定会因为时间而减弱
    其他 取决于业务的需求
    举例 Tina Jones 2013年6月1日提交了紧急联系人的细节,但是6月4日才被更新到学生数据库.这显然有了三天的延迟,因为系统变更的服务时间是两天.
    编程逻辑 Date emergency contact number entered in the Student database (4th June 2013) minus the date provided (1st June 2013) = a 3 Day delay.

    注脚: 1. 每个数据集会有一部分因时间变化的动态数据,也会有比较稳定静态的数据.

    有效性

    主题 有效性
    定义 数据只有服从业务属性(格式,类型,范围)才是有效的
    参考 数据库,元数据或文档规则,相关的数据类型(字符串,整数型,浮点型,指针型等), 格式(长度,数量等)和范围(最小,最大,或在允许的数值范围内)
    度量 数据元数据或文档对比的结果
    范畴 所有数据都需要验证有效性,有效性原则适用于所有层级
    度量单位 百分比:有效数据集比数据集
    度量类型
    • 描述型
    • 连续型
    • 离散型 描述型,连续型,离散型
    相关维度 准确性,完整性,一致性和独特性
    其他 强制性的
    应用性
    举例 英国中学的每个班级都会有个班号,包括三个教师名字首字母和两个年份,如AAA99,三个大写字母两个数字.

    场景 1:
    一个9年级新老师, Sally Hearn (没有中间名字), 只有两个名字首字母.那必须决定怎么应用两个首字母,否则就不符合数据库的入库规则,’SH09’这样的班号就入不了库.后来决定补充个’Z’字母凑成: “SZH09”, 不过这样就不够精确了.更好的解决方案是修改数据库入库规则来接受两个或三个首字母和一个或两个数字.
    场景 2:
    英国小学的入学年龄是填在入学申请表上的.输入数据库的时候检查规则是4-11岁,如果表上填有14岁或者空着,数据库就认为是无效数据而禁止入库.
    编程逻辑 Scenario 1:
    Evaluate that the Class Identifier is 2 or 3 letters a-z followed by 1 or 2 numbers 7 – 11.

    Scenario 2:
    Evaluate that the age is numeric and that it is greater than or equal to 4 and less than or equal to 11.

    准确性

    主题 准确性
    定义 数据描述真实世界对象或要描述的事件的正确程度
    参考 理想的真实世界的事实是通过严格的科研建立起来的.可是科学研究不容易,通常使用的第三方参考数据来源于公认的同年的可信材料.
    度量 数据能够反映出真实世界对象或者事务的真实度.
    范畴 任何真实世界物体或者能够被数据描述的,可以被转化为数据项,记录,数据集或数据库
    度量单位 通过数据准确性检测的百分比.
    度量类型
    • 描述型
    • 连续型
    • 离散型 描述型,如关键研究或对对可信数据的参考说明
    连续型,如学生年龄
    离散型,如记录的年龄
    相关维度 有效性是直接相关的质量维度,因为不有效就谈不上准确.
    其他 必须, 如果不准确就不能应用
    应用
    举例 一个欧洲学校从每年九月报名人员收到申请书,同时要求在入学年的8月31日以前年满5周岁.

    在这种情况下,美国公民在申请欧洲学校的时候填写的生日用美国日期格式月/日/年,而欧洲的格式是日/月/年, 这就导致了月和日的顺序颠倒. 结果,生日是09/08/YYYY实际上是08/09/YYYY的孩子就符合了8月31日前五周岁的入学要求.

    这个现象,实际上是区域格式的差别,经常会导致数据不够准确.
    编程逻辑 ((Count of accurate objects)/ (Count of accurate objects + Counts of inaccurate objects)) x 100
    Example: (Count of children who applied aged 5 before August/YYYY)/ (Count of children who applied aged 5 before August 31st YYYY+ Count of children who applied aged 5 after August /YYYY and before December 31st/YYYY) x 100

    一致性

    主题 一致性
    定义 当对比两个或更多的事件代表数据时根据定义口径没有差异
    参考 本数据的度量或跟它对应的另一组的数据集或数据库
    度量 模式分析或数值频率
    范畴 跨多数据集的一致性分析或跨多数据项的数据值和格式的检查.处理过程包括:人为手工,自动,电子或文本处理.
    度量单位 百分比
    度量类型
    • 描述型
    • 连续型
    • 离散型 描述型和离散型
    相关维度 有效性, 准确性和独特性
    其他 数据一致不代表有效和准确
    举例 学校行政: 学生的生日和存在学生数据库里面的数据格式和数值是一样的.
    编程逻辑 Select count distinct on ‘Date of Birth’

    其他数据质量的考量因素
    理解和使用好六个核心维度是至关重要的.然而,还会有一些其他因素会影响到有效使用数据.甚至六个数据质量维度都满足,该数据还是可能不会有预期分析结果.
    数据可能比较完美地符合完整性,独特性,时效性,有效性,准确性和一致性. 然而如果数据都是英文的而使用者又不懂英文也就没有用了.

    针对数据询问如下问题或许能有所帮助:

    数据可用性 – 它好理解吗? 简单吗? 有关联性吗? 能访问可维护吗?是在某个层级上也准确吗?

    时间问题(不是时效和时序问题) – 法规执行如果有变化(比如到期了),这些数据还能有效吗?

    数据灵活性 - 能兼容和与其他数据进行比对吗? 能复用吗?能复制吗?

    数据置信度 – 有数据治理,保护和安全机制吗? 数据的口碑怎么样? 可以得到确认和证实吗?

    数据代价 – 该数据性价比好吗? 能数尽其用吗? 会侵犯公众隐私和公共安全吗? 会影响公司的法律责任吗? 会破坏企业形象和口碑吗?

    术语表

    术语 定义
    维度 通常是一个深思熟虑总结出来的通用属性
    描述型 由算法检查, 产生于公认的数据或应用研究. 比如’最长’,模式序列, 公认的数据如邮政编码,或专家讨论等.
    连续型 周期性地检查,如年龄,体重,身高,随时间还会变化.
    离散型 检查数据是不是孤立的绝对值,如性别,生日,出生地
    数据项 数据记录的一个独立字段,一般指数据库中的一列.
    记录 一个数据记录就是一组相关数据,一般是数据库的一行数据
    数据集 一个数据集就是一组数据,一般就是一个二维数据表
    数据库 有组织地大批数据
    度量 建立该维度的程度范围的计算单位
    范畴 该维度的应用范围
    度量单位 计算的方式方法的程度和范围
    相关维度 定义相关联的质量维度
    可选 是不是必须要求的
    事务 ? 数据项,数据集,数据库等
    参考 针对要考量的维度找出关联的
    编程逻辑(伪码) 用简单的英语表示出如何编写一个符合逻辑的程序

    原文下载: https://download.csdn.net/download/bigdatapang/12125767
    作者

    • Nicola Askham - The Data Governance Coach; DAMA UK Committee Member
    • Denise Cook - Senior Manager, Data Governance, Security & Quality, Lloyds Banking Group, Fellow of the BCS
    • Martin Doyle - CEO, DQ Global
    • Helen Fereday - Data Management Consultant, Aviva UK Health
    • Mike Gibson - Data Management Specialist, Aston Martin
    • Ulrich Landbeck - Data Management Architect, Microsoft Corporation
    • Rob Lee - Group Head of Information Architecture, Lloyds Banking Group
    • Chris Maynard - Director, Transforming Information Ltd
    • Gary Palmer - Chief Alchemist, Information Alchemy; Charter Member IAIDQ
    • Julian Schwarzenbach - Director, Data and Process Advantage; Chair, BCS Data Management Specialist Group

    参考文献

    • DAMA Body of Knowledge – First Edition
    • DAMA Dictionary of Data Management DAMA Body of Knowledge – First Edition • DAMA Dictionary of Data Management - 2nd Edition
    • IAIDQ Glossary
    • Institute of Direct Marketing Award in Data Management
    • Institute of Asset Management Asset Information Quality Handbook
    • Siemens Industry Online Support
    • Wikipedia Data Consistency Entry
    • Execution - MiH
    • The Practitioner’s Guide to Data Quality Improvement - David Loshin
    • The TIQM Quality System for Total Information Quality
    • Management – Larry English (MIT Information Quality Industry Symposium, July 15-17, 2009)
    • Data Quality, The Accuracy Dimension - Jack E Olson
    • Improving Data Warehouse and Business Information Quality - Larry English

    This paper represents the views of DAMA UK and the Data Quality Dimensions Working Group and not necessarily the viewpoint of the organisations which the authors work for.

    |–|--|
    | | |

    展开全文
  • 做数据分析的同学们都遇到过这个问题:从多维度分析问题,提出对业务有意义的建议。这个题目看起来很简单,可很多同学辛辛苦苦跑了一堆报表,结果只落得业务一堆抱怨:“你这一堆说明了啥!”“你的重...
  • 维度设计基本方法 1、设计步骤: 1)第一步:选择维度或新建维度。 作为维度建模的核心,在企业级数据仓库中必须保证维度的唯一性。以淘宝商品维度为例,有且只允许有一个维度定义。 2)第二步:确定主维表。 此处...
  • 人类认知世界的个基本维度

    万次阅读 2018-10-20 23:10:30
    对于人的价值认知体系来说,总共可分为六大基本作用场景,从最底层的感觉系统的机械式感应,到最高层的针对矛盾关系的选择处理,每一类场景都代表着一组或多组刺激信号的采集,以及所触发的机体组件的响应过程。...
  • 项目失败的概率极,因此一个好的项目经理,能够团队团队成员向一个方向去努力,能大大提高项目成功的概率,尤其是在越的项目团队中,体现的越明显,对于一个项目过程越复杂,参与人数越多的项目,项目经理的位置...
  • 需求评审分析什么——测试维度

    千次阅读 2019-09-20 19:36:41
    软件质量的个标准: 1:功能性; 2:可靠性; 3:易使用性; 4:效率; 5:可维修性; 6:可移植性 测试人员,可以简单的分为4个级别。 第一层:功能性上保证。做好本职工作,考虑正常的业务主线以及各种异常流,尽量不...
  • 矩阵 维度 axis

    千次阅读 2020-08-08 12:38:16
    python numpy tenforflow中维度的概念是什么呢? 怎么用python语言来表示维度呢? 我们在利用深度学习进行目标检测的过程中,经过会进行批量图片的处理,常见格式为(batchsize,size,size,channel)四维的矩阵。...
  • 这6个维度是作者自己的总结,这维度也只是和功能测试有关,至于系统的性能、可靠性、可用性如何度量 首先,我们要明确一个概念,就是“严重bug”。这6个维度,有很多都和严重bug有关。严重bug指的是项目中,...
  • 《关于促进消费扩容提质加快形成强大国内市场的实施意见》点评:六大方面促进消费扩容提质,三维度关注零售行业受益公司.pdf
  • 维度属性随类型变化较时,将所有可能的属性建立在一个表中时不切合实际的,也没有必要这样做。此事建议采用方案一。。定义一个主维度用于存放公共属 性;同时定义多个子维度,其中除了包含公共属性外,还包含...
  • 数据仓库 维度建模 维度表Generally, only 5V's of big data are discussed. But here we will also talk about the sixth one and will also understand why we should not ignore the 6th one. 通常,仅讨论5V的...
  • 3. 修改定期装载维度表的转换 4. 修改定期装载事实表的转换 5. 测试 二、维度子集 1. 建立包含属性子集的子维度 2. 建立包含行子集的子维度 3. 使用视图实现维度子集 三、角色扮演维度 1.修改数据库模式 2....
  • 【单选题】关于函数,以下选项中描述错误的是 【简答题】背诵王国维《人间词话》涉及的首诗词。 【单选题】下面代码的输出结果是 ‪‪‪‪‪‪‫‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‪‫‪‪‪‪‪‪‪...
  • 、杂项维度 1. 新增销售订单属性杂项维度 2. 修改定期装载Kettle作业 3. 测试修改后的定期装载 七、维度合并 1. 修改数据仓库模式 2. 修改定期装载Kettle作业 3. 测试修改后的定期装载 八、分段维度 1. ...
  • 准确性:哪些数据不能正确的描述对象的属性或已经过期? 合规性:哪些数据是以非标准格式存储的? 一致性:哪些数据值提供了冲突信息? 重复性:哪些数据记录是重复的记录? 及时性:关键数据是否及时传送到目标应用...
  • 此处提供的 Matlab 代码提供了使用文件 Six_dim_scatter.m 中的 Matlab 命令“scatter3”进行 6D 数据... X、Y 和 Z 坐标表示前三个维度,第四个维度通过动画表示,第五个维度用颜色显示,第维度 - 散点的大小。
  • TensorFlow:维度变换

    千次阅读 2019-12-25 14:55:39
    基本的维度变换包含了改变视图 reshape,插入新维度 expand_dims,删除维 squeeze,... 删除维度四、交换维度五、数据复制、Broadcasting(自动扩展) 一、张量的存储和视图(View)概念 张量的视图就是我们理解张量...
  • 五、元数据、数据仓库建模1、什么是数据模型?2、数据模型架构3、维度和指标(度量)4、事实表和维度表七、数据模型建立过程八、建模方法1、范式建模法2、维度建模法∗\color{red}{*}∗3、实体建模法九、星型模型...
  • 从一维度到十维度的变化

    千次阅读 2019-04-02 17:08:06
    如果把一到十维度的空间用一张图来表达,你是否会看得明白呢? 根据弦理论,粒子被看作是长度为普朗克尺度一维弦,在引入费米子的座标后,科学家提出了超弦理论。...它什么也没有,空间、时间...
  • 竞品分析十大维度

    千次阅读 2021-11-24 17:58:30
    运营数据:分析竞品的主顾用户数,活跃用户量,用户增长率,用户付费率,留存率,日新增用户,转化率,ARPU等,用到的工具有ASO100,蝉大师,百度指数,360指数 .竞品分析 1.功能分析(PM做的最多的分析) 把竞品...
  • 串联的矩阵的维度不一致。

    千次阅读 2021-04-23 10:59:06
    找了个潮流计算的程序,按照程序里的例子输入却说串联的矩阵的维度不一致。错误在最后,可以拉到最后看。能不能帮忙看看是什么地方出错,谢谢啦!>> %简单潮流计算的牛顿拉夫逊程序,相关的原始数据数据数据...
  • 当然有一些维度属性我们可以通过事实表反算数据进入维度表来补充维度属性。个人建议在数据分析项目中一定要对维度属性进行评估,在项目处理前利用简单的模型告诉客户能够出具的效果。 识别 下方二 维码 ,即可关注...
  • 反欺诈识别中,重要的一个参考就是黑名单,市场上领先的大数据风控公司拥有将近1000万左右的黑名单,部分黑名单是过去十多年积累下来的老赖名单,真正有价值的黑名单在两百万左右。黑名单来源于民间借贷、线上P2P...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 58,811
精华内容 23,524
关键字:

六大维度是什么