精华内容
下载资源
问答
  • 维度建模事实表是围绕业务过程来设计,其包含了业务过程度量和引用的维度。下面我们将从以下事实表相关内容来对事实表相关技术有一全面介绍: 事实类型:可加性、半可加性,不可加性 粒度 事实表...

    维度模型系列文章:

    《维度模型系列》-1初识维度模型

    《维度模型系列》-2数据仓库总线架构

    《维度模型系列》-3事实表核心技术(上)

    《维度模型系列》-3事实表核心技术(下)

    。。。

    更多最新文章请文末扫码关注公众号查看


     

    1引言

    维度建模的事实表是围绕业务过程来设计的,其包含了业务过程的度量和引用的维度。下面我们将从以下事实表相关内容来对事实表相关技术有一个全面的介绍:

    • 事实类型:可加性、半可加性,不可加性

    • 粒度
    • 事实表三种类型: 事务事实表(单事务,多事务)、周期快照事实表和累积快照事实表
    • 父子型事实表
    • 退化维
    • 代理键
    • 一致性事实
    • 事实表设计方法

    2事实类型

    作为度量业务过程的事实,一般是整形或者浮点型的数值,有可加性、半可加性,不可加性三种类型。

    • 可加性指的是事实可以按照任意维度进行汇总,例如销售订单事实表的商品数量可以按照时间,地点,商品进行汇总求和统计每个城市的销售数量。
    • 半可加性指的是事实可以按照某些特定维度进行汇总,如有关库存或者账户余额的事实就是半可加的,这类事实是对某一时间点的度量,不能跨越时间周期将他们加到一起,但是可以对某一时间点的库存按照地点,商品汇总
    • 不可加性的事实,比如某个产品单位价格,温度 ,比率值等,因为所有维度中的这类事实是独立的,这种数据汇总毫无意义

    3粒度

    粒度用于确定实表中一行所表示业务过程的细节层次,技术上来说粒度确定了事实表的主键。例如下面订单相关的两个事实表:

    • 左边订单事实表中的粒度是到订单级别的,相关事实都是相对于整个订单来说的,如毛订单总额
    • 右边的订单明细事实表的粒度是具体到子订单中的商品来说的,如该订单中某一商品的下单数量,该商品的总毛利额等等

    事实表中强调同一事实表中的事实要具有相同的粒度,这样我们就可以按照任意维度进行汇总,避免不同粒度在汇总计算时出现重复统计的情况。

     

    4事实表三种类型

    按照粒度划分事实表类型大致可以分为三种: 事务事实表、周期快照事实表和累积快照事实表。它们作为互补事实表,从不同的粒度层次上表现数据,提供了对业务较为全面的描述。下面我们分别介绍这几种事实表的设计以及试用场景。

    4.1事务事实表

    事务事实表的粒度是每一行数据对应一个事务,或者一行对应事务中的一个条目。事务可以理解为业务过程中的各个事件节点,比如网购交易过程中的创建订单,买家付款,物流过程中的揽活,发货,签收,退款过程中的申请退款,确认退款等,都可以理解为事务。事务事实表针对这些过程构建,作为数仓的原子明细数据,可以跟踪定义业务过程的事件,提供丰富的分析能力。

    事务事实表只有事务发生才会新增对应的一条数据,一般不会做更新操作

    事务事实表可以分为单事务事实表和多事务事实表

    单事务事实表

    单事务事实表,顾名思义,即针对每个业务过程设计 个事实表。这样设计的优点不言而喻,可以方便地对每个业务过程进行独立的分析研究。如下单,支付两个事务事实表:

    两个事务事实表表的维度基本一致,不同的是事务发生对应的事实

     

    下面以具体交易订单为例 ,展示单事务事实表的设计实例。假设orderl在2019-11-01日下单并且在当天完成支付;order2 order3在2019-11-01日下单并且在2019-11-02日完成支付。order1 order2 order3 写入单事务事实表中,下单日期均为 2019-11-01日, orderl order2 order3 也分别写入支付事务事实表中,支付日期分别为2019-11-01,2019-11-02,2019-11-02

    多事务事实表

    多事务事实表,将不同的事实放到同一个事实表中,即同一个事实表包含不同的业务过程。不同的业务过程可以通过打标签的方式区分,标记当天是否是这个业务过程,比如针对下单,则打一个是否当天下单的标签,针对支付打一个是否当天支付的标签。

    多事务事实表在设计时有两种方法进行事实的处理:

    • 不同业务过程的事实使用不同的事实字段进行存放

    当不同业务过程的度量差异较大时可以使用这种设计方式

    每个度量都使用一个字段进行保存 ,即不同的事实使用不同的字段进行存放;如果不是当前 业务过 程 的度量,则采取零值处理方式。比如在下单业务过程中,对于支付度量全部置为0

    同样以交易订单为例,假设orderl在2019-11-01日下单并且在当天完成支付;order2 order3在2019-11-01日下单并且在2019-11-02日完成支付。则交易多事务事实表数据实例如下:

     

    • 不同业务过程的事实使用同一个事实字段进行存放,但增加一个业务过程标签

    当不同业务过程的度量比较相似,差异不大时可以使用这种设计方式

    以收藏商品业务过程来举例说明,收藏事务事实表使用 一个“收藏事件类型”字段来区分是收藏商品还是删除商品。收藏商品和删除商品的事实主要是商品价格

     

     

    4.2周期快照事实表

    周期快照事实表在了解有规律的,可预见时间间隔的业务累计性能方面很有必要。与针对每个出现的事件都要加载一行数据的事务事实表不同,利用周期快照可以在每天,每周,每月结束时,为当时的行为进行拍照,然后在下一周期拍另一张照片,比如商品库存,账户余额,每日交易额,每月累计交易额等。事务事实表需要聚集长期的事务历史才能得出这些结果,使用效率比较差,可以用周期快照作为事务事实表的补充。

    下面举两个周期快照的例子:库存周期快照和每月累计销售额周期快照表

     

    4.3累积快照事实表

    累积快照表完全涵盖一个事务或者离散产品(或者用户)的生命期的不确定跨度。累积快照表具有多个日期字段,用于对应可预见的主要事件或者环节的发生时间。通常还有一个用于指示快照行最后一次更新的附加日期列。

    累积快照事实表需要对数据进行重新访问,当某一事件发生后,需要对应时间字段和相关度量进行更新操作,而不是新增一行。

    累积快照可以很好的满足某些特殊的需求,例如:统计下单到支付的时长,支付到发货的时长,下单到确认收货的时长等。如果用事务事实表的话逻辑复杂且性能较差。

    以交易订单业务过程举例,包含下单,支付,发货,收货几个主要节点,具体的事实表设计如下:

    5总结

    事务与快照是维度数据仓库的阴与阳。事务事实表伴随快照事实表一起使用,能购提供业务方面的完整视图。同时存在对这几种类型的事实表的需要,是因为通常没有一种简单的方式能将这几种视图组合在一起。虽然在事务与快照之间存在一些数据冗余,但是每个单独的事实表类型都为相同内容提供了一个不同的分析视图,更加能够有效的对数据进行分析。

    在下篇我们会继续介绍事实表其他相关的内容:

    • 父子型事实表
    • 退化维
    • 代理键
    • 一致性事实
    • 事实表设计方法

    更多技术文章请关注公众号:

     

     

     

     

     

     

     

     

     

     

     

     

     

     

    展开全文
  • 卷积过程是CNN的核心,准确推导各卷积层输出的维度是实现CNN基础,下面总结一下CNN卷积过程中输出特征图尺寸与维度变化规律.  CNN常以图像作为输入,例如VGG输入图像格式就为224*224*3,其中224*224是图像...

           卷积过程是CNN的核心,准确推导各卷积层输出的维度是实现CNN的基础,下面总结一下CNN卷积过程中输出特征图的尺寸与维度变化规律.

           CNN常以图像作为输入,例如VGG的输入图像格式就为224*224*3,其中224*224是图像的height*width,3是通道数。因此,VGG的输入数据实际上是一个三维的变量,卷积层中的卷积核相应也应是三维。通常情况下,输入图像的height与width相等,卷积核也往往只有一个参数——卷积核大小。常用的卷积核有1*1*1、3*3*3、5*5*5、7*7*7等,如今更偏向使用小卷积核,因为其堆叠起来可以获得与大卷积核相似的感受野,同时参数量大大减少。下图是VGG模型的各层参数:

           在上图中,conv3-64表示该卷积层使用的是3*3*3卷积核,卷积核数量为64,因此该卷积层输出数据的维度应为64维。同理可得,VGG最后输出数据的维度为512维。

           那么,在卷积过程中,各卷积层输出的特征图尺寸(height*width)是如何变化的呢?特征图的尺寸主要与卷积核的大小、步长、输入图的尺寸与填充量有关。常用的Tensorflow框架有两种填充模式——same与valid,same表示用0填充,输出尺寸与输入尺寸相同;valid不填充。因为特征图尺寸的推导公式通过画出示意图,根据卷积公式可以轻易得到,所以直接摆出结果:

    valid:

    height = (H-F)/S+1;width = (W-F)/S+1;H、W分别指输入图的尺寸,F为卷积核大小,S表示步长。

     

    展开全文
  • 技术管理的维度

    千次阅读 2019-08-02 10:47:03
    如何把这维度通过一定方式展示给开发人员,从而让开发人员能够快速和准确理解进而完成转型是我们首先需要明确个核心问题。针对该问题,很难通过一个面面俱到的模型或视图做出完整回答。我们在思路上也...

    技术管理无疑是一项综合性工作,包含业务、技术和管理这三大维度。如何把这三大维度通过一定的方式展示给开发人员,从而让开发人员能够快速和准确的理解进而完成转型是我们首先需要明确的一个核心问题。针对该问题,很难通过一个面面俱到的模型或视图做出完整的回答。我们在思路上也是使用分解的策略,把技术管理者所应该具备的转型方法转换为不同的子维度。子维度的提出也是为本书如何进行内容组织提供了具体的表现形式。

    要想清晰、明确的展示技术管理维度,首先要对维度进行建模,即通过统一的表述方式和模型来展示不同的维度。在本文中,每一个维度将从切入点和实施方法两个角度出发进行展开讨论。其中切入点描述某一个维度特定的关注点,并提供切入该维度的方向,任何一个维度都应该具备若干与其他维度不一样的切入点,以便在技术管理过程中能够找到问题所对应的切入点并进行优化和管控。而实施方法则包括技术管理过程中的方法和策略,对于维度和子维度之间可能存在的相互关系也将属于讨论范畴。

    一.业务维度

    业务维度主要围绕的主题是“产品”。当然,产品经理或运营经理是对产品进行规划和实施的主要推手。作为技术管理者,业务维度的要求体现在对于行业的分析和理解,以及产品化的思路和实践,对组织级别的产品化战略起到促进作用。业务维度可以进一步分解成行业分析子维度和产品化子维度。

    1.行业分析子维度

    行业分析子维度的切入点包括技术管理者眼中的行业,在当前互联网大背景下,各个行业在其各自发展的同时也呈现出一定的共性,这些共性需要技术管理者进行理解和思考;用户研究和用户体验,研究用户并能够理解用户体验上的痛点和需求,也是技术管理者需要掌握的一项技能。尤其在互联网行业,用户体验至上的思想会实实在在的影响到技术规划和实现;商业模式分析与设计,技术管理者同样需要部分商业思路,懂得从运营角度出发思考问题。运营驱动产品、产品驱动技术的组织模式也日益普遍,这其中各项业务数据是各个团队之间流转的主要媒介,技术团队自然也不能例外。

    对于行业分析,技术管理者相关工作的主要产出是解决方案。解决方案设计是一项综合性的工作,具备基本设计思路的同时还需要考虑某个行业的特定需求。同时,技术也是解决方案的一个重要组成部分,技术可能是各行业通用的表现形式,也可能因行业而异。

    2.产品化子维度

    产品化子维度的切入点主要包括业务结构的建立。业务结构中业务的背景、范围和约束条件是其主要需要把控的对象,而业务结构的建立是为了更好的实现业务决策。业务决策过程会产生业务基线和各种变更,同时需要处理业务需求的不同所导致的业务冲突。

    在技术管理上,产品化的实施方法包括两个方面。一方面在于确定产品发展策略,产品策略的确定会形成各个产品平台和产品线。而另一方面在于如何推进产品策略的落地,项目化的操作方式以及与产品平台配套的技术平台的确立都属于这一范畴。

    二  技术维度

    技术维度主要围绕的主题自然是“技术”本身。作为技术管理者,对技术体系的把控也可以分解成三个子维度,包括技术理论子维度、系统架构子维度和技术创新子维度。

    1.技术理论子维度

    现代软件开发工具和框架的发展非常迅速,但各个工具和框架背后的理论体系实际上是比较成熟和稳定的。技术理论的切入点比较明确,是对软件开发理论体系的总结和抽象,其目的是用思想和理论去梳理主流技术实现方案的原理。

    通过梳理软件体系结构风格、设计模式、架构模式、架构模型等内容,有助于提高技术管理者的技术理论水平,并有效指导系统架构的设计和实现。

    2.系统架构子维度

    系统架构子维度依赖于技术理论子维度,其切入点在于明确架构设计的层次,本书中的系统架构设计通过业务架构设计和技术架构设计两个层次进行展开。

    对于业务架构,实施方式上可以从业务需求出发,针对系统的拆分、集成和扩展三个角度进行设计;而对于技术架构,则更多考虑系统性能、可用性和安全性等非功能性特性。

    3.技术创新子维度

    伴随技术变革的基本规律,技术创新需要明确基本的策略和过程。这些策略和过程决定了技术创新是从内部还是从外部进行切入。

    对于内部创新,实施上主要包括技术应用和技术演变。前者使用成熟技术解决新问题,而后者偏重于对现有技术进行改造,使其演变成技术问题的解决方案。而对于外部创新,开展合作从外部获取新技术,或者通过应用其他行业的成熟技术到现有业务中的跨业创新都是可以使用的创新手段。

    三  管理维度

    软件开发是一项系统工程,从系统工程角度出发,软件开发可以分成三大部分,即软件实现、项目管理和过程改进。软件实现部分已经在技术维度进行介绍,管理维度则从工程性管理角度出发,包括软件的开发过程和软件经济学等内容,从中我们抽象成项目管理、研发过程和组织管理三个子维度。

    1.项目管理子维度

    项目管理的切入点在于从范围、时间、成本等角度出发讨论如何在一定的约束条件下实现系统并完成最终成果的交付。这其中涉及到项目管理的通用性知识体系,但也需要根据软件开发的特征进行分析。

    对于软件开发而言,需求工程、计划管理、质量管理、风险管理是项目管理重点需要实施和管理的对象。相较其它行业,需求以及系统建模、软件开发范围的分解和工作量评估、技术评审的实施方法以及持续交付思想和工具的应用贯穿整个软件开发的进程。

    2.研发过程子维度

    软件开发是一系列过程的集合,过程改进围绕这些过程,提出持续优化的方法和实践确保得到令人满意的结果。过程改进的切入点在于通过理解代表性的过程模型,并结合团队目前以及未来的开发状况找到适合自身的过程模型。

    研发过程的建设包括过程管理的模型以及研发相关的工程实践,而过程改进同样也有一整套的方法论,无论是传统型的瀑布还是当下流行的敏捷,都崇尚过程改进。而对于特定团队,这些模式和方法都不一定适用,不能照抄照搬,所以研发过程建设的实施方法首先是过程裁剪,通过裁剪建立起符合自身团队发展的轻量级过程模型。

    3.组织管理子维度

    组织管理的切入点在于明确一个组织中需要技术管理者进行管理的视角和边界。对于软件开发而言,向下的团队管理和向外的协商沟通管理是最基本的组织管理视角,但我们也应该注意到向上管理的重要性以及提升管理者本身的自我管理意识。

    对于向下管理,实施过程中需要理解技术人员,并通过领导、激励、培训和绩效管理等手段提升团队整个工作效率。对于向上管理,更多则关注结果导向和目标管理。向外管理上,沟通是关键。而对于自我管理,则需要培养个人的管理风格以及处事能力。

    以上各个维度和子维度虽然各自表现技术管理的某个方面,但也存在依赖关系。下图描述的是三个维度之前最基本的依赖关系。从图中可以看到行业分析帮助定义产品,技术体系为产品提供实现方法,而管理体系从过程角度为产品开发提供保障。因此,技术体系和管理体系的建立本质上都是为了实现产品,也就是说技术管理的本质需求是完成产品目标。

    不同的行业、不同的业务、不同的系统对于技术管理的维度而言具有不同的展示要求。以互联网行业为例,目前各个领域变化迅速,从行业分析到产品发布的周期也较短,这就意味着在开发过程管理上适合采用比较轻量级、快速迭代的研发模式,这就需要在项目管理、组织管理上采用与之匹配的模式。另一方面,互联网产品或服务通常面向多个领域,按应用类型区分,通常行业门槛并不高,如果想要快速占据市场,通过技术创新来推动产品化是常见的手段。而面向企业级应用的软件产品中,由于业务复杂且具有一定的行业壁垒,技术更多时候是为了实现业务需求,一个产品的开发周期普遍较长,相应的研发节奏和过程也偏向于采用重量级框架,这些都与互联网产品有较大差别。

     

    如果对文章感兴趣,可以关注我的微信公众号:程序员向架构师转型,或扫描下面的二维码。

    我出版了《系统架构设计:程序员向架构师转型之路》、《向技术管理者转型:软件开发人员跨越行业、技术、管理的转型思维与实践》、《微服务设计原理与架构》、《微服务架构实战》等书籍,并翻译有《深入RabbitMQ》和《Spring5响应式编程实战》,欢迎交流。

    展开全文
  • 它基于也参考对比文献的三个维度:匹配经济学,组装经济学和知识管理经济学。 我们的框架试图确定替代性数字业务模型中选择核心的主要折衷,并在竞争力和效率方面进行比较。 它还强调了用户在生产信息商品以及与纯...
  • 谈到用户分类模型,最被谈及的应该就是RFM模型了。...在客户分类中,RFM模型是一个经典的分类模型模型利用通用交易环节中最核心的三个维度——最近消费(Recency)、消费频率(Frequency)、消费金...

    目录

    一、背景

    二、分析方法与过程

    2.1数据抽取

    2.2 数据探索分析

    2.3 数据预处理

    2.3.1 数据清洗

    2.3.2 属性规约

    2.3.3 数据变换

    2.4 聚类分析

    2.5特征分析

    三、分析结果

    四、模型应用

    4.1会员的升级与保级

    4.2首次兑换

    4.3交叉销售

    参考资料


    一、背景

    面对激烈的市场竞争,各个航空公司都推出了更优惠的营销方式来吸引更多的客户,国内某航空公司面临着客户流失、竞争力下降和航空资源未充分利用等经营危机。通过建立合理的客户价值评估模型,对客户进行分群,分析比较不同客户群的客户价值,并制定相应的营销策略,对不同的客户群提供个性化的服务是必须和必要的。目前该航空公司已积累了大量的会员档案信息和其乘坐航班积累,经加工后得到下图所示的部分数据属性定义信息。

     

     

    需要根据这些数据实现以下目标。

    1. 对客户进行分类。
    2. 对不同的客户类别进行特征分析,比较不同类别客户的客户价值。

    二、分析方法与过程

    在客户分类中,RFM模型是一个经典的分类模型,模型利用通用交易环节中最核心的三个维度——最近消费(Recency)、消费频率(Frequency)、消费金额(Monetary)细分客户群体,从而分析不同群体的客户价值。在某些商业形态中,客户与企业产生连接的核心指标会因产品特性而改变。如互联网产品中,以上三项指标可以相应地变为下图中的三项:最近一次登录、登录频率、在线时长。

     

    我们说RFM模型由R(最近消费时间间隔)、F(消费频次)和M(消费总额)三个指标构成,通过该模型识别出高价值客户。但该模型并不完全适合所有行业,如航空行业,直接使用M指标并不能反映客户的真实价值,因为“长途低等舱”可能没有“短途高等舱”价值高。考虑到商用航空行业与一般商业形态的不同,决定在RFM模型的基础上,增加2个指标用于客户分群与价值分析,得到航空行业的LRFMC模型:

    1. L:客户关系长度。客户加入会员的日期至观测窗口结束日期的间隔。(反映可能的活跃时长)
    2. R:最近一次乘机时间。最近一次乘机日期至观测窗口结束日期的间隔。(反映当前的活跃状态)
    3. F:乘机频率。客户在观测窗口期内乘坐飞机的次数。(反映客户的忠诚度)
    4. M:飞行总里程。客户在观测窗口期内的飞行总里程。(反映客户对乘机的依赖性)
    5. C:平均折扣率。客户在观测窗口期内的平均折扣率。(舱位等级对应的折扣系数,侧面反映客户价值高低)

    2.1数据抽取

    以2014-03-31为结束时间,选取宽度为两年的时间段作为分析观测窗口,抽取观测窗口内所有客户的详细数据形成历史数据。对于后续薪资的客户详细信息,以后续薪资数据中最新的时间点作为结束时间,采用同样的方法进行抽取,形成增量数据。

    根据末次飞行日期(LAST_FLIGHT_DATE),抽取2012-04-01日至2014-03-31期间的所有客户数据,共有6万余条记录44个属性。

    2.2 数据探索分析

    本案例的探索分析是对数据进行缺失值分析与异常值分析。通过观察数据发现存在票价为空值,票价最小值为0、折扣率最小值为0、总飞行公里数大于0的记录。票价为空值的数据可能是客户不存在乘机记录造成,其他的数据可能是客户乘坐0折机票或者积分兑换产生的。

    过初步的数据探索,发现数据有几点特征:

    1、共62988条记录

    2、部分维度存在缺失值,WORK_CITY缺失2269条,SUM_YR_1缺失551条,SUM_YR_2缺失138条

    2.3 数据预处理

    本案例主要采用数据清洗、属性规约与数据变换的预处理方法。

    2.3.1 数据清洗

    通过数据探索分析,发现数据总存在缺失值,票价最小值为0、折扣率最小值为0、总飞行公里数大于0的记录。由于原始数据量大,这类数据占比较小,因此对其进行丢弃处理。

    1、缺失值:票价为null的数据(注意不是票价为零)

    2、异常值:票价为0、平均折扣率不为0、总飞行公里数大于0的数据(折扣不为0,仍有飞行里程,说明客户必然是花钱买票飞行的,如果此时票价也为0,说明是错误数据)

    共清洗944条异常数据,得到62044条有效记录。

    2.3.2 属性规约

    根据航空公司客户LRFMC模型,选择与LRFMC模型指标相关的6个属性:FFP_DATE、LOAD_TIME、FLIGHT_COUNT、AVG_DISCOUNT、SEG_KM_SUM、LAST_TO_END。

    2.3.3 数据变换

    本案例中采用的数据变换方式为属性构造和数据标准化。

    LRFMC模型中五项指标的计算公式:

    (1)L = LOAD_TIME – FFP_DATE. (观测窗口结束日期 – 入会日期)

    (2)R = LAST_TO_END. (最后一次乘机时间至观测窗口结束时长)

    (3)F = FLIGHT_COUNT. (观测窗口内的飞行次数)

    (4)M = SEG_KM_SUM. (观测窗口的总飞行公里数)

    (5)C = AVG_DISCOUNT. (平均折扣率)

    对每个指标数据的分布情况进行分析,发现每个指标的数据取值范围分布较广,为消除数量级数据带来的影响,还需要将L、R、F、M、C五类数据进行标准化处理。标准化方法有极大极小标准化、标准差标准化等方法,此处采用标准差标准化的方法对数据进行处理。

    2.4 聚类分析

    根据5个指标的数据对客户进行聚类分群,利用K-Means算法对客户进行聚类分析,聚类结果如下图所示。

    注:a. 由于K-Means聚类是随机选择类标号,因此重复实验结果中类标号可能与此不同;

    b. 由于算法精度问题,重复实验得到的聚类中心也可能略有不同;

    c. 需要结合业务理解与分析来确定客户的类别数量,此次选择5个类别。

    2.5特征分析

    结合业务对每个客户群进行特征分析,分析客户价值。

     

    1、对细分的客户群进行特征分析:

    群体1的C属性上最大

    群体2的M、F属性属性最大,R属性最小

    群体3的L、C属性最小

    群体4的R属性最大,F、M属性最小

    群体5的L属性最大

    2、其中每项指标的实际业务意义为:

    L:加入会员的时长。越大代表会员资历越久

    R:最近一次乘机时间。越大代表越久没乘机

    F:乘机次数。越大代表乘机次数越多

    M:飞行总里程。越大代表总里程越多

    C:平均折扣率。越大代表折扣越弱,0表示0折免费机票,10代表无折机票

     

    3、对应实际业务对聚类结果进行分值离散转化,对应1-5分,其中属性值越大,分数越高。

     

    4、结合业务需要,参考RFM模型对客户类别的分类,定义五个等级的客户类别。指标大于平均值表示为↑,小于平均值表示为↓。

    (1)重要保持客户

    1. 平均折扣率高(C↑),最近有乘机记录(R↓),乘机次数高(F↑)或飞行里程高(M↑),入会时间长(L↑)。
    2. 这类客户机票票价高,不在意机票折扣,经常乘机,是最理想的高价值客户,但所占比例比较小。
    1. 公司应优先将资源投放到他们身上,维持这类客户的忠诚度与满意度,尽可能延长这类客户的高消费水平。

    (2)重要发展客户

    1. 平均折扣率高(C↑),最近有乘机记录(R↓),但乘机次数低(F↓)或飞行里程低(M↓),入会时间短(L↓)。
    2. 这类客户机票票价高,不在意机票折扣,最近有乘机记录,但总里程低,人如何时间短,是潜在价值客户。虽然当前价值不是很高,但有很大的发展潜力。
    3. 通过客户价值的提升,加强这类客户的满意度,提高他们转向竞争对手的转移成本,使他们逐渐成为忠诚客户。

    (3)重要挽留客户

    1. 平均折扣率高(C↑),最近无乘机记录(R↑),乘机次数高(F↑)或里程高(M↑),入会时间长(L↑)。
    2. 这类客户入会时间长,总里程高,但最近无乘机记录,可能处于流失状态。
    3. 由于这类客户价值变化的不确定性很高,衰退原因各不相同,所以掌握客户的最新信息、维持与客户的互动尤为重要。航空公司应采取一定的营销手段防范客户流失,延长客户的生命周期。

    (4)一般客户

    1. 平均折扣率低(C↓),最近无乘机记录(R↑),乘机次数低(F↓)或飞行里程低(M↓),入会时间短(L↓)。
    2. 这类客户机票票价低,经常买折扣机票,飞行频次低,最近无乘机记录,可能是趁着折扣而选择购买。
    3. 公司需要在资源支持的情况下强化对这类客户的联系,进行一些交叉销售。

    (5)低价值客户

    1. 平均折扣率低(C↓),最近无乘机记录(R↑),乘机次数低(F↓)或飞行里程低(M↓),入会时间短(L↓)。
    2. 这类客户入会时间短,属于新客户,多选择折扣票,飞行里程低,最近有乘机记录,可能是趁着折扣而选择购买,对品牌无忠诚度。

    其中,重要发展客户、重要保持客户、重要挽留客户这三类重要客户可以分别归入客户生命周期管理的发展期、稳定期、衰退期三个阶段。

    根据每种客户类型的特征,对各类客户群进行客户价值排名。针对不同类型的客户群提供不同的产品和服务,提升重要发展客户的价值、稳定和延长重要客户的高消费水平、防范重要挽留客户的流失并积极进行关系恢复。

     

    三、分析结果

    根据建模结果,发现该公司的五类不同价值的客户数量分布如图所示:

     

    重要保持客户、重要发展客户占比15.3%,不足两成,整体较少

    一般客户、低价值客户占比59.3%,接近六成,整体偏多

    重要挽留客户占比25.4%,接近四分之一,整体发挥空间大

    按照20/80法则:一般而言企业的80%收入由头部20%的用户贡献。从上图中也能发现:忠诚的重要保留客户、中发展客户必然贡献了企业收入的绝大部分,企业也需要投入资源服务好这部分客户。

    一般而言,数据分析最终的目的是针对分析结果提出并开展一系列的运营/营销策略,以期帮助企业发展。在本实例中,运营策略有三个方向:

    提高活跃度:提高一般客户、低价值客户的活跃度。将其转化为优质客户

    提高留存率:与重要挽留客户互动,提高这部分用户的留存率

    提高付费率:维系重要保持客户、重要发展客户的忠诚度,保持企业良好收入

    四、模型应用

    根据对各个客户群进行特征分析,采取下面的一些营销手段和策略,为航空公司的价值客户群管理提供参考。

    4.1会员的升级与保级

    航空公司的会员一般分为白金卡会员、金卡会员、银卡会员、普通卡会员,非普通卡会员可以统称为精英会员,不同航公司的会员制管理方法大同小异。成为精英会员一般要求在一定时间内积累一定的飞行里程或航段,达到这种要求后就会在有效期内成为精英会员,并享受相应的高级版服务。在有效期快结束时,根据相关评价方法确定客户是否有资格继续做为精英会员,然后对该客户进行相应的升级或降级。

    然而,由于许多客户并没有意识到或不太了解会员升级或保级的时间与要求(相关的文件说明往往复杂且不易理解),经常在评价期过后才发现自己其实只差一点就可以实现升级或保级,错失了机会而使之前的里程积累白白损失。同时,这种认知可能导致客户的不满而放弃在本公司的消费。

    因此,航空公司可以在对会员升级或保级进行评价的时间点之前,对那些尚未达到要求的较高消费客户进行适当提醒或者采取一些促销活动,刺激他们达到相应标准。这样既可以获得收益同事也提高了客户的满意度。

    4.2首次兑换

    客户可以通过消费积累的里程来兑换免票或免费升舱等,但很多航空公司的里程累积会随着时间进行一定的削减,例如有的公司会在年末对该年积累的里程进行折半处理。这样会导致许多不了解情况的会员损失自己积累的里程,甚至总是难以实现首次兑换,同样也会引起客户的不满或流失。

    因此,航空公司可以对这些接近但尚未达到首次兑换标准的会员进行提醒或促销,使他们通过消费达到标准。一旦客户实现了首次兑换,客户在进行消费兑换就比其他公司进行兑换要容易许多,在一定程度上提高了转移成本。

    4.3交叉销售

    通过发行联名卡等于非航空类企业合作,使客户在其他企业的消费过程中获得公司的积分,增强与公司的联系,提高客户的忠诚度。例如,可以查看重要客户在非航空类合作伙伴处的消费情况,找出客户的行为偏好,对他们进行相应的促销。

     

    参考资料

    1.《Python数据分析与挖掘实战》第七章及配套数据

    2.案例分析:基于RFM的客户价值分析模型

    3.实战代码

    基于RFM的客户价值分析模型
    [Jīyú RFM de kèhù jiàzhí fēnxī móxíng]
    RFM customer value analysis model
     
    展开全文
  • RFM模型是什么 RFM是客户关系管理(CRM:Customer Relationship Management)中一种重要的分析模型,通过研究一个客户的交易时间、交易频率和交易...RFM模型的核心目的就是对用户黏性、忠诚度和收入这三个维度进行数值
  • 目标:容器操作;两地中心;四层服务发现;五种 Pod 共享资源;六 CNI 常用插件;七层负载均衡;八种隔离维度;九网络模型原则;十类 IP 地址;百级产品线;千级物理机;万级容...
  • 在《.NET Core采用全新配置系统[1]: 读取配置数据》中,我们通过实例方式演示了几种典型配置...通过上面演示实例我们知道,配置编程模型涉及到三个核心对象,它们分别是Configuration、ConfigurationSour...
  • 文章目录一、最小频次 min_count二、词向量维度 size、并行处理核心数 workers 我们可以使用一些参数设置来控制训练速度和质量。 一、最小频次 min_count min_count 用来修剪内部词表。 比如在一 10 亿词...
  • 评价指标体系由三个维度构成,分别为:流动性风险,市场风险和信用风险。 利用R型聚类分析减少指标体系维数,最终获得核心指标评价体系。 在此基础上,首次通过经典DEA-CCR模型对风险控制能力效率进行了评估,...
  • 数据仓库和商业智能目标 ...事实表:维度模型事实表存储组织机构业务过程事件性能度量结果 最实用事实是数值型和可加型事实 事实表粒可分为类: 事务 周期性快照 累积快照 维度提供数
  • 从物 品、网络、应用三个维度提出了一个物联网体系结构,探讨物联网由信息物品、自主网络和智能应用组合而成物 联网内在特征;并且建议长期物联网项目应该侧重于物联网基础设施类系统和技术研究和开发。
  • 从物品、网络、应用三个维度提出了一个物联网体系结构,探讨物联网由信息物品、自主网络和智能应用组合而成物联网内在特征;并且建议长期物联网项目应该侧重于物联网基础设施类系统和技术研究和开发。
  • 业务地图说核心,其他张地图均围绕着业务地图展开,业务地图主要阐述基于部门业务战略所分解到自身项目组业务整体目标及子目标,包括TopN专项业务,围绕分解业务目标当前存在关键挑战是什么,面对关键挑战,...
  • 人脸三维重建就是建立人脸的三维模型,它相对于二维人脸图像多了一个维度,在电影,游戏等领域应用广泛。目前获取人脸三维模型的方法主要包括三种,软件建模,仪器采集与基于图像的建模。 (1) 软件建模作为最早的三...
  • 本次分享主要是对生活品类精选池进行介绍,为了挑选出生活品类优质内容,我们主要通过作者、内容、消费三个维度进行建模: *图1-1 生活精品池模型 01 为何考虑从作者、内容、消费三个维度进行建模? 主....
  • 本论文主要就企业管理领域竞争力水平分析及研究框架进行系统性研究及建模分析,参考工信部第期全球公有链技术评估指数和2018中国区块链产业白皮书等,通过多个维度对企业包含行业口碑、行业地位、产品创新、模式...
  • 第十章 线性因子模型 官网 原版 许多深度学习算法被设计为处理无监督学习问题,但不像深度学习已经在很大程度上解决了各种任务监督学习问题,没有一算法能以同样方式真正解决无监督学习问题。 无监督学习...
  • Go实战抢红包系统()-架构设计

    千次阅读 2019-06-22 20:20:15
    本文从Why、What、How三个维度来介绍代码架构,说明代码架构意义、要做事、常见代码分层。从四层架构来阐述每一层职责,最后介绍Go module模块化管理代码工具。… 1 代码架构意义 代码架构就是详细设计中...
  • 认知智能大技术体系分别是认知维度划分与识别,类脑结构功能机制的模型和万维图谱。大技术体系是认知认知智能大奠基理论(三体论,融智学,HNC)指导下而形成的核心技术体系。大技术体系相辅相成,共同支撑...
  • 小结 关系模型、多维模型和Data Vault模型是三种常见的数据仓库模型。 数据结构、完整性约束和SQL语言是关系模型的三个要素...事实、维度、粒度是维度模型的三个核心概念。 维度模型的四步设计法是选择业务流程、声...
  • 认知智能大技术体系分别是认知维度划分与识别,类脑结构功能机制的模型和万维图谱。大技术体系是认知认知智能大奠基理论(三体论,融智学,HNC)指导下而形成的核心技术体系。大技术体系相辅相成,共同支撑...
  • 认知智能大技术体系分别是认知维度划分与识别,类脑结构功能机制的模型和万维图谱。大技术体系是认知认知智能大奠基理论(三体论,融智学,HNC)指导下而形成的核心技术体系。大技术体系相辅相成,共同支撑...
  • 用户行为分析系统是指由第方提供集合了数据采集SDK、数据分析模型、分布式算法与存储架构用户属性与行为事件数据分析系统。比如国外MixPanel、Heap等,用户行为数据分析前提是在前期埋点时打好扎实基础...
  • 数据仓库学习小结

    2019-05-15 01:02:00
    关系模型、多维模型和Data Vault模型是三种常见的数据仓库模型. 数据结构、完整性约束和SQL语言是关系模型的三个要素. ...事实、纬度、粒度是维度模型的三个核心概念. 纬度模型的四步设计法是选择业务流程...

空空如也

空空如也

1 2 3 4 5 6
收藏数 113
精华内容 45
关键字:

维度模型的三个核心模型