精华内容
下载资源
问答
  • CTO在企业应当起怎样的作用
    千次阅读
    2020-02-20 15:45:18

    站在不同的位置,会看到企业不同的侧面。从产品、市场、销售来看都很正常的企业,从CTO的视角看,可能面临着技术落后,团队涣散的危机;而精干的团队加先进的技术,也完全可能在市场上处处碰壁,找不到出路。
    归根结底,一个企业之所以能够生存,根本的原因是建立了一套运作机制,这一机制可以用较低的成本满足一种社会需求。而CTO的职责,是利用技术来更好更高效率低成本地服务于这套运作机制。
    这里有三个层次:
    1、了解企业的运作机制是如何满足社会需求的
    2、运转技术团队,使IT技术服务于这套运作机制
    3、在保证运作的基础上谈持续改进

    第一个层次,具体企业的运作机制千差万别,其形成也往往是由客户、企业、历史、社会现状的合理形成的。看起来经营相似产品的企业,其运作机制有可能是完全不同的。有些企业具有较完整的增值链,用产品满足客户某种真实的需求;有些企业的重点是运营客户关系,产品只是起道具的作用。前提是企业的行为没有违背我们的价值观,具体的运作逻辑并不用CTO过多考虑,但CTO必须清楚地了解它。

    第二个层次,IT技术,在企业的运作机制中扮演什么样的角色,起什么样的作用。这里是有CTO施展的空间的。不同企业使用的基础技术可能很不相同,作为CTO,首先是对现有技术的全面掌握。这里的掌握,不必是具体技术细节,而是能够访问到全部技术的资源为准(包括静态技术文档、内外的技术团队和社团)。只有尽量充分全面地了解公司的所用的技术,才能更好地理解技术是如何作用于企业的运作逻辑。
    然后是保证公司技术能力的稳定,技术团队的动态稳定。
    其次是保证技术团队的运转和产出,正常来说一个相对稳定的技术团队可以在没有CTO的情况下完成很多具体工作,CTO可以做的是通过改进工作流程来提高工作效率和保证工作质量,设计有效的考核机制来提升团队工作热情。

    第三个层次,CTO应当关注技术的发展,了解技术的发展将对企业现有运作机制将产生怎样的影响,抓住新的机会,规避风险。从企业整体角度,对企业运作机制受影响的部分提出改进建议。从技术的角度,平稳地引入新技术,平稳地替代落后技术,组织学习和培训,平稳地调整团队技术栈以适应这种改进。
     

    更多相关内容
  • CRM(Customer relationship management system)客户关系管理系统,是指利用软件、硬件和网络技术,为企业建立一个客户信息收集、管理、分析和利用的信息系统。 以客户数据的管理为核心,记录企业在市场营销和销售...

    CRM(客户关系管理)介绍

    CRM(Customer relationship management system)客户关系管理系统,是指利用软件、硬件和网络技术,为企业建立一个客户信息收集、管理、分析和利用的信息系统。

    以客户数据的管理为核心,记录企业在市场营销和销售过程中和客户发生的各种交互行为,以及各类有关活动的状态,提供各类数据模型,为后期的分析和决策提供支持。

    中国CRM 市场规模

    根据T研究《2021中国CRM数字化全景实践报告》显示,数字化加速CRM覆盖,挖掘客户数据价值令CRM迎来可持续爆发契机。无论是B2B,还是B2C业态,对CRM的数字化应用已经帮助企业在经济下行或外部风险骤增的环境下,实现逆增长。

    企业常用CRM服务矩阵

    长按识别二维码,点击图内Logo即可查看产品详情

    CRM 原理

    客户关系管理系统在一个企业内部的成功构建,必须有一些前提和基础来做保障。

    首先,必须得到高层和领导的全力支持。因为CRM系统是对原有客户关系管理的升级,其结果不可避免会与原来的营销策略不一致,同时会触及到某些人的利益,受到各方的阻力,若没有高层的支持,再好的系统也难以维持下去;

    其次,必须重视团队的作用。CRM系统的实施不仅要求团队成员充分了解企业业务流程,而且要求能够将问题与流程结合起来去选择合适的技术,对团队成员的要求较高;再此,必须获得全员的认同。

    CRM 作用

    1、维护老客户,寻找新客户

    研究表明,开发一个新客户付出的成本是维护一个老客户的5倍,而企业通过建立CRM系统能够对客户信息进行收集、整理和分析,并实现内部资源共享,能有效提高服务水平,保持与老客户的关系。同时,有助于企业寻找目标客户、及时把握商机和占领更多的市场份额,是企业不断开拓新客户和新市场的重要帮手。

    2、避免客户资源过于分散引起的客户流失

    很多企业的客户资源是分散积累的,这直接导致客户信息记录的不完整,价值不高。同时由于销售人员的流动,客户资源会不断流失。而CRM系统能够帮助决策人准确得知客户整体推进状况和存在的问题,从而及时开展业务指导和策略调整,避免客户无故流失。

    3、提高客户忠诚度和满意度

    CRM系统可以帮助企业详细地了解客户的资料,促进企业与客户的交流,协调客户服务资源,给客户最及时和最优质的服务。同时能够帮助建立起与客户长久且稳固的互惠互利关系,对提高客户忠诚度和满意度作用明显。

    4、降低营销成本

    企业通过CRM系统对内能够实现资源共享,优化合作流程,对外能够增加对市场的了解,有效预测市场发展趋势,不仅能够提高企业运营效率,而且能极大降低运营成本。

    5、掌握销售人员工作状态

    移动CRM系统能够使负责人准确掌握销售人员的位置、工作状态,防止出现偷奸耍滑、做私事的情况,有利于企业进行绩效考核,提高销售人员工作效率。

    CRM 功能

    集成了客户关系管理思想和先进技术成果的客户关系管理系统,是企业实现以客户为中心战略导向的有力助手。一个完整、有效的CRM系统应当包含以下四个子系统。

    客户合作管理系统

    客户关系管理系统要突出以客户为中心的理念,首先应当使客户能够以各种方式与企业进行沟通交流,而客户合作管理系统就具备这项功能。

    业务操作管理系统

    企业中每个部门都需要与客户进行接触,而市场营销、销售、客户服务部门与客户的接触最为频繁,因此,客户关系管理系统需要对这些部门提供支持,业务操作管理系统便应运而生。业务操作管理系统主要实现了市场营销、销售、客户服务与支持等三种基本功能。

    数据分析管理系统

    数据分析管理系统中,将实现数据仓库、数据集市、数据挖掘等工作,在此基础上实现商业智能和决策分析。此系统主要负责收集、存储和分析市场、销售、服务及整个企业的各类信息,对客户进行全方位的了解,为企业市场决策提供依据。

    信息技术管理系统

    由于客户关系管理的各功能模块和相关系统运行都由先进的技术进行保障,因此对于信息技术的管理也成为CRM系统成功实施的关键。

    CRM 价值

    客户关系管理系统依据先进的管理思想,利用先进的信息技术,帮助企业最终实现客户导向战略,这样的系统具有如下特点:

    先进性

    客户关系管理系统涉及种类繁多的信息技术,比如数据仓库、网络、多媒体等许多先进的技术。同时,为了实现与客户的全方位交流和互动,要求呼叫中心、销售平台、远端销售、移动设备以及基于因特网的电子商务站点的有机结合。

    综合性

    客户关系管理系统包含了客户合作管理、业务操作管理、数据分析管理、信息技术管理四个子系统,综合了大多数企业的销售、营销、客户服务行为的优化和自动化的要求,运用统一的信息库,开展有效的交流管理和执行支持,使交易处理和流程管理成为综合的业务操作方式。

    集成性

    CRM解决方案因其具备强大的工作流引擎,可以确保各部门各系统的任务都能够动态协调和无缝连接。因此,CRM系统与其他企业信息系统的集成,可以最大限度地发挥企业各个系统的组件功能,实现跨系统的商业智能,全面优化企业内部资源,提升企业整体信息化水平。

    智能化

    客户关系管理系统的成熟,不仅能够实现销售、营销、客户服务等商业流程的自动化,减少大量的人力物流,还能为企业的管理者提供各种信息和数据的分析整合,为决策提供强有力的依据。同时,采取集中管理将大大简化软件的部署、维护和升级工作;基于因特网的客户关系管理系统,使用户和员工可随时随地访问企业,减少大量的交易成本。

    CRM 分类

    根据客户的类型不同,CRM可以分为B2B CRM及B2C CRM. B2B CRM中管理的客户是企业客户,而B2C CRM管理的客户则是个人客户。提供企业产品销售和服务的企业需要的B2B的CRM,也就是市面上大部分CRM的内容。而提供个人及家庭消费的企业需要的是B2C的CRM。

    根据CRM管理侧重点不同又分为操作型和分析型CRM。大部分CRM为操作型CRM,支持CRM的日常作业流程的每个环节,而分析型CRM则偏重于数据分析。

    有必要开发专属于自己的 CRM 产品吗?

    自己开发客户关系管理更能够满足自身要求,还可以随时升级、维护,可控性强,能避免上当受骗,但实际上呢?

    首先,客户关系管理系统已经涉及到越来越多的学科技术,包括计算机、通信、网络、管理与行为、多媒体、数据库、图形图像等等,是一个需要综合各种人才的团队工程,一个或者几个普通程序员已经很难做好。

    其次,单位内部的程序员受行业和职位限制,无法掌握最新的管理理念及其发展趋势,往往只能对市面上的CRM系统和自己单位的办公流程进行简单模仿和克隆,不能够真正实现提升管理水平的目的;再次,频繁调整客户关系管理系统会严重影响员工的快速掌握和正常使用,延长融合期。

    最后,开发客户关系管理系统需要耗费大量的人力、物力、财力、管理、时间成本,不可控因素很多,综合费用最低也要几万元,很多都要数十万元,显然得不偿失。

    因此除了个别特大型企业和敏感性单位,建议普通企业不必自己开发,选择一些成熟的CRM比较合适。

    免责声明

    本报告部分内容来源于互联网公开资料,由开发者共同创建和维护,不代表蒲公英企服平台立场。

    选CRM(客户关系管理)服务,就上蒲公英企服!

    展开全文
  • 数据:大数据时代的金矿随着大数据时代的来临,我们在迎来海量数据的同时,如何探索数据中蕴藏的巨大价值,也成为了广大企业和数据服务提供商们热烈探讨的共同话题。数字经济的蓬勃发展,使得无数企业...

    数据:大数据时代的金矿

    随着大数据时代的来临,我们在迎来海量数据的同时,如何探索数据中蕴藏的巨大价值,也成为了广大企业和数据服务提供商们热烈探讨的共同话题。

    数字经济的蓬勃发展,使得无数企业都对数字化产生了迫切需求。越来越多的企业开始认识到,数字化组织将会是所有企业组织未来的发展方向,而数据正是数字化组织的驱动力。全球知名调研机构IDC更是在一份研究报告中预测:未来超过90%的组织都将成为“数字化原生组织”。

    当数据成为数字化组织成长和发展的驱动力,大数据时代诞生的海量数据就像是一座无穷无尽的金矿,等待着无数企业去发掘其中蕴藏的巨大价值。

    那么对于数字化组织来说,应该如何运用数据来驱动业务、创新和管理决策?也就是说,当面对数据这座金矿时,企业应当如何更快更好地挖掘出金子?

    作为国内领先的大数据基础设施提供商,爱数针对这个问题给出了自己的答案。

    AnyDATA ONE:洞悉私域数据

    提起AnyDATA,相信关注大数据领域的读者朋友都应该耳熟能详。2016年,爱数举办了第一届AnyDATA大会,提出云中数据,探索无尽的数据潜力;2018年,AnyDATA大会提出数据即服务。今天,爱数给与AnyDATA全新的定义,它成为爱数继AnyBackup、AnyShare、AnyRobot之后,爱数的第四大产品,在数字化和认知智能的下一个十年,为数据带来认知驱动力,开启一段全新的旅程。

    2021年1月28日,“Σ Partner × Potential”爱数2020年度会议在线上盛大召开。而作为爱数数据智能探索的最新实践成果,AnyDATA ONE也在本次大会上重磅发布。

    秉持“以客户为中心”的理念,爱数围绕企业客户需求不断推出数据智能和超可用解决方案,助力其打造数据驱动型组织。AnyDATA ONE就是这样一款充满“智能”的创新产品。

    众所周知,伴随着企业组织的数字化,大量的数据信息也会随之产生。在如今这个万物互联的时代,这些原始数据都会被接入一个完全连接的知识网络,爱数产品副总裁李基亮向趣味科技表示:“知识网络一方面是让原始数据全面的知识化,另外一个层面是分析的知识化,通过知识化的分析模型(数据统计定量分析+知识定性逻辑推理分析),为企业找到正确的信息、分析业务的逻辑、决策的依据提供支撑。”

    AnyDATA ONE的产品方案与应用价值

    对于每一家数字化组织来说,挖掘私域数据价值都是重中之重。然而要构建和运营组织专属的知识网络,则需要面对数据如何知识化(如何做到将复杂多样的私域数据转化为机器可理解的知识);如何将知识网络服务于知识搜索、意图推荐以及业务分析判断;如何解决持续运营优化的投入产出压力,因为数据和业务都是动态发展的,知识网络需要持续运营。

    “作为一款一站式的知识网络平台,AnyDATA ONE能够帮助企业组织构建知识网络,洞悉私域数据,为数字化组织构建数据的认知驱动力。”李基亮向趣味科技表示,“AnyDATA ONE是知识网络和认知智能领域的先行者,基于这一平台,每个组织都可以打造自己的专属数据知识网络,即私域数据知识网络(私域是指组织可以访问的一切合法数据,包括内部和外部的),化解数据知识化和知识化分析的难题,提供最佳性价比的解决方案,从而实现智能内容的搜索和分析内容,洞察数据辅助决策。”

    “AnyDATA ONE的产品架构可以分为两层两大技术架构。第一层是语言模型层,是数据知识化的基础,通俗的讲它的目的是让机器读懂人话,基于此,爱数通过一个统一的启发式构建框架来实现数据的知识化,包括模型训练、业务知识标注、抽取和融合;第二层也就是知识表示和存储的载体,有知识图谱,也有决策树、概率图,以及外部的领域知识数据, 在此之上是知识化分析的引擎,包括对用户意图的理解、基于规则去判断、基于关系去推理、基于图的区域计算,以及知识的搜索,最终输出有价值的信息和知识。”李基亮表示,

    “还有重要的一点,AnyDATA ONE提供一个开放的框架,通过OpenKN,AnyDATA的基础架构可以是部署在公有或者私有云云平台上,并且提供基于知识模型、构建、分析的各类API。支持Serverless开发模式,满足知识应用自由组合,全面利用知识网络的能力。”

    基于AnyDATA ONE,每一家数字化组织都可以用最佳性价比的解决方案,打造自己专属的数据知识网络,也就是私域数据知识网络。其方向大体可以分为两类:一类是以内容为基础的知识网络,可结合AnyShare实现智能的搜索和分析,合同的内容和规则分析;另一类则是以辅助决策分析为主的知识网络,通常会结合大数据分析、内容分析,目前已探明的方向有面向数字政府的城市招商引资,以及企业服务领域的企业大脑解决方案等。

    另外值得一提的是,AnyDATA ONE 实现端到端的服务交付,用来解决知识网络持续运营的投入产出的焦虑。AnyDATA ONE产品和数据服务都采用了订阅模式,可以让不同行业的用户根据使用量来实现阶梯订阅,当用户认为已经达到效果或者想要更换平台时也可以随时停止订阅,非常便利,爱数承诺订阅逾期,功能不限,数据无忧。

    强强联手打造认知智能联合研究中心

    数据如何才能成为企业运营、创新和决策的驱动力?

    “数据只有通过知识,才能产生有价值的信息,成为组织的驱动力。如果说数据是金矿,那么知识就是挖金矿的铲子,金子就是有价值的信息。”李基亮说道,“核心问题是,如何基于数据学习到知识,提取知识?这属于认知范畴,以前都是靠人来分析和判断,但现在则是人工智能研究和发展的趋势,也就是研究认知智能,让数据变成有价值的信息。”

    复旦和爱数联手打造的认知智能联合研究中心,正是在这样的时代背景之下应运而生。

    作为爱数2020年度会议的重要一环,“复旦-爱数认知智能联合研究中心”签约仪式在大会上隆重举行。复旦大学计算机科学技术学院院长姜育刚、复旦大学大数据学院副院长阳德青、爱数董事长贺鸿富、爱数董事长助理宋娅莉见证了本次签约仪式。

    据悉,“复旦-爱数认知智能联合研究中心”成立之后,将围绕大数据条件下的认知智能相关的技术进行算法研究,侧重前沿科技研究,研发拥有自主知识产权和核心技术的新技术新产品。其研究成果将应用于爱数旗下的AnyBackup、AnyShare、AnyRobot、AnyDATA四大产品线,致力于打造领先的数据安全、数据可用性、数据智能、数据洞察力方案和服务,帮助各行各业的客户释放数据价值,打造数据驱动型组织。

    “大数据和人工智能是未来世界的重要发展趋势,也是复旦大学深度布局的研究方向,为此复旦投入了大量的师资力量,有着深厚的积累。爱数致力于探索数据智能,双方有着一致的目标,期待通过双方的紧密合作,让联合实验室取得优秀的研究成果。”复旦大学计算机科学技术学院院长姜育刚表示。

    “我们相信,数字化的下一个十年,是认知智能的十年,也是知识网络的十年。”李基亮信心满满地表示,“知识网络是数字化组织的认知驱动力,是将数据转换为有价值信息的魔法。我们期待与各位合作伙伴和客户挖掘数据价值,将数据转换为知识,共同打造认知的驱动力!”

    展开全文
  • 数据挖掘实战—航空公司客户价值分析

    千次阅读 多人点赞 2021-04-05 16:18:13
      企业在面向客户制定运营策略与营销策略时,希望针对不同的客户推行不同的策略,实现精准化运营。通过客户分类,对客户群体进行细分,区分出低价值客户与高价值客户,对不同的客户群体开展不同的个性化服务,将...


    案例数据及notebook百度网盘链接—提取码:1234 或者可以从我上传的资源里面找,下载不需要积分
    传送门:


    引言

      企业在面向客户制定运营策略与营销策略时,希望针对不同的客户推行不同的策略,实现精准化运营。通过客户分类,对客户群体进行细分,区分出低价值客户与高价值客户,对不同的客户群体开展不同的个性化服务,将有限的资源合理地分配给不同价值的客户,从而实现效益(利润)最大化。本文将使用航空公司客户数据,结合RFM模型,采用K-Means聚类算法,对客户进行分群,比较不同类别客户的价值,从而指定相应的营销策略。定义挖掘目标如下:

    • 借助航空公司数据对客户进行分类
    • 对不同的客户类别进行特征分析,比较不同类别客户的价值
    • 针对不同价值的客户制定相应的营销策略,为其提供个性化服务

    本文数据挖掘主要包括以下步骤:

    1. 抽取航空公司2012年4月1日至2014年3月31日的数据
    2. 对抽取的数据进行数据探索分析数据预处理,包括数据缺失值与异常值的探索分析、数据清洗特征构建标准化等操作
    3. 基于RFM模型,使用K-means算法进行客户分群
    4. 针对模型结果得到不同价值的客户,采用不同的营销手段,提供定制化服务
      在这里插入图片描述

    一、数据探索分析(EDA)

      航空公司数据属性说明如下:
    在这里插入图片描述

    %matplotlib inline
    import pandas as pd
    import numpy as np
    import missingno as mg
    import matplotlib.pyplot as plt
    import seaborn as sns
    
    # 加载数据
    air_data = pd.read_csv('data/air_data.csv',header=0,index_col=0)
    air_data.head(10)
    

    在这里插入图片描述

    1.数据质量分析

    1.1 缺失值分析

      缺失值可视化,图中的白线即为缺失值

    # 缺失值可视化
    mg.matrix(air_data)
    

    在这里插入图片描述
      利用柱状图进行缺失值可视化,柱状图的高度代表非缺失比例
    在这里插入图片描述
      定量展示每一列缺失值个数并排序

    air_data.isnull().sum().sort_values(ascending=False)
    

    在这里插入图片描述
      展示每一列的缺失值个数与缺失率以及缺失值的属性

    def missing_percentage(df):
        dtypes = df.dtypes[df.isnull().sum() != 0]
        total = df.isnull().sum().sort_values(ascending=False)[df.isnull().sum() != 0]
        percentage = total*100 / len(df)
        return pd.concat([total,percentage,dtypes],axis=1,keys=['Total','Percentage','Dtypes'])
    
    missing_percentage(air_data)
    

    ![在这里插入图片描述](https://img-blog.csdnimg.cn/202104052120

    1.2 异常值分析

      用箱型图来识别异常值,箱型图识别异常值是以四分位数与四分位距为基础,同时结合业务逻辑,因为异常值并不代表是错误值,需要结合业务来考虑异常值在不在合理的范围内。

    # 数据类别统计分析
    air_data.dtypes.value_counts()
    

    在这里插入图片描述

    # 连续型变量
    num_columns = air_data.loc[:,air_data.dtypes != object].columns
    for var in num_columns:
        fig,ax = plt.subplots(figsize=(5,5))
        sns.boxplot(air_data[var],orient='v')
        ax.set_xlabel(var)
    

    以AGE为例,很明显看出该特征有异常值,而且这个异常值对于业务来说属于噪声,应当进行删除异常值或者将异常值取为空,然后在进行补充
    在这里插入图片描述
      对每个图进行分析,分析结果如下,这个是自身对业务的认知水平基础上的分析

    FFP_TIER:会员卡级别中数据要么6要么5没有异常值
    AGE:年龄中可以看到有些大于100岁,要对这些数据进行处理
    FLIGHT_COUNT:观测窗口内的飞行次数没有小于0的值,其他不在箱子中的异常值是有价值
    BP_SUM:总基本积分没有小于0的值,其他不在箱子里面的值是有价值
    EP_SUM =EP_SUM_YR_1 +EP_SUM_YR_2 :总精英积分有1个值远高于其他值,这个我认为是有价值的异常值
    SUM_YR = SUM_YR_1 + SUM_YR_2:观测窗口的票价收入,没有低于0的,有特别高的,我认为是有价值的异常值
    SEG_KM_SUM :观测窗口的飞行里程数,没有小于0的值,有特别高,我认为是有价值的异常值
    WEIGHTED_SEG_KM : 含义未知,跟里程数有关
    AVG_FLIGHT_COUNT : 平均里程数 没有小于0的值,有特别高,我认为是有价值的异常值
    AVG_BP_SUM:平均基本积分,没有小于0的,有特别高的,我认为是有价值的异常值
    BEGIN_TO_FIRST:我猜测是第一次乘机时间至观测窗口结束时长,没有小于0的,有特别高的,我认为是有价值的异常值
    LAST_TO_END:最后一次乘机时间至观测窗口结束时长,我猜测是时间间隔类数据,没有小于0的,有特别高的,我认为是有价值的异常值
    AVG_INTERVAL : 平均乘机时间间隔,即(LAST_TO_END - BEGIN_TO_FIRST) / FLIGHT_COUNT,没有负值
    MAX_INTERVAL : 最大乘机时间间隔,没有负值
    EXCHANGE_COUNT : 积分兑换次数,没有负值
    ADD_POINT_SUM : 具体含义未知,累积积分的一种,看着没有负值,之后统计分析的时候再看一下,这个值与ADD_POINT_SUM_YR_1和ADD_POINT_SUM_YR_2有关
    Eli_Add_Point_Sum:具体含义未知,累积积分的一种,看着没有负值,之后统计分析的时候再看一下,
    Ponits_Sum : 总累积积分,看着没有小于0的,有特别高的,我认为是有价值的异常值
    Ponit_NotFlight:非乘机的积分变动次数,看着没有小于0的
    总结:AGE有异常值

    1.3 重复数据分析

    在这里插入图片描述

    2.数据特征分析

    2.1 描述性统计分析

    explore = air_data.describe().T
    # count代表非空值个数
    explore['null'] = len(air_data) - explore['count']
    # 构建缺失值个数,最大值,最小值的表格
    explore = explore[['null','min','max']]
    explore.columns = ['空值个数','最小值','最大值']
    # 按空值个数进行排序
    explore.sort_values(by='空值个数',ascending= False,inplace=True)
    

    在这里插入图片描述
    在这里插入图片描述
      从表中可以看出,有3个连续型数据列有缺失值,年龄最大值为110岁,年龄中存在异常值。在三个含缺失值列中有两个是票价(SUM_YR = SUM_YR_1 + SUM_YR_2),票价为空值的数据可能是客户不存在乘机记录造成的。票价列还存在票价为0,折扣率为0,但总飞行里程数大于0的记录。这种数据业务上可以这么理解:客户乘坐了0折机票或者机票是通过非购买的其他途径获得。

    2.2 分布分析

      从三个角度寻找客户信息的分布规律

    2.2.1 客户基本信息分布分析

      针对客户基本信息中的入会时间、性别、会员卡级别和年龄字段进行分析

    1. 入会时间—各年份入会人数变化图
    from datetime import datetime
    
    # 将时间字符串转换为日期
    ffp = air_data['FFP_DATE'].apply(lambda x : datetime.strptime(x,'%Y/%m/%d'))
    # 提取入会年份
    ffp_year = ffp.map(lambda x : x.year)
    # 统计人数
    ffp_year_count = ffp_year.value_counts()
    

    在这里插入图片描述

    # 绘制各年份入会人数趋势图
    plt.rcParams['font.sans-serif'] = [u'simHei']   # 显示中文
    plt.rcParams['axes.unicode_minus'] = False      # 解决负号问题
    
    plt.figure(figsize=(10,10))
    plt.hist(ffp_year,bins='auto',color='r')
    plt.xlabel('年份')
    plt.ylabel('入会人数')
    plt.title('各年份入会人数变化趋势图')
    plt.show()
    

    在这里插入图片描述
    可以发现入会人数大致是随着年份的增加而增加,在2012年达到顶峰。2009年与2013年与趋势不符,有可能是采样的问题,有可能是其他类似政策的问题

    1. 性别—入会性别比例图
    gender =  air_data['GENDER']
    # 统计男女比例
    gender_count = gender.value_counts()
    gender_count = gender_count/gender_count.sum()
    

    在这里插入图片描述

    plt.figure(figsize=(8,8))
    color = ['yellowgreen', 'gold']
    plt.pie(gender_count,labels=['男','女'],colors=color,autopct='%1.1f%%')
    plt.title('入会性别比例图',fontsize=20)
    plt.show()
    

    在这里插入图片描述

    1. 会员卡级别—会员卡级别统计图
    ffp_tier = air_data['FFP_TIER']
    # 会员卡级别统计
    ffp_tier_count = ffp_tier.value_counts()
    ffp_tier_count
    

    在这里插入图片描述

    plt.figure(figsize=(8,8))
    plt.hist(ffp_tier,bins='auto',color='b',alpha=0.8)
    plt.xlabel('会员卡级别',fontsize=15)
    plt.ylabel('人数',fontsize=15)
    plt.title('会员卡级别统计图',fontsize=20)
    plt.show()
    

    在这里插入图片描述
    可以看出绝大多数会员为4级会员,仅有少数5级或者6级会员

    1. 年龄
    age = air_data['AGE'].dropna()
    # 绘制箱型图
    plt.figure(figsize=(10,10))
    sns.boxplot(age,orient='v')
    plt.xlabel('会员年龄',fontsize=15)
    plt.title('会员年龄分布箱型图',fontsize=20)
    

    在这里插入图片描述
    可以看出绝大多数年龄位于30~50岁之间,还存在一个年龄大于100岁的异常数据

    2.2.2 客户乘机信息分析

      针对客户乘机信息中的观测窗口内的飞行次数,观测窗口内的总飞行公里数,观测窗口内的票价收入,平均乘机时间间隔来分析

    1. 观测窗口内的飞行次数与观测窗口内的总飞行公里数
    flight_count = air_data['FLIGHT_COUNT']
    # 统计飞行次数
    flight_count.value_counts()
    

    在这里插入图片描述

    seg_km_sum = air_data['SEG_KM_SUM']
    # 统计飞行里程数
    seg_km_sum.value_counts()
    

    在这里插入图片描述
      对观测窗口内的飞行次数与观测窗口内的总飞行公里数进行绘图

    fig,ax = plt.subplots(1,2,figsize=(16,8))
    sns.boxplot(flight_count,orient='v',ax=ax[0])
    ax[0].set_xlabel('飞行次数',fontsize=15)
    ax[0].set_title('会员飞行次数分布箱型图',fontsize=20)
    
    sns.boxplot(seg_km_sum,orient='v',ax=ax[1])
    ax[1].set_xlabel('飞行里程数',fontsize=15)
    ax[1].set_title('会员飞行里程数分布箱型图',fontsize=20)
    

    在这里插入图片描述
    通过图像可以很清晰的发现:客户的飞行次数与总飞行里程数明显分为两个群体,大部分客户集中在箱型图中的箱体中,少数客户位于箱体上方,这部分客户很可能就是高价值客户

    1. 观测窗口内的票价收入
    sum_yr = air_data['SUM_YR_1'] + air_data['SUM_YR_2']
    sum_yr.value_counts()
    

    在这里插入图片描述

    plt.figure(figsize=(10,10))
    sns.boxplot(sum_yr,orient='v')
    plt.xlabel('票价收入',fontsize=15)
    plt.title('会员票价收入分布箱型图',fontsize=20)
    

    在这里插入图片描述
    通过直方图可以发现:绝大多数的会员票价收入小于3000,客户明显被分为两个群体,箱型体上方的客户很可能是高价值客户

    1. 平均乘机时间间隔统计
    avg_interval = air_data['AVG_INTERVAL']
    avg_interval.value_counts()
    

    在这里插入图片描述

    plt.figure(figsize=(10,10))
    sns.boxplot(avg_interval,orient='v')
    plt.xlabel('平均乘机时间间隔',fontsize=15)
    plt.title('会员平均乘机时间间隔分布箱型图',fontsize=20)
    

    在这里插入图片描述

    1. 最后一次乘机时间至观测窗口时长
    last_to_end = air_data['LAST_TO_END']
    plt.figure(figsize=(8,8))
    sns.boxplot(last_to_end,orient='v')
    plt.xlabel('最后一次乘机时间至观测窗口时长',fontsize=15)
    plt.title('客户最后一次乘机时间至观测窗口时长箱型图分布',fontsize=20)
    

    在这里插入图片描述
    最后一次乘机时间至观测窗口时长越短,表示客户对航空公司越满意。时间间隔越短同时也表示该客户可能是高价值客户。并且还可以从这个属性中看到公司的发展问题,如果时间间隔短的客户越来越少,说明该公司的运营出现了问题,需要及时调整营销策略。

    2.2.3 客户积分信息分布分析

      针对客户积分信息中的积分兑换次数、总累计积分进行分析

    1. 积分兑换次数
    exchange_count = air_data['EXCHANGE_COUNT']
    # 统计积分兑换次数
    exchange_count.value_counts()
    

    在这里插入图片描述

    plt.figure(figsize=(8,8))
    plt.hist(exchange_count,bins='auto',color='b',alpha=0.8)
    plt.xlabel('积分兑换次数',fontsize=15)
    plt.ylabel('会员人数',fontsize=15)
    plt.title('会员卡积分兑换次数分布直方图',fontsize=20)
    plt.show()
    

    在这里插入图片描述
    通过图形可以看出:绝大多数兑换次数位于0~10次之间,这表明大部分客户很少进行积分兑换
    2. 总累计积分

    point_sum= air_data['Points_Sum']
    # 统计总累计积分
    point_sum.value_counts()
    

    在这里插入图片描述

    plt.figure(figsize=(10,10))
    sns.boxplot(point_sum,orient='v')
    plt.xlabel('总累计积分',fontsize=15)
    plt.title('会员总累计积分分布箱型图',fontsize=20)
    

    在这里插入图片描述
    通过箱型图可以看出:绝大多数的累积积分比较小,箱型体外的积分明显高于箱型体内的积分

    2.3 相关性分析

    corr = air_data.corr()
    # 画热力图
    fig,ax = plt.subplots(figsize=(16,16))
    sns.heatmap(corr,
               annot=True,
               square=True,
               center=0,
               ax=ax)
    plt.title("Heatmap of all the Features", fontsize = 30)
    

    在这里插入图片描述
      分析入会时间、会员卡级别、会员年龄、飞行次数、飞行里程数、观测窗口内的票价收入,平均乘机时间间隔,最近一次乘机至结束时长、积分兑换次数、总累计积分属性的相关性

    data_corr = air_data[['FFP_TIER','FLIGHT_COUNT','LAST_TO_END','SEG_KM_SUM','AVG_INTERVAL','EXCHANGE_COUNT','Points_Sum']]
    age1 = air_data['AGE'].fillna(0)
    data_corr['AGE'] = age1.astype('int64')
    data_corr['ffp_year'] = ffp_year
    data_corr['sum_yr'] = sum_yr.fillna(0)
    data_corr
    

    在这里插入图片描述

    # 计算相关性矩阵
    dt_corr = data_corr.corr(method='pearson')
    dt_corr
    

    在这里插入图片描述

    fig,ax = plt.subplots(figsize=(16,16))
    # 绘制热力图
    sns.heatmap(dt_corr,
               annot=True,
               square= True,
                center=0,
               ax=ax)
    plt.title("Heatmap of some Features", fontsize = 30)
    

    在这里插入图片描述
    通过热力图可以看出:部分属性之间存在强相关性,比如总飞行公里数与票价收入,总累计积分,飞行次数。

    二、数据预处理

      针对航空客户数据从数据清洗、属性归纳与数据变换入手进行数据预处理

    1.数据清洗

    1.1 异常值处理

      根据数据预处理我们知道了,原始数据中存在票价为空值的记录,同时存在票价最小值为0,折扣率最小值为0,总飞行公里数大于0的记录,同时年龄中存在一个大于100的记录。由于这类数据在原始数据中占比不大,这里采用丢弃处理。

    # 删除年龄中的异常值
    data = pd.read_csv('data/air_data.csv',header=0,index_col=0)
    print(data.shape)
    # 去除票价为空的记录
    data_notnull = data.loc[data['SUM_YR_1'].notnull() & data['SUM_YR_2'].notnull(),:]
    

    在这里插入图片描述

    # 只保留票价非零的,或者平均折扣率不为0且总飞行公里数大于0的记录,去除年龄大于100的记录
    index1 = data_notnull['SUM_YR_1'] !=0
    index2 = data_notnull['SUM_YR_2'] !=0
    index3 = (data_notnull['avg_discount'] !=0) & (data_notnull['SEG_KM_SUM'] >0)
    index4 = data_notnull['AGE'] >100
    
    airline = data_notnull[(index1|index2 ) & index3 & ~index4]   # 按位取反
    airline.to_csv('data_cleaned.csv')
    

    在这里插入图片描述

    1.2 缺失值处理

    在这里插入图片描述

    发现有4个类别型数据:WORK_CITY,WORK_PROVINCE ,WORK_COUNTRY ,GENDER中缺失值
    1个连续型数据:AGE有缺失值
    由前面的相关性图可以看出,年龄与其他属性的相关性低,因此这里可以采用均值填充

    data_clean['AGE'].fillna(data_clean['AGE'].mean(),inplace = True)
    

    在这里插入图片描述

    2.属性归约

      RFM模型中,消费金额(M)表示一段时间内客户购买该企业产品金额的总和。由于航空公司票价受运输距离、舱位等级等影响因素,即并不是金额越高的客户并不一定比金额低的客户价值高(长途经济舱与短途商务舱的对比)。基于航空公司业务,这个特征用一定时间内累计的飞行里程M 与客户在一定时间内乘坐舱位对应的平均折扣率C来代替。同时考虑到会员的入会时间在一定程度上能够影响客户的价值,所以在模型中增加客户关系长度L,作为区分客户的一种特征。本模型将以下5个特征作为识别客户价值的特征,即为LRFMC模型。
    在这里插入图片描述
    根据LRFMC模型,选择与LRFMC指标相关的6个属性:FFP_DATE,LOAD_TIME,FLIGHT_COUNT,AVG_DISCOUNT,SEG_KM_SUM,LAST_TO_END,删除与其不相关、弱相关或冗余属性。

    data_select = data_clean[['FFP_DATE','LOAD_TIME','LAST_TO_END', 'FLIGHT_COUNT','SEG_KM_SUM','avg_discount']]
    

    在这里插入图片描述

    3.数值变换

      构造入会时长指标,并对数据进行标准化

    # 构造L 单位为天数
    L = pd.to_datetime(data_select['LOAD_TIME']) - pd.to_datetime(data_select['FFP_DATE'])
    L = L.astype('str').str.split().str[0]   # 去掉单位
    
    # 构造LRFMC指标
    data_change = pd.concat([L,data_select.iloc[:,2:]],axis=1)
    data_change.columns = ['L','R','F','M','C']
    
    # 标准化—聚类模型基于距离
    from sklearn.preprocessing import StandardScaler
    data_scale = StandardScaler().fit_transform(data_change)
    # 保存数据
    np.savez('data_scale.npz',data_scale)
    

    在这里插入图片描述

    三、模型构建

    1.客户聚类分群

      采用Kmeans算法对客户进行聚类,基于业务逻辑,聚类为5群

    from sklearn.cluster import KMeans
    kmeans = KMeans(n_clusters=5,n_jobs=-1,random_state=1234)
    # 模型训练
    kmeans_fit = kmeans.fit(data_scale)
    # 聚类中心
    kmeans_cluster = kmeans_fit.cluster_centers_
    print('聚类中心为\n',kmeans_fit.cluster_centers_)
    # 聚类后样本的类别标签
    kmeans_label = kmeans_fit.labels_
    print('聚类后样本标签为\n',kmeans_fit.labels_)
    # 聚类后各个类别数目
    r1 = pd.Series(kmeans_label).value_counts()
    print('聚类后各个类别数目\n',r1)
    # 输出聚类分群结果
    cluster_center = pd.DataFrame(kmeans_cluster,columns=['ZL','ZR','ZF','ZM','ZC'])
    cluster_center.index = pd.DataFrame(kmeans_label).drop_duplicates().iloc[:,0]
    cluster = pd.concat([r1,cluster_center],axis=1)
    # 修改第一列列名
    list_column = list(cluster.columns)
    list_column[0] = '类别数目'
    cluster.columns = list_column
    

    在这里插入图片描述

    2.客户价值分析

      针对聚类结果进行特征分析,绘制客户分群雷达图

    import matplotlib.pyplot as plt 
    plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
    plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号 
    
    # 客户分群雷达图
    labels = ['ZL','ZR','ZF','ZM','ZC']
    legen = ['客户群' + str(i + 1) for i in cluster_center.index]  # 客户群命名,作为雷达图的图例
    lstype = ['-','--',(0, (3, 5, 1, 5, 1, 5)),':','-.']
    kinds = list(cluster_center.index)
    # 由于雷达图要保证数据闭合,因此再添加L列,并转换为 np.ndarray
    cluster_center = pd.concat([cluster_center, cluster_center[['ZL']]], axis=1)
    centers = np.array(cluster_center)
    
    # 分割圆周长,并让其闭合
    n = len(labels)
    # endpoint=False表示一定没有stop
    angle = np.linspace(0, 2 * np.pi, n, endpoint=False)
    angle = np.concatenate((angle, [angle[0]]))
    # 绘图
    fig = plt.figure(figsize = (8,6))
    # 以极坐标的形式绘制图形
    ax = fig.add_subplot(111, polar=True)  
    # 画线
    for i in range(len(kinds)):
        ax.plot(angle, centers[i], linestyle=lstype[i], linewidth=2,label=kinds[i])
    # 添加属性标签
    ax.set_thetagrids(angle * 180 / np.pi, labels)
    plt.title('客户特征分析雷达图')
    plt.legend(legen)
    plt.show()
    

    在这里插入图片描述
    由雷达图中可知:客群1在C处最大,在F,M处的值较小,说明客群1是偏好坐高级舱的客户群(一般航班舱位等级越高,折扣系数越大)。客群2在L,R,F,M,C处都小,说明客群2是新入会员较多客户群。客群3在L处最大,在R处值较小,其他特征适中,说明客群3属于入会时间长,飞行频率高的高价值客户。客群4在F,M处最大,且在R处最小,说明客户群体4频繁乘机并且最近也有乘机记录。客群5在R处最大,在其他特征处都较小,属于入会时间短的低价值客户群。
      总结每个客户群的优势与弱势特征
    在这里插入图片描述
      根据以上特征分析,说明不同用户类别的表现特征不同。基于特征描述,我们将客户分为5个等级:重要保持客户,重要发展客户,重要挽留客户,一般客户与低价值客户
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    参考于《python数据分析与挖掘实战》


    如果对您有帮助,麻烦点赞关注,这真的对我很重要!!!如果需要互关,请评论留言或私信!
    在这里插入图片描述


    展开全文
  • 2.客户层面 3.内部业务流程层面 4.学习与成长层面 一、战略地图的框架 战略地图是对组织战略要素之间因果关系的可视化表示方法,是一个用以描述和沟通战略的管理工具。 (一)战略地图的框架及逻辑结.
  • 现如今,数字技术已渗入企业从产品到服务,从流程到监管,从员工到客户,从开发到市场等各个环节。企业正在经历技术、社会和法规力量前所未有的交汇融合。随着人工智能 (AI)、自动化、物联网 (IoT)、区块链和第...
  • 1. 企业资源规划(ERP)、客户关系管理(CRM)、协同管理系统(CMS)是企业信息化的三大代表之作 1 2. 概念累 1 2.1. ERP (Enterprise Resource Planning,企业资源计划)ERP 是一个以管理会计 为核心 财务类 1 2.2. ...
  • CRM客户关系管理是指企业为提高核心竞争力,利用相应的信息技术以及互联网技术协调企业与顾客间在销售、营销和服务上的交互,从而提升其管理方式,向客户提供创新式的个性化的客户交互和服务的过程。其最终目标是...
  • 1.(2.5分) ( )的集成运行真正解决了企业供应链中上下游供应链的管理,将客户、经销商以及企业销售全部整合到一起,以实现企业客户个性化需求的快速响应。 A、CRM与ERP B、SCM与ERP C、ERP与SFA D、CRM与...
  • 应当反映一个企业的安全目标,以及企业为保障信息安全而制定的管理策略。因此,为了实施信息安全策略的后续措施,管理人员必须取得一致意见。在策略的内容问题上存在争论将会影响后续的强化阶段,其结果就是导致...
  • 企业管理的六大关系和八大系统

    万次阅读 2021-01-21 12:15:01
    一是要解决与市场的关系,包括客户关系、竞争者关系、合作者关系, 二是要解决与政府的关系,尤其是与拥有公权力部门的政府关系, 三是要解决与金融单位的关系,任何一家企业没有金融单位的支持是很难开展经营活动...
  • 企业实施客户关系管理的作用主要体现在提升企业竞争优势、提高客户满意度、(? )以及提升企业销售业绩。 A. 增强客户数据分析 B. 增强客户忠诚度 C. 减少交易成本 D. 减少互动沟通" "试题 3:3. 在(? )模式中,...
  • 客户开发就是企业让目标客户产生购买欲望并付诸行动,促使他们成为企业现实客户的过程。对新企业来说,首要任务就是吸引和开发客户,对老客户来说,企业发展也需要源源不断地吸引和开发新客户。因为根据一般经验,...
  • 中小企业CEO应当避免销售错误四:不是自动吸引并跟进潜在客户 多数情况下,在时机不合适或客户需求不明确时,你给客户提供一份报价后就再也得不到客户的反馈,你的目标应该是在正确的时间让销售机会出现在销售代表的...
  • 电信客户流失分析

    千次阅读 2021-07-03 11:37:32
    现如今,在电信行业蓬勃发展的同时,电信市场也趋于饱和,获取一个新客户的难度要远远高于维系一个老客户的难度,而老客户的流失意味着收益的流失和市场占有率的下降。可以说,电信运营商的竞争就是针对客户资源的...
  • 截止到2007年6月底,我国中小企业数量已达到4200多万户,占全国企业总量的99.8%,其中,经工商部门注册的中小企业数量为460万户,个体经营户3800多万户。中小企业实现的国内生产总值已占全国的60%,税收和进出口方面...
  • 什么是企业信息化建设企业...从内容上看,企业信息化主要包括企业产品设计的信息化、企业生产过程的信息化、企业产品销售的信息化、经营管理信息化、决策信息化以及信息化人才队伍的培养等多个方面。由于企业信息化...
  •  无论企业多么成熟,成熟企业面临的挑战与任何新晋企业是相同的:创建新的商业模式,价值主张和客户服务的能力体系,让企业获得长期的成功。】破坏(或颠覆),从定义上讲,意味着从主导商业模式转向另一种商业模式...
  • 了解你的客户(KYC)

    万次阅读 2018-10-10 15:21:21
    “了解你的客户”(KnowYou Customer,简称KYC,也称“尽职调查”、“合理审慎”)。要求金融机构了解客户的真实身份,识别特定资金与其真正所有人、受益人的关系,以便当局监测和控制洗钱活动;要求金融机构对政治...
  • 互联网企业文化

    千次阅读 2020-09-08 10:25:21
    目录 1、 快速迭代,勇于试错 2、 不断反思,放空自己 ...16、 员工与企业共同成长 17、 互联网公司经典语录 一、互联网文化 1、快速迭代,勇于试错 互联网讲究的是“天下武功,唯快不破”,所...
  • 是指对企业事业信息管理系统中具有体系的、普遍性的问题而提供的通用解决方案,更确切的说,是基于业务导向和驱动的架构来理解、分析、设计、构建、集成、扩展、运行和管理信息系统。复杂系统集成的关键,是基于架构...
  • 特点 集团型企业特点,首先,相关多元...这些特点决定了企业管理和信息化建设的复杂性。信息化管控的上下冲突,集团总部希望加强下属公司的管控,子孙公司希望集团总部最好不要管。管什么、管到什么程度,上下矛盾通...
  • 中小企业的资源是非常有限的(包括资金和时间),因此,必须有一套有效的资源组织方式才能让企业快速成长。对于一个想要成长的小公司来说,没有什么比营销和销售更重要的了。然而,对于大多数小企业主来说,销售和...
  • 如果说 《网络安全法》 是对企业端单方面的数据的存取进行监管, 那么 《个人信息保护法》 就是加强对数据定级和授权的监管, 而且形态不再是企业一方行为, 而是企业和个人的双方行为. GRC的实施将是对现有数据形态的...
  • 《数据安全法》对金融科技企业数据合规工作的六点影响 文/泰和泰律师事务所 陈福中、潘兴琦、刘若愚 引言 2021年6月10日,十三届全国人大常委会第二十九次会议表决通过了《中华人民共和国数据安全法》(下称“...
  • 基于WEB的客户关系管理系统

    千次阅读 2017-11-20 14:29:26
    第一章 客户关系管理绪论 客户关系管理CRM(Customer Relationship Management)最早由美国artner Group提出,自1997年开始,经过几年的发展,全球的CRM市场一直处于爆炸性的快速增长之中。1999年全球的CRM市场...
  • 企业网盘对比NAS哪个更适合企业

    千次阅读 2019-10-09 12:18:01
    目前企业用户较多采用NAS功能来作为邮件、OA、ERP等企业办公系统的文件存储及系统间共享。 作为传统的文件级的存储方法,NAS有诸多亮点: NAS存储作为一种能提供方便/独立/集中化管理的小数据中心,在应用中非常...
  • 全国企业会计信息化知识竞赛试题及答案第 1 题(单选)下列各项中,符合会计软件不可逆的记账功能要求的是( A )A.记账标记不得通过任何操作予以取消B.不可以用红字凭证更正记账错误C.可以删除已经记账的记账凭证D.可以...
  • 网站内容模块化管理,包括新闻模块,产品图片模块,客户反馈等。并可任意添加与删除模块。 完美整合ewebedit4.6编辑器,所见所得发布图文混排的产品信息 后台操作简洁,无需专业知识,即可掌控整站。 风格模板机制简单,...
  • 客户企业生存和发展的基石。只有充分了解客户企业才能制定相应的营销策略,提高转化率并达到客户满意度。 客户对产品的反应能力可以用来指导公司的销售策略;他们的意见和建议可以为公司改善产品和服务提供支持...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 32,544
精华内容 13,017
关键字:

企业客户的信息应当包括