精华内容
下载资源
问答
  • 使用联合分析法分析客户价值,杨彤骥,李玲,想要在企业赢利的前提下更好的满足客户需要就要看公司在那些方面能提供给客户为其感到最有价值的产品及服务。联合分析法被认为是
  • 决策树算法是非常常用的挖掘算法 文中详细介绍了决策树算法在分析客户价值中的应用
  • 客户价值分析模型

    2017-03-15 17:20:10
    比较有借鉴意义的客户价值分析模型,数学基础不好的慎下,通过数据对用户需求进行分析、推倒、得到最终结果,如何描述客户行为,过程性非常强,简单易懂。 没有数学基础的不要下载,如果你连贝叶斯算法都不懂,就...
  • 航空客户价值分析

    2019-10-17 14:12:38
    航空客户价值分析 航空公司在客户关系管理的关键问题是客户分类,通过客户分类,区分无价值客户、高价值客户。 通过借助数据,使用各类算法对客户进行分类。对不同类别的客户进行特征分析,比较不同类客户客户...

    航空客户价值分析

    信息时代来临使得企业的营销点从产品中心转变为客户中心,客户关系管理成为企业的核心问题,客户关系管理的关键问题是客户分类,通过客户分类,区分客户价值,企业针对不同类型的客户进行个性化的服务方案,采用不同的营销策略,将有限的资源集中用于高价值的客户,实现企业利润最大化目标。那么如何对客户进行分类就成了最关键的问题。

    面对激烈的市场竞争,各航空公司都推出了更优惠的营销方式来吸引更多的客户,国内某航空公司现通过建立合理的客户价值评估模型,对客户进行分群,分析不同客户群的客户价值,并制定相应的营销策略。目前该航空公司已积累了大量的会员档案信息和其乘坐信息。
    由于航空公司在客户关系管理的关键问题是客户分类,通过客户分类,区分无价值客户、高价值客户。借助数据,使用各类算法对客户进行分类。对不同类别的客户进行特征分析,比较不同类客户的客户价值。识别客户价值应用最广泛的模型是RFM模型。
    最近消费时间间隔(Recency)
    消费频率(Frenquency)
    消费金额(Monetary)
    模型修改:
    由于航空公司票价受到飞行距离、舱位等级等多种因素影响,同样消费金额的不同旅客对航空公司的价值是不同的。因此单纯的RFM模型并不是适用航空客户价值分析。所以选择客户在一定时间内累积的飞行里程M和客户在一定时间内的平均折扣率C两个指标代替消费金额。另外再增加一个指标就是会员入会时间,这个指标在一定程度也会影响客户价值。
    最终指标:L:入会时间 R:最近乘坐航班 F:飞行次数 M:累积飞行里程 C:平均折扣率 (LRFMC模型)
    构造LRFMC指标:
    L=LOAD_TIME - FFP_DATE(观测窗口的结束时间 - 入会时间)
    R=LAST_TO_END(最后一次乘坐飞机距观测窗口结束的时长)
    F=FLIGHT_COUNT(观测窗口内的飞行次数)
    M=SEG_KM_SUM(观测窗口内的总飞行里程)
    C=AVG_DISCOUNT(平均折扣率)

    一、数据探索分析

    通过观察发现原始数据中存在票价为空,票价最小值为0,折扣率最小值为0、总飞行记录大于0的记录。
    票价为空可能是客户不存在乘机记录,其他数据可能是客户乘坐0折机票,可将这些数据删掉。

    在这里插入图片描述
    在这里插入图片描述

    二、数据预处理

    过滤:
    票价为空的记录
    票价为0、平均折扣率不为0、总飞行距离大于0的记录 (可能是积分兑换)

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    三、模型构建

    主要是两个部分: 利用K-means算法对客户进行聚类。 结合业务,分析客户特征,分析客户价值。
    (1)客户聚类

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    (2)客户价值分析

    r1 = pd.Series(kmodel.labels_).value_counts() # 统计各个类别的数目
    r2 = pd.DataFrame(kmodel.cluster_centers_) # 找出聚类中心

    所有簇中心坐标值中最大值和最小值

    max = r2.values.max()
    min = r2.values.min()
    r = pd.concat([r2, r1], axis=1) # 横向连接(0是纵向),得到聚类中心对应的类别下的数目
    r.columns = list(data_sta.columns) + [u’类别数目’] # 重命名表头

    绘图

    fig = plt.figure(figsize=(10, 8))ax = fig.add_subplot(111, polar=True)center_num = r.valuesfeature = ["入会时间—L", '最后一次飞行时间-R',"飞行次数-F", "飞行总里程=M", "平均折扣率-C"]N = len(feature)for i, v in enumerate(center_num):# 设置雷达图的角度,用于平分切开一个圆面angles = np.linspace(0, 2 * np.pi, N, endpoint=False)# 为了使雷达图一圈封闭起来,需要下面的步骤center = np.concatenate((v[:-1], [v[0]]))angles = np.concatenate((angles, [angles[0]]))# 绘制折线图ax.plot(angles, center, 'o-', linewidth=2, label="第%d簇人群,%d人" % (i + 1, v[-1]))# 填充颜色ax.fill(angles, center, alpha=0.25)# 添加每个特征的标签ax.set_thetagrids(angles * 180 / np.pi, feature, fontsize=15)# 设置雷达图的范围ax.set_ylim(min - 0.1, max + 0.1)# 添加标题plt.title('客户群特征分析图', fontsize=20)# 添加网格线ax.grid(True)# 设置图例plt.legend(loc='upper right', bbox_to_anchor=(1.3, 1.0), ncol=1, fancybox=True, shadow=True)

    显示图形

    plt.show()
    L:入会时间 R:最后一次飞行时间 F:飞行次数 M:飞行总里程 C:平均折扣率

    客户的价值分析:
    (1)客户群3 —— R特别高,其余都低,属于低价值客户
    (2)客户群4 —— F M 很高,L也不低,可以看做是重要保持客户
    (3)客户群1 —— 可以看做是一般客户
    (4)客户群2 —— 可以看做是重要发展客户
    (5)客户群5 —— L很高,可以看做是重要的挽留客户,因为入会时间较长,但是F和M较低。

    客户价值排名:

    客户群4 ——1—— 重要保持
    客户群2 ——2—— 重要发展
    客户群5 ——3—— 重要挽留
    客户群1 ——4—— 一般客户
    客户群3 ——5—— 低价值客户

    客户特点:
    (1)重要保持客户:
    客户平均折扣率(C)较高(一般所乘航班的舱位等级较高)
    最近乘坐航班(R)低,乘坐的次数(F)或里程较高(M)
    他们是航空公司的高价值客户,是最为理想的客户类型,对公司贡献最大,所占比例小,最优先的目标,进行差异化管理,提高满意度。

    (2)重要发展客户:
    客户平均折扣率(C)较高(一般所乘航班的舱位等级较高),
    最近乘坐航班(R)低,乘坐的次数(F)或里程较低(M),
    入会时长L短,他们是潜在价值客户。
    虽然说,当前价值不高,但是却有很大的发展潜力,促使这类客户在本公司消费和合作伙伴处消费。通过客户价值提升,加强满意度,促使称为忠诚客户。

    (3)重要挽留客户:
    客户平均折扣率(C)(一般所乘航班的舱位等级较高),
    乘坐的次数(F)或里程(M)较高,但是很长时间没乘坐本公司航班(R)或频率变小,
    增加与这类客户的互动,了解情况,采取一定手段,延长客户生命周期。

    (4)一般与低价值客户:
    客户所乘坐航班平均折扣率C、乘坐次数F里程M低以及入会时间L短,较长时间无乘坐R高。
    他们可能是在公司打折促销时才会乘坐本公司航班。

    展开全文
  • 航空公司客户价值分析,航空公司客户价值分析源数据,Python源码
  • 客户价值分析.ipynb

    2021-04-06 20:51:00
    数据挖掘实战—航空公司客户价值分析
  • 航空公司客户价值分析

    千次阅读 2018-06-01 10:41:55
    (2) 对不同的客户类别进行特征分析,比价不同类客户客户价值。 (3) 对不同价值客户类别提供个性化服务,制定相应的营销策略。 分析方法与过程 识别客户价值应用最广泛的模型指标:最近消费时间间隔,...

    挖掘目标

    (1) 根据航空公司客户数据对客户进行分类。

    (2) 对不同的客户类别进行特征分析,比价不同类客户的客户价值。

    (3) 对不同价值的客户类别提供个性化服务,制定相应的营销策略。

    这里写图片描述


    分析方法与过程

    识别客户价值应用最广泛的模型指标:最近消费时间间隔,消费频率,消费金额(RFM模型)。

    本案例考虑项目指标(LRFMC模型):

    (1) 客户关系长度L:航空公司会员时间的长短。

    (2) 是消费时间间隔R。

    (3) 消费频率F。

    (4) 飞行里程M。

    (5) 折扣系数的平均值C。

    观测窗口:以过去某个时间段为结束时间,某一时间长度作为宽度,得到历史时间范围内的一个时间段。


    LRFMC模型指标含义:

    (1) L:会员入会时间距观测窗口结束的月数。

    (2) R:客户最近一次乘坐公司飞机距离观测窗口结束的月数。

    (3) F:客户在观测窗口内乘坐公司飞机的次数。

    (4) M:客户在观测窗口内累计的飞行里程碑。

    (5) C:客户在观测窗口内乘坐仓位所对应的折扣系数的平均值。


    方法:本案例采用聚类的方法,通过对航空公司客户价值的LRFMC模型的五个指标进行K-Means聚类,识别客户价值。

    总体流程:数据抽取->数据预处理(数据清洗(缺失值填补舍弃等),属性规约(提取需要特征数据),数据变换(转换适当格式))->建模->结果


    CODE

    1. 数据抽取

    以2014-03-31为结束时间,选取宽度为两年的时间段为分析窗口,抽取观测窗口内有乘机记录的所有客户的详细数据形成历史数据。
    抽取2012-04-01至2014-03-31所有乘客的详细数据,总共62988条,44个属性。

    2. 数据探索分析

    查找每列属性观测值个数,最大值,最小值。完整代码如下:

    # 数据探索分析
    import pandas as pd
    
    datafile = 'eeeee/chapter7/demo/data/air_data.csv'
    resultfile = 'eeeee/chapter7/demo/data/explore.xls'
    
    data = pd.read_csv(datafile, encoding='utf-8')
    
    explore = data.describe(percentiles=[], include='all').T
    explore['null'] = len(data) - explore['count']
    
    explore = explore[['null', 'max', 'min']]
    explore.columns = [u'空值数', u'最大值', u'最小值']
    
    explore.to_excel(resultfile)

    3.数据预处理

    数据清洗,属性规约,数据变换。

    3.1数据清洗

    通过数据探索分析,发现数据中存在缺失值,由于原始数据量大,这类数据量少,对其进行丢弃处理。
    (1)丢弃票价为空的记录。
    (2)丢弃票价为0、平均折扣率不为0、总飞行公里数等于0的记录。
    满足清洗条件的一行数据全部丢弃,使用Pandas对满足清洗条件的数据进行丢弃。
    完整代码如下:

    # 数据清洗
    cleanedfile = 'eeeee/chapter7/demo/data/data_cleaned.xls'
    
    data = data[data['SUM_YR_1'].notnull()*data['SUM_YR_2'].notnull()]#保留票价非空的记录
    
    index1 = data['SUM_YR_1'] != 0
    index2 = data['SUM_YR_2'] != 0
    index3 = (data['SEG_KM_SUM'] == 0) & (data['avg_discount'] == 0)# 只保留票价非0,或者平均折扣率与总飞行距离同时为0的记录
    
    data = data[index1 | index2 | index3]# 或
    
    data.to_excel(cleanedfile)

    3.2属性规约

    根据我们建立的LRFMC模型,提取这五个特征,删除语气不相关的属性。

    3.3数据变换

    将数据变换成‘适当的’格式。通过数据变换来构造这个五个特征。
    计算方式如下:
    (1) L=LOAD_TIME-FFP_DATE
    会员入会时间距观测窗口结束的月数=观测窗口的结束时间-入会时间[单位:月]
    (2) R=LAST_TO_END
    客户最近一次乘坐公司飞机距观测窗口结束的月数=最后一次乘机时间至观测窗口末端时长[单位:月]
    (3)F=FLIGHT_COUNT
    客户在观测窗口内乘坐公司飞机的次数=观测窗口飞行次数[单位:次]
    (4)M=SEG_KM_SUM
    客户在观测时间内在公司累计的飞行里程=观测窗口的总飞行里数[单位:公里]
    (5)C=AVG_DISCOUNT
    客户在观测时间内乘坐舱位所对应的折扣系数的平均值=平均折扣率[单位:无]
    提取5个特征后生成文件:zscoredata.xls

    # 标准化
    zfile = 'eeeee/chapter7/demo/data/zscoredata.xls'
    zscoredfile = 'eeeee/chapter7/demo/data/zscoreddata.xls'
    
    data1 = pd.read_excel(zfile)
    data1 = (data1 - data1.mean(axis=0)) / (data1.std(axis=0))
    
    data1.columns = ['Z'+i for i in data1.columns]
    
    data1.to_excel(zscoredfile, index=False)
    

    4.构建模型

    客户价值分析模型包括两个:
    (1) 根据5个特征对客户进行聚类分群。
    (2) 对每个客户群进行特征分析,分析客户价值,并对每个客户进行排名。

    # K-means聚类
    from sklearn.cluster import KMeans
    
    inputfile = 'eeeee/chapter7/demo/data/zscoreddata.xls'
    k = 5
    
    data2 = pd.read_excel(inputfile)
    
    kmodel = KMeans(n_clusters=k, n_jobs=4)
    kmodel.fit(data2)
    
    kmodel.cluster_centers_
    kmodel.labels_

    客户价值分析:

    根据聚类结果构造客户群特征分析图。
    根据特征值大小总结出每个群体优势特征和弱势特征,将客户群分为四类:

    a重要保持客户:平均折扣率高,乘坐次数或里程高,最近坐过本公司航班。

    b重要发展客户:平均折扣率较高,乘坐次数和里程较低。

    c重要挽留客户:平均折扣率,乘坐次数或者里程较高,较长时间没坐本公司航班。

    d一般与低价值客户:折扣率低,较长时间未做本公司航班,乘坐次数或里程较低,入会时长短。

    展开全文
  • 数据分析之航空公司客户价值分析

    千次阅读 2020-03-06 20:24:04
    航空公司客户价值分析 1.挖掘背景与目标 开启了第一个数据分析的项目,针对于航空公司价值分析客户关系管理的关键问题是客户分类,通过客户分类,区别无价值客户,高价值客户,企业针对不同价值客户制定...

    航空公司客户价值分析

     

    1.挖掘背景与目标

    开启了第一个数据分析的项目,针对于航空公司价值的分析。客户关系管理的关键问题是客户分类,通过客户分类,区别无价值客户,高价值客户,企业针对不同价值的客户制定优化的个性化服务方案,采取不同的营销策略,将有限营销资源集中于高价值客户,实现企业利润最大化目标。

    1)借助航空公司客户数据,对客户分类。

    2)对不同的客户类别进行特征分析,比较不同客户的客户价值。

    3)对不同价值的客户类别提供个性化的服务,制定相应的营销策略。

     

    2.分析方法与过程

    目标是客户价值识别,通过航空公司客户数据识别不同价值的客户,识别客户价值应用最广泛的模型是通过三个指标(最近消费时间间隔(Recency),消费频率(Frequency)和消费金额(Monetary))来进行客户细分,识别出高价值客户,简称RFM模型。

    本案例将客户关系长度L,消费时间间隔R,消费频率F,飞行里程M和折扣系数的平均值C五个指标作为航空公司识别客户价值目标,记为LRFMC模型。

     

    航空公司客运信息挖掘主要包括以下步骤。

    1)从航空公司的数据源中进行选择性抽取与新增数据抽取分别形成历史数据和增量数据。

    2)对步骤1)中形成的两个数据集进行数据探索分析与预处理,包括数据缺失值与异常值的分析探索,数据的属性规约,清洗与变换。

    3)利用步骤2)中形成的已完成数据预处理的建模数据,基于旅客价值的LRFMC模型进行客户分群,对各个客户群进行特征分析,识别出有价值的客户。

    4)针对模型得到不同的价值的客户,采用不同的营销手段,提供定制化的服务。

     

    2.1数据抽取与探索分析

    本案例的探索分析是对数据进行缺失值分析与异常值分析,分析出数据的规律以及异常值。通过对数据观察发现原始数据中存在票价为价值,价值最小值为0,折扣率最小值为0,总飞行公里数大于0的记录。票价为空值的数据可能是客户不存在乘机记录造成,其他的数据可能是客户乘坐0折扣机票或者积分兑换产生的。

    查找每列熟悉观测值中空值的个数,最大值,最小值的python代码。

    # 对数据进行基本的探索
    # 返回缺失值个数以及最大最小值
    
    import pandas as pd
    
    datafile = '../Data/air_data.csv' # 航空原始数据
    resultfile = '../Tmp/explore.xls' # 数据探索结果
    
    data = pd.read_csv(datafile, encoding= 'utf-8') # 指定为UTF-8编码格式
    
    print(data)
    
    explore = data.describe(percentiles= [], include= 'all').T
    # 对数据的基本描述,percenttiles参数是指定计算多少的分位数表(1/4分位数,中位数)
    
    explore['null'] = len(data) - explore['count'] # describe()函数自动计算非空数值,需要手动计算空值数
    
    explore = explore[['null', 'max', 'min']] # 只选取部分探索结果
    explore.colums = ['空值数', '最大值', '最小值'] # 表头重命名
    # describe()函数自动计算的字段有count(非空值数),unique(唯一值数),top(最高频者)
    # freq(最高频数),mean(平均值),std(方差),min(最小值),50%(中位数),max(最大值)
    
    print(explore)
    
    explore.to_excel(resultfile) # 导出结果
    
    
    #result
                             null       max   min
    MEMBER_NO                   0     62988     1
    FFP_DATE                    0       NaN   NaN
    FIRST_FLIGHT_DATE           0       NaN   NaN
    GENDER                      3       NaN   NaN
    FFP_TIER                    0         6     4
    WORK_CITY                2269       NaN   NaN
    WORK_PROVINCE            3248       NaN   NaN
    WORK_COUNTRY               26       NaN   NaN
    AGE                       420       110     6
    LOAD_TIME                   0       NaN   NaN
    FLIGHT_COUNT                0       213     2
    BP_SUM                      0    505308     0
    EP_SUM_YR_1                 0         0     0
    EP_SUM_YR_2                 0     74460     0
    SUM_YR_1                  551    239560     0
    SUM_YR_2                  138    234188     0
    SEG_KM_SUM                  0    580717   368
    WEIGHTED_SEG_KM             0    558440     0
    LAST_FLIGHT_DATE            0       NaN   NaN
    AVG_FLIGHT_COUNT            0    26.625  0.25
    AVG_BP_SUM                  0   63163.5     0
    BEGIN_TO_FIRST              0       729     0
    LAST_TO_END                 0       731     1
    AVG_INTERVAL                0       728     0
    MAX_INTERVAL                0       728     0
    ADD_POINTS_SUM_YR_1         0    600000     0
    ADD_POINTS_SUM_YR_2         0    728282     0
    EXCHANGE_COUNT              0        46     0
    avg_discount                0       1.5     0
    P1Y_Flight_Count            0       118     0
    L1Y_Flight_Count            0       111     0
    P1Y_BP_SUM                  0    246197     0
    L1Y_BP_SUM                  0    259111     0
    EP_SUM                      0     74460     0
    ADD_Point_SUM               0    984938     0
    Eli_Add_Point_Sum           0    984938     0
    L1Y_ELi_Add_Points          0    728282     0
    Points_Sum                  0    985572     0
    L1Y_Points_Sum              0    728282     0
    Ration_L1Y_Flight_Count     0         1     0
    Ration_P1Y_Flight_Count     0         1     0
    Ration_P1Y_BPS              0  0.999989     0
    Ration_L1Y_BPS              0  0.999993     0
    Point_NotFlight             0       140     0
    
    
    
    
    
    
    

     

     

    2.2数据预处理

    本案例中采用数据清洗,属性规约与数据变换的预处理方法。

    1.数据清洗

    通过数据探索分析,发现数据中存在缺失值,票价最小值为0,折扣率最小值为0,总飞行公里数大于0的记录。由于袁术数据量大,这类数据所占比例较小,对于问题影响不大,因此对其进行丢弃处理。

    丢弃票价为空的记录。

    丢弃票价为0,平均折扣率不为0,总飞行公里数大于0的记录。

    使用pandas对满足清洗条件的数据进行丢弃,处理方法:满足清洗条件的一行数据全部丢弃。

    # 数据清洗,过滤掉不和规则的数据
    
    import pandas as pd
    
    datafile = '../Data/air_data.csv' # 原始数据
    cleanfile = '../Tmp/data_cleaned.csv' # 清洗后的数据
    
    data = pd.read_csv(datafile, encoding='utf-8') # 采用UTF-8格式
    
    # 只保留票价非零的,或者平均折扣率与总飞行公里数同时为0的记录
    index1 = data['SUM_YR_1'] != 0
    index2 = data['SUM_YR_2'] != 0
    index3 = (data['SEG_KM_SUM'] == 0 ) & (data['avg_discount'] == 0) # 该规则是“与”
    data = data[index1 | index2 | index3] # 该规则是或
    
    print(data)
    
    data = data[['LOAD_TIME', 'FFP_DATE', 'LAST_TO_END', 'FLIGHT_COUNT', 'SEG_KM_SUM', 'avg_discount']] # 选取这六个属性
    data.columns = ['LOAD_TIME', 'FFP_DATE', 'LAST_TO_END', 'FLIGHT_COUNT', 'SEG_KM_SUM', 'AVG_DISCOUNT'] # 重命名列名
    print(data)
    
    data.to_csv(cleanfile)
    
    
    # 属性选择后的数据集
    
    
    

    属性选择后的数据集

     

    2.3数据变换

    数据变换是将数据转换成“适当的”格式,以适应挖掘任务及其算法的需要。,本案例中主要采取的数据变换方式为属性构造和数据标准化。

    由于原始数据中并没有直接给出LRFMC五个指标,需要通过原始数据提取这五个指标,具体的计算方式如下。

    1)L = LOAD_TIME - FFP_DATE

    会员入会时间距观测窗口结束的月数 = 观测窗口结束时间 - 入会时间

    2)  R = LAST_TO_END

    客户最近一次乘坐公司飞机距观测窗口结束的月数 = 最后一次乘机时间至观察窗口末端时长。

    3) F = FLIGHT_COUNT

    客户在观测窗口内乘坐公司飞机的次数 = 观测窗口的飞行次数

    4) M = SEG_KM_SUM

    客户在观测时间内在公司累计的飞行里程= 观测窗口的总飞行公里数 

    5) C = AVG_DISCOUNT 

    客户在观测时间内乘坐舱位所对应的折扣系数的平均值 = 平均折扣率

    五个指标的数据提取后,对每个指标数据分布进行分析,其数据的取值范围进行处理,需要进行标准化。标准差标准化处理的python代码为

    # 标准差标准化
    
    import pandas as pd
    
    datafile = '../Data/zscoredata.xls' # 需要进行标准化的数据文件
    zscorefile = '../Tmp/zscoreddata.xls' # 标准差化后的数据存储路径文件
    
    # 标准差化处理
    data = pd.read_excel(datafile)
    
    data = ((data - data.mean(axis = 0)) / (data.std(axis = 0))) # 实现了所有数据的标准差化 (axis = 0)为按列标准差化
    
    data.columns = ['Z'+i for i in data.columns] # 表头重命名
    
    print(data)
    
    data.to_excel(zscorefile, index= False) # 数据写入
    
    
    # result
        ZL        ZR        ZF        ZM        ZC
    0      1.689882  0.140299 -0.635788  0.068794 -0.337186
    1      1.689882 -0.322442  0.852453  0.843848 -0.553613
    2      1.681743 -0.487707 -0.210576  0.158569 -1.094680
    3      1.534185 -0.785184  0.002030  0.273091 -1.148787
    4      0.890167 -0.426559 -0.635788 -0.685170  1.231909
    ...         ...       ...       ...       ...       ...
    62039  0.590805 -0.938881  1.986351  2.694820 -0.499506
    62040  0.578774 -0.086114  0.072898  0.163414  0.366201
    62041  0.592928 -0.796753  0.710716  1.607265 -0.932360
    62042  0.575235 -0.211715 -0.423182 -0.187230 -0.661826
    62043  0.529234 -0.376980  0.143767  0.616752  0.041561

     

    3.模型构建

    客户价值分析模型构建主要是有两个部分组成,第一个部分根据航空公司客户五个指标的数据,对客户进行聚类分群。第二部分结合业务对每个客户进行特征分析,分析器客户价值,对每个客户群排名。

    3.1客户聚类

    采用K-Means聚类算法对客户数据进行客户分群,聚成五类

    # K-Means 聚类算法
    
    import pandas as pd
    from sklearn.cluster import KMeans # 导入K均值聚类算法
    
    inputfile = '../Tmp/zscoreddata.xls' # 待聚类的数据文件
    k = 5 # 聚类的个数
    
    # 读取数据进行聚类分析
    data = pd.read_excel(inputfile)
    
    # 调用K-Mean算法
    kmodel = KMeans(n_clusters= k, n_jobs= 4) # n_jobs 是并行数
    kmodel.fit(data) # 训练模型
    
    center = kmodel.cluster_centers_ # 查看聚类中心
    label = kmodel.labels_ # 查看各样本对应的类别
    print(center)
    print(label)
    
    

     

    3.2模型应用

    根据对每个客户群进行特征分析,采取以下的一些营销手段和策略,为航空公司的价值客户群管理提供参考。

    (1)会员升级与保级

    航空公司的会员分为很多类,其中非普通卡会员可以统称为航空公司的精英会员。成为精英会员一般都是要求在一定时间内内积累一定的飞行里程,达到这种要求后就会在有效期内成为精英会员,并享受相应的高级别服务。有效期快结束时,根据相关评价方法确定客户是否有资格继续作为精英会员,然后对该客户进行相应的升级或降级。

    然而,航空公司可以在对会员升级评价的时间点之前,对那些接近但尚未到要求的比较高消费客户进行适当提醒升值采取一些促销活动,刺激他们消费达到相应指标。这样既可以获得收益,同时也可以提高客户的满意度,增加了公司的精英会员。

    (2)首次兑换

    航空公司常用首次兑换或者免费升舱来吸引客户。也就是客户端里程或者航段积累到一定程度时才可以实现第一次兑换,这个标准会高于正常的里程兑换标准。但是很多公司的里程积累随着时间会进行一定的消减,这样会导致许多不了解情况的会员白白损失自己的里程,甚至总是难以实现首次兑换。同样,这样会引起客户的不满,可以采取的措施时从数据库中提取出接近但是尚未达到首次兑换标准的会员,对他们进行提醒或者促销,是他们通过消费达到标准。这样会提高客户的满意度。

    (3)交叉销售

    通过与银行发行联名卡等措施来提高客户的粘性,时客户在其他企业的消费过程中获得本公司的积分,增强与公司的联系,提高他们的忠诚度。

    客户识别和发展期为客户关系打下基石,但是这两个时期带来的客户关系时短暂的,不稳定的。企业要获取长期的利润,必须具有稳定的,高质量的客户。保持客户对于企业时至关重要的,不仅是因为争取一个新的客户的成本远远高于维持老客户的成本,更重要的时客户流失会造成公司收益的直接损失,因此,在这一时期,航空公司应该努力维护客户关系,使之处于较高的水准,最大化生命周期内公司与客户的互动价值。

     

    这个项目主要是分析了航空公司如何维持客户的关系,最大化客户关系,获取更高的收益。同时提升公司的业务水平,并进一步优化公司的管理模式。为成功上市做好前期工作。

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

    展开全文
  • 开题报告书——基于顾客价值客户关系管理分析.doc
  • 利用K-means算法对历年航空公司数据进行分析
  • 航空公司客户价值分析 项目背景 信息时代的到来注定营销焦点从产品中心转到了用户中心,客户关系管理成为企业的核心问题。 客户关系管理的关键问题则是客户分类,通过分类区分客户价值的有无和高低,针对不同...

    航空公司客户价值分析

    • 项目背景
      • 信息时代的到来注定营销焦点从产品中心转到了用户中心,客户关系管理成为企业的核心问题。
      • 客户关系管理的关键问题则是客户分类,通过分类区分客户价值的有无和高低,针对不同类别的用户制定个性化服务方案,采取不同营销方案,集中营销资源于高价值用户。
      • 对于航空公司而言,建立合理的客户价值评估模型,对客户进行分群,进行分价值处理是必要的。
    • 挖掘目标
      • 借助航空公司数据,进行客户分类。
      • 对不同客户类别进行特征分析,比较不同类别的客户价值。
      • 对不同价值的客户提供个性化服务,制定相应的营销策略。
    • 分析过程
      • 目标是用户价值识别,一般客户价值识别最广泛的模型是三个指标(最近消费时间间隔(Recency)、消费频率(Frequency)和消费金额(Monetary))来进行客户细分,识别高价值用户,这就是RFM模型。
      • 这里需要注意,显然使用消费金额是不合理的(一个长距离的普通舱用户和一个短距离的高级舱用户价值显然不一样)。所以采用累积里程M和乘坐舱位对应的折扣系数的平均值C两个指标代替消费金额。
      • 此外,这种会员制的公司一般入会时间也影响价值判断,所以引入客户关系长度L,作为另一指标。
      • 最终这个模型的指标5个分别是客户关系长度L、消费时间间隔R、消费频率F、飞行里程M、折扣系数平均数C。
    • 处理过程
      • 显然,得到了需要的处理指标了,我们就要进行分析,如果使用传统的RFM的属性分箱方法(依据平均值分析),可以识别,但是分类结果群太多,企业不可能花费这么多的针对性营销成本。
      • 所以很明显,这是一个聚类分析的案例,不妨使用K-Means聚类分析。
      • 数据获取
        • 数据给出。
      • 数据探索 - 主要目标发现缺失值和异常值(如票价为0,可能原因是兑换或者0折)
      • 数据预处理
        • 数据清洗
          • 显然,通过探索已经得知数据存在异常值、缺失值,但是原始数据量太大,这类异常数据占比太少,直接丢弃即可。
          • 属性规约
          • 显然,原始数据中的数据属性太多了,根据需求指标,删除不相干的或者弱相关或者冗余的属性列。
          • 数据变换
        • 属性构造
          • 构造出不存在的指标
          • L = LOAD_TIME - FFP_DATE
          • R = LAST_TO_END
          • F = FLIGHT_COUNT
          • M = SEG_KM_SUM
          • C = AVG_DISCOUNT
        • 数据标准化
          • 不同属性之间取值范围差距过大,理论上影响程度应该一致。
      • 数据挖掘建模
        • 聚类分群(根据5个指标)
        • 采用K-Means聚类分群
        • 特征分析每个群,进行群组排序(依据价值)
        • 不难看出,基本上每一类都有明显的优势和弱势特征,企业需要做的就是根据这些修改营销方案。
      • 后续处理
        • 根据用户特征区间,分策略进行营销。
    • 补充说明
      • 参考书《Python数据分析与挖掘》

    这里只列出建模代码,预处理代码可以查看我的github

    # -*- coding: UTF-8 -*-
    '''
    使用K-Means进行聚类
    '''
    import pandas as pd
    from sklearn.cluster import KMeans
    import numpy as np
    import matplotlib.pyplot as plt
    
    
    def leida(data, kmodel):
        '''
        画出雷达图
        :return:
        '''
        plt.rcParams['font.sans-serif'] = ['SimHei']
        plt.rcParams['axes.unicode_minus'] = False
        labels = data.columns
        print(labels)
        k = 5
        plot_data = kmodel.cluster_centers_
        color = ['b', 'g', 'r', 'c', 'y']
        angles = np.linspace(0, 2*np.pi, k, endpoint=False)
        plot_data = np.concatenate((plot_data, plot_data[:, [0]]), axis=1)
        angles = np.concatenate((angles, [angles[0]]))
        fig = plt.figure()
        # polar参数
        ax = fig.add_subplot(111, polar=True)
        for i in range(len(plot_data)):
            # 画线
            ax.plot(angles, plot_data[i], 'o-', color=color[i], label=u'客户群'+str(i), linewidth=2)
        ax.set_rgrids(np.arange(0.01, 3.5, 0.5), np.arange(-1, 2.5, 0.5), fontproperties="SimHei")
        ax.set_thetagrids(angles * 180/np.pi, labels, fontproperties="SimHei")
        plt.legend(loc=4)
        plt.show()
    
    
    if __name__ == '__main__':
        inputfile = './data/data_standard.csv'
        k = 5
        # 读取数据并进行聚类分析
        data = pd.read_csv(inputfile, encoding='utf-8')
        # 调用k-means算法,进行聚类分析
        # n_jobs是并行数,一般等于CPU数较好
        kmodel = KMeans(n_clusters=k, n_jobs=4)
        kmodel.fit(data)
        # 查看聚类中心
        kmodel.cluster_centers_
        # 查看各样本对应的类别
        kmodel.labels_
        leida(data, kmodel)
    

     

    展开全文
  • 研究核心刚性的本质及其量化分析问题.... 然后通过对核心能力价值与顾客价值之间的偏离程度的计算, 准确描述和分析核心刚性; 最后通过对核心刚性产 生原因的分析, 探讨避免和克服核心刚性的途径和方法.</p>
  • python数据分析-客户价值分析

    千次阅读 2018-03-09 20:07:11
    目标:企业针对不同价值客户制定个性化的服务,将有限的资源集中于高价值客户。 1、借助航空公司的数据进行客户分类 2、比较不同类客户价值并制定销策略 传统上识别客户价值模型是通过RFM模型: Recency: ...
  •   客户价值分析,顾名思义,即通过客户数据识别不同价值客户。识别客户价值应用最广泛的模型是RFM模型。 一、RFM模型   在RFM模型理论中,最近一次消费时间与截止时间间隔、消费频率、消费金额是测算客户价值...
  • 客户价值分析:RFM聚类分析原理

    千次阅读 2019-08-22 08:39:16
    根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了客户分类最好的指标: R-最近一次消费距当前的时长(Recency) F-消费频率(Frequency) M-消费金额(Monetary)...
  • python数据分析客户价值分析案例实战 数据集,相应文章地址为:https://blog.csdn.net/weixin_42000526/article/details/82014361
  • 利用Python分析航空公司客户价值

    千次阅读 多人点赞 2020-01-11 16:19:40
    利用Python分析航空公司客户价值 一、背景介绍 随着社会生活中数据量的急剧增多,如何从这些海量的数据中提取与发掘出对我们决策有用的信息成为当前亟待解决的题,因此,数据分析与挖掘技术在这些年得到了广泛的...
  • 电信客户价值分析

    千次阅读 2019-02-28 08:29:06
    文章目录一、电信运营商--客户价值分析二、使用聚类模型—分析项目需求三、聚类模型的原理和方法四、代码:4.1 数据感知4.2 数据预处理4.3 模型建立4.4 概率密度图 开发环境 jupyter notebook...
  • 本项目的目标是客户价值分析,即通过航空公司客户数据识别不同价值客户,识别客户价值应用最广泛的模型是RFM模型。 R(Recency)指的是最近一次消费时间与截止时间(采集数据)的间隔。 F(Frequency)指顾客在某...
  • 大数据分析技术-航空公司客户价值分析(一)
  • 通过客户分类,对客户群体进行细分,区分出低价值客户与高价值客户,对不同的客户群体开展不同的个性化服务,将有限的资源合理地分配给不同价值客户,从而实现效益(利润)最大化。本文将使用航空公司客户数据,...
  • 3航空公司客户价值分析

    千次阅读 2017-09-01 16:39:09
    3航空公司客户价值分析 目标 将客户进行分类分群,分析对比不同客户群体的客户价值,将营销资源集中于高价值客户,实现企业利润最大化。(通过航空公司的数据识别不同价值客户。) 3.1 数据的探索性分析 探索...
  • 听说你还在满世界找企业质量服务和顾客价值分析报告?在这里,为大家整理收录了最全、最好的企...该文档为企业质量服务和顾客价值分析报告,是一份很不错的参考资料,具有较高参考价值,感兴趣的可以下载看看
  • 统计分析法在电信客户价值分析中的应用.doc
  • 基于LRFMC+KMeans航空大数据客户价值分析 ** (客户是公司存在的意义根本,如何找出价值客户, 针对性提供更个性化的服务? 公司资源是有限的,如何把有限的资源用在高价值客户上?怎么才算有价值?产品面要大...
  • 引言 本篇文章是根据航空公司提供的乘客个人信息,通过建立合理的客户价值评估模型,对客户进行分群,比较分析不同客户群的特点和价值,来指定相应的营销策略,从而减少客户流失,挖掘出潜在客户,实现盈利。...
  • 价值流图是可以保证改进的活动是顾客真正需要的,我们可以按照价值流图析方法选择一个产品,绘制现状图,然后按照EVC多个层次来建模,再按照价值分析来找出价值点和更改项。我也只是最近才思考这个问题,所以希望...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 177,297
精华内容 70,918
关键字:

如何分析客户价值