精华内容
下载资源
问答
  • 数据挖掘课程,关联规则购物篮数据分析中的应用的课程设计文档。购物篮;关联规则;数据分析;挖掘算法。关联规则挖掘理论
  • 陈 虹模糊关联观则算法在数据挖掘中的血用 模糊关联规则算法在数据挖掘中的应用 陈 虹 (江苏广播 电视大学武进学院江苏 常州 215149) 摘 要简要地介绍 了数据挖掘技术的意义及概念通过对关联分析的经典算法-Apriorf...
  • 多维关联规则数据挖掘在税务数据分析中的研究与应用 摘要 关键词数据挖掘关联规则 ABSTRACT 目录 TOC \o "1-3" \h \z 第一章 绪论 6 1.1论文研究背景及意义 6 1.2国内外的研究现状 7 1.3 论文研究内容 9 1.4 论文的...
  • 针对目前煤矿安全监控系统对数据综合分析及处理能力欠缺、很多井下瓦斯异常情况无法自动识别问题,介绍了数据挖掘的概念、关联分析关联分析数据挖掘的核心算法Apriori算法和FPgrowth算法,随后结合煤矿特点设计了...
  • 关联规则分析及其空间数据挖掘中的应用研究,优秀硕士论文
  • 基于MapReduce的关联规则数据挖掘在电信网络运营分析中的应用.docx
  • 一、引言 CRM(客户关系管理)是指企业为了获取最大经济效益,运用现代科学技术对公司与客户之间关系进行有效管理新模式.它包括市场调查、产品销售、客户服务和管理决策等一系列商业流程。随着客户数量大量...

    一、引言

        CRM(客户关系管理)是指企业为了获取最大经济效益,运用现代科学技术对公司与客户之间的关系进行有效管理的新模式.它包括市场调查、产品销售、客户服 务和管理决策等一系列商业流程。随着客户数量的大量积累,客户信息的日益复杂,仅限于营销流程的管理已很难满足企业进一步发展的需要。另外,激烈竞争的市 场环境,迫使企业必须立足于客户的个性需求,提供相应的产品和服务,而客户的个性特征如何获取,是企业面临的难题之一。数据挖掘作为一种强有力的数据分析 工具.在分析型CRM中的关键作用已经显现.为企业进行全面深入和多维的客户分析提供了强有力的工具。数据挖掘技术在企业的客户关系管理中.可以应用到客 户群体分类分析、交叉销售、客户的维护、客户盈利能力分析和预沏!L客户满意度分析等;而关联分析是商业分析中应用最广泛的一种数据挖掘方法和模式。

    二、基于关联分析的数据挖掘

        关联分析是数据挖掘的一种主要形式,而且是无监督学习型系统中最普遍的知识发现形式。典型的关联分析体现在基于交易数据的购物篮分析中。关联分析能够发现 交易数据库中不同商品《项)之间的联系,如购买了某一商品对购买其他商品的影响。这种影响有时是正面的.有时是负面的,例如90%的顾客在一次购买活动中 购买商品A的同时购买商品旷.表明商品A与B是正相关的。这种规则可以表示为”A=>B”,表明顾客在购买商品A的条件下.购买B的概率。根据类似 规则可以对顾客的购买模式进行深入分析,发现对商业决策有价值的规则和知识。

        用于关联规则发现的主要对象是事务型数据库.其中针对的应用则是售货数据,也称货篮数据。一项事务一般由事务处理时间、一组客户购买的物品、客户标识号等 组成。由于条形码技术的发展,零售部门可以方便地收集存储大量的售货数据。对这些历史事务数据进行关联分析,则可对客户的购买行为提供极有价值的信息。例 如.可以帮助规划市场(怎样相互搭配销售)。从事务数据中发现关联规则.对于改进销售业绩等商业活动的决策是非常重要的。

    三、关联分析在企业CRM中的应用实例

        1.数据挖掘的主题

        某企业以销售打印机相关产品为主要业务,客户中有购买商品自用的最终客户,也有批发商。多年的业务使企业积累了一定量的销售数据。本次数据挖掘的主题就是 对这些数据展开关联分析,找到最有价值客户中的购买规律,从大量的交易数据中,获得这些大客户购买商品的种类和频率;通过关联规则,找出最受大客户欢迎的 商品:并根据大客户的喜好,采取相应措施维护客户关系,实现客户价值。

        2.数据的收集

        本次数据挖掘我们从该销售公司的原始销售表格中提取了以下数据作为我们数据挖掘的原数据(见表1)
        (1)客户名称:描述客户关系管理的对象;
        (2)单号、货品编码、数量、销售货款:描述每个客户所购买的货品、数量、每一笔交易中每一种货品的总价格;
        (3)销售收入、销售毛利:描述哪些商品盈利大,哪些商品最畅销;
        (4)开单日期:描述客户购买的频率;
        (5)品名规格、计量单位、单价:描述客户所购商品的基本信息。


        3.数据预处理

        采用关联规则的挖掘方法,需要先对数据进行预处理,就是对数据进行筛选,选出数据挖掘中需要的数据,并且对数据进行整理。首先以每个客户的半年交易总额为 参考,把交易总额低于10万的客户剔除。因这部分客户大都是零散购买商品的客户,公司购买商品量比较小,毛利率低,客户关系维护的价值不大。其次,把交易 总额高于10万的客户再进行一次筛选.剔除属于一次性购买大量的办公自动化用品的用户.这样留下的客户则是那些与公司有多次交易往来并且交易总额比较大的 客户,当然这些客户是公司主要的客户关系维护目标。

    [url]http://articles.e-works.net.cn/CRM/Article66958.htm[/url]

    数据经过筛选以后,在实现数据挖掘之前,还需要对数据进行二元处理。首先,把商品分为6大类,分别为“复印机”、“墨粉”、“硒鼓”、“复印纸”、“打印机”、“送纸器”。其次,判断大客户是否购买这些商品,并以二元数据加以表示。处理后的数据如表2所示。



        4.数据挖掘的实现

        本次数据挖掘选用Weka GUI Chooser工具。Weka GUI Chooser是基于Java的用于数据挖掘和知识分析的平台.集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理、分类、回归、聚类、 关联规则以及在新的交互式界面上的可视化。本文对企业销售数据的挖掘.只选用关联规则算法,调用Weka GUIChooser挖掘工具中的Associate Rules的模块,选定关联规则中的Apriori算法,将预处理好的数据转换为文本格式,导入Weka GUIChooser进行挖掘。

        挖掘后的结果显示为:
        Best rules found:
        (1)toner=yes printer=no 400==>manifdder=no paper=no 235 conf:(0.59)
        (2)manifdder=no automatic-document-feeder=no 566==>paper=no printer=no 332 conf:{0.59)
        (3)manifdder=no 620==>toner=yes printer=no 36 conf:(0.59)
        (4)toner=yes 41 0==>manifdder=no paper=no automaticdocument-feeder=no 240 conf:(0.59)
        (5)toner=no automatic-document-feeder=no 504==>manifdder=yes tambour-opc=no printer=no 294 conf:(0.58)
        (6)manifdder=no printer=no 530==>tambour-opt=no 309 conf:(0.58) ,
        (7)paper=no 672==>toner=no 390 conf:(0.58)
        (8)manifdder=no 620==>toner=yes printer=no automaticdocument-feeder=no 359 conf:(0.58)
        (9)toner=yes printer=no 400==>manifdder=no paper=no automatic-document-feeder=no 231 conf:(0.58)
        (10)paper=no 672==>manifdder=no automatic-documentfeeder=no 388 conf:(0.58)

        在所得结果中.有意义的关联规则主要有:

        1.if automatic—document-feeder=yes 1 77 then manifdder=yes 123 conf:(0.69)
        意义:如果客户购买复印机.那么同时买送纸器.置信度为0.69

        2、if manifdder=yes 218 then paper=yes 397 conf:(0.55)
        意义:如果客户购买复印机,那么同时复印纸.置信度为0.55

        3、if tambour-opc=yes 255 then toner=yes 133 conf:f0.52)
        意义:如果客户购买硒鼓.那么同时购买墨粉.置信度为0.52

    四、数据挖掘结果对企业CRM的作用

        1.深入了解重要客户的需求特征

        对重要客户的数据挖掘结果显示“if automatic-documentfeeder=yes 1 77 then manifdder=yes 1 23 conf:(O.69)”.即如果客户购买复印机.那么同时购买送纸器.其置信度为0.69。可以看出,凡是购买复印机类商品的客户,很大一部分都会购买 型号为MB-501的旁路送纸器。在企业销售的数据中也验证了这样的购买特征。由此可见.购买复印机类商品的代理商,都对型号为MB-501的旁路送纸器 有相当的需求量。

        2.根据客户需求周期

        做好重要客户的关系维护所有的客户都会存在客户生命周期(客户生命周期是指一个客户和一个企业之间不同的管理阶段,客户的生命周期包括未来潜在的客户、有 意向者、真正的客户和历史客户四个阶段)。对于公司经营者而言.客户处在生命周期的第三阶段的时间越长,就意味着公司所赚取的利润会越高。重要客户则是处 于客户生命周期的第三阶段,良好的客户关系维护是延长客户生命周期的重要手段。

        挖掘结果表明,在公司的各类客户中.代理型客户都属于公司的重要客户。其购买特征是定期大批量进货,有的是每一个月进一次货,有的是每两个月一次。在这些 客户的往来订单上会发现有很多的赠送品,其中办公耗材用品居多。客户之所以会选择这些商品,是由于现在大部分公司都需要使用打印机、复印机等办公自动化设 备,办公耗材用品(复印纸、墨粉、打印墨水等)的使用量自然就非常大了。

        3.关注潜在客户的需求

        数据挖掘结果关注的是公司重要客户购买规律,公司针对这些客户进行客户关系的维护固然十分重要,然而挖掘潜在的客户的需求同样很重要。公司所有的客户中, 除了代理型客户以外还有自用型客户,而自用型客户又可以分为新客户和老客户。老客户是属于重要客户的一部分,他们会以一定的周期购进一系列的商品,大部分 以耗材用品为主,因为这些客户本身已经有一定量的复印机或打印机之类的办公自动化设备。在使用这些设备的过程中会有很多的消耗,如打印纸、墨盒、钻粉等。 这些用品的消耗速度是一定的,因此到了一定的时间,他们就会发生购买行为。这样的客户一般情况下交易量会很大,而且是长久的定期客户。至于新客户,则是那 些新公司或新部门成立.需要为办公室准备一些必须的自动化设备.往往会先以购进大型的复印机或打印机为主,在使用一段时间之后,再根据实际情况购进耗材, 完善办公室设备的需求。这种购买的行为一般会持续2-3个月左右,他们会在这段时期内不断地发现自己的新需求,购买行为直到需求基本上被满足为止。由于这 些客户使用大量的办公设备,需要的耗材数量也很巨大,这些新客户就是公司潜在的大客户。公司可以利用一系列的方式维护与这些潜在客户之间的关系,这也为公 司降低了寻找新客户的成本,而这些客户成为重要客户的机率也会比其他客户高。

    五、结束语

        数据挖掘技术在以客户为中心的电子商务时代扮演越来越重要的角色,可以通过对企业销售数据的关联分析把企业的大量客户分成不同的类型.并发现不同类客户的需求特征.从而提供不同的产品和服务.维护好老客户,挖掘新客户.不断提高客户满意度。

      参考文献:
      [1]冀玉苓胡华赵远华:E商业时代基于数据挖掘的客户关系管理.文章编号:1009-8119(2006)04-0045-03
      [2]陈京民等编著:数据仓库与数据挖掘技术.北京:电子工业出版社,2006年1月第三次印刷版,P259,P79
      [3]迈克尔.J.A.贝里(Michael J.A.Berry),戈登.S.利诺夫(Gordon S.Linoff):数据挖掘--客户关系管理的科学与技术.袁卫等译,北京:中国财政经济出版社,2004年1月第1版,P7,P51
      [4]李冠乾许亮:CRM数据挖掘中关联规则的应用.昆明理工大学学报(理工版)Vol.29No.1

     

     

    《转自》数据挖掘学习交流论坛

    展开全文
  • 空间数据挖掘是从空间数据库中抽取隐含知识、空间关系及空间数据库中存储的其它信息的...在分析空间关联规则的基础上,用基于关联规则的逐步求精挖掘算法,得出空间数据库中的隐含知识,通过实例证明其方法的可行性。
  • 2014/2015第二学期 多元统计分析课程设计 R Apriori 设计题目基于 语言的 算法在挖掘商品交易数据中的应用 摘 要 Apriori 算法是一种挖掘关联规则的频繁项集算法广泛应用于商业领域与 R arules Apriori 网络安全领域...
  • 设计开发了一个简单的数据挖掘系统。该系统包括获取数据、数据预处理、关联规则挖掘和规则结果分析四个模块。通过对学生成绩数据挖掘,可以发现隐藏其中的关联规则,得出有实际价值规则及结论,从而为教学管理...
  • 本文简单介绍传统数据挖掘关联规则算法中的Apriori算法,以及挖掘中医医案辨证规律中的应用。并简单分析传统算法缺点,提出简要的改进思路。 文章目录一、关联规则简介二、Apriori算法简介三、Apriori步骤Step1 找...

    本文简单介绍传统数据挖掘关联规则算法中的Apriori算法,以及在挖掘中医医案辨证规律中的应用。并简单分析传统算法缺点,提出简要的改进思路。

    一、关联规则简介

    引入:“啤酒和尿布”
    通过对超市数据进行分析,发现hin多男性在买尿布的时候会买几瓶啤酒,因为年轻的爹给娃买尿布的时候也会顺带着给自己带瓶啤酒回去LOL。So,在超市调整货架后,明显的提升了超市啤酒尿布的销量。

    简单来说,关联规则就是用来找规律的。(不过数据量比较庞大,所以找规律时比较复杂)

    关联规则目的:从海量数据中找出事物之间存在的隐藏的关系
    形如X→Y的蕴涵式(若X,则Y)
    X:关联规则的先导
    Y:关联规则的后继

    二、Apriori算法简介

    Apriori这个单词啥意思呢?翻翻小字典,发现【adj. 先验的;推测的,adv. 自原因推及结果地】有这两层意思。
    所以,很好理解,他是关联规则的一种算法,是用来挖掘海量医案中潜在的隐性规律的。而且是那种肉眼看不出来的规律嘤嘤嘤。

    三、Apriori步骤

    核心步骤有两个。
    Step1:找频繁项集
    所有元素中共同出现概率较大的元素集合(很好理解,就是利用概率,找出共同出现很频繁的一组数据,以集合形式呈现)

    Step2:从频繁项集找出关联规则
    从频繁项集中找出规则X→Y,X和Y可能为单个元素,也可能为多个元素。(可以理解为:X出现的条件下,Y出现的可能性很大,找出这样若干组X、Y,计算即条件概率

    Step1 找频繁项集

    频繁项集是什么?是一个集合,集合里是共同出现概率偏大的一组数据。

    求解频繁项集时利用的评价指标为支持度Support(名字这么好听……说白了就是共现概率呗)
    Support(X,Y)=P(XY)

    这里有一个规定:
    如果一个项集是频繁项集,则它的所有子集都是频繁项集;如果一个集合不是频繁项集,则它的所有父集都不是频繁项集。(很容易理解叭)
    利用这样的思想即可进行下面的步骤。此处举例说明。

    已知有4条数据,和ABCDE五个元素,表格展示了每条数据中不同元素的分布情况。
    在这里插入图片描述
    目的是为了找到一个元素都出现很频繁的集合。先设定支持度即共现概率的阈值,若计算结果小于该值,则表示出现不频繁,自然频繁项集中就没有这些元素。
    设定支持度阈值为0.5。
    1、先从一元集合入手,共ABCDE五个数据,所以第一步得到{A}{B}{C}{D}{E}五个一元元素集合,计算每个集合中元素出现的概率,如{A}出现概率为2/4,以此类推。将小于0.5的集合舍去,即{D}。
    2、得到{A}{B}{C}{E}四个一元集合,进一步找二元集合,即将刚才的四个一元集合排列组合拼接,得到{AB}{AC}{AE}{BC}{BE}{CE},再次计算二元集合内部元素的支持度,如{AB}支持度为AB共同出现的概率1/4,小于0.5,舍去。同理,得到符合要求的二元集合。
    3、同理,增加集合元素数,元素数为3、4……时,计算出支持度……得到最后的结果,频繁项集为{BCE}
    在这里插入图片描述
    在这里插入图片描述

    Step2 找关联规则

    规则是什么?是一个蕴含式X->Y(若X即Y),且X、Y同属于一个集合,X、Y无交集。

    计算关联规则标准时利用的评价指标为置信度Confidence(名字依旧好听……其实就是条件概率)
    Confidence(X,Y)=P(Y|X)

    找关联规则时是通过频繁项集的子集得到的,{BCE}的子集有{B},{C},{E},{B,C},{B,E},{C,E},计算这些子集两两之间的置信度,将小于阈值的规则舍去。
    设定置信度阈值为0.5。
    如{B}->{C}即计算B出现的情况下C出现的概率,为2/3。同理,计算其他。最后得到下图符合条件的结果。
    在这里插入图片描述

    四、算法缺点

    实验数据为中医医案,实验目的为找中医辨证规律,即症状、病位、病性、症状两两之间的关系。
    数据为excel表格,每一行是一条医案,用Apriori明显有两个缺点。
    1、重复度太高。结果会有A->B,A->C,A->BC,显然前两个规则是重复的。当然这和阈值设定有关,如果阈值太低,重复度就会惊人的高!
    2、易过滤出现次数少但很重要的数据。比如实验时发现“证型”数据总是被筛除,支持度阈值小于0.04时,频繁项集中才出现证型。那阈值低了之后,能确保结果出现证型这类比较少的数据,可是其他数据很多重复的呀,这就很矛盾。
    3、规则前后项类别混杂。由于频繁项集里的元素会有不同证类型数据,而找规则时是利用频繁项集子集,所以不同证类别地位平等,就导致结果会有类似“症状,病位->病位,病性”这种,明显不符合要求。

    五、中医药数据挖掘的改进方法

    以“症状->病位”的规则为例。
    将原有症状数据和病位数据单独抽取出来,做两个0-1矩阵,每个矩阵行为医案索引,列为所有出现过的症状或病位。
    然后计算每一个症状到每一个病位的共现频率和条件概率,设定二者阈值,筛选出符合要求的二元规则,最后将重复以元素聚合。

    okk
    以上就是全部内容啦
    下期再会~

    展开全文
  • 可视化数据挖掘在中医流感症状分析中的应用,陆浩,朱婷,本文通过社会网络分析方法对流感中医症状进行可视化数据挖掘的初步探索。社会网络分析提供了实体关联分析的可视化分析和数值分析
  • 数据挖掘在高速公路收费数据中的应用,郑长江,沈金星,数据挖掘技术的发展为分析高速公路收费站海量统计资料提供了便利,通过对数据挖掘技术内容及其分类的简单介绍,运用关联规则并使
  • 客户流失管理应用数据挖掘技术主要思路是根据所拥有客户流失数据建立客户属性、服务属性和客户消费数据与客户流失可能性关联的数据模型,找出其中关系,并给出分析模型,从而计算客户流失可能性。
  • 针对动态关联规则挖掘中支持度向量和置信度向量变化趋势的分析和预测,提出一种改进的粒子群优化的灰色模型应用在动态关联规则挖掘中。由于灰色模型引入背景值后导致非平稳序列中的预测精度下降,因此有必要引入...
  • 因为最初这种关联分析主要是超市应用广泛,所以也称为“购物篮分析”。购物篮分析是商业领域最前沿、最具挑战性问题之一,也是许多企业研究重点问题。购物篮分析是通过发现顾客一次购买行为放入购物篮...
    关联规则挖掘应用-“购物篮分析”

    将单个客户一次购买商品的总和(以收银台结账为准)称为一个购物篮。那么购物篮分析就是针对商品的相关性进行分析。因为最初这种关联分析主要是在超市应用广泛,所以也称为“购物篮分析”。

    购物篮分析是商业领域最前沿、最具挑战性的问题之一,也是许多企业研究的重点问题。购物篮分析是通过发现顾客在一次购买行为中放入购物篮中不同商品之间的关联,研究客户的购买行为,从而辅助零售企业制定营销策略的一种数据分析方法。

    本章使用Apriori关联规则算法实现购物篮分析,发现超市不同商品之间的关联关系,并根据商品之间的关联规则制定销售策略。

    背景与挖掘目标

    现代商品种类繁多,顾客往往会由于需要购买的商品众多而变得疲于选择,且顾客并不会因为商品选择丰富而选择购买更多的商品。繁杂的选购过程往往会给顾客疲惫的购物体验。对于某些商品,顾客会选择同时购买,如面包与牛奶、薯片与可乐等,当面包与牛奶或者薯片与可乐分布在商场的两侧,且距离十分遥远时,顾客购买的欲望就会减少,在时间紧迫的情况下顾客甚至会放弃购买某些计划购买的商品。相反,把牛奶与面包摆放在相邻的位置,既给顾客提供便利,提升购物体验,又提高顾客购买的概率,达到了促销的目的。许多商场以打折方式作为主要促销手段,以更少的利润为代价获得更高的销量。打折往往会使顾客增加原计划购买商品的数量,对于原计划不打算购买且不必要的商品,打折的吸引力远远不足。而正确的商品摆放却能提醒顾客购买某些必需品,甚至吸引他们购买感兴趣的商品。

    因此,为了获得最大的销售利润,销售什么样的商品,采用什么样的促销策略,商品在货架上如何摆放,了解顾客的购买习惯和偏好对销售商尤其重要。通过对商场销售数据进行分析,从而得到顾客的购买行为特征,并根据发现的规律而采取有效的行动,制定商品摆放商品定价新商品采购计划,对商场增加销量并获取最大利润有重要意义。

    我们需要根据提供的数据实现以下目标。

    1) 构建零售商品的Apriori关联规则模型,分析商品之间的关联性。

    2) 根据模型结果给出销售策略。

    预告:

    数据挖掘十大经典算法之一关联规则挖掘的应用(二)-数据探索分析,将于本周五推送

    1e478b266efe0195d15becd9f883bb93.png

    展开全文
  • 数据挖掘的主要技术手段包括关联规则挖掘、分类分析、聚类分析、估计、预测、时序模式和偏差分析等。支持上述技术核心研究内容是相应的数据挖掘算法研究,包括贝叶斯算法、决策树、时序算法、聚类算法、关联算法、...
  • 针对目前煤矿隐患管理缺乏对隐患数据深入分析的问题,介绍了适合隐患关联规则发现的数据挖掘算法,提出用支持度-置信度-Kulczynski度量模式表达隐患因素间的关联关系。对隐患数据预处理、转换后构建隐患数据仓库,并...
  • 电商数据运营中,对于客户而言,有两个很重要的指标对于扩大销售规模是很重要的:第一,提高顾客重复购买次数;第二,提高客户订单中的Basket size(即购物篮件数)。而第二个指标提高Basket size,就是让客户从...
      在电商数据运营中,对于客户而言,有两个很重要的指标对于扩大销售规模是很重要的:第一,提高顾客重复购买次数;第二,提高客户订单中的Basket size(即购物篮件数)。而第二个指标提高Basket size,就是让客户从以前只购买一件产品的转换到现在购买多件产品,从而提高整个购物篮的销售金额,最大限度地实现销售增长。


          但是如何挑出那些产品之间有关联销售的机会,从而形成相应的组合优惠套装呢?去过零售商场的人都知道,经常看到不少组合的套装打包在一起优惠销售,对于P&G的产品组合,背后必然有相应的数据进行支撑,才敢推出相应的优惠组合套装;而对于本人书本的组合,有可能是当当网做了相应的分析,确认这三本书捆绑在一起能产生最大的销售机会,也有可能是出版社通过人为的数据协助当当推出这样的组合。但无论怎么样的决策,优惠组合套装都离不开数据支撑,而这背后的原理就是涉及到数据挖掘中的关联分析。说起关联分析,也许是太过于专业了,但连那些都不知道啥数据挖掘的最土鳖的那些土人都听说过啤酒与尿布的典型案例,啤酒与尿布就是关联分析的典型,让无数的人都对该规则津津乐道,但这个都已经成为过去了,现在数据增长及产品增长飞速,会出现越来越多啤酒与尿布的规则指导市场运营。结合本人的参与的电商数据挖掘、零售大商场的数据挖掘经验,分享一点我对关联分析的所谓经验,帮助他人或帮助自己不断提高。


          第一、关联分析具体能用来做什么呢?


          可以一句话来概括:最大限度地从你口袋里面掏出更多的钱买我的产品。


          1.通过关联规则,推出相应的促销礼包或优惠组合套装,快速帮助提高销售额。如前面所说的:飘柔洗发水+玉兰油沐浴露、海飞丝洗发水+舒肤佳沐浴露等促销礼包;还比如全家里面推出的牛奶+面包、豆奶+面包的早餐组合。


          2.零售超市或商场,可以通过产品关联程度大小,指导产品合理摆放,方便顾客最购买更多其所需要的产品。最常见的就是超市里面购买肉和购买蔬菜水果等货架会摆放得很近,目前就是很多人会同时购买肉与蔬菜,产品的合理摆放也是提高销售的一个关键。


          3.进行相关产品推荐或者挑选相应的关联产品进行精准营销。最常见的是你在亚马逊或京东购买产品的时候,旁边会出现购买该商品的人,有百分之多少还会购买如下的产品,快速帮助顾客找到其共同爱好的产品。物以类聚,人以群分。例如,穷人一般和穷人在一起,富人也喜欢和富人在一起。还有数据挖掘的人喜欢和数据挖掘的人打交道,都离不开这些鸟道理。


          4.寻找更多潜在的目标客户。例如:100人里面,购买A的有60人,购买B的有40人,同时购买A和B的有30人,说明A里面有一半的顾客会购买B,反推而言。如果推出类似B的产品,除了向产品B的用户推荐(因为新产品与B的功能效果比较类似)之外,还可以向A的客户进行推荐,这样就能最大限度地寻找更多的目标客户。


           注:以上的具体应用场景是目前本人知识范围内能想到的且都用在实际场景的。 


           第二、如何做好关联分析呢?


          1.必须进行大量的产品梳理工作,区分不同等级的层次关系,并且给相应的产品打上合适的标签。产品梳理是一项纯手工的并且需要耗费大量的人力及时间才能完成的。一般的企业,其产品不会很多,就比如P&G的产品或者其SKU数,也不过是几千个,但产品梳理的标准是很重要的。产品标准过于粗放,对于后期的关联分析意义不大;产品标准过于细化,如涉及到SKU的层面的话,关联分析出的规则也不一定很理想。所以选定好一个比较合理的产品梳理规范,对于关联分析的结果精准程度很重要。


          因为很多SKU一般只有产品名称及价格,对数据管理比较规范的企业会打上品牌标签,其他相应的信息都是需要进行手工梳理。具体的产品梳理示例如下:


           海飞丝男士去屑洗发水 活力酷爽型190ml 洗发去屑正品


           海飞丝丝源复活头皮净化洗发水530ml洗发正品


          如果对于大零售超市或商场,其SKU数一般都是几十万甚至上百万,产品梳理工作是一项很痛苦的工作,但如果要从数据角度进行产品运营,建议可以开展相应的产品梳理咨询项目,通过半年多的产品梳理,形成标准化的产品梳理流程及产品目录。过去的半年里,在对某商场的产品梳理时候,发现目前的产品体系还是漏洞百出,很多还是很不规范的。做好关联分析或数据运营,请从产品梳理工作开始。


          2.建议选取SAS EM模块里面的关联分析模块。合适的工具是做好关联分析的关键。个人使用过SPSS Clementine里面的关联分析模块,其实其对数据格式要求很严格,但不符合常规的数据库录入的基础源数据,操作也不算很简单。R语言里面的关联分析缺陷也不少,别看目前大吹特吹R语言在大数据上的应用有多广,前途有多光明,但我们只是从业务角度去挖掘商业机会,不懂那些Java等更高级的编程。其实发现还是SAS的EM模块比较好用,纯图形化操作。


          3.请深刻理解关联分析中的三度:置信度、支持度、提升度,同时不能忽略产品规模。如果规则的提升度很高,但其相关的置信度很小,说明其市场规模很小。市场经营必须同时考虑市场规模大小及精准程度大小的两个维度。如果该规则真的很精准,但其受众客户就只有几百个,对于销售额而言,一点都没有影响。而另外一条规则虽然提升度不是很高,但其受众客户涉及了几万人,对该部分客户进行营销,能够有效地扩大规模,大幅提高销售额。所以后期的营销规则选取也必须要切合实际的商业应用。


          第三、关联分析有哪些后遗症?


          1.注意购买产品赠送礼品的人为因素影响规则。有些挖掘师或分析师在做出关联分析后,看到了几条提升度及置信度都很高的规则,就兴奋不已地告诉客户:我觉得产品A和产品B有很大的关联性,从数字上看,捆绑销售肯定能够取得很好的销售效果。当拿到这样的结果的时候,客户很镇定地说:“你不知道我们在某月的时候,大量开展了购买产品A即可免费赠送产品B的活动么?”杯具,坑爹。对于这个时候的挖掘师是很悲催的。在筛选关联规则的时候,必须对该企业过去一年开展的活动有了解,还必须对不同时间段的主推产品进行提前沟通,确保关联规则不受人为因素影响。


          2.注意产品之间的位置摆放是否有很大的影响。在零售大商场中,产品摆放的位置对产品关联销售会产生很大的影响的,因为关联分析就是为了更方便地让顾客找到其需要的产品,购买更多其需要的产品。人流比较大的两个相隔货架之间的产品关联性比较大,在我们项目中会发现不少的这样规则。但其结果表明了货架关联性比较大,摆放在一起就肯定比较合理的。但在进行关联分析的时候,客户更希望能从其他不相隔的货架之间找出更好的关联销售机会,这决定了后期的关联规则挑选难题。


           3.注意关联推荐的规则合理性及流失成本的大小。后期的关联推荐应用于主要是三个方面:1、重购:继续购买原来的产品;2、升级:购买更高档次的产品;3、交叉销售:购买相关的产品。如果该规则的客户本来是买了50块钱的产品的,发现关联规则里面出现了推荐其购买30块的同类型产品,这等于给客户降档推荐了,会让销售额大幅减少,销售机会白白浪费并且造成了损失,所以在进行关联推荐的时候,那些涉及到了降档的规则一定要剔除。


          关联分析是一个很有用的数据挖掘模型,能够帮助企业做很多很有用的产品组合推荐、优惠促销组合,同时也能指导货架摆放是否合理,还能够找到更多的潜在客户,的确真正的把数据挖掘落到实处。

    更多精彩请关注微尚互动(vsapp.cn)和趣尚云(q.vsapp.cn)和微尚互动微信号(vsappcn)


    展开全文
  • 本文把图书馆借阅数据作为研究对象,采用适合于图书馆数据关联规则中的FP-growth算法,同时针对FP-growth算法实施了优化。依靠对图书馆业务数据挖掘分析,取得读者的兴趣及图书之间的关联等信息。
  • 基于数据挖掘和数据库技术,通过关联规则算法对系统瓦斯数据进行研究,建立了瓦斯浓度数据挖掘模型,对瓦斯浓度数据挖掘结果进行分析,进而对瓦斯安全进行预测。计算结果表明:瓦斯浓度是影响煤矿安全隐患最主要因素。...
  • 来自的关联规则挖掘犯罪分析的空间数据 抽象 该项目目的是检查与美利坚合众国北卡罗来纳州夏洛特市一年内犯罪空间分布有关的数据。 从大约60,000起犯罪收集了数据,以及地区人口普查数据和有关商业活动信息...
  • 电商数据运营中,对于客户而言,有两个很重要的指标对于扩大销售规模是很重要的:第一,提高顾客重复购买次数;第二,提高客户订单中的Basket size(即购物篮件数)。而第二个指标提高Basket size,就是让客户从以...
  • 针对高校科研项目量化与评价工作缺乏对量化数据进行理论分析的问题,提出了利用数据挖掘技术对高校科研项目量化数据进行挖掘分析应用AprioriTid算法获得了科研项目各项量化与评价指标之间的关联规则。该规则表明...
  • 数据挖掘的关联规则

    2012-05-21 18:05:20
    关联挖掘文献借阅历史数据分析中的应用,关于图书馆数据与数据挖掘的参考文献
  • 根据红酒与化学分子红酒中的分布进行聚类,并结合Apriori算法进行关联分析,最终找出气味与化学分子之间的关系,为设计一个能够通过测试化学分子识别食品气味的电子鼻打下基础。实验数据由法国南特大学Oniris气味...
  • 爱搜联合告诉您数据挖掘在广告中的应用,创业公司PeerSet新发布了一个广告数据工具,能够通过网页内容分析提供网络用户“心理”方面的特征。Peerset的技术能够有机地把用户的兴趣、价值观、生活方式、对品牌的态度...
  • 数据挖掘在各行业的应用论文

    热门讨论 2010-04-19 09:40:57
    中介粗集及其在数据挖掘中的应用.caj 数据挖掘在音高变化规律学习中的应用.caj 数据挖掘技术在财经领域的应用.caj 知识发现和数据挖掘的研究.caj 数据仓库与数据挖掘技术浅谈.caj 用户访问模式数据挖掘的模型与算法...
  • 关联分析(关联挖掘)是指交易数据、关系数据或其他信息载体,查找存在于项目集合或对象集合之间频繁模式、关联、相关性或因果结构。关联分析的一个典型例子是购物篮分析。通过发现顾客放入购物篮不同商品...
  • 针对煤矿企业未对安全信息进行深入挖掘问题,设计了煤矿安全信息管理系统,利用数据仓库和数据挖掘技术对井下实时安全信息进行深入分析,以关联规则为例对煤矿监测数据进行挖掘,分析挖掘结果表明安全参数之间存在紧密...

空空如也

空空如也

1 2 3 4 5 ... 19
收藏数 371
精华内容 148
关键字:

关联分析在数据挖掘中的应用