精华内容
下载资源
问答
  • 常用的数据分析方法有哪几个
    万次阅读
    2020-12-22 11:15:10

    常用的数据分析方法有5种。

    常用的5种数据分析方法有哪些?

     

    1.对比分析法

    常用的5种数据分析方法有哪些?

     

    对比分析法指通过指标的对比来反映事物数量上的变化,属于统计分析中常用的方法。常见的对比有横向对比和纵向对比。

    横向对比指的是不同事物在固定时间上的对比,例如,不同等级的用户在同一时间购买商品的价格对比,不同商品在同一时间的销量、利润率等的对比。

    纵向对比指的是同一事物在时间维度上的变化,例如,环比、同比和定基比,也就是本月销售额与上月销售额的对比,本年度1月份销售额与上一年度1月份销售额的对比,本年度每月销售额分别与上一年度平均销售额的对比等。

    利用对比分析法可以对数据规模大小、水平高低、速度快慢等做出有效的判断和评价。
     

    2.分组分析法

    分组分析法是指根据数据的性质、特征,按照一定的指标,将数据总体划分为不同的部分,分析其内部结构和相互关系,从而了解事物的发展规律。根据指标的性质,分组分析法分为属性指标分组和数量指标分组。所谓属性指标代表的是事物的性质、特征等,如姓名、性别、文化程度等,这些指标无法进行运算;而数据指标代表的数据能够进行运算,如人的年龄、工资收入等。分组分析法一般都和对比分析法结合使用。
     

    3.预测分析法

    预测分析法主要基于当前的数据,对未来的数据变化趋势进行判断和预测。预测分析一般分为两种:一种是基于时间序列的预测,例如,依据以往的销售业绩,预测未来3个月的销售额;另一种是回归类预测,即根据指标之间相互影响的因果关系进行预测,例如,根据用户网页浏览行为,预测用户可能购买的商品。
     

    4.漏斗分析法

    漏斗分析法也叫流程分析法,它的主要目的是专注于某个事件在重要环节上的转化率,在互联网行业的应用较普遍。比如,对于信用卡申请的流程,用户从浏览卡片信息,到填写信用卡资料、提交申请、银行审核与批卡,最后用户激活并使用信用卡,中间有很多重要的环节,每个环节的用户量都是越来越少的,从而形成一个漏斗。使用漏斗分析法,能使业务方关注各个环节的转化率,并加以监控和管理,当某个环节的转换率发生异常时,可以有针对性地优化流程,采取适当的措施来提升业务指标。
     

    5.AB测试分析法

    AB 测试分析法其实是一种对比分析法,但它侧重于对比A、B两组结构相似的样本,并基于样本指标值来分析各自的差异。例如,对于某个App的同一功能,设计了不同的样式风格和页面布局,将两种风格的页面随机分配给使用者,最后根据用户在该页面的浏览转化率来评估不同样式的优劣,了解用户的喜好,从而进一步优化产品。

    除此之外,要想做好数据分析,读者还需掌握一定的数学基础,例如,基本统计量的概念(均值、方差、众数、中位数等),分散性和变异性的度量指标(极差、四分位数、四分位距、百分位数等),数据分布(几何分布、二项分布等),以及概率论基础、统计抽样、置信区间和假设检验等内容,通过相关指标和概念的应用,让数据分析结果更具专业性。

    本文摘自《机器学习测试入门与实践》

    常用的5种数据分析方法有哪些?

     

    本书全面且系统地介绍了机器学习测试技术与质量体系建设,分为5部分,共15章。第一部分(第1~4章)涵盖了机器学习、Python编程、数据分析的基础知识;第二部分(第5~7章)介绍了大数据基础、大数据测试指南及相关工具实践;第三部分(第8~10章)讲解了机器学习测试基础、特征专项测试及模型算法评估测试;第四部分(第11~13章)介绍了模型评估平台实践、机器学习工程技术及机器学习的持续交付流程;第五部分(第14章和第15章)探讨了AI(Artificial Intelligence)在测试领域的实践及AI时代测试工程师的未来。

    本书能够帮助读者了解机器学习是如何工作的,了解机器学习的质量保障是如何进行的。工程开发人员和测试工程师通过阅读本书,可以系统化地了解大数据测试、特征测试及模型评估等知识;算法工程师通过阅读本书,可以学习模型评测的方法和拓宽模型工程实践的思路;技术专家和技术管理者通过阅读本书,可以了解机器学习质量保障与工程效能的建设方案。

    更多相关内容
  • 9种常用数据分析方法

    万次阅读 2020-08-17 11:09:23
    我们知道孤立的数据没有意义,对比才差异。比如在时间维度上的同比和环比、增长率、定基比,与竞争对手的对比、类别之间的对比、特征和属性对比等。对比法可以发现数据变化规律,使用频繁,经常和其他方法搭配...

    一、公式拆解

    所谓公式拆解法就是针对某个指标,用公式层层分解该指标的影响因素。
    举例:分析某产品的销售额较低的原因,用公式法分解

     

    图片.png

    二、对比分析

    对比法就是用两组或两组以上的数据进行比较,是最通用的方法。

    我们知道孤立的数据没有意义,有对比才有差异。比如在时间维度上的同比和环比、增长率、定基比,与竞争对手的对比、类别之间的对比、特征和属性对比等。对比法可以发现数据变化规律,使用频繁,经常和其他方法搭配使用。

    下图的AB公司销售额对比,虽然A公司销售额总体上涨且高于B公司,但是B公司的增速迅猛,高于A公司,即使后期增速下降了,最后的销售额还是赶超。

     

    图片.png

    三、A/Btest

    A/Btest,是将Web或App界面或流程的两个或多个版本,在同一时间维度,分别让类似访客群组来访问,收集各群组的用户体验数据和业务数据,最后分析评估出最好版本正式采用。A/Btest的流程如下:

    (1)现状分析并建立假设:分析业务数据,确定当前最关键的改进点,作出优化改进的假设,提出优化建议;比如说我们发现用户的转化率不高,我们假设是因为推广的着陆页面带来的转化率太低,下面就要想办法来进行改进了

    (2)设定目标,制定方案:设置主要目标,用来衡量各优化版本的优劣;设置辅助目标,用来评估优化版本对其他方面的影响。

    (3)设计与开发:制作2个或多个优化版本的设计原型并完成技术实现。

    (4)分配流量:确定每个线上测试版本的分流比例,初始阶段,优化方案的流量设置可以较小,根据情况逐渐增加流量。

    (5)采集并分析数据:收集实验数据,进行有效性和效果判断:统计显著性达到95%或以上并且维持一段时间,实验可以结束;如果在95%以下,则可能需要延长测试时间;如果很长时间统计显著性不能达到95%甚至90%,则需要决定是否中止试验。

    (6)最后:根据试验结果确定发布新版本、调整分流比例继续测试或者在试验效果未达成的情况下继续优化迭代方案重新开发上线试验。
    流程图如下:

     

    image.png

    四、象限分析

    通过对两种及以上维度的划分,运用坐标的方式表达出想要的价值。由价值直接转变为策略,从而进行一些落地的推动。象限法是一种策略驱动的思维,常与产品分析、市场分析、客户管理、商品管理等。比如,下图是一个广告点击的四象限分布,X轴从左到右表示从低到高,Y轴从下到上表示从低到高。

     

    image.png

     

    高点击率高转化的广告,说明人群相对精准,是一个高效率的广告。高点击率低转化的广告,说明点击进来的人大多被广告吸引了,转化低说明广告内容针对的人群和产品实际受众有些不符。高转化低点击的广告,说明广告内容针对的人群和产品实际受众符合程度较高,但需要优化广告内容,吸引更多人点击。低点击率低转化的广告,可以放弃了。还有经典的RFM模型,把客户按最近一次消费(Recency)、消费频率(Frequency)、消费金额 (Monetary)三个维度分成八个象限。

     

    image.png


    象限法的优势:
    (1)找到问题的共性原因

    通过象限分析法,将有相同特征的事件进行归因分析,总结其中的共性原因。例如上面广告的案例中,第一象限的事件可以提炼出有效的推广渠道与推广策略,第三和第四象限可以排除一些无效的推广渠道;

    (2)建立分组优化策略
    针对投放的象限分析法可以针对不同象限建立优化策略,例如RFM客户管理模型中按照象限将客户分为重点发展客户、重点保持客户、一般发展客户、一般保持客户等不同类型。给重点发展客户倾斜更多的资源,比如VIP服务、个性化服务、附加销售等。给潜力客户销售价值更高的产品,或一些优惠措施来吸引他们回归。

    五、帕累托分析

    帕累托法则,源于经典的二八法则。比如在个人财富上可以说世界上20%的人掌握着80%的财富。而在数据分析中,则可以理解为20%的数据产生了80%的效果需要围绕这20%的数据进行挖掘。往往在使用二八法则的时候和排名有关系,排在前20%的才算是有效数据。二八法是抓重点分析,适用于任何行业。找到重点,发现其特征,然后可以思考如何让其余的80%向这20%转化,提高效果。

    一般地,会用在产品分类上,去测量并构建ABC模型。比如某零售企业有500个SKU以及这些SKU对应的销售额,那么哪些SKU是重要的呢,这就是在业务运营中分清主次的问题。

    常见的做法是将产品SKU作为维度,并将对应的销售额作为基础度量指标,将这些销售额指标从大到小排列,并计算截止当前产品SKU的销售额累计合计占总销售额的百分比。

    百分比在 70%(含)以内,划分为 A 类。百分比在 70~90%(含)以内,划分为 B 类。百分比在 90~100%(含)以内,划分为 C 类。以上百分比也可以根据自己的实际情况调整。

    ABC分析模型,不光可以用来划分产品和销售额,还可以划分客户及客户交易额等。比如给企业贡献80%利润的客户是哪些,占比多少。假设有20%,那么在资源有限的情况下,就知道要重点维护这20%类客户。

    image.png

    六、漏斗分析

    漏斗法即是漏斗图,有点像倒金字塔,是一个流程化的思考方式,常用于像新用户的开发、购物转化率这些有变化和一定流程的分析中。

     

    image.png

    上图是经典的营销漏斗,形象展示了从获取用户到最终转化成购买这整个流程中的一个个子环节。相邻环节的转化率则就是指用数据指标来量化每一个步骤的表现。所以整个漏斗模型就是先将整个购买流程拆分成一个个步骤,然后用转化率来衡量每一个步骤的表现,最后通过异常的数据指标找出有问题的环节,从而解决问题,优化该步骤,最终达到提升整体购买转化率的目的。

    整体漏斗模型的核心思想其实可以归为分解和量化。比如分析电商的转化,我们要做的就是监控每个层级上的用户转化,寻找每个层级的可优化点。对于没有按照流程操作的用户,专门绘制他们的转化模型,缩短路径提升用户体验。

    还有经典的黑客增长模型,AARRR模型,指Acquisition、Activation、Retention、Revenue、Referral,即用户获取、用户激活、用户留存、用户收益以及用户传播。这是产品运营中比较常见的一个模型,结合产品本身的特点以及产品的生命周期位置,来关注不同的数据指标,最终制定不同的运营策略。

    从下面这幅AARRR模型图中,能够比较明显的看出来整个用户的生命周期是呈现逐渐递减趋势的。通过拆解和量化整个用户生命周期各环节,可以进行数据的横向和纵向对比,从而发现对应的问题,最终进行不断的优化迭代。

     

    image.png

    七、路径分析

    用户路径分析追踪用户从某个开始事件直到结束事件的行为路径,即对用户流向进行监测,可以用来衡量网站优化的效果或营销推广的效果,以及了解用户行为偏好,其最终目的是达成业务目标,引导用户更高效地完成产品的最优路径,最终促使用户付费。如何进行用户行为路径分析?

    (1)计算用户使用网站或APP时的每个第一步,然后依次计算每一步的流向和转化,通过数据,真实地再现用户从打开APP到离开的整个过程。
    (2)查看用户在使用产品时的路径分布情况。例如:在访问了某个电商产品首页的用户后,有多大比例的用户进行了搜索,有多大比例的用户访问了分类页,有多大比例的用户直接访问的商品详情页。
    (3)进行路径优化分析。例如:哪条路径是用户最多访问的;走到哪一步时,用户最容易流失。
    (4)通过路径识别用户行为特征。例如:分析用户是用完即走的目标导向型,还是无目的浏览型。
    (5)对用户进行细分。通常按照APP的使用目的来对用户进行分类。如汽车APP的用户可以细分为关注型、意向型、购买型用户,并对每类用户进行不同访问任务的路径分析,比如意向型的用户,他进行不同车型的比较都有哪些路径,存在什么问题。还有一种方法是利用算法,基于用户所有访问路径进行聚类分析,依据访问路径的相似性对用户进行分类,再对每类用户进行分析。

    以电商为例,买家从登录网站/APP到支付成功要经过首页浏览、搜索商品、加入购物车、提交订单、支付订单等过程。而在用户真实的选购过程是一个交缠反复的过程,例如提交订单后,用户可能会返回首页继续搜索商品,也可能去取消订单,每一个路径背后都有不同的动机。与其他分析模型配合进行深入分析后,能为找到快速用户动机,从而引领用户走向最优路径或者期望中的路径。
    用户行为路径图示例:

     

    image.png

    八、留存分析

    用户留存指的是新会员/用户在经过一定时间之后,仍然具有访问、登录、使用或转化等特定属性和行为,留存用户占当时新用户的比例就是留存率。留存率按照不同的周期分为三类,以登录行为认定的留存为例:
    第一种 日留存,日留存又可以细分为以下几种:
    (1)次日留存率:(当天新增的用户中,第2天还登录的用户数)/第一天新增总用户数
    (2)第3日留存率:(第一天新增用户中,第3天还有登录的用户数)/第一天新增总用户数
    (3)第7日留存率:(第一天新增用户中,第7天还有登录的用户数)/第一天新增总用户数
    (4)第14日留存率:(第一天新增用户中,第14天还有登录的用户数)/第一天新增总用户数
    (5)第30日留存率:(第一天新增用户中,第30天还有登录的用户数)/第一天新增总用户数

    第二种 周留存,以周度为单位的留存率,指的是每个周相对于第一个周的新增用户中,仍然还有登录的用户数。

    第三种 月留存,以月度为单位的留存率,指的是每个月相对于第一个周的新增用户中,仍然还有登录的用户数。留存率是针对新用户的,其结果是一个矩阵式半面报告(只有一半有数据),每个数据记录行是日期、列为对应的不同时间周期下的留存率。正常情况下,留存率会随着时间周期的推移而逐渐降低。下面以月留存为例生成的月用户留存曲线:

     

    image.png

    九、聚类分析

    聚类分析属于探索性的数据分析方法。通常,我们利用聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的。聚类结果要求组内对象相似性较高,组间对象相似性较低。在用户研究中,很多问题可以借助聚类分析来解决,比如,网站的信息分类问题、网页的点击行为关联性问题以及用户分类问题等等。其中,用户分类是最常见的情况。

    常见的聚类方法有不少,比如K均值(K-Means),谱聚类(Spectral Clustering),层次聚类(Hierarchical Clustering)。以最为常见的K-means为例,如下图:

    image.png

    可以看到,数据可以被分到红蓝绿三个不同的簇(cluster)中,每个簇应有其特有的性质。显然,聚类分析是一种无监督学习,是在缺乏标签的前提下的一种分类模型。当我们对数据进行聚类后并得到簇后,一般会单独对每个簇进行深入分析,从而得到更加细致的结果。



    作者:数据蝉
    链接:https://www.jianshu.com/p/d27563e492a0
    来源:简书
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    展开全文
  • 精心整理了7种常用数据分析方法(建议收藏)

    万次阅读 多人点赞 2019-11-08 08:30:00
    一位朋友最近吐槽,他...今天DataHunter数猎哥就来给大家分享7种最常用数据分析方法,让你轻松运用数据分析解决实际工作问题,提升核心竞争力。一、漏斗分析法漏斗分析法能够科学反映用户行为状态,以及从起点...
    640?wx_fmt=jpeg

    有一位朋友最近吐槽,他提交了一份7月数据分析报告给领导,报告里面放了很多图表,也摆了很多数据,结果被痛批了一顿,觉得很委屈。其实,这位朋友与很多小伙伴一样,做数据分析时,拿着手里的数据不知道怎么分析、从什么维度分析。

    640?wx_fmt=jpeg

    今天DataHunter数猎哥就来给大家分享7种最常用的数据分析方法,让你轻松运用数据分析解决实际工作问题,提升核心竞争力。


    一、漏斗分析法

    漏斗分析法能够科学反映用户行为状态,以及从起点到终点各阶段用户转化率情况,是一种重要的分析模型。漏斗分析模型已经广泛应用于网站和APP的用户行为分析中,例如流量监控、CRM系统、SEO优化、产品营销和销售等日常数据运营与数据分析工作中。

    640?wx_fmt=png
    例如:Data Analytics为网站制作的“促销活动分析” 

    比如,对一些电商产品来说,最终目的是让用户下单并支付,但转化率取决于整个流程。这时,我们就可以通过漏斗模型一步一步地进行监测。如下图所示,我们可以监控用户在流程中各个层级上的行为路径,寻找每个层级的可优化点。对没有按照流程操作的用户绘制他们的转化路径,找到可提升用户体验,缩短路径的空间,最终提升整体转化率。

    640?wx_fmt=png
    漏斗模型除了在电商中应用的比较多以外,在落地页、H5等也应用的比较多。我们可以反复优化落地页当中的图片、文案、布局,进一步的提高整体转化率。


    二、留存分析法

    640?wx_fmt=png
    留存分析法是一种用来分析用户参与情况和活跃程度的分析模型,考察进行初始行为的用户中,有多少人会进行后续行为。从用户的角度来说,留存率越高就说明这个产品对用户的核心需求也把握的越好,转化成产品的活跃用户也会更多,最终能帮助公司更好的盈利。

    这里需要注意的是,在做留存分析之前,我们首先需要了解用户留存的特点:

    640?wx_fmt=png
    比如,我们可以通过观察不同时间段用户留存的情况,通过对比各个渠道、活动、关键行为的用户后续留存变化,发现提升用户留存率的影响因素,例如观察领取过优惠券的用户留存率是否比没有领取优惠券的用户留存率更高。

    除此以外,还可以针对流失高/留存高的用户群组进行一对一的用户行为分析,统计留存/流失用户的行为特征,特别是针对流失用户,通过流失用户的行为分析总结流失原因,从而提升留存率。具体步骤如下图所示:

    640?wx_fmt=png
    三、分组分析法

    分组分析法是根据数据分析对象的特征,按照一定的标志(指标),把数据分析对象划分为不同的部分和类型来进行研究,以揭示其内在的联系和规律性。

    分组的目的就是为了便于对比,把总体中具有不同性质的对象区分开,把性质相同的对象合并在一起,保持各组内对象属性的一致性、组与组之间属性的差异性,以便进一步运用各种数据分析方法来揭示内在的数量关系,因此分组法必须与对比法结合运用。

    640?wx_fmt=png
    如图所示,分组分析在日常工作中应用的比较多的是用户分层与分群,比如在发优惠券的时候,可以通过红包,满减,限时券还有积分券等方式。我们可以针对不同的用户发送不同的优惠券以达到精细化运营的效果。那么当我们在做数据分析时,也可以从结果将用户进行分层来进行判断,这时同样也可以得到优化和改进业务的建议。

    640?wx_fmt=png
    说了完用户分层,接下来我们说说用户分群。用户分群和用户分层其实是相关联的,用户分群是对用户分层的补充,当用户差异性较大,层级上不能再做用户细分时,可以考虑将同一个分层内的群体继续切分,满足更高的精细化运营需要。

    640?wx_fmt=png
    例如:Data Analytics制作的“客户RFM群体分析” 

    RFM模型是客户管理中的一个经典方法,它用以衡量消费用户的价值和创利能力,是一个典型的用户分群。它依托收费的三个核心指标:最近一次消费时间(Recency)、消费频率(Frequency)和消费金额(Monetary)。

    640?wx_fmt=png

    消费金额Monetary:衡量用户对企业利润的贡献,消费金额越高的用户,价值也就越高。

    消费频率Frequency:衡量用户的忠诚度,是用户在限定的期间内购买的次数,最常购买的用户,忠诚度也越高。

    最近一次消费时间Recency:衡量用户的流失,消费时间越接近当前的用户,越容易维系与其的关系。1年前消费的用户价值肯定不如一个月才消费的用户。


    四、矩阵分析法

    矩阵分析法是指根据事物(如产品、服务等)的两个重要属性(指标)作为分析的依据,进行分类关联分析,找出解决问题的一种分析方法,也称为矩阵关联分析法,简称矩阵分析法。

    640?wx_fmt=png
    矩阵关联分析法在解决问题和资源分配时,可以为决策者提供重要参考依据——先解决主要矛盾,再解决次要矛盾,这样有利于提高工作效率,并将资源分配到最能产生绩效的部门、工作中,最终有利于决策者进行资源优化配置。

    640?wx_fmt=png
    比如在电商行业,我们可以使用浏览量和加购数这两个维度来进行矩阵分析,如图所示,左上角的是浏览量低的,然后加购次数多的,这说明产品其实是有很大潜力的,这时需要将这部分产品放在更好的位置让给用户进行浏览;右下角的浏览量高,但加购数低的,说明这个时候他的资源位置是好的,但是用户对这部分的产品并不感兴趣的,我们就需要对其进行相应的位置调整。


    五、关联分析法

    关联分析法是一种简单、实用的分析技术,是指从大量数据集中发现项集之间的关联性或相关性。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联等。
    640?wx_fmt=png

    关联分析的一个典型例子是购物篮分析。该过程通过发现顾客放入其购物篮中的不同商品之间的联系,分析顾客的购买习惯。通过了解哪些商品频繁地被顾客同时购买,帮助零售商制定营销策略。其他的应用还包括价目表设计、商品促销、商品的排放和基于购买模式的顾客划分。 

    可从数据库中关联分析出形如"由于某些事件的发生而引起另外一些事件的发生"之类的规则。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的“啤酒和尿布”的货架摆放或捆绑销售可提高超市的服务质量和效益。


    六、指标分析法

    在实际工作中,当拿到一些可视化数据图表或者是Excel表格时,我们可以直接运用统计学中的一些基础指标来做数据分析,比如平均数、众数、中位数、最大值、最小值等,下面我们分别来介绍:

    1.平均数

    平均数、也叫平均分析法,是指运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平的分析方法。平均分析法常用指标有算术平均数、调和平均数、几何平均数、众数和中位数等,其中最为常见的是算术平均数,也就是日常所说的平均数或平均值。

    640?wx_fmt=png

    平均数指标可用于对比同类现象在不同地区、不同行业、不同单位等之间的差异程度,比用总量指标对比更具说服力。除此以外,利用平均指标对比某些现象在不同历史时期的变化,也更能说明其发现趋势和规律。

    比如,汽车行业的自媒体如果想要分析数据,可从两个方面来分析:①外部:行业内整体公众号的平均打开率是多少,我们距离行业平均水平相差多少,该如何去做一些优化;②内部:针对每个月都在尝试的各种选题和内容运营策略,可以分析本月比上月平均打开率又增加了多少,这个月的选题是否有一些爆款,爆款文章平均打开率是多少,标题有什么特点等等。

    2.众数、中位数

    众数也就是数据中的一种代表数,它反应的是数据的一种集中程度。比如说最佳,最受欢迎,最满意都与众数有关。众数本质上来说,反映的是数据中发生频率最高的一些数据指标,在做数据分析时,我们可以对这些数据指标提取一些共性的特点,然后进行提炼和总结,然后得出一些改进的意见。

    中位数主要是反映的是一组数据的集中趋势,像我们比较常见的正态分布,比如说我们想去统计某市的人均收入,其实,大部分的人均收入都是在一定范围之内的,只有少部分是处于最低的和最高的,其实这是中位数带来的意义。

    640?wx_fmt=png

    在做数据分析时,如果各个数据之间的差异程度较小,用平均值就有较好的代表性;而如果数据之间的差异程度较大,特别是有个别的极端值的情况,用中位数或众数有较好的代表性。

    3.最大(小)值

    最大(小)值在平时做数据分析工作时比较常见,只是我们没有特别去注意。最值是作为典型代表和异常值进行分析的,比如说销售团队里的销售冠军,电商爆款商品等,如图所示,我们可以将销售额最大的几款商品提出来,然后我们去总结共性,找到原因,然后复制到其他的商品,最终提高平均转化率。

    640?wx_fmt=png


    七、对比分析法

    对比分析法是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性。它可以非常直观地看出事物某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是多少?对比分析法可分为静态比较和动态比较两类。

    640?wx_fmt=png

    静态比较:在同一时间条件下对不同总体指标的比较,如不同部门、不同地区、不同国家的比较、也叫横向比较,简称横比;

    动态比较:在同一总体条件下对不同时期指标数值的比较,也叫纵向比较,简称纵比。

    这两种方法既可单独使用,也可结合使用。

    进行对比分析时,可以单独使用总量指标、相对指标或平均指标,也可将它们结合起来进行对比。比较的结果可用相对数表示,如百分数、倍数等指标。

    在使用对比分析法时,需要先注意以下几个方面:①指标的口径范围、计算方法、计量单位必须一致,即要用同一种单位或标准去衡量;②对比的对象要有可比性;③对比的指标类型必须一致。无论绝对数指标、相对数指标、平均数指标,还是其他不同类型的指标,在进行对比时,双方必须统一。

    1.时间维度对比

    同一指标在不同时间维度下的对比,如同比、环比、定基比等。同比就是与去年的同一个时间段进行对比分析,可以是季、月、周、天;环比就是和上一个时间段来对比(也有和下一个时间段对比的,也叫后比),例如本月和上月,本周和上周对比;定基比是和某个指定的时期进行对比分析,比如2013年每个月都和2013年1月的销售额进行对比取值。

    如图为各月销售额对比,时间范围一致(均为月汇总)、指标一致、指标含义一致、其表现的为整个企业信息,总体性质可比。

    640?wx_fmt=png

    2.空间对比

    就是不同空间数据的对比,比如华北区和华南区对比,北京和上海,上海古北店和成都春熙路店进行对比。相似空间的对比对象必须是形态上比较接近,先进空间则是和同一种形态中的优秀空间进行对比,与扩大空间的对比,比如北京和全国的数据对比,北京王府井店和全北京的数据对比,和竞争对手的对比也在此列。

    如图为2018年全年各销售小组销售额对比,其对比的时间范围一致、指标一致、指标含义一致、维度为各个销售小组,具有相同性质。

    640?wx_fmt=png

    3.计划对比

    和计划标准的对比是销售追踪中非常重要的一环,所有的绩效考核都是计划标准,例如销售实际达成金额与销售计划达成金额对比,看销售是否完成当初指定的计划,如果没有完成,原因在哪里。

    640?wx_fmt=png

    4.与经验值或理论值对比

    其中的经验标准是在大量的实践过程中总结出来的值,而理论标准则是根据理论推断出来的值,平均值则是某一空间或时间的平均值。如,一单一品率:所有销售小票中只有一个商品的小票数量占比。参考值为小于40%,如果数据超过了40%,则需要考虑如何调整策略,帮助客户做关联购买。而参考值小于40%,就是一个理论值。
    640?wx_fmt=png

    以上就是7种常见的数据分析方法,在不同领域的工作中,它们通常都是以不同的形式展现出来的,我们需要在拥有数据面前,清晰知道应用哪一个或几个方法来分析实际问题最为有效,结合场景灵活运用,没有最好的分析方法只有最适合的。

    --end--

    推荐阅读:
    展开全文
  • 16种常用数据分析方法-聚类分析

    千次阅读 2021-11-25 14:02:34
    聚类分析是根据在数据中发现的描述对象及其关系的信息,将数据对象分组。目的是,组内的对象相互之间是相似的(相关的),而不同组中的对象是不同的(不相关的)。组内相似性越大,组间差距越大,说明聚类效果越好。...

     

    聚类(Clustering)就是一种寻找数据之间内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似组被称作簇。处于相同簇中的数据实例彼此相同,处于不同簇中的实例彼此不同。

    聚类分析定义

    聚类分析是根据在数据中发现的描述对象及其关系的信息,将数据对象分组。目的是,组内的对象相互之间是相似的(相关的),而不同组中的对象是不同的(不相关的)。组内相似性越大,组间差距越大,说明聚类效果越好。

    聚类效果的好坏依赖于两个因素:1.衡量距离的方法(distance measurement) 2.聚类算法(algorithm)

     


     

    聚类分析常见算法

    • K-Means

    K-均值聚类也称为快速聚类法,在最小化误差函数的基础上将数据划分为预定的类数K。该算法原理简单并便于处理大量数据。

    • K-中心点

    K-均值算法对孤立点的敏感性,K-中心点算法不采用簇中对象的平均值作为簇中心,而选用簇中离平均值最近的对象作为簇中心。

    • 系统聚类

    也称为层次聚类,分类的单位由高到低呈树形结构,且所处的位置越低,其所包含的对象就越少,但这些对象间的共同特征越多。该聚类方法只适合在小数据量的时候使用,数据量大的时候速度会非常慢。


     

    案例

    有20种12盎司啤酒成分和价格的数据,变量包括啤酒名称、热量、钠含量、酒精含量、价格。

    问题一:选择那些变量进行聚类?——采用“R型聚类”

    现在我们有4个变量用来对啤酒分类,是否有必要将4个变量都纳入作为分类变量呢?热量、钠含量、酒精含量这3个指标是要通过化验员的辛苦努力来测定,而且还有花费不少成本。

    所以,有必要对4个变量进行降维处理,这里采用spss R型聚类(变量聚类),对4个变量进行降维处理。输出“相似性矩阵”有助于我们理解降维的过程。

    4个分类变量各自不同,这一次我们先用相似性来测度,度量标准选用pearson系数,聚类方法选最远元素,此时,涉及到相关,4个变量可不用标准化处理,将来的相似性矩阵里的数字为相关系数。若果有某两个变量的相关系数接近1或-1,说明两个变量可互相替代。

    只输出“树状图”就可以了,从proximity matrix表中可以看出热量和酒精含量两个变量相关系数0.903,最大,二者选其一即可,没有必要都作为聚类变量,导致成本增加。

    至于热量和酒精含量选择哪一个作为典型指标来代替原来的两个变量,可以根据专业知识或测定的难易程度决定。(与因子分析不同,是完全踢掉其中一个变量以达到降维的目的。)这里选用酒精含量,至此,确定出用于聚类的变量为:酒精含量,钠含量,价格。

            

    问题二:20中啤酒能分为几类?——采用“Q型聚类”

    现在开始对20中啤酒进行聚类。开始不确定应该分为几类,暂时用一个3-5类范围来试探。Q型聚类要求量纲相同,所以我们需要对数据标准化,这一回用欧式距离平方进行测度。

    主要通过树状图和冰柱图来理解类别。最终是分为4类还是3类,这是个复杂的过程,需要专业知识和最初的目的来识别。

    这里试着确定分为4类。选择“保存”,则在数据区域内会自动生成聚类结果。

    问题三:用于聚类的变量对聚类过程、结果又贡献么,有用么?——采用“单因素方差分析”

    聚类分析除了对类别的确定需讨论外,还有一个比较关键的问题就是分类变量到底对聚类有没有作用有没有贡献,如果有个别变量对分类没有作用的话,应该剔除。

    这个过程一般用单因素方差分析来判断。注意此时,因子变量选择聚为4类的结果,而将三个聚类变量作为因变量处理。方差分析结果显示,三个聚类变量sig值均极显著,我们用于分类的3个变量对分类有作用,可以使用,作为聚类变量是比较合理的。

     

    问题四:聚类结果的解释?——采用”均值比较描述统计“

    聚类分析最后一步,也是最为困难的就是对分出的各类进行定义解释,描述各类的特征,即各类别特征描述。这需要专业知识作为基础并结合分析目的才能得出。

    我们可以采用spss的means均值比较过程,或者excel的透视表功能对各类的各个指标进行描述。其中,report报表用于描述聚类结果。对各类指标的比较来初步定义类别,主要根据专业知识来判定。这里到此为止。

    以上过程涉及到spss层次聚类中的Q型聚类和R型聚类,单因素方差分析,means过程等,是一个很不错的多种分析方法联合使用的案例。


     

    聚类分析的应用

    • 商业上

    聚类分析是细分市场的有效工具,被用来发现不同的客户群,并且它通过对不同的客户群的特征的刻画,被用于研究消费者行为,寻找新的潜在市场。

    • 生物上

    聚类分析被用来对动植物和基因进行分类,以获取对种群固有结构的认识。

    • 保险行业上

    聚类分析可以通过平均消费来鉴定汽车保险单持有者的分组,同时可以根据住宅类型、价值、地理位置来鉴定城市的房产分组。

    • 互联网应用上

    聚类分析被用来在网上进行文档归类。

    • 电子商务上

    聚类分析通过分组聚类出具有相似浏览行为的客户,并分析客户的共同特征,从而帮助电子商务企业了解自己的客户,向客户提供更合适的服务。

    展开全文
  • 10种常用数据分析方法

    万次阅读 2018-12-07 16:15:57
    道家强调四字,叫“道、法、术、器”。   层次区别:   “器”是指物品或工具,在数据分析...“法”是指选择的方法句话说“选择比努力重要”;   “道”是指方向,是指导思想,是战略。   在数...
  • 数据分析的三个常用方法是什么?

    千次阅读 2019-03-11 17:30:34
    产品,如果你不能衡量它,你就不能了解它,自然而然,你就无法改进它。数据说到底,就是这样一工具——通过...本文主要讨论一些数据分析的三个常用方法: 1. 数据趋势分析 趋势分析一般而言,适用于产品核...
  • 16种常用数据分析方法-相关分析

    万次阅读 2020-05-26 21:13:17
    相关分析是一种简单易行的测量定量数据之间的关系情况的分析方法。可以分析包括变量间的关系情况以及关系强弱程度等。 如:身高和体重的相关性;降水量与河流水位的相关性;工作压力与心理健康的相关性等。 ...
  • 作者:阿平@zhihu来源:知乎一、描述统计描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描...
  • 产品,如果你不能衡量它,你就不能了解它,自然而然,你就无法改进它。数据说到底,就是这样工具...本期主要讨论些数据分析的三个常用方法: 数据趋势分析 数据对比分析 数据细分分析 1.数据趋势分析 趋势分析...
  • 数据分析方法论(6种方法,8思路)

    万次阅读 多人点赞 2020-02-26 17:23:05
    在介绍数据分析方法论和思路之前,我们还是先不厌其烦地看一下数据分析的流程,简单来说分为以下六步骤: 1、明确分析的目的,提出问题。只有弄清楚了分析的目的是什么,才能准确定位分析因子,提出价值的问题...
  • 16种常用数据分析方法汇总

    万次阅读 多人点赞 2017-04-04 16:16:33
    经常会朋友问到一朋友,数据分析常用的分析方法哪些,我需要学习哪个等等之类的问题,今天数据分析精选给大家整理了十六种常用数据分析方法,供大家参考学习。 一、描述统计 描述性统计是指运用制表和...
  • 常用的统计分析方法

    千次阅读 2020-12-27 12:53:30
    分析方法 频率分析 主要用于查看数据基本分布特征,数据清晰,各种统计量、基本报告数据源等 数据探索 探索性分析主要是从统计的角度查看统计量来评估数据分布,主要用于异常值侦测、正态分布检验、数据分段、分位点...
  • 数据分析常用的100指标和术语

    万次阅读 多人点赞 2019-09-05 18:31:47
    3、数据分析名词解释 一、互联网常用名词解释 1、PV(Page View)页面浏览量 指某段时间内访问网站或某一页面的用户的总数量。通常用来衡量一篇文章或一次活动带来的流量效果,也是评价网站日常流量数据的重要...
  • 在进行数据分析时,我们通常需要用到各类分析模型和方法,一是为了让自己的结论更说服力,二是让论证过程更具备逻辑性和条理性。 今天帆软君就来给大家分享18种常用数据分析模型和方法,并附上用FineBI分析的...
  • 16种常用数据统计分析方法汇总

    万次阅读 多人点赞 2019-04-24 16:43:00
    经常会朋友问到一朋友,数据分析常用的分析方法哪些,我需要学习哪个等等之类的问题,今天数据分析精选给大家整理了十六种常用数据分析方法,供大家参考学习。 (注:这些统计分析方法基本都是统计学的方法...
  • 描述分析(描述性统计分析)就是用来概括、描述数据的整体状况以及数据各特征的统计方法。 描述的内容分为: 集中趋势:平均数,众数、中位数、四分位数 离散程度:方差、标准差、极差、变异系数、四分位差 分布...
  • 常用数据分析方法有:聚类分析、因子分析、相关分析、对应分析、回归分析、方差分析。 1、聚类分析(Cluster Analysis) 聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多类的分析过程。聚类是将...
  • 电商数据分析方法和指标整理

    万次阅读 多人点赞 2018-11-25 12:06:14
    对于电商行业来说,数据分析的核心公式是:销售额 = 流量*转化率*客单价。因此,分析可以从流量、转化率和客单价这三维度进行: 1、流量 流量分析,可以从中发现用户访问网站的规律,并根据这些规律改进网站设计...
  • 中文“预测”的含义在“英语”情境下则两种含义:evaluate,“估算”,前文归因的方法中,是从因变量Y发现自变量X,也就是Y-->X,“估算”则是“归因”的逆操...
  • 统计学常用数据分析方法总结

    千次阅读 2019-10-31 15:54:45
    描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。 集中趋势分析 ...
  • 种常见的数据分析模型

    千次阅读 2019-08-15 09:31:23
    根据模型进行分析,这样在数据分析时,明确数据分析思路,运用适当的分析方法将最终的数据分析结果得出来。下面我将介绍种常见的数据分析模型。 常见的数据分析模型 1.用户模型 数据分析时,我们首先要明确我们...
  • 什么是数据分析方法

    万次阅读 2018-09-04 09:26:21
    数据分析方法论 确定分析思路需要以营销、管理等理论为指导。...常用的数据数据分析方法:PEST分析法、5W2H分析法、逻辑树分析法、4P营销理论、用户行为理论。   数据分析方法论的重要性 很多人在做数...
  • 数据分析的类型哪些?

    千次阅读 2021-06-20 19:42:31
    数据分析的类别 维度一 ...从另一角度看,描述性数据分析属于初级数据分析,常见的分析方法有对比分析法、平均分析法、交叉分析法等。而预测性数据分析以及规范性数据分析属于高级数据分析,常见
  • 数据仓库常用几种建模方法

    万次阅读 2019-02-18 14:43:31
    数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中事务的相互关系的一种映射。在这里,数据模型表现的抽象的是实体和实体之间的关系,通过...
  • 主成分分析(Principal Component Analysis, PCA)是最常用的一种降维方法,通常用于高维数据集的探索与可视化,还可以用作数据压缩和预处理等。 PCA可以把具有相关性的高维变量合成为线性无关的低维变量,成为...
  • 数据可视化是以图示或图形格式表示的数据,以更直观方式理解与分析数据。本篇内容,我们给大家介绍数据分析中关于可视化的一些核心知识,包括:各类图形及特点,不同图形选择方法
  • 数据分析方法

    万次阅读 2018-01-29 23:29:32
    数据分析方法论 确定分析思路需要以营销、管理等理论为指导。这些 跟数据分析相 关的营销、...数据分析方法论主要用来指导数据分析师进行一次完整的数据分析,它 更多的是指数据分析思路,比如主要从哪几方面开展数据
  • 今天给大家介绍几个数据分析模型吧 一、用户价值模型 1、RFM模型 RFM分析是客户关系分析中一种简单实用客户分析方法,他将最近一次消费、消费频率、消费金额这三个要素构成了数据分析最好的指标,衡量客户价值和...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 451,770
精华内容 180,708
热门标签
关键字:

常用的数据分析方法有哪几个