精华内容
下载资源
问答
  • SPSS做主成分分析及得分分析的结果解释及与DPS的结果比较
  • 对比是最基本的数据分析方法,也是其他数据分析方法的基础。我们识别数据的差异是通过对比来实现的。为了得到一个结论,我们通常会查看两个数据的差异,如果1月份的销售额是1000万元,2月份的销售额是1200万元,则...

    在这里插入图片描述
    对比是识别事物的基本方法对比——横向、纵向及多维度对比比值比率背后的逻辑指标的逻辑与管理指标对标的层次和维度标杆管理与榜样的力量。

    4.1 对比是识别事物的基本方法

    对比是最基本的数据分析方法,也是其他数据分析方法的基础。我们识别数据的差异是通过对比来实现的。为了得到一个结论,我们通常会查看两个数据的差异,如果1月份的销售额是1000万元,2月份的销售额是1200万元,则月度销售额环比上升了20%,销售额增加了200万元,这就是一个数量上的对比。人总有问问题的本能,我们潜意识里会问:为什么会增加了200万元,这200万元从哪里增加的?怎么增加的?
    从这种潜意识的思考中可以看到,我们关心的是差200万元,而没有关心1000万元或者1200万元,为什么会这样呢?因为在我们的潜意识中,如果两个数字相同,就没有太大的比较价值。如果1月份的销售额是1200万元,2月份的销售额也是1200万元,那么这个时候我们只会得到一个结论:两个月的销售额一样。然后,大多数人就没有然后了,去追问为什么的人是少数人。而数据分析师需要去追问:2月份和1月份的1200万元在产品、客户、区域、业务人员、销售时间、销量、单价等方面是否有区别?如果有,那么这些区别是什么?都完全一样吗?还是都发生了很大的变化。
    如果把这个案例变成:1月份的1200万元销售额来自上海客户的订单;2月份的1200万元销售额来自北京客户的订单。这个时候就存在了差异,我们应该在潜意识里提出疑问,为什么会有这个差异?为什么1月份北京没有订单?为什么2月份上海没有订单?如果2月份的订单来自北京,那么上海的客户是不是流失了?这两个地方的客户的订单都是1200万元,都是同一个客户吗?为什么都是1200万元?是巧合还是有特殊的原因?是因为销售政策导致的最优采购量,还是因为两家客户碰巧有相同的需求量?这两个客户来自同一个集团吗?下个月会在哪里产生订单呢?——当数据有了差异之后,就会衍生出一系列的问题,当数据相同的时候,这些问题也是可以问的,但是因为数据相同导致大多数人没有了追问的好奇心。所以,在人的本能或者潜意识里容不下差异,因为差异可能意味着一种“不安全”因素;而相同,没有变化,是一种“安全”的状态。
    从事数据分析的专业人士要从这种天生的“安全”感走出来,要保持足够的敏锐和敏感,即使在相同的数据中也要找寻差异,要找寻“相同的原因是什么”,即一般人在找寻“差异的原因”,而数据分析师要找寻“差异是有原因的,而相同也是有原因的”。所以,数据分析师的“对比”和普通人的“对比”在概念上是有本质区别的。当然,这也体现出了数据分析师的基本素养。

    4.2 对比——横向、纵向及多维度对比

    在使用对比方法时,首先必须要有两个事物或者同一事物的两个状态;其次,必须要有一个对比的标准或者指标。对比的两个事物一个是对比的主体,一个是对比的客体;对比的指标或者标准被称作对比的度量。
    例如“小明比小强高10厘米”,这是一个最简单的对比。其中小明是对比的主体,小强是对比的客体,虽然句子中没有明确对比的指标是什么,但从语义上可以知道,对比的指标是两个人的身高,度量的标准是厘米。如果追究语法的完整性,那么这个句子是病句,应该改成“小明的身高比小强的身高高10厘米”。在现实生活中,语言是用来表达含义的,能够让大家理解而不会产生太大歧义的表达我们都会认可。当我们在分析大数据时,有大量的这样简易的表达语句,我们不能像语言学家那样追求所有的句子都是完整和无误的。
    从上面这个例子中我们明确了对比的三个要素:主体、客体、度量(指标或者标准)。
    上例可以转换表达为:“小强比小明矮10厘米”。在这个新的表达中,小强成了主体,小明成了客体,度量没有变化。之所以要区分主体和客体,主要是要分清楚谁(WHO)对比谁(WHOM),在比例和对比中,主体和客体转换会带来数据的差异。
    如果小强的身高是100厘米,那么小明的身高是110厘米。我们可以用百分比的方法来表达:“小明比小强高10%”(小明的身高是110厘米,小强的身高是100厘米,(110-100)/100=10%)。如果将主体、客体转换过来,则数据就不同了:“小强比小明矮9%”(小明的身高是110厘米,小强的身高是100厘米,(110-100)/110=9%)。
    这种差异主要来自于分母的差异,在比例类的对比上,我们常用客体作为分母,可以简易记忆为:比谁就除以谁。例如要计算这个月的销售额比上个月的销售额增长了多少,上个月的销售额是1000万元,这个月的销售额是1200万元,分母是上个月的销售额,所以增长幅度是20%。
    我们常用柱形图或者条形图来展示数据之间的差异,但在这个过程中要注意基准的问题,如果基准不为零,则容易产生视觉误导。例如小明和小强身高的对比,如下图所示。
    在这里插入图片描述
    在上图中,左图和右图都是柱形图,唯一的差异是数据基准的选择,左图以94为基准,无形中放大了小明和小强的身高差异,给人感觉两者的身高差别很大;而右图则是以零为基准,反映了两人真实的身高差异。我们在阅读图形的时候,一定要关注基准,不要被作图者人为地放大视觉差异从而影响了对事物真实状况的判断。
    有时候,我们使用对比的方法,但没有明确指明对比的客体是什么,那是因为背后是有共识性的客体存在的。
    例如当我们去大排档点了一份猪肉饭花了48元时,会觉得太贵了;当我们去五星级宾馆的旋转餐厅点一份猪肉饭花了148元时,反而没有觉得太贵,还会认为是比较合理的。当我们使用对比的方法对数据做出判断时,其实在这些方法背后都有我们主观形成的基准在帮我们做判断,也就是我们在拿数据与我们的“常识”做对比。我们根据常识认为大排档的饭菜一般都应该在30元,如果超过30元,就会觉得贵了;而我们在五星级宾馆超豪华的旋转餐厅吃饭时,会觉得一盘菜的价格都应该在100元以上,所以并不觉得猪肉饭的价格为148元有什么问题。这个时候,我们选择了“常识”作为客体进行比较。
    选择常识作为比较的基准或者客体是没有问题的。但问题在于,我们所谓的“常识”并非“共识”,每个人的“常识”是不同的。同样一款LV的包,对一个富家子女来讲,几万元的价格很正常,而对一个偏远山区的孩子来讲,这可能是一个天文数字。作为数据分析师,我们在得出结论或者对数据结果做出判断时,必须要审查我们的“常识”是否是所有人的“共识”,如果不是共识,那么我们就要非常谨慎地得出结论,否则就容易从自我出发做出结论性判断,这会影响结论的中肯性。
    例如,如果在一二线城市中一个环境相对不错的餐馆吃饭,则人均消费在60~100元;如果是更高档的餐厅,则人均消费在100~200元;如果是超豪华的高档餐厅,则人均消费可以达到1000~5000元,这些就是共识,不要用自己的常识来做出判断。
    人们在通过对比形成概念的过程中,会受到客体的影响。选择的客体不同,得出的结论就会不同。客体的度量指标为我们对主体的评判提供了一个标尺。当我们去一个咖啡厅喝了一杯咖啡消费48元时,会觉得很正常;但当我们要花48元下载一个APP时,就会觉得这个APP太贵了。这是因为我们对比的标准是不同的,我们不是从使用价值的角度来评测的,而是根据相对价位来定义价格是否合理的。
    在营销和销售领域,企业也经常通过帮助用户构筑一个价格参照物,引导用户认可产品或者服务的定价。例如,你在买房子或者租房子时会发现,中介绝对不会第一次就带你看你希望看到的房子,而是带你去看价格差不多,但质量差很多的房子,你会在心中形成一个概念:这样的房子都这么贵,那么比这个房子好点儿的房子肯定更贵,如果比这套房子还好的房子是一样的价格,我肯定要考虑租/买了。然后中介会带你看很多房子,当你基本要累趴下的时候,他会带你去看最适合你的房子,并且说房子价格合适,是紧缺户型,流动性高,要赶紧下手,不然明天就没有了。甚至当你去看这套房子的时候,另外一个中介,就是带你看房子的中介的同事,也带了另外一个客户去看这套房子,这时不冷静的你就会立马出手了。
    中介就是利用了对比原理,利用前面所看的质量较差的房子,让你形成目前市场价格的基准,然后让你在这个基准上再去衡量中介要推销给你的房子的定价。如果中介直接带你去看目标房子,你不会觉得这套房子好,也不会觉这套房子差,因为你所看的第一套房子会形成你的定价基准,你肯定会寻找性价比更高的房子。这个时候中介就非常被动,很可能带你看了好几套房子都无法成交。
    很多公司产品的定价也采用了这种方案。例如苹果手机,每一代苹果手机都会推出不同内存的机型,就拿iPhone 6S来说,16GB的机型的定价是5288元,32GB的机型的定价是6188元,64GB内存的定价是7088元,128GB内存的定价是7888元。你觉得哪一款机型更划算?一个64GB的内存不足百元,在实际产品中价格却增加了800元,你会觉得心有不甘,从而会选择64GB的机型,而64GB的机型对比32GB或者16GB的机型也不划算,但32GB和16GB的机型容量太小让你无法使用。
    苹果构筑了这个产品系列的目的是让用户在这4款产品中比价(见下图),而不会将比价的范围放到其他的产品上。既然选择了苹果品牌,就不要用苹果手机的价格与三星或者华为的手机的价格做比较。如果苹果手机只有一款64GB的机型,那么消费者肯定会跟其他的产品进行比较。这个时候消费者对价格的评判就不再是哪个容量的手机价格更合理,而是哪个公司的产品价格更合理。
    在这里插入图片描述
    (图片来自京东网站)
    作为专业的数据分析人员,一方面我们要避免被别人左右了我们的比较基准;另外一方面,我们在准确传达数据对比结论的时候,可以采用一些心理学的方法,让数据的认知度更高,确保我们的数据对比结论能够有效达到说服的目的。
    全文摘自《企业经营数据分析-思路、方法、应用与工具》赵兴峰著
    该文转载已取得作者认可

    展开全文
  • 对比是识别事物的基本方法对比——横向、纵向及多维度对比比值比率背后的逻辑指标的逻辑与管理指标对标的层次和维度标杆管理与榜样的力量。 4.3 比值比率背后的逻辑 最常见的对比是大小的对比、数量的对比,例如销售...

    对比是识别事物的基本方法对比——横向、纵向及多维度对比比值比率背后的逻辑指标的逻辑与管理指标对标的层次和维度标杆管理与榜样的力量。

    4.3 比值比率背后的逻辑

    最常见的对比是大小的对比、数量的对比,例如销售额的对比、人数的对比、时间长短的对比。使用不同的对比指标会得到不同的结论。
    我们把对比标准的选择叫作对比的视角,对比视角不同,就会得出不同的结论。例如将小强和小明对比,从身高的角度对比,就有了高矮的判断,我们还可以从学习成绩、年龄等其他的视角进行对比。在对比人的时候,我们可能会有更加综合的维度,例如在对比客户的时候,我们会综合考虑各种因素;在对比各种变化的原因时,我们也有各种模型。对比随时随地都在发生,我们所要做的就是找到合适的对比视角,针对同样的问题,发现不同的洞察。
    对第一层级的变量做了对比之后,我们还可以形成综合的变量。将第一层级的变量(直接描述事物的变量,如长度、数量、额度、宽度、高度等)加工之后得到的变量,称作二级变量。在进行二级变量对比的时候,常用的有增速、效率、效益等指标。
    增速是指在一定时间范围内数量变化的比率。两家公司、两个产品、两个市场、两个客户、两个渠道,都可以对比增速。而对比的时间周期可以按照月份、季度或者年度来设定。2015年,美国的国内生产总值为17.4万亿美元,中国的国内生产总值为10.4万亿美元,美国全年经济的增速是2.4%,中国全年经济的增速是6.9%。这就是速度的比较,如下图所示。我们很自然地会问,如果按照这个增速发展下去,中国国内生产总值赶超美国大概要等到哪一年?2027年!
    在这里插入图片描述
    效率是投入与产出之间的比值,是资源利用能力的评价指标。效率对比就是看谁能够利用更少的投入产出更多的价值。对比两家企业的效率,可以看出哪家企业更有发展潜力,更有竞争力。
    常用的衡量人力资源效率的指标是人均产值(一定时期内平均每个人产出的价值)、元当产值(公司每发出一元工资所带来的产值),如下图所示。前者是把人数作为投入要素来评价的,而后者是把人员工资作为投入要素来评价的。如果一家公司的销售额和利润实现了快速且稳定的增长,但是在公司成长的过程中,物质要素的效率在提高,而劳动力要素的效率却在下降,即人均产值在下降,那就意味着随着公司的发展,新招聘的人员的平均水平在下降,而工资却在不断增长,每一元工资投入的产出在大幅度下降。
    在这里插入图片描述
    一些表面繁荣的公司,背后却蕴藏着巨大的人力资源危机,公司的人力资源整体水平在下降,这样的公司是很难持续发展的,特别是到了市场竞争越来越激烈时期,人力能力跟不上公司的发展。如果公司在发展的过程中看不到这个问题,将来就会成为非常关键的问题——公司在快速发展时,所有的问题都不是问题,但到了公司发展受阻时,一个小问题都会成为天大的问题。很多公司在危难时期面临的问题都是在顺境中衍生的。所以,对一些效率指标的跟踪非常重要。

    4.4 指标的逻辑与管理指标

    对于相对比较复杂的事物,某一个维度的分析往往只代表一个侧面,不能代表事物的全貌。而如果对比的维度太多,我们往往就不能得到一个明确的答复。
    例如小明比小强高10厘米,但小强比小明帅;有的客户购买力不强,但他能够带动朋友来购买公司的产品和服务。这就需要综合考虑各个因素,也给数据分析工作带来了新的挑战——我们需要找到一个更加简单的方法来评价事物。
    所谓的指标,就是各种评价标准经过加权综合之后得到的具有一定意义的评价体系。例如消费者物价指数就是衡量物价变化的指标。蔬菜价格在上涨,但大米的价格在下降,肉、禽、蛋、奶的价格也在下降,我们就不能说整体的物价在上涨。那么如何评价物价的波动呢?可以用衡量物价的综合指标——CPI(ConsumerPriceIndex,消费者物价指数)或工业价格指数PPI(ProducerPriceIndex,生产者物价指数)等指标来衡量物价的波动。
    消费者物价指数(CPI)是综合了大多数人的消费习惯,按照消费产品的比例加权计算消费者综合的消费价格波动,不同时期的CPI组成也不同,不同国家也会根据消费者不同的消费习惯组合成不同的消费者物价指数。因为中国地域广阔,消费者的消费习惯差异很大,所以CPI带给大家的感觉也会不同。CPI的本质是用来衡量消费者所拥有的现金在特定时期生活消费购买力变化的指标。PPI则是指工业生产者综合购买力的指标。
    在企业管理中也会采用一些综合的评价指标来进行对比。例如,最为典型的就是KPI(KeyPerformanceIndicator,关键业绩指标),它是根据公司对某个岗位的要求,以及在各个维度上要求的重要程度的不同,设定不同的权重,从而形成的一个综合评分指标。不同岗位在不同公司的KPI设定肯定会不同。为了能够更好地让业绩指标为公司战略服务,曾经有知名的咨询公司提出一个通过综合考虑4个方面要素而组合出来的KPI指标,叫作BSC(BalanceScoreCard,平衡记分卡),其考虑到每个岗位的财务指标、客户指标、成长指标和流程指标。不同公司中不同岗位的BSC肯定不同,但基本涵盖的是4大类指标的综合加权平均值。
    数据分析师有一个关键的职能就是要设计“指标”来对比。设计指标与应用指标有着天壤之别,很多人在应用别人的指标的时候还会出错,如果要真正设计指标,则需要对事物之间的逻辑关系有着深刻的理解。
    例如,笔者服务过一家经营婴幼儿食品的公司,其产品包括配方奶粉、米粉、水果泥和婴幼儿安全营养补充零食。他们的业务与一个市场中人口的出生率、这个市场的整体购买力、消费者对婴幼儿食用包装食品的观念有直接的关系,还与政府对这个市场中的食品安全管控力度有关系。分析了这么多关系之后,他们希望能够构建一个指标反映一个市场对公司的吸引力,从而能够让公司根据这个市场吸引力指标来投资。
    而市场的吸引力还与市场中的竞争强度有关系,如果在这个市场中竞争者众多,前几名的竞争者实力雄厚,后台资本实力强大,那么这个市场的吸引力就小;如果这个市场几乎是空白市场,那么这个市场的吸引力就大。
    考虑到以上因素,我们需要建立一个综合指标来评价这个市场的吸引力,最好能够直接得到一个分数进行直观判断,例如80分的市场比75分的市场有5分的吸引力差异,60分的市场是30分的市场的吸引力的两倍。那么如何设计这个指标呢?我们需要各种数据的加权计算。
    在不考虑市场规模的情况下,我们可以先构建一个指标指数模型:
    Y=aX1+bX2+cX3+dX4+eX5+fX6+…
    其中:
    Y:市场吸引力指标值。X1:婴儿出生率(或者每年婴儿出生的数量)。X2:市场购买力平价指标。X3:消费者对婴幼儿包装食品的态度。X4:企业信誉对消费者购买婴幼儿产品的影响。X5:政府对婴幼儿食品的管控力度。
    a,b,c,d,e,f…是系数,代表影响的程度。
    我们可以构建一个加法模型。加法模型代表各个要素之间并没有相互的影响,各个要素独立地对市场吸引力产生影响。
    当然我们也可以构建成乘法模型:
    Y=aX1×X2×X3×X4×X5×X6×…
    此乘法模型假设各个要素之间是相互影响的。例如如果消费者的信心不足,则购买力会因此被大幅度缩小。
    我们可以追踪各种历史数据,将不同阶段的数据放到一起,形成多个数据组合方程式,通过近似求解的方法实现对模型的构建。最终得到一个计算市场吸引力指标的数学模型:
    Y市场吸引力=f(X1,X2,X3,X4,X5,X6,…)这个数学模型可以用来指导公司未来的市场投资实践,也可以在公司不断拓展市场的过程中不断地验证这个数学模型,不断完善各种假设、指数、系数、计算方法,最终形成适合公司自我发展过程中的扩张模型。
    这是本书第一次提到数学模型的构建,这些内容需要读者具有数学基础。如果以上的内容让你感到很难理解,那么完全可以跳过这部分内容;如果你是从事数据分析专业的人士,那么这部分内容对你来说应该不太难;如果你不是从事数据分析专业的人士,那么只需要了解这些内容就足够了,不需要深究,更不需要自己去构筑完成一个数学模型;如果你是公司的高层管理者,那么阅读这部分内容可以让你更好地了解一个数据模型产生的过程,从而能够理解数据分析师每日的工作内容。
    下面就以CPI来进行示范说明。CPI本质上是一个构筑数学模型后形成的综合数据指标。
    假设一个居民每个月要吃掉5斤猪肉、3斤鸡肉、2斤牛肉、1斤羊肉、0.5斤鸭肉,0.5斤鹅肉、5斤白面、5斤青瓜……经过大量的统计调研,我们得到全国人民的饮食结构是如上的构成要素。
    我们调研所有的菜市场(其实是抽样代表)中所有这些产品的价格,得到本月该居民的消费支出,假定为1000元;下个月他同样购买这些产品来满足自己的日常生活需要,但是各个产品的价格发生了变化,用当月新的产品价格重新计算了他的消费支出情况,得到的结果是1050元,那么将该月的消费支出与上个月的消费支出进行对比,消费者价格上涨了(1050-1000)/1000=5%。如果把上个月的CPI认定为100元,则本月的CPI为105元,CPI上涨5%。这就是对CPI即消费价格指数的形象描述。当然,实际的CPI计算会比这个要复杂,因为我们监控的产品品种比我列举的要多,获取产品价格的渠道和监测点也要多得多。
    指数在整个经济领域中有着重要的地位,有的指数直接代表了经济的风向标,甚至左右着经济的发展。代表一个经济体、一个经济实体或者公司的指标有信誉评级指标,价格指标有CPI和PPI,短期经济发展兴衰指标有PMI(采购经理人指数)……
    我们对数据进行对比分析的时候,除简单地直接对比数据外,还需要构建一些可以重复使用或者在某个部门、某个业务领域、某个情景下进行评测的指标。这些指标背后可以是多个数据的综合分析结果,也可以是某个业务指标的合集。数据分析师要根据业务需求做出各种指标的模型,并形成长期的观测数据集,从而验证这种指标的合理性,只有通过长时期实践检验的指标才可以成为公司持续使用的对比指标。一个综合指标企业使用越久,就越完善,并且可以体现出公司管理的特色。
    当企业的管理指标逐步丰富之后,你会发觉企业的管理文化和管理体系都在发生着潜移默化的改变。之前管理者的职责是根据生产经营状况做出决策并确保决策的执行,在执行的过程中形成事前、事中和事后的反馈,并不断调整决策的执行过程。当数据承担起更多的这种分析和决策的过程时,管理者的职责逐渐从“思考型”向“指挥型”过渡,并且对管理者的聪明程度、经验能力的要求反而变弱了。同样能力的管理者所能够管理的人员数量在逐步发生变化,管理幅度在增加,一些复杂的管理工作逐步由数据和数据指标在发挥作用,一些分析和判断性的工作由智能的系统来完成,企业组织逐步转向扁平化、社群化。
    全文摘自《企业经营数据分析-思路、方法、应用与工具》赵兴峰著
    该文转载已取得作者认可
    上期内容:
    数据分析中常用分析思路-对比分析解析(一)、
    ①对比是识别事物的基本方法
    ②对比——横向、纵向及多维度对比
    下期内容预告:
    数据分析中常用分析思路-对比分析解析(三)
    ①对标的层次和维度
    ②标杆管理与榜样的力量

    展开全文
  • 中外智库研究对比分析,李立,杨祖国,[目的/意义]智库为政府科学、有效地决策提供支持,智库研究方兴未艾。对国内外智库研究状况进行分析,有利于揭示智库发展态势,了
  • 数据对比分析法,看这篇就够了!

    千次阅读 2021-04-22 18:15:28
    任何事物都有对立面,站在不同的角度去分析问题,不仅是数据分析的方法,也是各行各业都会用到的思维模式。今天就来聊一下对比分析。01时间上的对比1纵比同一空间条件下,对不同时期数据的比较。如下...

    任何事物都有对立面,站在不同的角度去分析问题,不仅是数据分析的方法,也是各行各业都会用到的思维模式。

    今天就来聊一下对比分析。

    01

    时间上的对比

    1

    纵比

    同一空间条件下,对不同时期数据的比较。

    如下图2018年1月到8月全国的订单数量柱状图,可以看出1月的订单量最高,8月最低。

     

    2018年1~8月全国订单数量柱状图

    2

    同比


    同比是同时期内进行比较,比如2019年7月与2018年7月的某项数据进行对比是同比。

     

    3

    环比

    环比是与前一个统计期内进行比较,如2019年7月与2019年6月的某项数据进行对比是环比。

     

    Ø  如广东省2018年6月的订单数量为5400单,2019年6月订单量为4788单,2019年7月的订单量为5277单,那么我们可以这样描述:

    2019年7月,广东省订单数量为5277单,环比上月增长了10.2%,同比去年降低了2.3%。

    4

    与特定时期的对比

     

    当前时期与特定时期的对比,如与历史最好水平或与某一关键的时期进行对比。


    下图是从推广活动开始前和开始后各季度的平均销售额进行对比的条形图。

     活动前后各季度平均销售额对比条形图

     

    02

    空间上的对比

    1

    横比

    同一时间条件下,对不同空间数据的比较。

    如下图2018年7月各省的订单数量柱状图,反映的是不同省份间同一时期的比较。

    7月各省订单数量柱状图

     

    2

    横比与同地域、同部门对比

    这里指的是同一统计期内,与同地区、部门间的比较。

    下图是世界各国面积排名的柱状图。空间上的对比总是基于一个基础,那就是他们都是同一级别的。这时候如果让国家和洲去对比,就不能够了。

    世界各国面积排名TOP10(图源见水印)

     

    03

    与标准对比

    1

    与目标值对比

    还可将数据与目标值进行对比,从而发现差异,进行改正。

    要与目标值进行对比,必不可少的就是目标值线。

    Excel里怎样才能在图表区加上目标值线呢?

    右图红色为目标值线

     

    Step1:首先,在I列新增一列1~8月订单量的目标值。

     

     

    Step2:在绘图区右键【选择数据】——【添加】,系列名称为目标,系列值为刚新增的目标值一栏的数据值。

     

     Step3:这时得到的图不是我们理想中的样子,在绘图区右键【更改图表类型】,将平均值系列更改为折线图。

     

     Step4:添加一个数据标签,可再美化一下,大功告成,最后结果如图所示:

     

    2

    与业内平均水准对比

    进行现状调查、背景介绍的时候,会进行竞争对手或行业内水平的比较,从而分析处于行业内的什么阶段,下一步该做怎样的努力。

     

     Ø  需要注意的是,在做对比分析的时候,比较的数据的计量单位、计算方法需得一致,比较的对象也得具备可比性,否则就失去了对比的意义。

     

    比如像下面这种,单位未统一的对比就是错误的

    如下图所示,将广东的销量与山东的销量增长率进行对比,二者单位没有统一,这样对比显然是错误的。

     错误的销量对比图

     

    正确的对比是:

    将广东与山东的销量进行对比,或将二者的增长率进行对比,若非要在一张图上放销量和增长率,那也应只放一个地区的销量和增长率。

    正确做法1:销量间对比

    正确的销量对比图

     

    正确做法2:增长率间对比

     

     正确做法3:同一区的销量与增长率的展现

     

     知识不怕会,就怕用,对比分析乍一看固然简单,能用会用才是王道。

    任何疑问,欢迎加我个人微信号:data_cola 交流讨论

    提供入门级数据分析的学习路线规划,分享从Excel到统计学的干货。数据分析是一项技能,希望人人都能分析数据。

    相关内容:

    SQL学习:MySQL入门 | 库/表/记录的增查删改

    Excel分析方法:时间序列分析 | 回归分析 | 描述性统计分析 | 相关性分析 

    Excel图表:数据地图 | 数据透视表 | 5个基本图 | 13个进阶图 | 直方图 | 控制图 | 排列图

    Excel函数:日期文本函数 | 查找引用函数 | if函数 | 统计函数

    用Excel进行数据分析:数据获取 | 数据处理 

    方法论:如何系统地学习Excel | 数据分析学习 | Excel相见恨晚的技巧 

    如果你觉得有用,请点击右下角 在看 

    展开全文
  • 对比分析了中美两国煤矿安全生产现状,认为中美两国同为煤炭资源、生产和消费大国,但美国煤矿安全水平却明显高于我国。提出了改善我国煤矿安全生产状况的具体措施,研究措施对改善我国煤矿安全生产现状有一定的指导...
  • 数据挖掘之对比分析

    2019-01-09 13:12:43
    对比分析是把两个相互联系的指标进行比较,从数量上展示和说明研究对象规模的大小,水平的高低,速度的快慢,以及各种关系是否协调,特别适合指标的横向和纵向比较、时间序列的比较分析。在对比分析中,选择合适的...

    对比分析是把两个相互联系的指标进行比较,从数量上展示和说明研究对象规模的大小,水平的高低,速度的快慢,以及各种关系是否协调,特别适合指标的横向和纵向比较、时间序列的比较分析。在对比分析中,选择合适的对比标准是关键,选择不合适,可能会得出错误的结论.
    对比形式有以下几种:
    1、绝对数比较:利用绝对数比较,寻找差异的常用方法
    2、相对数比较:由两个有联系的指标对比计算的,用以反映客观现象之间数量联系程度的指标,其数值表现为相对数,由于研究目的和对比基础不同,相对数分为以下几种:
    a、结构相对数:将同一总体内的部分数值与全部数值对比求得比重,用以说明事物的性质、结构或者质量。如居民食品支出额占消费支出总额比重、产品合格率等.
    b、比例相对数:将同一体内不同部分的数值进行比较,表明总体内各部分的比例关系。如人口与性别比例、投资与消费比例等.
    c、比较相对数:将同一时期两个性质相同的指标数值进行对比,说明同类现象在不同的空间条件下数量对比关系.如:不同地区商品价格对比,不同行业、不同企业间某项指标对比等.
    d、强度相对数:将两个性质不同,但有一定联系的总量指标进行对比,用以说明现象的强度、密度和普遍程度。如:人均国内生产总值用“元/人”,人口密度用“人/平方公里”
    e、计划完成程度相对数:是某一时期实际完成数与计划数的对比,用以说明计划完成程度.
    f、动态相对数:将同一现象在不同时期的指标数值进行对比,用以说明发展方向和变化的速度等.
    统计量分析:用统计指标对定量数据进行统计描述,长从集中趋势和离中趋势两个方面进行分析,平均水平的指标是对个体集中趋势的度量,使用最广泛的是平均数和中位数,反映变异程度的指标则是个体离开平均水平的度量,使用最为广泛的是标准差(方差)、四分位间距。
    其中均值对极端值很敏感,如果数据中存在极端值或者数据是偏态分布的,那么均值分析不能很好的反映数据的集中度,为了消除极端值的影响,可以采用截断均值或者中位数来度量数据的趋势,截断均值,就是去除最大值和最小值的平均数.
    中位数:数据从小到大排列,排在最中间的那个数字.
    众数:指数据集中出现最频繁的值,一般用于离散型变量和非连续型变量

    离中趋势度量:极差=最大值-最小值
    标准差度量:数据偏离均值的程度,


    变异系数:变异系数度量标准差相对于均值的离中趋势,用来比较两个或者多个具有不同单位或者不同波动振幅的数据集的离中趋势.

    四分位数:包括上四分位数和下四分位数。并将所有数值从大到小排列并分成四等份,处于第一个分割点的位置的数值是下四分位数,处于第二个分割点的位置的数值是中位数,处于第三个分割点位置的数值是上四分位数。
    四分位数间距是上四分位数减去下四分位数之差,期间包含了观察者的一般,其中



    计算相关系数:相关性系数:

    如果有两个变量:X、Y,最终计算出的相关系数的含义可以有如下理解:

    (1)、当相关系数为0时,X和Y两变量无关系。

    (2)、当X的值增大(减小),Y值增大(减小),两个变量为正相关,相关系数在0.00与1.00之间。

    (3)、当X的值增大(减小),Y值减小(增大),两个变量为负相关,相关系数在-1.00与0.00之间。

    相关系数的绝对值越大,相关性越强,相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。

    通常情况下通过以下取值范围判断变量的相关强度:
    相关系数     0.8-1.0     极强相关
                     0.6-0.8     强相关
                     0.4-0.6     中等程度相关
                     0.2-0.4     弱相关
                     0.0-0.2     极弱相关或无相关

    Pearson(皮尔逊)相关系数:
    公式一:

    公式二:

    公式三:

    公式四:


    其中E为方差,cov为协方差,N表示变量取值的个数。

    当两个变量的标准差都不为零时,相关系数才有定义,皮尔逊相关系数适用于:

    (1)、两个变量之间是线性关系,都是连续数据。

    (2)、两个变量的总体是正态分布,或接近正态的单峰分布。

    (3)、两个变量的观测值是成对的,每对观测值之间相互独立
     

    Spearman Rank(斯皮尔曼等级)相关系数:
    在统计学中,斯皮尔曼等级相关系数以Charles Spearman命名,并经常用希腊字母ρ(rho)表示其值。斯皮尔曼等级相关系数用来估计两个变量X、Y之间的相关性,其中变量间的相关性可以使用单调函数来描述。如果两个变量取值的两个集合中均不存在相同的两个元素,那么,当其中一个变量可以表示为另一个变量的很好的单调函数时(即两个变量的变化趋势相同),两个变量之间的ρ可以达到+1或-1。

    假设两个随机变量分别为X、Y(也可以看做两个集合),它们的元素个数均为N,两个随即变量取的第i(1<=i<=N)个值分别用Xi、Yi表示。对X、Y进行排序(同时为升序或降序),得到两个元素排行集合x、y,其中元素xi、yi分别为Xi在X中的排行以及Yi在Y中的排行。将集合x、y中的元素对应相减得到一个排行差分集合d,其中di=xi-yi,1<=i<=N。随机变量X、Y之间的斯皮尔曼等级相关系数可以由x、y或者d计算得到,其计算方式如下所示:

    由排行差分集合d计算而得(公式一):

    斯皮尔曼等级相关系数公式一

    由排行集合x、y计算而得(斯皮尔曼等级相关系数同时也被认为是经过排行的两个随即变量的皮尔逊相关系数,以下实际是计算x、y的皮尔逊相关系数)(公式二):

    斯皮尔曼等级相关系数公式二

     

    以下是一个计算集合中元素排行的例子(仅适用于斯皮尔曼等级相关系数的计算)

    斯皮尔曼等级相关系数表一

     

    这里需要注意:当变量的两个值相同时,它们的排行是通过对它们位置进行平均而得到的。

    2、适用范围

    斯皮尔曼等级相关系数对数据条件的要求没有皮尔逊相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关系数来进行研究。

    Kendall Rank(肯德尔等级)相关系数

    1、简介

    在统计学中,肯德尔相关系数是以Maurice Kendall命名的,并经常用希腊字母τ(tau)表示其值。肯德尔相关系数是一个用来测量两个随机变量相关性的统计值。一个肯德尔检验是一个无参数假设检验,它使用计算而得的相关系数去检验两个随机变量的统计依赖性。肯德尔相关系数的取值范围在-1到1之间,当τ为1时,表示两个随机变量拥有一致的等级相关性;当τ为-1时,表示两个随机变量拥有完全相反的等级相关性;当τ为0时,表示两个随机变量是相互独立的。

    假设两个随机变量分别为X、Y(也可以看做两个集合),它们的元素个数均为N,两个随即变量取的第i(1<=i<=N)个值分别用Xi、Yi表示。X与Y中的对应元素组成一个元素对集合XY,其包含的元素为(Xi, Yi)(1<=i<=N)。当集合XY中任意两个元素(Xi, Yi)与(Xj, Yj)的排行相同时(也就是说当出现情况1或2时;情况1:Xi>Xj且Yi>Yj,情况2:Xi<Xj且Yi<Yj),这两个元素就被认为是一致的。当出现情况3或4时(情况3:Xi>Xj且Yi<Yj,情况4:Xi<Xj且Yi>Yj),这两个元素被认为是不一致的。当出现情况5或6时(情况5:Xi=Xj,情况6:Yi=Yj),这两个元素既不是一致的也不是不一致的。

    这里有三个公式计算肯德尔相关系数的值

    公式一:

    肯德尔相关系数公式1

    其中C表示XY中拥有一致性的元素对数(两个元素为一对);D表示XY中拥有不一致性的元素对数。

    注意:这一公式仅适用于集合X与Y中均不存在相同元素的情况(集合中各个元素唯一)。

    公式二:

    肯德尔相关系数公式2

    注意:这一公式适用于集合X或Y中存在相同元素的情况(当然,如果X或Y中均不存在相同的元素时,公式二便等同于公式一)。

    其中C、D与公式一中相同;

    肯德尔相关系数公式2-子公式1肯德尔相关系数公式2-子公式2肯德尔相关系数公式2-子公式3

    N1、N2分别是针对集合X、Y计算的,现在以计算N1为例,给出N1的由来(N2的计算可以类推):

    将X中的相同元素分别组合成小集合,s表示集合X中拥有的小集合数(例如X包含元素:1 2 3 4 3 3 2,那么这里得到的s则为2,因为只有2、3有相同元素),Ui表示第i个小集合所包含的元素数。N2在集合Y的基础上计算而得。

    公式三:

    肯德尔相关系数公式3

    注意:这一公式中没有再考虑集合X、或Y中存在相同元素给最后的统计值带来的影响。公式三的这一计算形式仅适用于用表格表示的随机变量X、Y之间相关系数的计算(下面将会介绍)。

    参数M稍后会做介绍。

    以上都是围绕用集合表示的随机变量而计算肯德尔相关系数的,下面所讲的则是围绕用表格表示的随机变量而计算肯德尔相关系数的。

    通常人们会将两个随机变量的取值制作成一个表格,例如有10个样本,对每个样本进行两项指标测试X、Y(指标X、Y的取值均为1到3)。根据样本的X、Y指标取值,得到以下二维表格(表1):

    肯德尔相关系数表1

    由表1可以得到X及Y的可以以集合的形式表示为:

    X={1, 1, 2, 2, 2, 2, 2, 3, 3, 3};

    Y={1, 2, 1, 1, 2, 2, 3, 2, 3, 3};

    得到X、Y的集合形式后就可以使用以上的公式一或公式二计算X、Y的肯德尔相关系数了(注意公式一、二的适用条件)。

    当然如果给定X、Y的集合形式,那么也是很容易得到它们的表格形式的。

    这里需要注意的是:公式二也可以用来计算表格形式表示的二维变量的肯德尔相关系数,不过它一般用来计算由正方形表格表示的二维变量的肯德尔相关系数,公式三则只是用来计算由长方形表格表示的二维变量的Kendall相关系数。这里给出公式三中字母M的含义,M表示长方形表格中行数与列数中较小的一个。表1的行数及列数均为三。

    2、适用范围 

    肯德尔相关系数与斯皮尔曼相关系数对数据条件的要求相同,可参见统计相关系数(2)--Spearman Rank(斯皮尔曼等级)相关系数及MATLAB实现中介绍的斯皮尔曼相关系数对数据条件的要求。
     

     





     

    展开全文
  • 最后本实验利用ECharts在eclipse IDE 下进行数据可视化分析,得出了所有买家各消费行为对比、男女买家交易对比、男女买家各个年龄段的交易对比、商品类别交易额对比、各省份的销量对比,这些数据分析结果将有助于...
  • 数据分析入门(一)

    千次阅读 多人点赞 2020-02-29 11:17:19
    1.数据分析概念 1.1数据分析 是指用适当的统计分析方法对收集来的大量数据进行...常见的分析方法包括:对比分析法、平均分析法、交叉分析法等。Excel可以实现。 探索性数据分析(高级数据分析):EDA指对已有数据在...
  • spss教程进行单因素方差分析(图文教程) 单因素方差分析原理 因变量:连续变量 自变量:多分类 用来测试某一个控制变量的不同水平是否给观察变量造成显著差异和变动。 方差分析前提:不同水平下,各总体均值...
  • 在之前的文章中,我们介绍了组间比较的基本操作,并在上期文章中详细介绍了t检验在JMP中的实现。t检验是用于检验两组均值差异的统计方法,而本文要讲的则是用于检验多组均值差异的统计方法——方差分析。 为了帮助更...
  • 西部地区经济发展纵横比较分析,沙景华,相楠,落后地区的经济发展是世界各国普遍关注的问题,西部大开发战略对我国经济发展、社会稳定和民族团结有重要的意义,自1999年实施以来�
  • 一个产品,如果你不能衡量它,你就不能了解它,自然而然,你就无法改进它。数据说到底,就是这样一个工具——通过数据,我们可以衡量产品,可以了解产品,可以在数据驱动下改进产品。数据分析和数据处...
  • 两种方法分析道路扬尘粒径的比较意义,黄嫣旻,束炯,对上海市道路扬尘的54个样品分别用激光粒度仪和动力学粒径谱仪进行粒径分布的测量。由于两种方法的原理不同,获得粒径的物理意义
  • 问题4:是否可以用变异系数比较不同类项目的相对估算偏差大小? 问题5:偏差率是否可以画控制图进行分析? 问题1:哪个项目的偏差率更大? 由于偏差率有正负之分,并非项目A偏差率10%大于项目B的偏差率-15%..
  • 天然裂缝是油气储层的重要组成部分,天然裂缝的闭合问题关系到油气藏的衰竭。目前,这方面的研究主要局限于室内实验和在数学模型基础上分析裂缝闭合与有效...研究结果对于油气藏衰竭式开采及后期改造实践具有重要意义
  • 数据分析和数据处理本身是个非常大的领域,这里主要总结些我个人觉得比较基础且实用的部分,在日常产品工作中可以发挥比较大作用。本期主要讨论些数据分析的三个常用方法: 数据趋势分析 数据对比分析 数据细分分析 ...
  • 在稀硝酸工业化生产过程中,硝酸装置工艺的选择,对于企业降低成本、提高经济效益有着重要意义。介绍了常压法、综合法、全中压法、全高压法、双加压法5种硝酸装置工艺技术,并对5种工艺从技术及经济指标方面进行了对比,...
  • 综合评价,顾名思义,就是对一些已有的评价结果进一步综合评价,进而得出具有决策意义结果的算法。 首先,说一下熵值法,以汽车综合评分为例,需要先获得每辆车在油耗、功率、费用等方面的评分,没有这个后面一些都...
  • 本文以大量地质资料为基础,总结了矿区主要含煤段的地层特征、煤层自身特征、煤层组合特征,采用有效的对比方法,对主要可采煤层进行了系统的对比分析,并对后续矿区煤炭资源勘查具有一定的指导意义
  • 因子分析在SPSS中的操作过程及结果解读

    万次阅读 多人点赞 2019-01-14 16:28:27
    因子分析在SPSS中的操作过程及结果解读 笔者在做该项研究时在网络上查阅了大量资料,都写得不够十分完整,所以该篇文章将因子分析从前到后做一个通俗易懂的解释,全文并不涉及非常晦涩的公式原理。 一.因子分析是...
  • 通过对比国内外企业内部控制开展情况和学者理论研究现状,阐述了国内外企业在内部控制方面存在的六大差异性,针对性地从重视内控组织机构建设、完善法人治理结构,引入独立董事制度、强化内部风险管理、提升文化建设...
  • 有用的统计学 Statistics 第9讲 降维... 理解主成分的含义和主成分的得分因子的 含义和因子得分的应用 主成分分析 案例背景 某公司打算从48名应聘者中选出6人 对前来应聘的 人在简历格式兴趣爱好洞察力工作能力自信 心
  • 通过采用标志层、层间距、煤岩组合特征、测井曲线以及古生物化石等方法对含煤地层进行综合划分与对比,准确地划分了各可采煤层及标志层层位,对比结论准确可靠,对指导井田地质勘查和未来煤矿生产具有重要意义
  • 数据分析各图的含义

    2020-04-05 19:03:39
    饼图 将数据划分为几个有明显区别的组,饼图体现的是...用来展示数值型数据,能体现数据趋势,趋势比条形图更清晰,对数据进行比较用折线图用折线图来表示是没有意义的 举例:表示趋势 条形图 可用来表示比例...
  • 本文结合案例,将中兴WCDMA的网络仿真结果与试验网路测结果进行对比分析分析结果表明,二者的误差可以控制在可接受的范围之内,从而验证WCDMA网络仿真结果对WCDMA网络的规划和优化具有重要的指导意义
  • 建模方法(四)-因子分析定义和应用

    万次阅读 多人点赞 2018-08-20 20:58:05
    因子分析(factor analysis)也是一种降维、简化数据的技术。 它通过研究众多变量之间的内部依赖关系,使用少数几个“抽象”的变量来表示其基本的 数据结构。这几个抽象的变量被称作“因子”,能反映原来 众多变量的...
  • 数据分析方法论2:交叉&平均分析

    千次阅读 2020-12-17 16:44:19
    平均分析法顾名思义,就是用平均数来反映数据在某一特征下的水平,平均分析通常和对比分析结合在一起,从时间和空间多个角度衡量差异,找到其中的趋势和规律。 01 不得不提的平均数 平均数用来反映一组数据的...
  • 示例 评价某药物耐受性及安全性的I期临床实验中,将符合纳入标准的30名健康自愿者随机分为3组...如果方差分析有统计学意义,我们可能还会进一步通过两两比较考察到底是那两组有统计学差异。此外,本例中分组因素为有..
  • 二、库存的意义 1、提升发货时效,进而提升用户体验 库存太少会导致: 1、造成用户服务水平的下降,影响销售利润和企业信誉; 2、造成生产系统原材料或其他物料供应不足,影响生产过程的正常进行; 3、使订货间隔期...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 650,319
精华内容 260,127
关键字:

对比分析的意义