-
数据分析方法论2:交叉&平均分析法
2020-12-17 16:44:19平均分析法顾名思义,就是用平均数来反映数据在某一特征下的水平,平均分析通常和对比分析结合在一起,从时间和空间多个角度衡量差异,找到其中的趋势和规律。 01 不得不提的平均数 平均数用来反映一组数据的...交叉分析 and 平均分析
- 平均分析法
平均分析法顾名思义,就是用平均数来反映数据在某一特征下的水平,平均分析通常和对比分析结合在一起,从时间和空间多个角度衡量差异,找到其中的趋势和规律。
01 不得不提的平均数
平均数用来反映一组数据的集中趋势,表示平均的指标有算术平均数、几何平均数、中位数和众数。
- 算术平均数
最常用的一个平均数,也就是常说的均值、平均值,就是我们熟悉的那个求平均值的公式,所有的数值相加再除以总个数:
x=i=1nxin
算术平均数受极值的影响较大,当数据集中出现极端值时,所得到的结果将会出现较大的偏差,如计算一个企业员工的平均收入,因为老板的收入太高了,导致平均值被拉高,出现了整体收入的平均值偏高的现象,我们经常说的工资收入被平均,就是这个道理。
在Excel里也是用AVERAGE()函数来计算
- 几何平均数
几何平均数在计算增长率、收益率等比率和指数进行平均时应用比较广泛,受极端值的影响较小,几何平均值是所有数值乘积开n次方根,在计算几何平均数的时候,不可以有0和负数,公式为:
XG=nX1×X2×…×Xn
在Excel里用GEOMEAN()函数来计算几何平均值
- 中位数
上面讲算术平均数的时候举了一个收入被平均的例子,如果因异常值的出现而无法用算术平均数来描述数据的话,那应该用什么指标来描述呢?对了,就是中位数和众数。
中位数是将数据按照从小到大的顺序排列,最中间的那个数据即为中位数。
中位数的寻找方法:
当数据个数为奇数时,中位数即最中间的数;当数据个数为偶数时,中位数为中间两个数的平均值。中位数不受极值影响,因此对极值缺乏敏感性。
在Excel里用MEDIAN()函数计算中位数
- 众数
众数是数据中出现次数最多的数字,即频数最大的数值。在一组数据中众数可能不止一个,众数不仅能用于数值型数据,还可用于非数值型数据,且不受极值影响。众数通常用来反映一组数据的一般水平,如某次考试中学生的集中水平、城镇居民的平均生活水平等。
在Excel里用MODE()函数来计算众数
02 平均分析法的应用
同一行业不同竞争产品之间同一平均指标的对比,可以用来比较事件的整体水平,下图所示为2018年淘宝、拼多多、唯品会人均单日使用次数和人均单日使用时长的对比。
(数据来源见图片右下角,,侵删)
如下某公司员工平均收入的例子
通过绘制收入分布直方图我们发现,收入在2000~4000的员工最多,与8203的平均值差距太大,这是因为收入在20000以上的几个异常值导致,因此不能用平均值来说明问题。
- 交叉分析法
01 交叉分析的意义
交叉分析就是将两项及多项指标进行交叉,从而找到变量之间的关系,发现数据的特征。如下图所示的一份某连锁店统计的商品销售的数据,原始数据表中有年、月、销售区域、销售数量和售价5个维度,可以进行两两组合,得到一些交叉的关系思路,年&销量,年&售价,区域&销量,区域&售价等等,如果每一个字段我们都进行两两交叉,就可以得到10个交叉关系,需要注意的是,这些交叉关系是要有实际意义的,如年和月的交叉,分析不出什么,也没有意义。
【年&销量】
通过对年和销量间的交叉,得到10年销量比09年高。
【区域&销量】
通过对区域和销量进行交叉分析,得到沈阳的销量最好,上海最差。
【3个维度交叉】
除了两两交叉,还可以多项交叉,如区域&销量&年之间的关系。
【多个维度交叉】
区域&销量&年份&售价四个维度的交叉关系
【小结】
- 对于交叉分析用到最多的工具就是数据透视表
- 要能甄别有意义的交叉和无意义的交叉
- 要找到交叉的点
02 交叉分析的应用
下图所示的拼多多在不同时间维度上的月活,以及与淘宝、京东用户重合的比例进行分析,可以了解到不同时期与竞品的对比。
我是可乐,更多精彩内容欢迎关注公众号:可乐的数据分析之路
-
谁说菜鸟不会数据分析---第5章数据分析5.1数据分析方法--5.1.3结构分析法,5.1.4平均分析法,5.1.5交叉分析...
2018-06-30 23:20:00 -
经典数据分析方法——移动平均法在时序数据分析中的应用分析
2019-01-09 14:22:48移动平均法是指上是对变量值进行平均的方法而已,即对原时间序列数据进行修正,从而消除季节变动和个别不规则变动对整体数据的影响。根据时序数据的特性不同移动平均法可分为三类: 简单移动平均 直接上例子 ...移动平均法
移动平均法是指上是对变量值进行平均的方法而已,即对原时间序列数据进行修正,从而消除季节变动和个别不规则变动对整体数据的影响。根据时序数据的特性不同移动平均法可分为三类:
简单移动平均
直接上例子
移动项数k即为从第一项开始k每隔k项相加,然后相加所得的值除以k就得到了新的时间序列,22=5+7+10得到三项移动的平均值为7.33。有以上例子可以看出,简单的移动平均可以消除个别例外数值对整个数据的趋势。该移动平均方法首先要确定移动项数k,其实k值越大修匀效果越好,但是对于数据量比较少的时候应该权衡k值与数据总个数之间合理性。
如果某个数据具有周期性的变化,应该以周期长度作为移动项数,例如季度数据就应该以4为移动项数,以消除不同季度对整体数据的影响,若为星期数据,就应该以7为移动项数。另外为了数据的连续性和完整性,k的选取也有讲究,若原数据总项数为奇数,那么k也应该取奇数,偶数亦然。这样可以保证所形成的的新的平均数据序列每条数据都是k项相加求平均而来。当然若不按照以上方法确定k也不会对数据整体走势有很大的影响,只是在新数列的首尾两项会存在不合理的现象,数据足够多的情况下可以直接删除首位两项。
简单的移动平均法一般只是使用与具有直线走势的时间数列。
加权移动平均法
该中移动平均方法可以理解为在简单移动平均方法基础之上于k项求和时做一个加权求和的操作。
图中49=5+7*2+10*3,原数列乘以权重后得到三项移动的总和值,再取平均即为8.17。
那么为什么要这么做呢?原因是,在很多情况下,当前数值
受
的影响要大于
, 而
又要大于
,所以就形成了以上权值相加的局面。权值大小的定义需要根据应用场景的不同做调整,但是只要涉及到因为时序数据先后关系影响到当前时序数据值时应该考虑到用加权移动平均的方法。如果你只知道权值在近期数据要大一些,远期数据要小一些,并不知道这权值到底如何进行分配,那么请看一下的指数平滑法。
指数平滑法
指数平滑法是加权移动平均法的一种特殊情形。只选择一个权数,即最近时期观测值得权数,其它时期数据值的权数可以自动推算出来,观测值离预测时期越远,它的权数就越小。模型如下:
现有三个时期的数据y1,y2,y3,来说明任意时期的指数平滑法的预测值。同样也是时间数列以前所有时期值得加权平均数。
个人觉得该种方法必须牢记一点
,即当前项的预测值为前一时刻实际值乘以平滑系数,然后加上前一个时刻的预测值乘以阻尼系数。上面我们看到对
预测期望值的所有参数之和为1,即
。
以下是查阅资料后平滑系数取值与整体数据变化趋势之间大致的一个对应关系,仅供参考。
1、当时间序列呈现较稳定的水平趋势时,应选较小的α值,一般可在0.05~0.20之间取值;
2、当时间序列有波动,但长期趋势变化不大时,可选稍大的α值,常在0.1~0.4之间取值;
3、当时间序列波动很大,长期趋势变化幅度较大,呈现明显且迅速的上升或下降趋势时,宜选择较大的α值,如可在0.6~0.8间选值,以使预测模型灵敏度高些,能迅速跟上数据的变化;
4、当是上升(或下降)的发展趋势类型,α应取较大的值,在0.6~1之间。
综上所述,移动平均法比较适用于具有长期趋势数据的分析。所以当遇到长期的、具有周期性或者不规律的数据走向时可以考虑采用移动平均法。
-
大数据相加_雨沐田:Excel数据分析-移动平均法预测分析
2020-12-30 07:47:46之前的文章对描述分析的几种方法进行了介绍:雨沐田:Excel数据分析工具库进行...这就需要进行预测分析了预测分析是通过对现在和过去的数据分析去展望未来的发展,其中较常用的方法之一就是移动平均法。何为移动平均...之前的文章对描述分析的几种方法进行了介绍:
雨沐田:Excel数据分析工具库进行描述分析
雨沐田:Excel数据分析-直方图是神马东东?
雨沐田:Excel数据分析-相关性分析
描述分析属于认识当下、了解现在,但从根本上说,数据分析的目的是为了更好的发展,可是将来会如何发展呢?这就需要进行预测分析了
预测分析是通过对现在和过去的数据分析去展望未来的发展,其中较常用的方法之一就是移动平均法。
何为移动平均法?
举个栗子先,班上来了新老师,如何能快速的了解学生的学习情况呢?很有效的方法是,查看学生最近几次的考试成绩即可,高效且可靠性很高。
其实这种方法就是移动平均法。
移动平均法是用一组最近的实际数据值来预测未来一期或几期内的未来数据值一种常用方法。移动平均法适用于即期预测。
何为即期预测?就是近期预测,短时间内的预测。
如产品销售额预测,当产品需求既不快速增长也不快速下降,且不存在季节性因素时,移动平均法能有效地消除预测中的随机波动,是非常有用的。
Excel如何做移动平均预测呢?
以某宝网店销售预测为例说明。
我们拿到的样本数据是网店17年前10个月的销售数据,现在想通过移动平均法预测11月份的销售额?
1、点击Excel数据分析菜单,弹出对话框:
2、选择“移动平均”,点击确定后,打开设置窗口:
输入区域:选择销售额列,连同标题一同选择
间隔:填入2
输出区域:选择与当前表格相邻的列中的空白单元格
其他按图示选择
3、点击确定后,得到如下数据:
3、给新数据加表头,并调整格式,最终表格如下:
最终预测得到2017年11月销售额为246249元。
4、点击移动平均结果列任一单元格,看到公式如下:
通过公式解释移动平均的预测方法:
2017年3月的预测值是 1月和2月值相加求平均
2017年4月的预测值是 2月和3月值相加求平均
.....
2017年11月的预测值是 9月和10月值相加求平均
为什么是前两个月相加,而不是前三月呢?这就是我们刚才没有解释的参数“间隔”的缘故:
如果我们将间隔设置为3,就会使三个月的相加求平均。
标准误差说明啥呢?
标准误差表示预测值与实际值的误差,这个值越小越好,说明预测值与实际值越接近,本例中相对于每月25W左右的销售额来说,几千元的误差还是在可以接受的范围内。
再说说图表:
图表没什么特别的,是实际值与预测值的图形输出,根据需要修改下相关文字就好,可以直接使用。
移动平均法是即期预测的常用方法,简单高效,比如房地产行业价格预测,销售企业或网店销售额预测等。
动手试试:
就上述销售数据,试试间隔为3的预测值!
本文的数据案例资源,可以关注公号<大数据力量>,回<移动平均法>免费获取!
-
指数加权移动平均模型_雨沐田:Excel数据分析-指数平滑法预测分析
2021-01-16 23:55:18昨天说到简单移动平均法(雨沐田:Excel数据分析-移动平均法预测分析(修正))预测销售额。最后提到了加权移动平均法,在此稍作说明。假设要用前三个月(7,8,9月)的销售预测本月(10月)的销售额,使用简单移动平均... -
数据分析方法:结构分析法
2020-12-15 16:37:01结构分析法,就是解读数据的一种简单、快捷的方法,也是数据分析师的祖传手艺,今天我们系统讲解一下。 一、从人见人厌的平均数说起 人们天生讨厌平均数,总觉得用平均数很扯淡,有种:“我和姚明平均身高,有毛用”... -
详解数据分析的六个步骤(分析法解释)
2019-09-26 19:08:10在前面我们提到了不少,比如对比分析法、分组分析法、结构分析法、平均分析法、交叉分析法、综合评价分析法、杜邦分析法、漏斗图分析法、矩阵分析法等,我们在这篇文章中给大家解释一下这些方法,希望能够给大家带来... -
人力资源信息分析 动态分析 第5章 数据分析—动态分析法.ppt
2020-09-27 07:19:442. 平均指数的编制 平均指数是以个体指数为基础通过对个体指数加权平均计算的总指数是由总指数变形得来的分为加权算术平均数指数和加权调和平均数指数 * 5.3.3 指数体系的因素分析 1. 指数体系 2. 指数体系的因素... -
数据分析(4):分布分析法&用户留存分析法
2020-02-18 08:54:19一、分布分析法 1. 常见的群体划分有哪些? (1)按事件的频率 举个栗子:某职业技能提升平台(下图)的某公开课程的页面,我们不止可以看PV,还可以把PV以用户浏览的次数进行查看,可以看看有多少人是看了1~3次... -
【数据分析】销售案例——杜邦分析法
2020-08-16 15:59:51杜邦分析法利用各个主要财务比率之间的内在联系,建立财务比率分析的综合模型,来综合地分析和评价企业财务状况和经营业绩的方法。采用杜邦分析图将有关分析指标按内在联系加以排列,本思想是 将企业的净资产收益率... -
数据分析方法论3:综合指标分析法
2020-12-17 16:54:19之前提到的对比、平均、分组和交叉的分析思路,都是在单一指标下分析的方法。而综合指标评价法是建立在复杂数据情况下,将多个指标的转化为一个综合指标对某一特征进行总体评价,如人民的幸福程度、人才评价、用户... -
一些常见的数据分析方法
2019-09-26 19:09:58我们在做数据分析工作的...数据分析中的平均分析法就是运用计算平均数的方法来反应总体在一定时间、地点条件下某一数量特征的一般水平。平均指标法的主要作用有两点,第一就是利用平均指标对比某些现象在不同历史... -
业务数据分析策略(1)——杜邦分析法拆解业务
2019-10-16 15:26:171、利用杜邦分析法拆解业务波动 算是今天价值最大的复盘和收获了了。 杜邦分析法 是利用权重大的几种财务比例的关系来综合分析和评估财务状况。基本思想是 将企业的净资产收益率逐级分解为多项比例的乘积,有助于... -
数据分析(入门篇)-第二章-玩转数据分析-Part7(Excel数据分析工具库-移动平均)
2017-07-09 13:19:33同相关分析和回归分析,移动平均法也可作为一种预测方法。 -
数据结构之算法分析O表示法
2020-10-11 16:36:08算法分析最坏情况分析为什么要考虑最坏情况O表示法O表示法简单规则计算的复杂度 最坏情况分析 通常评判算法性能的三种情况: 最佳情况 平均情况 最坏情况 算法在不同的情况下性能差异可能很大。比如一种简单的线性... -
大数据学习——常用的数据分析法和模型
2018-10-12 15:18:15产品的基本数据指标 新增:日新增、月新增 活跃:如日活跃(DAU)、月活跃(MAU)等 留存率:用户会在多长时间内使用产品,如:次日留存率、...常见的数据分析法和模型 直方图(频率分布)分析 将某... -
数据分析入门
2019-10-09 13:08:29描述性数据分析:属于初级数据分析,常见的分析方法有对比分析法,平均分析法,交叉分析法 探索性数据分析和验证性数据分析:属于高级数据数据分析,常见的分析方法有相关分析,因子分析,回归分析,这部分就是人工... -
Excel-移动平均分析及预测分析
2018-06-08 11:34:21一、背景说明移动平均法是用一组最近的实际数据值来预测未来一期或几期内公司产品的需求量、公司产能等的一种常用方法。移动平均法适用于即期预测。当产品需求既不快速增长也不快速下降,且不存在季节性因素时,移动... -
数据分析软件及其应用x_苹果x重启数据分析代码
2020-04-21 00:01:01EXCEL Markway SPSS 数据分析软件及其应用一课程概述一开课的意义二数据分析的基本内容三数据分析的基本方法四数据分析的基本程序五数据分析软件...多元统计数据分析数据相互关系的分析方法三数据分析的主要方法指标法... -
描述性数据分析
2018-07-22 16:33:38描述性数据分析属于比较初级的数据分析,常见的分析方法包括对比分析法、平均分析法、交叉分析法等。描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据... -
Python之数据分析(算数平均值、加权平均值、最大值与最小值)
2020-07-15 22:06:34文章目录一、算数平均值二、加权平均值三、最大值与最小值 一、算数平均值 ...2、算数平均值求法 样本:S = [s1, s2, s3, …, sn] 算术平均值:m = (s1 + s2 + s3 + … + sn)/n 3、Numpy中的格式 m = nu -
数据分析分类
2015-03-11 21:12:412015-3-11 统计学中,有些学者把数据分析划分为描述性数据分析、探索性数据分析... 常见方法:对比分析法、平均分析法、交叉分析法等。 探索性数据分析 、 高级数据分析 常见方法:相关分析、因子分析、回归分析 -
菜鸟数据分析讲解材料.pptx
2020-07-27 01:44:21数据分析哪些事儿数据分析是神马数据分析六部曲常用指标或术语数据分析是...数据分析对比分析法平均分析法交叉分析法高级数据分析相关分析因子分析回归分析数据分析是神马数据分析师的基本素质态度严谨负责好奇心强烈... -
两组的数据平均值合并_三种实验室间比对数据统计分析方法解读
2021-01-07 15:24:57而在国外,实验室间比对常用的数据统计分析方法为ISO 5725.2-1994《测量方法与结果的准确度(正确度与精密度) 第2部分 确定标准测量方法重复性与再现性的基本方法》中推荐的格拉布斯检验法(Grubbs)和科克伦(Cochran)... -
python爬取股票平均成本怎么算_用Python做股市数据分析(二)
2020-12-21 16:22:48在这两篇博文中,我会讨论一些基础知识,包括比如如何用pandas从雅虎财经获得数据, 可视化股市数据,平均数指标的定义,设计移动平均交汇点分析移动平均线的方法,回溯测试和 基准分析法。这篇文章会讨论如何... -
基于python数据分析(分析篇六:主观概率/启发法)
2020-10-06 20:15:14数据集中的大部分点都会落在平均值的一个标准偏差范围内 单位:取决于测量单位 作用:主观概率偏离平均的标准差越大,分析师在假设成立的可能性方面的差距就越大。 方法:这个使用Excel可以解决,后续会做;也可以... -
数据分析的流程
2020-09-15 14:13:54**描述性数据分析(Descriptive Data Analysis,DDA)**属于比较初级的数据分析,常见的分析方法包括对比分析法、平均分析法、交叉分析法等。描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括...
-
基于python的dango框架购物商城毕业设计毕设源代码使用教程
-
access应用的3个开发实例
-
龙芯实训平台应用实战(希云)
-
ubuntu18.04 roscore无效
-
通过枢轴选择进行物体识别的高效图像表示
-
基于隐马尔可夫模型的查询扩展方法
-
【LeetCode】1380. 矩阵中的幸运数(C++)
-
数字图像处理与机器视觉.rar
-
【邻接矩阵】56 邻接矩阵:添加一个顶点
-
HWIDGen.zip
-
FileOutputStream的使用
-
3.初窥JZ2440开发板
-
多标签分类的半监督低秩映射学习
-
【Python-随到随学】FLask第二周
-
PSCS3.zip文件包含ps软件及各种素材
-
umi配置less
-
sqlservr64.rar
-
MySQL 高可用工具 heartbeat 实战部署详解
-
2021-02-26
-
jetty-distribution-9.4.9.v20180320.zip