精华内容
下载资源
问答
  • 本篇文章主要讨论样本方差和样本协方差除以n-1问题,其他暂且不做过多赘述。 方差的维基百科定义:一个随机变量的方差描述的是它的离散程度,也就是该变量到其期望值的距离。 计算公式: 样本方差:样本方差是...

    本篇文章主要讨论样本方差和样本协方差除以n-1问题,其他暂且不做过多赘述。

    方差的维基百科定义:一个随机变量的方差描述的是它的离散程度,也就是该变量到其期望值的距离。

    计算公式:

    样本方差:样本方差是依据所给样本对方差做出的一个无偏估计。用样本去推测整体情况。

    计算公式: 其中n为样本数。

    等等,为什么样本方差的计算公式不是n而是n-1呢,不应该是求平均值吗,你看,假设一对数据的总体样本为:,然后每个样本不就是,也就是,这样似乎才是符合数学推理的吧?但是为什么那么多统计学家给出的却要除以n-1呢?

    原来啊,我们在估算的时候总是用最大似然方法,让去代替,这样就会导致:

    是不是:,那么这样的话,我们是不是总是莫名其妙的对样本方差估计小了?所以我们就要放大,就变成了除以n-1,那为什么不处以n-a,a为任意小于n的实数呢。这个挖个坑,因为我也没太明白,有没有知道的可以告诉我,哈哈。

    还有为什么不能用均值代替期望呢,因为期望和均值相等只是理想情况下的,比如你扔硬币,次数越多,可能越有偏差。

    刚刚那个是从数学上推断,我们来想想逻辑上的。

    假设我们两个平均有8个苹果,我比平均值多1个,那么我就算不知道你的任何信息,我也会计算出你的信息吧,也就是说,这一部分信息是多余的,那假设还有一个小王,我是比平均多一个,小王是少一个,我根本不用知道你的信息,就可以知道你的苹果数,对吧。样本方差也是这样,我们用整体去推测个体,是不需要个体都知道的,缺失一个信息是没有影响的,所以我们要从总样本中减去1。

    方差是协方差的特殊情况,就是当两个变量x与y相等时候的情况。既然我们已经知道样本方差为什么是除以n-1。那么样本协方差也是一样的道理。

    样本协方差的计算公式:

    转载于:https://www.cnblogs.com/xiaohuahua108/p/6385812.html

    展开全文
  • 样本协方差矩阵及MATLAB实现

    万次阅读 2018-05-11 19:11:42
    首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述:均值:标准差:方差:均值描述的是样本集合的中间点,它告诉我们的信息是有限的,而标准差给我们描述的是样本集合的各个样本点到...

    长时间不学数学,把知识都还给老师了~一起来温习一下吧。

    转自:http://pinkyjie.com/2010/08/31/covariance/

    一、统计学的基本概念

    统计学里最基本的概念就是样本的均值、方差、标准差。首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述:

    均值:clip_image002

    标准差:image

    方差:image

    均值描述的是样本集合的中间点,它告诉我们的信息是有限的,而标准差给我们描述的是样本集合的各个样本点到均值的距离之平均。

    以这两个集合为例,[0, 8, 12, 20]和[8, 9, 11, 12],两个集合的均值都是10,但显然两个集合的差别是很大的,计算两者的标准差,前者是8.3后者是1.8,显然后者较为集中,故其标准差小一些,标准差描述的就是这种“散布度”。之所以除以n-1而不是n,是因为这样能使我们以较小的样本集更好地逼近总体的标准差,即统计上所谓的“无偏估计”。而方差则仅仅是标准差的平方。

     

    二、为什么需要协方差

    标准差和方差一般是用来描述一维数据的,但现实生活中我们常常会遇到含有多维数据的数据集,最简单的是大家上学时免不了要统计多个学科的考试成绩。面对这样的数据集,我们当然可以按照每一维独立的计算其方差,但是通常我们还想了解更多,比如,一个男孩子的猥琐程度跟他受女孩子的欢迎程度是否存在一些联系。协方差就是这样一种用来度量两个随机变量关系的统计量,我们可以仿照方差的定义:

    clip_image002[6]

    来度量各个维度偏离其均值的程度,协方差可以这样来定义:

    clip_image002[8]

    协方差的结果有什么意义呢?如果结果为正值,则说明两者是正相关的(从协方差可以引出“相关系数”的定义),也就是说一个人越猥琐越受女孩欢迎。如果结果为负值, 就说明两者是负相关,越猥琐女孩子越讨厌。如果为0,则两者之间没有关系,猥琐不猥琐和女孩子喜不喜欢之间没有关联,就是统计上说的“相互独立”。

    从协方差的定义上我们也可以看出一些显而易见的性质,如:

    clip_image002[10]

    clip_image002[12]

     

    三、协方差矩阵

    前面提到的猥琐和受欢迎的问题是典型的二维问题,而协方差也只能处理二维问题,那维数多了自然就需要计算多个协方差,比如n维的数据集就需要计算clip_image002[16]个协方差,那自然而然我们会想到使用矩阵来组织这些数据。给出协方差矩阵的定义:

    clip_image002[18]

    这个定义还是很容易理解的,我们可以举一个三维的例子,假设数据集有三个维度,则协方差矩阵为:

    clip_image002[20]

    可见,协方差矩阵是一个对称的矩阵,而且对角线是各个维度的方差。

     

    四、Matlab协方差实战

    必须要明确一点,协方差矩阵计算的是不同维度之间的协方差,而不是不同样本之间的。以下的演示将使用Matlab,为了说明计算原理,不直接调用Matlab的cov函数:

    首先,随机生成一个10*3维的整数矩阵作为样本集,10为样本的个数,3为样本的维数。

    wps_clip_image-15418

    图 1 使用Matlab生成样本集

    根据公式,计算协方差需要计算均值,前面特别强调了,协方差矩阵是计算不同维度之间的协方差,要时刻牢记这一点。样本矩阵的每行是一个样本,每列是一个维度,因此我们要按列计算均值。为了描述方便,我们先将三个维度的数据分别赋值:

    wps_clip_image-17278

    图 2 将三个维度的数据分别赋值

    计算dim1与dim2,dim1与dim3,dim2与dim3的协方差:

    wps_clip_image-19087

    图 3 计算三个协方差

    协方差矩阵的对角线上的元素就是各个维度的方差,下面我们依次计算这些方差:

    wps_clip_image-20207

    图 4 计算对角线上的方差

    这样,我们就得到了计算协方差矩阵所需要的所有数据,可以调用Matlab的cov函数直接得到协方差矩阵:

    wps_clip_image-25729

    图 5 使用Matlab的cov函数直接计算样本的协方差矩阵

    计算的结果,和之前的数据填入矩阵后的结果完全相同。

    展开全文
  • 协方差的计算公式及R语言验证

    千次阅读 2020-02-28 02:19:26
    首先附上协方差公式: 来设5个样本点:(3,9),(2,7),(4,12),(5,15),(6,17) 用R绘制出散点图,大概是这样: 要求这5个点的协方差,首先样本点为5个,n=5,X依次取3,2,4,5,6,Y依次取9,7,12,15,17。X的...

    协方差的计算公式及R语言进行验证

    首先附上协方差公式:

    在这里插入图片描述

    来设5个样本点:(3,9),(2,7),(4,12),(5,15),(6,17)

    用R绘制出散点图,大概是这样:
    在这里插入图片描述
    要求这5个点的协方差,首先样本点为5个,n=5,X依次取3,2,4,5,6,Y依次取9,7,12,15,17。X的均值为4,带入公式可得:
    在这里插入图片描述
    不难计算出结果为6.5

    现在用R语言进行验证:

    已知R语言里边协方差函数为cov(x,y)
    我们分别用cov()函数和上述公式来进行仿真结果,代码如下:

    a <- c(3,2,4,5,6)
    b <- c(9,7,12,15,17)
    COV=0
    EX=mean(a)
    EY=mean(b)
    for(j in 1:5){
    	COV <- COV+(a[j]-EX)*(b[j]-EY)/4
    }
    COV
    cov(a,b)
    

    输出结果如下:

    > COV
    [1] 6.5
    > cov(a,b)
    [1] 6.5
    

    由此可得,计算公式得出的结果完全正确

    展开全文
  • 协方差cov(X),cov(X,Y);变异系数c.v

    千次阅读 2019-09-20 11:37:27
    首先看看 均值,样本方差,样本协方差 公式区别 其中样本方差公式中为什么除的n-1而不是n,样本协方差同样除的是n-1而不是n,请看此处:http://blog.csdn.net/maoersong/article/details/21819957,如果除的是n,...

    首先看看 均值,样本方差,样本协方差 公式区别

    Xˉ\bar{X} = 1Ni=1Nxi\frac{ 1}{N}\sum_{i=1}^N x_i

    S = 1N1i=1N(xixˉ)\frac{ 1}{N-1}\sum_{i=1}^N (x_i-\bar{x})

    cov(x,y) = 1N1i=1N(xixˉ)(yiyˉ)\frac{ 1}{N-1}\sum_{i=1}^N (x_i-\bar{x})(y_i-\bar{y})

    其中,样本方差公式中为什么除的n-1而不是n,样本协方差同样除的是n-1而不是n,请看此处:http://blog.csdn.net/maoersong/article/details/21819957,如果除的是n,那么求的方差就不是随机抽取变量组成样本的方差,而是整个空间的方差。

    协方差 cov(x)

    - x 为一个样本向量

    cov(x)计算的是样本方差的无偏估计,但不是真正的方差s2s^2,真正的方差是样本的最大似然估计,可以用cov(x,1)计算。
    cov(x) = i=1n(xxˉ)n1\frac{\sum_{i=1}^{n} (x-\bar{x})}{n-1}

    cov(x,1) = s2s^2 = i=1n(xxˉ)n\frac{\sum_{i=1}^{n}( x-\bar{x})}{n}

    - x 为一个样本矩阵

    若x=(x1,x2,...,xn)T(x_1,x_2,...,x_n)^T是n维矩阵,即n个样本变量,cov(x)得到n×n的矩阵
    在这里插入图片描述
    其中对角线元素是每个维度的方差,非对角线上的元素则是不同维度间的协方差,c12=c21c_{12}=c_{21}

    协方差 cov(x,y)

    x=[a1,a2,...,ama_1,a_2,...,a_m]
    y=[b1,b2,...,bmb_1,b_2,...,b_m]
    z=(a1a2...amb1b2...bm)\begin{pmatrix} a_1 & a_2 & ... & a_m \\ b_1 & b_2 & ... & b_m \end{pmatrix}

    cov(x,y) = cov(z)
    cov(z)其实就是把cov(x,y)中两个变量纵向拼接在一起作为z参与运算。

    所以,协方差矩阵运算时,首先要明确矩阵的一行是一组样本还是一列。

    变异系数 c.v

    比较两组数据离散程度,如果两组数据的测量尺度相差太大,或者数据量纲的不同,直接使用标准差来进行比较不合适,此时就应当消除测量尺度和量纲的影响。
    c.v = (标准差 s / 平均值 xˉ\bar{x})× 100%
    进行数据分析时,若变异系数大于15%,则考虑该数据可能不正常,应该剔除。

    ————————————————
    版权声明:部分内容参考「月亮是蓝色」的文章,
    原文链接:https://blog.csdn.net/lyl771857509/article/details/79439184

    展开全文
  • numpy中方差var、协方差cov求法

    千次阅读 2017-03-06 19:20:41
    在PCA中涉及到了方差var和协方差cov,下面详细了解这两个函数...首先均值,样本方差,样本协方差公式分别为   其中样本方差公式中为什么除的n-1而不是n,样本协方差同样除的是n-1而不是n,请看此处:http://blog.
  • 1.协方差和协方差矩阵的概念公式1.1协方差公式1.2协方差矩阵公式有数据集={X,Y,Z},是三维度的数据,即此此数据集中的样例有3个特征2.协方差的多种求解Python实现2.1代码2.2运行结果3.协方差矩阵的多种求解Python...
  • 协方差的意义和计算公式 分类: 学术 2013-02-25 20:59 16605人阅读 评论(4) 收藏 举报 目录(?)[+] 协方差与相关系数--ppt例子 协方差的意义和计算公式 学过概率统计的孩子都知道,统计里最基本的概念...
  • 意义和公式协方差

    2015-06-21 17:48:00
    意义和公式协方差 概率统计研究孩子知道。在最重要的概念的统计是样品平均值,方差,或带有标准偏差一起。首先,我们会给您一个含n采集样本。概念的公式描写叙述。这些高中学过数学的孩子都应该知道吧,一带而过...
  • 首先我们给你一个含有n个样本的集合,依次给出这些概念的公式描述,这些高中学过数学的孩子都应该知道吧,一带而过。 很显然,均值描述的是样本集合的中间点,它告诉我们的信息是很有限的,而标准差给我们...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 484
精华内容 193
关键字:

样本协方差公式