精华内容
下载资源
问答
  • 很多同学会很奇怪一个问题,那就是为什么样本的二阶中心m2=1n∑i=1n(Xi−X‾)2m_2=\frac{1}{n} \sum_{i = 1}^{n}(X_i - \overline{X})^2m2​=n1​∑i=1n​(Xi​−X)2和样本的方差S2=1n−1∑i=1n(Xi−X‾)2S^2 = \...

    问题引入:

    很多同学会很奇怪一个问题,那就是为什么样本的二阶中心矩m2=1ni=1n(XiX)2m_2=\frac{1}{n} \sum_{i = 1}^{n}(X_i - \overline{X})^2和样本的方差S2=1n1i=1n(XiX)2S^2 = \frac{1}{n-1} \sum_{i=1}^{n}(X_i - \overline{X})^2相差一个常数因子n1n\frac{n-1}{n},即
    m2=n1nS2 m_2 = \frac{n-1}{n}S^2
    这就涉及到估计量的无偏性问题。


    1.发现问题

    首先我们假设总体分布的期望和方差分别为μ\muσ2\sigma^2
    下面我们来看看问题所在。
    首先我们假设S2S^2m2m_2一样为1ni=1n(XiX)2\frac{1}{n}\sum_{i=1}^{n}(X_i-\overline{X})^2,那么有如下推导:
    S2=1ni=1n(XiX)2=1ni=1n(Xiμ+μX)2=1ni=1n[(Xiμ)2+2(Xiμ)(μX)+(μX)2]=1ni=1n(Xiμ)2+2ni=1n(Xiμ)(μX)+1ni=1n(μX)2=1ni=1n(Xiμ)2+2n(μX)i=1n(Xiμ)+1ni=1n(μX)2 S^2 = \frac{1}{n}\sum_{i=1}^{n}(X_i - \overline{X})^2 = \frac{1}{n} \sum_{i=1}^{n}(X_i - \mu + \mu - \overline{X})^2 \\ =\frac{1}{n} \sum_{i = 1}^{n}[(X_i - \mu)^2 + 2(X_i-\mu)(\mu-\overline{X}) + (\mu - \overline{X})^2] \\=\frac{1}{n}\sum_{i=1}^{n}(X_i-\mu)^2 + \frac{2}{n}\sum_{i=1}^{n}(X_i-\mu)(\mu-\overline{X})+\frac{1}{n}\sum_{i=1}^{n}(\mu-\overline{X})^2\\=\frac{1}{n}\sum_{i=1}^{n}(X_i-\mu)^2 + \frac{2}{n}(\mu-\overline{X})\sum_{i=1}^{n}(X_i-\mu)+\frac{1}{n}\sum_{i=1}^{n}(\mu-\overline{X})^2
    注意此时 i=1nXi=i=1nX\because \sum_{i=1}^{n}X_i=\sum_{i=1}^{n}\overline{X}\therefore 继续推导有:
    S2=1ni=1n(Xiμ)2+2n(μX)i=1n(Xμ)+1ni=1n(μX)2=1ni=1n(Xiμ)22ni=1n(μX)2+1ni=1n(μX)2=1ni=1n(Xiμ)21ni=1n(μX)2=Var(Xi)Var(X)=σ2Var(X) S^2 = \frac{1}{n}\sum_{i=1}^{n}(X_i-\mu)^2 + \frac{2}{n}(\mu-\overline{X})\sum_{i=1}^{n}(\overline{X}-\mu)+\frac{1}{n}\sum_{i=1}^{n}(\mu-\overline{X})^2 \\ =\frac{1}{n}\sum_{i=1}^{n}(X_i-\mu)^2 - \frac{2}{n}\sum_{i=1}^{n}(\mu-\overline{X})^2+\frac{1}{n}\sum_{i=1}^{n}(\mu-\overline{X})^2\\ = \frac{1}{n}\sum_{i=1}^{n}(X_i-\mu)^2 - \frac{1}{n}\sum_{i=1}^{n}(\mu-\overline{X})^2\\=Var(X_i)-Var(\overline{X})=\sigma^2 - Var(\overline{X})
    再次打断,\because方差有如下性质:
    1.若cc常数,则Var(cX)=c2Var(X)Var(cX)=c^2Var(X)[推导很简单,不解释了]
    2.Var(X1+X2+...+Xn)=Var(X1)+Var(X2)+...+Var(Xn)Var(X_1+X_2+...+X_n) = Var(X_1) + Var(X_2) +...+Var(X_n)
    且每个样本XiX_i都可视为一个随机变量,其分布同于总体分布,因此其方差也同于总体方差
    Var(X)=Var(1ni=1nXi)=1n2Var(i=1nXi)=1n2i=1nVar(Xi)=1n2nVar(Xi)=1nσ2 \therefore Var(\overline{X})=Var(\frac{1}{n}\sum_{i=1}^{n}X_i)=\frac{1}{n^2}Var(\sum_{i=1}^{n}X_i)\\=\frac{1}{n^2}\sum_{i=1}^{n}Var(X_i)=\frac{1}{n^2}\cdot n\cdot Var(X_i) = \frac{1}{n}\sigma^2
    \therefore 继续推导有:
    S2=σ2Var(X)=σ21nσ2=n1nσ2 S^2=\sigma^2 - Var(\overline{X})=\sigma^2 - \frac{1}{n}\sigma^2=\frac{n-1}{n}\sigma^2
    至此就会发现用m2m_2来估计σ2\sigma^2是不准确的。


    2.证明问题

    okay,那么接下来我们需要证明样本方差S2=1n1i=1n(XiX)2S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2是总体分布方差σ2\sigma^2无偏估计
    i=1n(XiX)2=i=1n[(Xiμ)(Xμ)]2=i=1n(Xiμ)22(Xμ)i=1n(Xiμ)+i=1n(Xμ)2=i=1n(Xiμ)22(Xμ)i=1n(Xiμ)+n(Xμ)2 \sum_{i=1}^{n}(X_i-\overline{X})^2=\sum_{i=1}^{n}[(X_i-\mu)-(\overline{X}-\mu)]^2\\=\sum_{i=1}^{n}(X_i-\mu)^2-2(\overline{X}-\mu)\sum_{i=1}^{n}(X_i - \mu)+\sum_{i=1}^{n}(\overline{X}-\mu)^2 \\=\sum_{i=1}^{n}(X_i-\mu)^2-2(\overline{X}-\mu)\sum_{i=1}^{n}(X_i - \mu)+n(\overline{X}-\mu)^2
    注意此时 i=1n(Xiμ)=n(Xμ)\because \sum_{i=1}^{n}(X_i-\mu)=n(\overline{X}-\mu)\therefore继续有:
    i=1n(XiX)2=i=1n(Xiμ)22n(Xμ)2+n(Xμ)2=i=1n(Xiμ)2n(Xμ)2 \sum_{i=1}^{n}(X_i-\overline{X})^2=\sum_{i=1}^{n}(X_i-\mu)^2-2n(\overline{X}-\mu)^2+n(\overline{X}-\mu)^2\\=\sum_{i=1}^{n}(X_i-\mu)^2-n(\overline{X}-\mu)^2
    \because 样本均值是总体分布均值的无偏估计
    E(Xi)=E(X)=μ\therefore E(X_i)=E(\overline{X})=\mu

    \therefore有:
    E[i=1n(Xiμ)2]=i=1nE(Xiμ)2=i=1nVar(Xi)=nσ2E[n(Xμ)2]=nE(Xμ)2=nVar(X)=n1n2i=1nVar(Xi)=nnn2σ2=σ2 E[\sum_{i=1}^{n}(X_i-\mu)^2]=\sum_{i=1}^nE(X_i-\mu)^2=\sum_{i=1}^{n}Var(X_i)=n\sigma^2\\ E[n(\overline{X}-\mu)^2]=nE(\overline{X}-\mu)^2=nVar(\overline{X})=n\cdot \frac{1}{n^2}\sum_{i=1}^{n}Var(X_i)=n\cdot \frac{n}{n^2}\cdot \sigma^2\\=\sigma^2
    因此最终有:
    E(S2)=1n1E(i=1n(XiX)2)=1n1E(i=1n(Xiμ)2n(Xμ)2)=1n1(nσ2σ2)=σ2 E(S^2)=\frac{1}{n-1}E(\sum_{i=1}^{n}(X_i-\overline{X})^2)=\frac{1}{n-1}E(\sum_{i=1}^{n}(X_i-\mu)^2-n(\overline{X}-\mu)^2)\\=\frac{1}{n-1}(n\sigma^2-\sigma^2)=\sigma^2
    至此说明了样本方差S2=1n1i=1n(XiX)2S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2是总体分布方差σ2\sigma^2无偏估计

    展开全文
  • 一阶矩+二阶矩估计求解一个参数

    万次阅读 2016-11-18 09:29:29
    但是有些情况下,只写一阶矩,原理上是可以求得解,但是,初等代数中很难剥离出来,可以考虑再求一次二阶矩,即,再利用样本提供一组值,二者相互作用,可以求解出p.值得注意是,二者求得实际解并不是完全一致...

    一阶矩+二阶矩估计求解一个参数

    @(概率论)

    一般来说,一个参数对应一个方程。所以在矩估计法中,用一阶矩就可以求解一元。但是有些情况下,只写一阶矩,原理上是可以求得解的,但是,初等代数中很难剥离出来,可以考虑再求一次二阶矩,即,再利用样本提供一组值,二者相互作用,可以求解出p.

    值得注意的是,二者求得的实际解并不是完全一致,因为又一次用了矩估计,所以等于两次估计求解一元。这是可以接受的,因为如果是二元,我们也会求两次,不会说因为多了一次估计,就少了很多精度。

    看一个例子。

    X1,X2,...,Xn是来自对数级数分布P(X=k)=pkln(1p)k,(0<p<1,k=0,1,2,...)的一个样本,求p的矩估计。

    分析:这是问的非常直接的题目。上来就可以列式:

    EX=k=1kP(X=k)=k=1kpkln(1p)k=1ln(1p)k=1pk=1ln(1p)p1p

    EX=1nni=1Xi

    很难从中抽出p的表达式。

    而且还不能就写p就在这个表达式的关系中。

    那么,可以考虑引入二阶矩。

    EX2=k=1k2P(X=k)=k=1k2pkln(1p)k=1ln(1p)k=1kpk=1ln(1p)p(1p)2

    EX2=1nni=1X2i

    二式相除:

    p̂ =1X1nni=1X2i

    即为所求。也就是用样本的一阶矩和二阶矩构造了一元参数的估计量。这种思路是很值得借鉴的。

    展开全文
  • 论文研究-基于已实现二阶矩预测期货套期保值策略及对股指期货应用.pdf, 资产收益跳跃行为给套期保值决策带来了挑战. 提出了考虑跳跃、基于预测VecHAR-RVRCOV-J...
  • 扩展的 SMA 模型可以准确地保留任意的二阶结构以及过程的高阶,从而能够更好地逼近任何类型的依赖(通过二阶统计)和边际分布函数(通过统计) ), 分别。 有趣的是,通过明确保留峰度系数,它还可以模拟间歇...
  • 然后利用样本损失离散值定位出困难样本、简单样本的边界,从而获得困难样本集合,最后在反向传播过程中根据不同样本损失的二阶矩对学习样本的贡献率分布进行平衡。实验结果表明所提多类绝缘子缺陷检测方法能够有效地...
  • 本博文源于matlab在概率论应用。学过概率论小伙伴知道要计算...其中一阶原点就是数学期望,而用二阶样本中心距是来计算总体方差。了解到这些,在matlab编写代码时,对照概率论书籍,就编写非常愉快了。

    本博文源于matlab在概率论的应用。学过概率论的小伙伴知道要计算矩估计值需要跟原点矩和中心矩打交道。其中原点矩和中心距在概率论书中都有相应的公式我们会套用即可
    其中一阶原点矩就是数学期望,而用二阶样本中心距是来计算总体的方差的。了解到这些,在matlab编写代码时,对照概率论的书籍,就编写的非常愉快了。

    例子:随机取8只活塞,测得它们的直径(以mm计),求总体均值以及方差的矩估计值:

    这是活塞直径:单位不要忘记mm哦!

    X = [74.001,74.005,74.003,74.001,74.000,73.998,74.006,74.002];
    

    然后我们采用函数编写的方式,分而治之就行了

    创建mu.m,代码如下:

    function y = mu(X)
    n = length(X);
    s = sum(X);
    y = s / n;
    
    

    这就是传说中的以样本均值代替总体均值

    创建sigma2.m,代码如下:

    function y = sigma2(X)
    Y = X - mu(X);
    Y2 = Y.*Y;
    n = length(X);
    s = sum(Y2);
    y = s/n;
    
    

    这样就是以样本方差代替总体方差的矩估计

    创建main.m,代码如下:

    这个主要处理总体数据流程控制:

    X = [74.001,74.005,74.003,74.001,74.000,73.998,74.006,74.002];
    mu = mu(X)
    sig = sigma2(X)
    

    运行在matlab代码里,就会有这样的显示效果:
    在这里插入图片描述
    博主采用在线编译(网址如下):
    不要忘记收藏的链接哟!
    最后回答:由此可见,总体均值的矩估计值为74.002,总体方差的矩估计值为6*10^-6.

    展开全文
  • 在某些科学著作中,一旦从感兴趣的人群中收集数据,通常很难了解数据以无组织方式呈现时的含义。 将原始数据组合成有意义的形式... Y = VAR(X,1) 通过 N 进行归一化并产生样本关于其均值的二阶矩。 VAR(X,0) 与 VAR(X)
  • 在某些科学著作中,一旦从感兴趣的人群中收集数据,通常很难了解数据以无组织方式呈现时的含义。 将原始数据组合成有意义的形式,... Y = STD(X,1) 用 N 归一化并产生样本关于其均值的二阶矩的平方根。 STD(X,0) 与 ST
  • 估计

    千次阅读 2013-03-25 11:14:44
    假设总体分布的k阶原点为uk,k阶中心...样本的k阶原点是总体k阶原点的无偏估计,而中心一般不是无偏的,有时可以通过一些参数修正为无偏估计。例如S2 = nm2/(n-1),就将有偏的二阶中心修正为无偏的方差。下面

    假设总体分布的k阶原点矩为uk,k阶中心矩为hk,当样本大小n较大时,总体矩接近于样本矩,即uk  ak,hk  mk。因此可以通过样本矩来估计总体矩,而总体矩中包含未知参数,可以通过求解方程组的方法来求解未知参数。

    样本的k阶原点矩是总体k阶原点矩的无偏估计,而中心矩一般不是无偏的,有时可以通过一些参数修正为无偏估计。例如S2 = nm2/(n-1),就将有偏的二阶中心矩修正为无偏的方差。下面举几个例子:



    由以上两个例子我们可以看出,矩估计法就是通过样本和总体k阶原点矩,k阶中心矩之间的近似相等关系,用总体矩来表示未知参数,再用样本矩近似表示相应总体矩,从而实现利用样本矩求解未知参数的目的。

    Reference

    陈希孺,《概率论与数理统计》


    展开全文
  • 样本估计

    2019-09-15 13:24:42
    为什么样本方差(sample variance)分母是 n-1 ...最简单的矩估计法是用一阶样本原点估计总体期望,而用二阶样本中心估计总体方差。 最大似然估计 最合理参数估计量应该是使得从模型中抽取该n...
  • 机器学习笔记

    2018-06-19 22:32:15
    样本均值虽然以真实均值为中心分布,但存在方差,由于以样本均值为中心的二阶矩小于以实际均值为中心的二阶矩,因此样本方差的期望小于实际方差,实际上前者比后者少了一个自由度。但是需要注意的是,我们说“过拟合...
  • Adam 这个名字来源于adaptive moment estimation,自适应矩估计,如果一个随机变量 X 服从某个分布,X 的一阶矩是 E(X),也就是样本平均值,X 的二阶矩就是 E(X^2),也就是样本平方的平均值。Adam 算法根据损失...
  • 统计学:估计法

    千次阅读 2016-02-16 10:39:17
    估计法 百度百科:... 所谓估计法,就是利用样本矩来估计总体中相应参数.最简单的矩估计法是用一阶样本原点来估计总体期望而用二阶样本中心来估计总体
  • 输入2-100的样本,要求输入格式为小数,样本数为n并确定具体数值,输出不超过每个数最大素数,并由此计算一阶矩、二阶矩及三阶矩,输入两组数据并验证。 二、实验代码 #include<iostream> #include<...
  • (常用算法2)估计与最大似然估计

    千次阅读 2018-03-11 13:29:29
    估计:即是通过已知样本求出未知整体参数;一、矩估计矩概念设有自然数k,常数a,...例:通过一阶矩与二阶矩估计整体设总体X服从区间[a,b]均均分布,a、b未知,x1、x2...xnx_1、x_2...x_n是X的样本值,求a,b;
  • 估计与最大似然估计

    千次阅读 2018-12-05 16:21:16
    一阶原点估计 :原理是针对矩阵的每一个点 求每一个点都和原点相减的和,然后在除以样本的总量 本质是上求样本的均值 二阶中心:(均值) 每个样本减去均值的平方和除以n 求方差  最大似然估计法: 最大似然...
  • 神经网络的输入可以是降低分辨率的人脸图像、局部区域的自相关函数、局部纹理的二阶矩等。这类方法同样需要较多的样本进行训练,而在许多应用中,样本数量是很有限的。
  • 随机最速下降法(SGD)与AdamOptimizer

    万次阅读 2018-02-22 12:03:11
    Adam 这个名字来源于adaptive moment estimation,自适应矩估计,如果一个随机变量 X 服从某个分布,X 的一阶矩是 E(X),也就是样本平均值,X 的二阶矩就是 E(X^2),也就是样本平方的平均值。Adam 算法根据损失函数...
  • 尝试Adam代替梯度下降

    千次阅读 2017-09-13 14:04:52
    概率论中矩的含义是:如果一个随机变量 X 服从某个分布,X 的一阶矩是 E(X),也就是样本平均值,X 的二阶矩就是 E(X^2),也就是样本平方的平均值。Adam 算法根据损失函数对每个参数的梯度的一阶矩估计和二阶矩估计...
  • 概率论中矩的含义是:如果一个随机变量 X 服从某个分布,X 的一阶矩是 E(X),也就是样本平均值,X 的二阶矩就是 E(X^2),也就是样本平方的平均值。Adam 算法根据损失函数对每个参数的梯度的一阶矩估计和二阶矩估计...
  • 借助于总体一个样本,构造适当的样本函数来估计总体S未知参数问题称为参数点估计问题。 点估计就是用一个数据(data)函数(通常称为估计统计量,estimator)来给出一个未知参数估计值。 这个定义不...
  • AdamOptimizer和SGD随机梯度下降

    千次阅读 2020-06-01 18:04:59
    Adam 这个名字来源于adaptive moment estimation,自适应矩估计,如果一个随机变量 X 服从某个分布,X 的一阶矩是 E(X),也就是样本平均值,X 的二阶矩就是 E(X^2),也就是样本平方的平均值。Adam 算法根据损失函数...
  • 此外,只能对宽平稳的各态历经的二阶矩过程谈功率谱,其存在性取决于二阶局是否存在并且二阶矩的Fourier变换收敛; 而频谱的存在性仅仅取决于该随机过程的该样本的Fourier变换是否收敛。 频谱分析(也称频率分析)...
  • 运用概率论计算方法,推导出了上述随机变量或过程二阶矩的解析表达式,得到了模拟风场统计特征时域估计偏度误差和随机误差。将三变量过程结果加以推广,给出了误差计算通式。通过算例中统计误差值和理论...
  • 问题背景: 我们知道了总体分布,但...这里就可以用样本一阶(均值)估计整体一阶(均值),样本二阶中心估计(方差)整体二阶中心距(方差) 2)极大似然估计: 理解: 利用已知的样本结果,反推最有可...
  • R语言中参数估计

    千次阅读 2020-12-25 11:52:44
    R语言中的参数估计 一直想要写博客来着,一直没有实现,昨天...简而言之,距估计就是用样本的一阶原点即样本的均值去估计均值,用样本的二阶中心距即样本方差估计方差。 极大似然估计就是求似然函数的极大值点啦,口
  • 3.4.参数估计 ...要求参数θ使得抽到样本的联合概率最大,也就是把θ看成变量,求函数L(θ)的最大值,求极值的做法通常就是求导: 由于函数L(θ)是连乘的形式,不好求解,因此把连乘变成连加,套路就是取.
  • 针对隐式极限状态可靠性分析问题 ,提出了一种支持向量机响应面法 ,该方法采用了与经典响应面法类似迭代思想 ,由支持向量回归机替代经典响应面法中固定多项式函数来构建响应面 ,并结合一次二阶矩法形成迭代过程。...
  • 通过主成分分析高光谱数据进行降维,从中优选出3幅特征图像,并从每幅特征图像中分别提取对比度、相关性、角二阶矩和一致性等4个基于灰度共生矩阵纹理特征变量,这样每个样本共有12个特征变量,再通过主成分分析...
  • M2是二阶样本矩,即按照方差定义以1/n代替1/(n-1)。当拿到一组数据时候该用一般方差定义(即总体方差)还是用样本方差呢?要看你是什么目的,如果目的就是要求这些数据方差(即把这组数据看做总体),那就用...

空空如也

空空如也

1 2 3
收藏数 59
精华内容 23
关键字:

样本的二阶矩