精华内容
下载资源
问答
  • 参数估计

    千次阅读 2019-09-02 22:09:01
    参数估计包括点估计和区间估计两类。 点估计 点估计是以抽样得到的样本指标作为总体指标的估计量,并以样本指标的实际值直接作为总体未知参数的估计值的一种推断方法。 点估计(point estimate)是用样本统计量的某个...

    参数估计包括点估计和区间估计两类。

    点估计

    点估计是以抽样得到的样本指标作为总体指标的估计量,并以样本指标的实际值直接作为总体未知参数的估计值的一种推断方法。

    点估计(point estimate)是用样本统计量的某个取值直接作为总体参数的估计值。例如,用样本均值x直接作为总体均值μ的估计值,用样本方差s2直接作为总体方差σ2的估计值。点估计的方法有:矩估计法、顺序统计量法、最大似然法、最小二乘法。

    矩估计法:矩是指以期望为基础而定义的数字特征,一般分为原点矩和中心矩。设X为随机变量,对任意正整数k,称E(Xk)为随机变量X的k阶原点矩,记为:
    m k = E ( X k ) m_k=E(X^k) mk=E(Xk)
    当k=1时,m1=E(X)=μ,可见一阶原点矩为随机变量X的数学期望。

    把Ck=E[X-E(X)]k称为以E(X)为中心的k阶中心矩。显然,当k=2时,C2=E[X-E(x)]22,可见二阶中心矩为随机变量X的方差。

    顺序统计量法:用样本中位数估计总体的数学期望的方法称数学期望的顺序统计量估计法。顺序统计量估计法的优点是计算简便,且中位数不易受个别异常数据的影响.如果一组样本值某一数据异常(如过于小或过于大),则这个异常数据可能是总体的随机性造成的,也可能是受外来干扰造成的(如工作人员粗心,记录错误),当原因属于后者,用样本平均值\overline{x}估计E(x)显然受到影响,但用样本中位数估计总体期望时,由于一个(甚至几个)异常的数据不易改变中位数的取值,所以估计值不易受到影响。

    最大似然法(Maximum Likelihood):它用来求一个样本集的相关概率密度函数的参数。

    最小二乘法(generalized least squares):是一种数学优化技术,它通过最小化误差的平方和找到一组数据的最佳函数匹配。 最小二乘法是用最简的方法求得一些绝对不可知的真值,而令误差平方之和为最小。 最小二乘法通常用于曲线拟合。很多其他的优化问题也可通过最小化能量或最大化熵用最小二乘形式表达。

    区间估计

    区间估计(interval estimate)是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。与点估计不同,进行区间估计时,根据样本统计量的抽样分布可以对样本统计量与总体参数的接近程度给出一个概率度量。

    区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间(confidence interval),其中区间的最小值称为置信下限,最大值称为置信上限。

    如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平(confidence level),也称为置信度或置信系数(confidence coefficient)。

    区间估计的正确理解方式:区间估计并不是总体参数落在某个区间的概率,而是抽取的多个样本中有多大的概率包含总体参数,由此通过概率可以知道在多次抽样得到的区间中大概有多少个区间包含了参数的真值。

    一个总体参数的区间估计

    研究一个总体时,所关心的参数主要有总体均值μ、总体比例π和总体方差σ2等。

    1. 总体均值的区间估计

      对总体均值进行区间估计时,需要考虑总体是否为正态分布,总体方差是否已知,用于构造估计量的样本是大样本(通常要求n≥30)还是小样本(n<30)等几种情况。下面分两种情况来分析:

      (1)正态总体、方差已知,或非正态总体、大样本

      当总体服从正态分布且方差已知,或总体非正态分布但样本为大样本时,样本均值x的抽样分布服从正态分布,其数学期望为总体均值μ,方差为σ2/n。样本均值经过标准化后的随机变量则服从正态分布,即
      z = x ‾ − μ σ / n ∼ N ( 0 , 1 ) z=\frac{\overline{x}-\mu}{\sigma/\sqrt{n}}\thicksim N(0,1) z=σ/n xμN(0,1)
      根据式上式和正态分布的性质可以得出总体均值μ在1-α置信水平下的置信区间为:
      x ‾ ± z α / 2 σ n \overline{x}\pm{z_{\alpha/2}}\frac{\sigma}{\sqrt{n}} x±zα/2n σ

      (2)正态总体、方差未知、小样本

      在总体服从正态分布的情况下,如果总体方差σ2未知,且样本较小的情况下,需要用样本方差s2代替σ2。这时,样本均值经过标准化以后的随机变量服从自由度为(n-1)的t分布,即
      t = x ‾ − μ s / n ∼ t ( n − 1 ) t=\frac{\overline{x}-\mu}{s/\sqrt{n}}\thicksim{t(n-1)} t=s/n xμt(n1)
      因此需要采用t分布来建立总体均值μ的置信区间。根据t分布建立的总体均值μ在1-α置信水平下的置信区间为:
      x ‾ ± t α / 2 s n \overline{x}\pm{t_{α/2}\frac{s}{\sqrt{n}}} x±tα/2n s

    2. 总体比例的区间估计

      在大样本的前提下,样本比例p的抽样分布可用正态分布近似。p的数学期望为E§=π,p的方差为σ2p=π(1-π)/n。而样本比例经标准化后的随机变量则服从标准正态分布,即
      z = p − π π ( 1 − π ) / n ∼ N ( 0 , 1 ) z=\frac{p-\pi}{\sqrt{\pi(1-\pi)/n}}\thicksim{N(0,1)} z=π(1π)/n pπN(0,1)
      与总体均值的区间估计类似,在样本比例p的基础上加减估计误差zα/2σp,即得总体比例π在1-α置信水平下的置信区间为:
      p ± z α / 2 π ( 1 − π ) n p\pm{z_{\alpha/2}\sqrt{\frac{\pi(1-\pi)}{n}}} p±zα/2nπ(1π)
      当通过上式计算总体比例π的置信区间时,π值应该是已知的。但实际情况不然,π值恰好是要估计的,所以需要用样本比例p来代替π。这种情况下,总体比例的置信区间可表示为:
      p ± z α / 2 p ( 1 − p ) n p\pm{z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}} p±zα/2np(1p)

    3. 总体方差的区间估计

      对于总体方差的估计,这里只讨论正态总体方差的估计。根据样本方差的抽样分布可知,样本方差服从自由度为n-1的χ2分布。因此用χ2分布构造总体方差的置信区间。

      总体方差σ2在1-α置信水平下的置信区间为:
      ( n − 1 ) s 2 χ α / 2 2 ≤ σ 2 ≤ ( n − 1 ) s 2 χ 1 − α / 2 2 \frac{(n-1)s^2}{{\chi^2_{\alpha/2}}}\leq\sigma^2\leq\frac{(n-1)s^2}{\chi^2_{1-\alpha/2}} χα/22(n1)s2σ2χ1α/22(n1)s2

    两个总体参数的区间估计后续讨论。

    样本量的确定

    通过区间估计可以了解到样本量的选择对于问题的求解至关重要,大样本(n≥30)和小样本(n<30)求解的方法不同。同样是大样本选择多大的样本来估计参数比较合适?

    通常,样本量的确定与可以容忍的置信区间的宽度以及对此区间设置的置信水平有一定关系。因此如何确定一个适当的样本量,也是抽样估计中需要考虑的问题。

    估计总体均值时样本量的确定

    总体均值的置信区间是由样本均值x和估计误差两部分组成的。在重复抽样或无限总体抽样条件下,估计误差为:
    z α / 2 σ n z_{\alpha/2}\frac{\sigma}{\sqrt{n}} zα/2n σ
    其中zα/2的值和样本n共同确定了估计误差的大小。当确定了置信水平1-α,zα/2的值就确定了。对于给定的zα/2的值和总体标准差σ,就可以确定任一希望的估计误差所需要的样本量。令E代表所希望达到的估计误差,即:
    E = z α / 2 σ n E=z_{\alpha/2}\frac{\sigma}{\sqrt{n}} E=zα/2n σ
    通过上式可以推导出确定样本量的公式如下:
    n = ( z α / 2 ) 2 σ 2 E 2 n=\frac{(z_{\alpha/2})^2\sigma^2}{E^2} n=E2(zα/2)2σ2
    式中的E值是使用者在给定的置信水平下可以接受的估计误差,zα/2的值可直接由区间估计中所用到的置信水平确定。当σ未知时,可以用样本的标准差来代替;也可以用试验调查的办法,选择一个初始样本,以该样本的标准差作为σ的估计值。

    从上式可以看出,样本量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量也就越大;样本量与总体方差成正比,总体的差异越大,所要求的样本量也越大;样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量就越小。

    估计总体比例时样本量的确定

    与估计总体均值时样本量确定的方法类似,在重复抽样或无限总体抽样条件下,估计总体比例置信区间的估计误差为:
    z α / 2 π ( 1 − π ) n {z_{\alpha/2}\sqrt{\frac{\pi(1-\pi)}{n}}} zα/2nπ(1π)
    由上式可知,zα/2的值、总体比例π和样本量n共同确定了估计误差的大小。令E代表所希望达到的估计误差,即:
    E = z α / 2 π ( 1 − π ) n E=z_{\alpha/2}\sqrt{\frac{\pi(1-\pi)}{n}} E=zα/2nπ(1π)
    据此可以推导出重复抽样或无限总体抽样条件下确定样本量的公式如下:
    n = ( z α / 2 ) 2 π ( 1 − π ) E 2 n=\frac{(z_{\alpha/2})^2\pi(1-\pi)}{E^2} n=E2(zα/2)2π(1π)
    式中的估计误差E必须是使用者事先确定的,大多数情况下,一般取E的值小0.10。zα/2的值可直接由区间估计中所用导的置信水平确定。如果π未知,可以用类似的样本比例来代替;也可以用试验调查的办法,选择一个初始样本,以该样本的比例作为π的估计值。当π的值无法知道时,通常取使π(1-π)最大时的0.5。

    参考文献

    点估计

    顺序量统计法

    最大似然估计

    最小二乘法

    《统计学(第六版)》:贾俊平

    展开全文
  • 参数估计(点估计和区间估计)

    万次阅读 多人点赞 2019-09-06 12:07:06
    1.点估计就是用样本统计量来估计总体参数。 概念理解:当我们想知道某一总体的某个指标的情况时,测量整体该指标的数值 的工作量太大,或者不符合实际,这时我们可以采用抽样的方法选取一部分样本测量出他们数值,...

    “参数估计是以抽样分布为中介,用样本的参数特征对总体的参数进行数值估计的过程。”

    一、点估计
    1.点估计就是用样本统计量来估计总体参数。
    概念理解:当我们想知道某一总体的某个指标的情况时,测量整体该指标的数值 的工作量太大,或者不符合实际,这时我们可以采用抽样的方法选取一部分样本测量出他们数值,然后用样本统计量的值来估计总体的情况。
    例如:想了解一个学校学生的身高情况,就可以随机抽取一部分学生测量他们的身高,得到一个平均值,再用这个样本的均值去估计整体学生的身高情况,就是点估计。

    常用的点估计有:用样本均值估计总体均值,用样本方差估计总体方差,用样本的分位数估计总体分位数,用样本的中位数估计总体的中位数。

    2.点估计方法
    矩估计法、顺序统计量法、最大似然法、
    最小二乘法(对于点估计方法,放在另一篇文章中详细介绍)

    3.由于用样本推断总体的过程一定存在估计误差,而点估计的估计误差无法衡量,所以点估计主要用于为定性研究提供数据参考,或者在对于总体参数估计精度要求不高时使用。

    二、区间估计
    1.区间估计就是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。
    另外一种说法,区间估计是从点估计值和抽样标准误差出发,按给定的概率值建立包含待估参数的区间,这个给定的概率值称为置信度或置信水平,这个建立起来的包含待估计参数的区间称为置信区间。

    2.关于置信水平(置信度)、置信区间和显著性水平:
    置信区间是根据样本信息推导出来的可能包含总体参数的数值区间,置信水平表示置信区间的可信度;例如某学校学生的平均身高的区间估计:有95%的置信水平可以认为该校学生的平均身高为1.4米到1.5米之间,(1.4,1.5)为置信区间,95%是置信水平,即有95%的信心认为这个区间包含该校学生的平均身高。
    置信水平用百分数表示,表示成(1-a)100%a指的是显著性水平,表示总体参数不落在置信区间的可能性。

    3.关于置信区间的计算:
    通过部分样本来计算总体参数的一个置信区间有以下步骤:
    a.明确要解决的问题,要估计的指标或参数是什么,
    b.求抽样样本的平均值和标准误差,
    注意区分标准差和标准误差:标准差反映的是整个样本对样本平均数的离散程度,标准差等于方差开根号;标准误差反映的是样本平均数对总体平均数的变异程度,标准误差等于样本标准差除n的开根号。
    c.确定需要的置信水平,
    d.查询z表,得到z值,
    e. 计算置信区间,[a,b],a=样本均值-z标准误差,b=样本均值+z标准误差。

    区间估计分为一个总体参数的估计和两个总体参数的估计

    4.一个总体参数的区间估计:总体均值的区间估计,总体方差的区间估计,总体比例的区间估计;

    4.1总体均值的区间估计:
    均值抽样分布即样本均值组成的抽样分布,总体参数的估计方法跟样本均值的抽样分布有关;
    Z分布其实就是标准正态分布,如果样本均值组成的抽样分布服从正态分布,那么将该正态分布标准化后即可得到Z分布,
    Z分布的适用条件有两种:一是总体服从正态分布且总体标准差已知;二是总体分布未知,但是样本容量大于或等于30;
    T分布:对于服从正态分布的总体且总体标准差未知的情况下 ,T分布是非常适用的均值抽样分布类型;
    切比雪夫不等式:对于非正态分布总体或总体分布未知并且小样本的情况下,只能用切比雪夫不等式来近似估计总体均值的置信区间。
    在这里插入图片描述截图来自《人人都会数据分析:从生活实例学统计》

    4.2 总体方差的区间估计:
    总体方差的区间估计要用到卡方分布,如果数据总体服从正态分布,从中抽取样本容量为n的样本,样本方差为s^2,那么包含样本方差的卡方统计量服从自由度为n-1的卡方分布。卡方统计量是由总体方差和样本方差的比值组成的统计量,用于总体方差的区间估计。
    卡方统计量的计算公式:
    χ α 2 ( n − 1 ) = ( n − 1 ) s 2 σ z 2 \chi^2_\alpha(n-1)=\frac{(n-1)s ^2}{\sigma ^2_z} χα2(n1)=σz2(n1)s2
    总体方差的双侧置信区间估计公式为:
    ( n − 1 ) s 2 χ α 2 2 ( n − 1 ) ≤ σ z 2 ≤ ( n − 1 ) s 2 χ 1 2 − α 2 ( n − 1 ) \frac{(n-1)s^2}{\chi ^2_\frac{\alpha}{2}(n-1)} \leq \sigma ^2_z \leq \frac{(n-1)s ^2}{\chi ^2_1-\frac{\alpha}{2} (n-1)} χ2α2(n1)(n1)s2σz2χ122α(n1)(n1)s2
    其中带有a/2的为下标;
    如果是单侧置信区间的话,只需要取上面式子的前半部分或者后半部分,并将a/2改成a即可得到单侧置信区间。

    4.3 总体比例的区间估计:
    或者叫总体比率的区间估计,跟二项分布有关,二项分布的理论是:事件发生概率是p,进行n次实验,其中x次实验该事件发生,则发生次数的概率分布服从二项分布;均值、方差为np,npq。
    若将发生的次数转换成比率(x/n),则比率的概率分布也服从二项分布。
    二项分布的特性:当抽取的样本容量n很大,是大 样本,使得np和nq(q为事件不发生的概率,等于1-p)的值都大于 5, 此时二项分布将近似于正态分布。
    由于事件发生比率x/n服从二项分布,所以如果比率的二项分布近似于正态分布,就可以得到不利的区间估计。

    在事件发生概率p已知的情况下,总体比率 p z ˉ \bar{p_z} pzˉ在置信度为1-a时,总体比率的置信区间为:
    p y ˉ ± Z α 2 p ( 1 − p ) n \bar{p_y} \pm Z_\frac{\alpha}{2} \sqrt{\frac{p(1-p)}{n}} pyˉ±Z2αnp(1p)
    其中, p y ˉ \bar{p_y} pyˉ为样本比率, p z ˉ \bar{p_z} pzˉ为总体比率,
    当事件发生概率p未知,可用样本中事件发生的概率即样本比率代替。

    5. 两个总体参数的区间估计
    两个总体均值之差的估计,两个总体方差比的区间估计
    两个总体与多个总体参数的区间估计在实际生活中的应用不是很多,更常用的是两个总体和多个总体参数的假设检验。 区间估计虽不常用,但是其与假设检验的应用原理是想通的。

    5.1 两个总体均值之差的区间估计:
    可以将单个总体均值的抽样分布推广到两个总体均值差的抽样分布,然后利用两个总体均值差的抽样分布推导出两个总体均值差的置信区间公式。
    方差齐性/方差不齐:对于配对样本来说其方差可被认为是想等的,即方差齐性。
    在这里插入图片描述
    截图来自《人人都会数据分析:从生活实例学统计》

    独立样本和配对样本:
    独立样本:是指如果从一个总体中选取样本,抽样形式无论怎样改变都不会影响从另一个总体中抽取样本的概率,则这两个随机样本为独立样本;
    配对样本:是指如果从一个总体中抽取样本的行为以某种方式决定了从另一个总体中抽取样本的概率,则这两个样本为成对样本或配对样本。

    均值和方差的特点:
    两个总体合并(相加或相减),那么合并后的总体均值等于原来两个总体的均值之和或均值之差;而合并后的总体方差都等于两个总体方差之和。

    差值抽样分布可以看做单个总体的均值抽样分布,因此可套用“均值抽样分布适用条件表”,将公式修改一下即可:

    截图来自《人人都会数据分析:从生活实例学统计》

    5.2 两个总体方差比的区间估计
    F分布可用于求取两个正态分布总体方差比的置信区间。
    F统计量可被看做是两个卡方统计量的商,F分布也被称为方差比分布。因为卡方分布要求总体服从正态分布,所以F分布也要求F统计量的两个总体都服从正态分布。
    当给定置信水平时,可推出两个正态分布总体方差比的置信区间。

    三、样本量的确定

    1总体均值区间估计的样本量确定
    在总体标准差已知的情况下,如果数据总体服从正态分布,则样本均值的抽样分布适用Z分布,就可以利用总体均值的置信区间公式来计算样本容量,总体均值的置信区间为:
    x ˉ ± Z α 2 σ n \bar{x}\pm Z_\frac{\alpha}{2} \frac{\sigma}{\sqrt{n}} xˉ±Z2αn σ x ˉ ± Z α 2 σ n N − n N − 1 \bar{x}\pm Z_\frac{\alpha}{2} \frac{\sigma}{\sqrt{n}} \sqrt{\frac{N-n}{N-1}} xˉ±Z2αn σN1Nn

    则总体均值的区间估计误差为:
    Δ μ = Z α 2 σ n \Delta\mu=Z_\frac{\alpha}{2} \frac{\sigma}{\sqrt{n}} Δμ=Z2αn σ
    进而可以求得样本容量的公式:
    n = ( Z α 2 σ Δ μ ) 2 n=(\frac{Z_\frac{\alpha}{2} \sigma}{\Delta\mu})^2 n=(ΔμZ2ασ)2

    以上是总体标准差已知时,当总体标准差未知时,一是可以用样本标准差代替,但是前提条件是样本容量要大于等于30;二是可以用过去试点调查的样本标准差代替;三是,如果知道总体数据中的最大和最小值,可用四分之一的最大与最小值的差值来代替总体标准差。

    2.总体方差区间估计的样本量确定
    总体方差的区间估计适用的抽样分布为卡方分布。卡方统计量为:
    χ 2 = ( n − 1 ) s 2 σ 2 \chi^2=\frac{(n-1)s ^2}{\sigma ^2} χ2=σ2(n1)s2
    由卡方分布的性质可知,当样本量足够大时,卡方分布近似于正态分布。卡方分布的均值为自由度(n-1),卡方分布的方差为两倍的自由度2(n-1),那么在大样本的情况下,总体方差的置信区间为:
    s 2 = ± Z α 2 s 2 2 n s^2=\pm Z_\frac{\alpha}{2} s^2 \sqrt{\frac{2}{n}} s2=±Z2αs2n2
    则总体方差的估计精度为:
    Δ σ 2 = Z α 2 s 2 2 n \Delta \sigma^2=Z_\frac{\alpha}{2} s^2 \sqrt{\frac{2}{n}} Δσ2=Z2αs2n2
    由此可得到样本容量公式为:
    n = 2 Z α 2 s 2 Δ σ 2 n=\frac{\sqrt{2} Z_\frac{\alpha}{2} s^2}{\Delta \sigma^2} n=Δσ22 Z2αs2

    3.总体比率区间估计的样本量确定
    在确定总体比率的区间估计时,利用的是二项分布近似于正态分布的性质,即当抽取的样本量n很大时,是大样本,使得np>5且nq>5(p是事件发生的概率,q是事件不发生的概率,q=1-p)时,二项分布近似于正态分布。
    总体比率的置信区间为:
    p y ˉ ± Z α 2 p ( 1 − p ) n \bar{p_y} \pm Z_\frac{\alpha}{2} \sqrt{\frac{p(1-p)}{n}} pyˉ±Z2αnp(1p)
    则总体比率的估计误差为:
    Δ p z ˉ = Z α 2 p ( 1 − p ) n \Delta \bar{p_z} =Z_\frac{\alpha}{2} \sqrt{\frac{p(1-p)}{n}} Δpzˉ=Z2αnp(1p)
    由此可得到样本容量为:
    n = Z α 2 2 p ( 1 − p ) Δ p z ˉ 2 n=\frac{Z_\frac{\alpha}{2} ^2 p(1-p)}{\Delta \bar{p_z} ^2} n=Δpzˉ2Z2α2p(1p)

    注:本文主要参考《人人都会数据分析:从生活实例学统计》

    展开全文
  • 《统计学》学习笔记之参数估计

    千次阅读 2020-03-16 15:05:29
    文章目录参数估计参数估计的基本原理评价估计量的标准一个总体参数的区间估计两个总体参数估计 参数估计 参数估计是推断统计的重要内容之一。它是在抽样及抽样分布的基础上,根据样本统计量来推断所关心的总体参数...

    鄙人学习笔记



    参数估计

    参数估计是推断统计的重要内容之一。它是在抽样及抽样分布的基础上,根据样本统计量来推断所关心的总体参数。

    参数估计的基本原理

    • 估计量与估计值

    参数估计就是用样本统计量去估计总体的参数。
    在参数估计中,用来估计总体参数的统计量为估计量
    而根据一个具体的样本计算出来的估计量的数值称为估计值

    • 点估计

    点估计就是用样本统计量的某个取值直接作为总体参数的估计值。

    • 区间估计

    区间估计是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。

    与点估计不同,进行区间估计时,根据样本统计量的抽样分布可以对样本统计量与总体参数的接近程度给出一个概率度量。

    • 置信区间

    在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。其中区间的最小值称为置信下限,最大值称为置信上限。

    由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。

    如果抽取了许多不同的样本,比如说抽取100个样本,根据每一个样本构造一个置信区间,这样,由100个样木构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%则没包含,则95%这个值称为置信水平。

    • 置信水平

    如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平,也称为置信度或置信系数。

    注意! 置信度为95%,并不能误以为真值落在构造的置信区间的概率为95%。因为总体真值是一个常数,而不是一个随机变量。总体真值要么落在置信区间内,要么不在置信区间内,这里并不涉及概率。

    评价估计量的标准

    究竟用样本的哪种估计量作为总体参数的估计呢?自然要用估计效果最好的那种估计量。什么样的估计量才算是一个好的估计量呢?
    这就需要一定的评价标准,主要有无偏性、有效性、一致性。

    • 无偏性

    无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。

    无偏和有偏图示:

    • 有效性

    一个无偏的估计量并不意味着它就非常接近被估计的参数,它还必须与总体参数的离散程度比较小。有效性是指对同一总体参数的两个无偏估计量,有
    更小标准差的估计量更有效。

    在无偏估计的条件下,估计量的方差越小,估计就越有效。

    两个无偏估计量的抽样分布:

    • 一致性

    一致性是指随着样本量的增大,估计量的值就越来越接近被估计总体的参数。换言之,一个大样本给出的估计量要比一个小样本给出的估计量更接近总体的参数。

    两个不同样本量的样本统计量的抽样分布:

    一个总体参数的区间估计

    两个总体参数估计

    展开全文
  •  a是事先确定好的一个概率值,也称为风险值,它是总体均值不包括在置信区间的概率 a 是显著水平 1-a是置信水平/置信系数/置信度 是标准正态分布右侧面面积为a/2时的z值, ...
    29002931_TbqB.jpg
     
    一、总体均值的区间估计
    29002932_OiPN.jpg
     
    1、正态总体,方差已知,或者非正态总体,大样本

    a、总体服从正态分布,均值的抽样分布为 29002932_ECgk.png ~N(μ, 29002932_NcB5.png ),将这个转化为标准的正态分布
    29002932_HzDZ.png
     b、置信区间用概念图来表示
    29002932_oKtU.png
     c、得 到总体均值在μ在1-a置信水平下的置信区间,它由估计值给估计误差组成
    29002932_Q9Tf.png
    置信下限
    29002932_fv3H.png
     置信上限
    29002932_0hfA.png
     a是事先确定好的一个概率值,也称为风险值,它是总体均值不包括在置信区间的概率
    a 是显著水平
    1-a是置信水平/置信系数/置信度

    29002932_98ob.png是标准正态分布右侧面面积为a/2时的z值,

    29002933_Lcm5.png是估计总体均值的估计误差


    2、总体服从正态分布但29002933_0wKA.png未知,或总体并不服从正态分布,但是大样本

    总体的方差29002933_L3wQ.png,可以用样本方差 29002933_Zd1j.png代替,这时总体均值μ在1-a置信水平下的置信区间可以为

    29002933_UUk7.png

     

    3、正态总体,方差未知,小样本
    需要用样本方差 29002933_Zd1j.png 代替 29002933_L3wQ.png ,样本均值经过标准化后的随机变量则服从自由度(n-1)的t分布即
    29002933_UkKW.png
     因此需要通过t分布来建立总体均值的μ在1-a置信水平下的置信区间
    29002933_lGL0.png
     

    29002933_2qXO.png是自由度为n-1时,t分布中右侧面积为a/2时t的值


    二、总体比例的区间估计
    1、当样本足够大时,抽样比例p的抽样分布逼近正态分布,p的数学期望E(p)=π,p的方差为
    29002934_VIOZ.png
     转化为标准的正态分布
    29002934_F2wu.png
     总体比例π,在1-a置信水平下的置信区间为
    29002934_dOgP.png
     实际情况中π是不知道的,恰好是要去估计π的值,所以用样本比例p代替π,得到如下
    29002934_4Bok.png
     三、总体方差的区间估计
    样本方差的抽样分布服从自由度为n-1的卡方分布,所以用卡方分布构建总体方差的置信区间
    29002934_hp4l.jpg
     


    转载于:https://my.oschina.net/u/1785519/blog/1060633

    展开全文
  • python实现参数估计

    2020-12-03 22:12:42
    一、前言参数估计(parameter estimation),统计推断的一种。根据从总体中抽取的随机样本来估计总体分布中未知参数的过程。从估计形式看,区分为点估计与区间估计:从构造估计量的方法讲,有矩法估计、最小二乘估计、...
  • [转载]参数估计(matlab)

    2021-04-20 14:00:41
    参数估计包含两种常用方式: 点估计和区间估计.Matlab统计工具箱给出了常用概率分布中参数的点估计 (采用最大似然估计法) 与区间估计,另外还提供了部分分布的对数似然函数的计算功能.由于点估计中的矩估计法的实质是...
  • 推断统计:参数估计和假设检验

    千次阅读 多人点赞 2020-03-03 00:35:24
    目录 ...  3、参数估计(点估计和区间估计)    1)参数估计、点估计和区间统计的概念    2)点估计说明    3)区间估计说明   4、中心极限定理    1)中心极限定理的概念    2...
  • 回归分析之参数估计

    千次阅读 2019-10-11 16:06:59
    参数估计:是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。 点估计:依据样本估计总体分布中所含的未知参数...
  • 什么是参数估计

    千次阅读 2020-10-20 20:06:51
    参数估计属于统计推断的范畴,是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。 统计推断是数理统计研究的核心问题,是指根据样本对总体分布或分布的数字特征等作出合理的推断。 参数估计分为:点估计...
  • 参数估计方法整理

    万次阅读 多人点赞 2018-08-06 10:33:27
    参数估计包括点估计和区间估计。 常见点估计方法:矩估计、最小二乘估计、极大似然估计、贝叶斯估计 区间估计:利用已知的抽样分布、利用区间估计与假设检验的联系、利用大样本理论 一、点估计 1、矩估计 矩...
  • 参数估计中,用来估计总体参数的统计量称为估计量。样本均值、样本比例、样本方差等都可以是一个估计量。 估计值 estimated value 根据一个具体的样本计算出来的估计量称为估计值。例如估计一个班学生考试的平均...
  • 数理统计:参数估计

    千次阅读 2020-12-29 22:57:30
    learning why, thinking what, then forgetting how. 随着时间的流逝,知识总会被遗忘和...统计推断主要分为参数估计和假设检验,参数估计又分为点估计和区间估计。 2.1 参数的点估计 首先提出参数和参数的估计量的.
  • 数理统计|参数估计

    千次阅读 2018-10-10 23:31:28
    单个正态总体参数:分为均值、方差是否已知,对均值和方差分别都有不同的枢轴量 大样本置信区间:原理是中心极限定理,在样本方差已知的时候,很 ok;在样本方差未知的时候,中心极限定理的分布可以将方差换成它的相...
  • 统计学之参数估计

    千次阅读 2019-12-29 22:48:48
    参数估计中,用来估计总体参数的统计量称为估计量,用符号θ^表示,如样本均值、样本方差。根据一个具体的样本计算出来的估计量的数值称为估计值。 点估计与区间估计 点估计:用样本统计量θ^的某个取值直接...
  • 总体参数估计及总体均值的估计

    千次阅读 2017-08-17 00:28:00
    以样本均值为中心所构造的估计区间,它包含总体均值μ的概率,等于1-a的情况下的表现形式 2、将等式两边进行标准化变形,a是显著性水平, 是标准正太分布右侧面积为a/2是的z值, 是 估计...
  • 关于参数估计(点估计和参数估计)的详细笔记。
  • 参数估计与非参数估计

    千次阅读 2017-10-12 15:48:45
    参数估计要求明确参数服从什么分布,明确模型的具体形式,然后给出参数的估计值。根据从总体中抽取的样本估计总体分布中包含的未知参数。非参数估计对解释变量的分布状况与模型的具体形式不做具体规定 ,运用核密度...
  • 参数估计(parameter estimation)是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。人们常常需要根据手中的数据,分析或推断数据反映的本质规律。即根据样本数据如何选择统计量去推断总体的分布或...
  • 参数估计与假设检验的区别和联系

    万次阅读 2019-05-11 18:09:08
    参数估计与假设检验的区别和联系 统计学方法包括统计描述和统计推断两种方法,其中,推断统计又包括参数估计和假设检验。 参数估计 参数估计就是用样本统计量去...区间估计是在点估计的基础上给出总体参数估计...
  • 浅谈参数估计

    万次阅读 2019-09-03 09:38:34
    参数估计是推断统计的重要内容之一,它是在抽样及抽样分布的基础上,根据样本统计量来推断所关心的总体参数. 估计量 如果能够掌握总体的全部数据,那么只需要作一些简单的统计描述,就可以得到所关心的总体特征,比如,...
  • 在学习统计学贾书的过程,在第6—14章节出有许多需要理解与记忆的公式和概念,在此通过博客的形式做一次梳理,主要内容为统计学中抽样分布、假设检验、参数估计、分类数据分析、方差分析、一元二元线性分析、时间...
  • 6 参数估计语言 实验R: 一实验目的; 1. 掌握矩法估计与极大似然估计的求法; R 软件完成一个和两个正态总体的区间估计2. 学会利用; 软件完成非正态总体的区间估计3. 学会利用R 软件进行单侧置信区间估计4. 学会利用R ...
  • 统计学——参数估计与假设检验

    万次阅读 2019-02-13 17:15:04
    参数估计中,用来估计总体参数的统计量称为估计量。样本均值、样本比例、样本方差等都可以是一个估计量。而根据一个具体的样本计算出来的估计量的数值称为估计值。 参数估计的方法有点估计和区间估计两种。点估计...
  • 文章目录参数估计的基本原理估计量与估计值点估计和区间估计点估计区间估计评价估计量的标准一个总体参数的区间估计总体均值的区间估计总体比例的区间估计总体方差的区间估计两个总体参数的区间估计两个总体均值之差...
  • 最大似然参数估计的基本原理 前导知识:【概率密度函数估计的引入】 在最大似然估计中,我们做以下基本假设: 我们把要估计的参数记作θ\thetaθ,它是确定但未知的量(多个参数时向量)。 每类的样本集记作Xi,i=1,...
  • 1.参数估计的一般问题 2.一个总体参数的区间估计 3. 两个总体参数的区间估计 4. 样本容量的确定 1.参数估计得一般问题 所谓参数估计也就是用样本统计量取估计总体的参数。例如,用样本均值x估计总体均值u等。 1.1 ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 30,293
精华内容 12,117
关键字:

总体参数估计包括