【参数估计的基本原理】
- 估计量与估计值
- 点估计与区间估计(置信区间,置信水平)
- 评价估计量的标准(无偏性,有效性,相合性)
【一个总体参数的区间估计】
- 总体均值的区间估计
- 总体比例的区间估计
- 总体方差的区间估计
【两个总体参数的区间估计】
- 两个总体均值之差的区间估计
- 两个总体比例之差的区间估计
- 两个总体方差比的区间估计
【样本量的确定】
- 估计总体均值时样本量的确定
- 估计总体比例时样本量的确定
【参数估计的基本原理】
- 估计量与估计值
- 点估计与区间估计(置信区间,置信水平)
- 评价估计量的标准(无偏性,有效性,相合性)
【一个总体参数的区间估计】
- 总体均值的区间估计
- 总体比例的区间估计
- 总体方差的区间估计
【两个总体参数的区间估计】
- 两个总体均值之差的区间估计
- 两个总体比例之差的区间估计
- 两个总体方差比的区间估计
【样本量的确定】
- 估计总体均值时样本量的确定
- 估计总体比例时样本量的确定
转载于:https://www.cnblogs.com/ForTech/p/8614143.html
第七章 参数估计
7.1 参数估计的基本原理
参数估计:用样本统计量去去估计总体的参数
7.1.1 估计量与估计值
样本统计量(估计量) | 总体参数 (被估计的参数) |
---|---|
点估计:用样本的估计量的某个取值直接作为总体参数的估计值
区间估计:在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到
置信区间:由样本统计量所构造的总体参数的估计区间
置信水平():置信区间中包含总体参数真值的次数,又称置信度或置信系数(为是总体参数未在区间内的比例)
常用置信水平的值:
置信水平 | |||
---|---|---|---|
90% | 0.10 | 0.05 | 1.645( 1.645 ) |
95% | 0.05 | 0.025 | 1.96( 1.96) |
99% | 0.01 | 0.005 | 2.58( 2.58) |
独立样本
如果两个样本是从两个不同的总体中独立抽取的,就称为独立样本。
匹配样本
这里面的和都是服从分子自由度为和分母自由度为的F分布的分位数。
在进行参数估计之前,首先应确定一个适当的样本量,也就是应该抽取一个多大的样本来估计总体参数,所以就需要确定样本量。
鄙人学习笔记
参数估计
参数估计是推断统计的重要内容之一。它是在抽样及抽样分布的基础上,根据样本统计量来推断所关心的总体参数。
参数估计的基本原理
参数估计就是用样本统计量去估计总体的参数。
在参数估计中,用来估计总体参数的统计量为估计量。
而根据一个具体的样本计算出来的估计量的数值称为估计值。
点估计就是用样本统计量的某个取值直接作为总体参数的估计值。
区间估计是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。
与点估计不同,进行区间估计时,根据样本统计量的抽样分布可以对样本统计量与总体参数的接近程度给出一个概率度量。
在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。其中区间的最小值称为置信下限,最大值称为置信上限。
由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。
如果抽取了许多不同的样本,比如说抽取100个样本,根据每一个样本构造一个置信区间,这样,由100个样木构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%则没包含,则95%这个值称为置信水平。
如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平,也称为置信度或置信系数。
注意! 置信度为95%,并不能误以为真值落在构造的置信区间的概率为95%。因为总体真值是一个常数,而不是一个随机变量。总体真值要么落在置信区间内,要么不在置信区间内,这里并不涉及概率。
究竟用样本的哪种估计量作为总体参数的估计呢?自然要用估计效果最好的那种估计量。什么样的估计量才算是一个好的估计量呢?
这就需要一定的评价标准,主要有无偏性、有效性、一致性。
无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。
无偏和有偏图示:
一个无偏的估计量并不意味着它就非常接近被估计的参数,它还必须与总体参数的离散程度比较小。有效性是指对同一总体参数的两个无偏估计量,有
更小标准差的估计量更有效。
在无偏估计的条件下,估计量的方差越小,估计就越有效。
两个无偏估计量的抽样分布:
一致性是指随着样本量的增大,估计量的值就越来越接近被估计总体的参数。换言之,一个大样本给出的估计量要比一个小样本给出的估计量更接近总体的参数。
两个不同样本量的样本统计量的抽样分布:
参数估计的基本原理
估计量与估计值
如果我们得到总体的全部数据,做统计描述即可得到总体特征,但现实是,难以得到全部数据。因而需要参数估计。参数估计:用样本统计量去估计总体的参数。如样本均值估计总体均值。在参数估计中,用来估计总体参数的统计量称为估计量,用符号θ^表示,如样本均值、样本方差。根据一个具体的样本计算出来的估计量的数值称为估计值。
点估计与区间估计
点估计:用样本统计量θ^的某个取值直接作为总体参数θ的估计值。如样本均值直接作为总体均值的估计值。
在用点估计值代表总体参数值的同时,必须给出点估计值的可靠性,即点估计值与总体参数的真实值接近的程度。但一个点估计值的可靠性由抽样标准误差来衡量,即一个具体的点估计值无法给出估计的可靠性度量,故而需要区间估计。
区间估计:在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。与点估计不同,区间估计可以根据样本统计量的抽样分布对样本统计量与总体参数的接近程度给出一个概率度量。
如果抽取100个样本,根据每个样本构造一个置信区间,由100个样本构造的总体参数的100个置信区间中,95%的区间包含总体参数的真值,95%这个值称为置信水平。即将构造置信区间这个步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平。
有关置信区间的概念可用下图来表示:
注意:1.置信区间的宽度随着置信系数的增大而增大
2.用某种方法构造的所有区间有95%包含真值,那么,用该方法构造的区间称为置信水平为95%的置信区间
3.总体参数的真值是固定的,未知的,而用样本构造的区间是不固定的,即抽取不同的样本,可以得到不同的区间
4.实际问题中,估计时常用一个样本,构造的区间是一个特定的区间,不再是随机区间,无法知道是否包含真值。