精华内容
下载资源
问答
  • 因为我们不可能期望点估计量能给出总体参数的精确值,所以经常在点估计上加减一个被称为边际误差( marginal of error)的值来计算区间估计( interval estimate)。区间估计的一般形式如下: 总体均值的区间估计:...

    我们发现点估计量是用于估计总体参数的样本统计量。例如,样本均值是总体均值的点估计量,样本比率是总体比率的点估计量。因为我们不可能期望点估计量能给出总体参数的精确值,所以经常在点估计上加减一个被称为边际误差( marginal of error)的值来计算区间估计( interval estimate)。区间估计的一般形式如下:
    在这里插入图片描述

    总体均值的区间估计:总体标准差已知情形
    计算样本的标准差
    在这里插入图片描述

    需要95%
    在这里插入图片描述

    构造置信区间
    在这里插入图片描述

    95%是置信水平(confidence level),0.95是置信系数(confidence coefficient),得到的区间是95%置信区间(confidence interval)

    总公式:
    在这里插入图片描述

    总体均值的区间估计:总体标准差未知情形
    在建立总体均值的区间估计时,我们通常并没有关于总体标准差的一个好的估计。在这种情形下,我们必须利用同一样本估计总体均值和总体标准差两个未知参数。当利用样本标准差估计总体标准差时,边际误差和总体均值的区间估计都以t分布( t distribution)的概率分布为依据进行的。虽然t分布的数学推导以假设抽样总体服从正态分布为依据,但是研究表明在许多总体分布显著偏离正态分布的情形下,利用t分布的效果还是相当不错的。当总体分布不是正态分布时,在本节稍后我们给出应用t分布的建议。
    t分布是由一类相似的概率分布组成的分布族,某个特定的t分布依赖于称为自由度( degrees of freedom)的参数。当自由度分别为1,2,3,…时,有且仅有唯一的t分布与之相对应。随着自由度的增大,t分布与标准正态分布之间的差别变得越来越小。图8-4给出了自由度分别为10和20时的t分布与标准正态概率分布的关系。我们注意,随着自由度的增大,t分布的变异幅度减小,与标准正态分布也越来越相似。还注意到,t分布的均值为0。
    在这里插入图片描述在这里插入图片描述

    当自由度超过100时,自由度为无穷的那一行可以用于近似实际的t值。
    在这里插入图片描述

    由于用样本标准差作为总体标准差的估计值,所以在式(8-2)中与t值对应的自由度为n-1。

    样本标准差的公式为:
    在这里插入图片描述

    自由度的详细解释
    在这里插入图片描述

    应用中的建议
    如果总体服从正态分布,式(8-2)所给出的置信区间是精确的,并且适用于任何样本容量。如果总体不服从正态分布,则式(8-2)所给出的置信区间是近似的。在这种情形下,近似的程度依赖于总体分布和样本容量。在绝大部分应用中,当利用式(8-2)建立总体均值的区间估计时,样本容量n≥30已经足够大。然而,如果总体分布严重偏斜或者包含异常点,绝大部分统计学家建议将样本容量增加到50或者更大。如果总体的分布不是正态分布但是大致对称,则在样本容量为15时便能得到置信区间的一个好的近似。仅当分析人员坚信或者愿意假设总体分布至少近似正态时,才可以在更小的样本容量下使用式(8-2)。

    样本容量的确定
    希望达到的边际误差
    在这里插入图片描述
    总体均值区间估计中的样本容量
    在这里插入图片描述

    但如果总体标准差是未知的怎么办呢
    可以给出初始值或计划值来作为总体标准差
    1.根据以前研究中的数据计算总体标准差的估计值作为总体标准差的计划值。
    2.利用实验性研究,选取一个初始样本,以初始样本的标准差作为总体标准差的计划值。
    3.对总体标准差值进行判断或最优猜测。例如,我们可以分别估计总体的最大值和最小值,两者之差是对数据极差的估计。一般建议将极差除以4作为总体标准差的粗略估计,从而最终得到一个可以接受的总体标准差的计划值。

    总体比率

    样本比率的抽样分布
    在这里插入图片描述

    边际误差
    在这里插入图片描述
    总体比率的区间估计
    在这里插入图片描述

    样本容量的确定
    在这里插入图片描述在这里插入图片描述

    因为样本比率是未知的,因此需要一个计划值
    在这里插入图片描述

    可通过如下方法来确定计划值
    (1)用以前相同或类似样本的样本比率来代替。
    (2)利用实验性的研究,选取一个初始样本,以该样本的样本比率作为计划值
    (3)使用判断或最优猜测作为计划值。
    (4)如果上述方法均不适用,则取计划值=0.5

    展开全文
  • 单个总体 的值μ的检验两个正态总体的值差的检验基于成对数据的检验均值估计的置信区间(单组样本)均值估计的置信区间(两组样本差)另外,本文将介绍如下补充内容:t检验的介绍原理单边检验与双边检验中心极限定理...

    Chapter 9:Inferential Statistics

    以下是课本中的五类题型(只想看课本内容的同学建议疯狂下划.D):

    1. 单个总体
      的值μ的检验
    2. 两个正态总体的值差的检验
    3. 基于成对数据的检验
    4. 均值估计的置信区间(单组样本)
    5. 均值估计的置信区间(两组样本差)

    另外,本文将介绍如下补充内容:

    1. t检验的介绍
    • 原理
    • 单边检验与双边检验
    • 中心极限定理与t检验

    2. t分布简介

    3.无偏估计

    4.点估计量,置信区间,置信水平


    首先,我们来讲讲什么是假设检验--假设检验是统计推断中的一类重要问题(另一类是参数估计),旨在在总体分布函数完全未知或只知其形式不知其参数的情况下,为推断总体的某些性质而作出的假设。

    其中chapter 9中的t检验一般是在正态分布下方差未知的情形中对于均值期望的检验。

    原理

    人话版:

    我们举个栗子(不严肃.gif)。

    “小明在上小学,但是他学得特别差!为什么这么说呢?因为他勤勤听写,勤勤挂,听写了十多次,没有一次及格,每一次都只拿十几二十分(满分100),对不超过四个词,每一次都是全年级最差的!

    小半个学期过去了,老师很生气,要跟小明的父亲打电话!小明听说了之后也又担忧又生气,连忙跟父亲解释:“哎呀,老师因为我长得帅针对我!我是优等生,不说每次都考满分至少平均下来也能拿八十多分!我这十多次没有考好只是因为发挥失常!”

    小明的父亲听完十分担忧,认为小明一定是得了精神病!(思维内容障碍:迫害妄想,夸大妄想,多见于精神分裂症)”

    42b92b162ba485483463893d197928bf.png

    话说回来,为什么小明的父亲会做出这样的推断呢,我们用假设检验的逻辑来描述一下。

    我们假定如小明所说的,他在一年内考试的成绩服从一个平均值为80的正态分布。

    首先零假设

    是:继续观察后小明平均成绩有八十分,小明确实长得帅而且是优等生(lol,考试千万别写后半句)

    则备择假设

    是:继续观察后小明平均成绩仍无八十分,小明很差,还得了精神病!

    我们不轻易拒绝(reject)零假设,并且给原假设一定范围的容忍度,即如果小明考得比80分差了一些也不能轻易怀疑小明的人格(滑稽),除非小明考得实在是太差了,很差,非常差,不是一般的差!因为作为一个80分选手,发生这样的事情的概率实在是太低啦!(假设检验是符合实际推断原则[1]的)所以我们预设了这样一个容错度,即只要小明不要差到考出出现概率低于某个标准的成绩,我们就不拒绝零假设,从而没有理由怀疑小明患上了精神病2333

    严肃版:

    前面已经提到,t检验一般是在正态分布下方差未知的情形中对于均值期望的检验

    则此时我们从一个服从正态分布的整体中选取n个样本,设样本均值为

    ,总体均值为

    现在,我们提出关于总体均值的假设:

    这是两个对立的假设,为了从中做出选择,我们给出了一个合理的法则,即检验统计量和临界值的计算和比较--根据其结果,如果接受

    ,就拒绝了
    ;反之,若拒绝
    ,则必须接受

    由于

    的无偏估计,即
    一定程度上反映了
    的大小,所以如果要让零假设为真,则
    需要让
    尽可能小
    ,并考虑到当零假设为真时
    ~
    ,故衡量
    的大小
    可转换为衡量
    的大小,我们可以适当选定k>0,当
    >k时(此时我们称
    的差异是
    显著的)就拒绝零假设,当
    ≤k(此时我们称
    的差异是
    不显著的)是则接受零假设。

    然而不幸的是,由于我们做出判断的依据仅仅是正态总体中的一个样本,所以即便

    为真时,我们也可能作出拒绝零假设的判断(我们称其为第一类错误或拒真错误,这是无法避免的,在显著性检验问题中,我们只对这类错误加以控制),为了
    加以控制我们希望将这类错误发生的可能性控制在
    内(
    即显著性水平significance level
    )。

    取等号时(
    临界值critical value),有

    3d11285f58428f9c157711182116f164.png

    以上是双边假设检验时的情形,单边检验则分为右边检验和左边检验两种情形:

    右边检验:

    ,

    左边检验:

    ,

    显然的,与双边检验不同,右边检验和左边检验的拒绝域分别为

    中心极限定理与假设检验:

    简而言之,中心极限定理表明:

    1. 总体满足正态分布时,所抽取样本均值的分布始终满足正态分布(样本大小为1时也满足)
    2. 总体不满足正态分布,但是单个样本大小n≥30时,所抽取样本均值的分布始终满足正态分布。

    详细介绍及证明可参考:

    Koffee:大数定律及中心极限定理zhuanlan.zhihu.com

    因此,t检验中我们总是可以假设样本均值分布满足正态分布。

    t分布:

    特点:

    • t分布曲线形态与n(确切地说与自由度df=n-1)大小有关。与标准正态分布曲线相比,自由度df越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度df愈大,t分布曲线愈接近正态分布曲线,当自由度df=∞时,t分布曲线为标准正态分布曲线。[2]
    • t分布与正态分布相比多了自由度参数,能够更好的剔除异常值对于小样本的影响

    无偏估计

    在CIE Further Statistics的课本中,还提到了unbiased estimator无偏估计

    ,但是课本中并没有给出太多的解释。这里进行一个简介。

    前面提到,参数估计是统计推断中除了假设检验外的另一重要问题。

    点估计量由样本数据得出,是对总体参数的估计,点估计的计算过程是得出一个精确的值

    而为了考虑结果的不确定性,又引入了置信区间(confidence interval)来表达一个误差范围,是对总体统计量给出一个区间估计

    置信水平(confidence level)衡量对于置信区间能够包含总体统计量这一事件的把握程度,我们形容总体均值的置信水平为

    则总体均值处于置信区间的概率为

    估计量有许多不同的评判标准,无偏性就是其中之一,我们希望估计值在未知参数的真值左右徘徊,而其数学期望等于真值,这就是无偏性。

    7b0cb60fef1042f790148aa635ec0fe3.png

    7583d6979b04204b0bcc70411dd0c6bd.png
    对于方差的无偏估计证明

    Finally,以下是课本内容的概览!!

    f180df764243805c372f34f88eda1c2b.png

    一、 单个总体

    的值μ的检验

    --

    未知,关于
    的检验(t检验)

    条件:

    1. 总体服从正态分布
    2. 样本小
    3. 方差未知

    检验统计量(Test statistic):

    ,其中
    ,
    是方差的无偏估计,
    =
    =

    对于显著水平

    ,
    单边检验中临界值
    拒绝域

    双边检验的临界值

    拒绝域

    二、两个正态总体的值差的检验(有A~N

    ,C~N

    --

    未知,关于
    的检验

    条件:

    1. 总体呈正态分布
    2. 两个分布独立
    3. 两个分布同方差

    检验假设Test Statistic:

    =
    ,其中 pooled estimate

    拒绝域:

    (单边)

    (双边)

    三、基于成对数据的检验,

    --为了比较两种仪器/产品/方法的差异。

    --不再测量均值的差,而是测量差的均值。

    条件

    1. 差呈正态分布

    检验统计量

    ,其中
    是差值方差的无偏估计=

    对于显著水平

    ,
    单边检验中临界值
    拒绝域

    双边检验的临界值

    拒绝域

    四、均值估计的置信区间(单组、两组样本差)

    --这两种情形分别可以由:

    一、单个总体

    的值μ的检验

    二、两个正态总体的值差的检验

    中的方法推出。

    df6264b7ea36422bb577eb9b0c973562.png

    In General,做题步骤就是:

    1.提出假设

    ,决定单边检验还是双边检验,一般零假设的内容是无差别的、不需检验的论述。

    2.计算检验统计量。

    3.读取临界值,并与检验统计量比较,若检验统计量在拒绝域内则拒绝零假设。

    4.结论。

    参考

    1. ^实际推断原理--一次试验小概率事件不会发生。
    2. ^https://baike.baidu.com/item/t分布/299142?fr=aladdin
    展开全文
  • 【一个总体参数区间估计】 总体均值的区间估计 总体比例的区间估计 总体方差的区间估计 【两个总体参数区间估计】 两个总体均值之差的区间估计 两个总体比例之差的区间估计 两个总体方差比的区间...

    【参数估计的基本原理】

    • 估计量与估计值
    • 点估计与区间估计(置信区间,置信水平)
    • 评价估计量的标准(无偏性,有效性,相合性)

    【一个总体参数的区间估计】

    • 总体均值的区间估计
    • 总体比例的区间估计
    • 总体方差的区间估计

    【两个总体参数的区间估计】

    • 两个总体均值之差的区间估计
    • 两个总体比例之差的区间估计
    • 两个总体方差比的区间估计

    【样本量的确定】

    • 估计总体均值时样本量的确定
    • 估计总体比例时样本量的确定

    转载于:https://www.cnblogs.com/ForTech/p/8614143.html

    展开全文
  • R语言与正态总体均值的区间估计

    千次阅读 2020-04-16 17:05:16
    学习笔记 参考书籍:《统计学》-贾俊平;...一个正态总体均值的区间估计 产品重量数据: 74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.5 79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.0 75.0 73....

    学习笔记
    参考书籍:《统计学》-贾俊平;《统计学:从数据到结论》-吴喜之;
    原理部分移步:参数估计


    一个正态总体均值的区间估计

    产品重量数据:

    74.3  78.8  68.8  78.0  70.4  80.5  80.5  69.7  71.2  73.5
    79.5  75.6  75.0  78.8  72.0  72.0  72.0  74.3  71.2  72.0
    75.0  73.5  78.8  74.3  75.8  65.0  74.3  71.2  69.7  68.0
    73.5  75.0  72.0  64.3  75.8  80.3  69.7  74.3  73.5  73.5
    

    假定,产品重量数据所代表的总体服从正态分布,且我们不知道总体方差,利用R我们可以计算出总体均值的置信度为95%的置信区间.

    读取数据:

    Tdata <- read.table("data5.txt", header = F)
    new_data <- as.vector(as.matrix(Tdata))
    

    计算置信区间:

    > t.test(new_data, con = 0.95)$conf
    [1] 72.38747 74.89253
    attr(,"conf.level")
    [1] 0.95
    

    输出的总体均值的置信度为95%的置信区间为:(72.38747, 74.89253)



    两个正态总体均值之差的区间估计

    两个城市的AQI数据:

    AQI1	55	52	42	32	37	36	57	66	66	62	45	77	78	60	65	66	91	98	99	90	76
    AQI2	117	52	92	108	142	160	148	167	181	89	79	96	115	56	50	70	69	144	73	85	104
    

    假定俩个城市的AQI数据所代表的总体服从正态分布,我们可以利用R语言计算出置信度为95%的两个总体均值之差的置信区间。

    按照步骤,在进行区间估计之前,我们应该先判断两个总体的方差是否相等,如何判断方差是否相等呢?, 可以用var.test(x, y)函数去检验。如果检验得到的p值很小,小于我们设定的显著性水平,则认为方差不相等;若得到的p值很大,也不能判断方差相等,只能说证明不了方差不等。有些时候,我们可以直接用方差不等的方法去进行区间估计,也不会存在任何问题,因为即使方差相等,结果差别也不大。

    这里我们依然给出方差相等和方差不等的区间估计的两种计算结果

    读取数据:

    aqi <- read.csv("Tdata.csv", header = T)
    

    • 方差不等
    > (mean(aqi$AQI1) - mean(aqi$AQI2))
    [1] -40.33333
    > t.test(aqi$AQI1, aqi$AQI2)$conf
    [1] -60.01738 -20.64928
    attr(,"conf.level")
    [1] 0.95
    

    • 方差相等
    > t.test(aqi$AQI1, aqi$AQI2, var = T)$conf
    [1] -59.80372 -20.86295
    attr(,"conf.level")
    [1] 0.95
    
    展开全文
  • 7.2 一个总体参数区间估计 7.2.1 总体均值的区间估计 7.2.2 总体比例的区间估计 7.2.3 总体方差的区间估计 7.3 两个总体参数区间估计 7.3.1 两个总体均值之差的区间估计 7.3.2 两个总体比例之差的区间估计 ...
  • 第七章 参数估计

    千次阅读 2015-08-31 11:47:25
    参数估计是在抽样及抽样分布的基础上,根据样本统计量来推断所关心的总体...参数估计的方法有点估计和区间估计。 点估计:用样本统计量的某个取值直接作为总体参数的估计值。无法概率度量可靠程度 区间估计:在点估
  • 统计学之参数估计

    2019-12-29 22:48:48
    参数估计的基本原理 估计量与估计值 如果我们得到总体的全部数据,做统计描述即可得到总体特征,但现实是,难以得到全部数据。因而需要参数估计。...点估计与区间估计 点估计:用样本统计量θ^的某个取值直接...
  • 文章目录参数估计参数估计的基本原理评价估计量的标准一个总体参数区间估计两个总体参数估计 参数估计 参数估计是推断统计的重要内容之一。它是在抽样及抽样分布的基础上,根据样本统计量来推断所关心的总体参数...
  • 学习内容 (点估计、区间估计、...区间估计:在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到 置信水平:一般地,如果将构造置信区间的步骤重复多次,置信区间中包含...
  • 文章目录参数估计的基本原理估计量与估计值点估计和区间估计点估计区间估计评价估计量的标准一个总体参数区间估计总体均值的区间估计总体比例的区间估计总体方差的区间估计两个总体参数区间估计两个总体均值之差...
  • 统计学——参数估计与假设检验

    千次阅读 2019-02-13 17:15:04
    统计学(第六版)贾俊平 读书笔记 第 7 章 参数估计 7.1 参数估计的基本原理 参数估计就是用样本统计量去估计总体的参数。比如,用样本均值估计...参数估计的方法有点估计和区间估计两种。点估计就是中样本统计量的...
  • 7.1 参数估计的基本原理 7.1.1 估计量与估计值 1.估计量:用于估计总体参数的随机...7.1.2 点估计与区间估计 1.点估计(只给出一个点) 1)用样本的估计量直接作为总体参数的估计值 · 例如:用样本均值直接作为总体...
  • 区间估计:  置信区间 符号说明: 1 参数估计问题 2 点估计 2.1 矩估计 矩估计法的基本思想是根据大数定律,利用样本矩对总体分布矩进行估计。 然后利用总体矩与参数的关系来对参数进行估计。 记号:...
  • -在上篇文章中,介绍了假设检验的基本方法和原理,并在文章的最后用Excel实现了主要的假设检验,见下文:数据分析 | 统计之参数假设检验这篇文章,用Python实现常用的假设检验!服从什么分布,就用什么区间估计方式...
  • 推断性统计部分(二)—参数估计标签(空格分隔): 概率论与数理统计参数估计包含两大部分,点估计及区间估计,点估计,是估计参数点的值,一个确定的值,区间估计就是估计参数的范围。点估计分为矩估计法及最大...
  • 又分为点估计和区间估计两种类型。 设总体 X的分布函数的形式已知,但它的一个或多个参数未知,借助于总体的一个样本来估计总体未知参数的值的问题称为参数的点估计问题。F(X,)表示在待估参数下的一个分布函数。 2...
  • 区间分析理论及其在控制领域...然后对区间方法在参数与状态估计、鲁棒控制、 智能理论等方面的应用研究成果进行了归纳和总结;最后分析了区间方法在控制理论应用研究中所面临的主要问题, 并展望了未来的研究方向.</p>
  • 在Stata的实现中,可以使用鲁棒...在这篇文章中,我将简要介绍使用稳健的区间回归的基本原理,并强调如果残差方差不是常数,与常规线性回归不同,则区间回归估计是有偏差的。 用于常规线性回归的稳健SE 在常...
  • 置信度又称显著性水平,意义阶段,信任系数等,是指估计总体参数落在某一区间时,可能犯错误的概率,用符号α表示 统计分析中一般规定:正确估计的概率,也即置信水平为0.95或0.99,那么显著性水平则为0.05或0.01,...
  • 对给定参数区间内部进行搜索,寻找到最优参数近似解的方法有很多。比如网格搜索。但是网格搜索太过暴力,往往花销过大。这里介绍一种新的参数寻优方法——蒙特卡洛树搜索。 网络上关于蒙特卡洛方法几乎清一色都是在...
  • bootstrap, boosting, bagging, stacking原理

    千次阅读 2018-08-25 01:08:42
    名字来自成语“pull up by your own bootstraps”,意思是依靠你自己的资源,称为自助法,它是一种有放回的抽样方法,它是非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法。其核心思想和基本步骤...
  • 这些统计量包括:回归系数参数估计、决定系数R方及调整后R方、F统计量以及F检验、对数似然、AIC、BIC、回归系数标准差和显著性t检验、回归系数置信区间、峰度与偏度、Jarque-Bera检验、Omnibus检验、Durbin-Watson...
  • 参数估计:点估计和区间估计 常用的数学记号 参数估计问题 矩估计 矩估计的基本定理 点估计:矩估计的例子(两点分布的参数估计) 点估计:矩估计(正态分布的参数估计) 点估计:极大似然估计 极大似然估计基本...
  • 轻松学统计--中国mooc8

    2019-12-02 17:33:23
    区间估计的基本原理: 点估计的缺点:不能反映估计的误差和精确程度 区间估计:利用样本统计量和抽样分布估计总体参数的可能区间(1934年,由统计学家J.奈曼所创立的一种严格的区间估计理论。) 【例】Traveller...
  • 检查清单-源码

    2021-02-10 00:42:41
    基本原理 / 一个总体参数区间估计 / 两个总体参数区间估计 8. [假设检验] 基本问题 / 一个总体参数的检验 / 两个总体参数的检验 [ 机器学习 ] 1. [特色工程] 特征归一化 / 类别型特征 / 组合特征 2. [模型评估] ...
  • 统计推断 笔记(一)

    2020-12-06 20:06:59
    估计原理2. 效率Efficiency和克拉美-劳不等式Cramer-Rao Inequality 0. 背景介绍 统计推断是对来自总体(population)的嘈杂样本(noisy sample)得出结论的过程。两大工具是估计和假设检验。 与概率论不同的是,...
  • 区间估计1.2. 似然与概率1.2.1. 概率1.2.2. 似然1.2.3. 表示1.3. 最大似然估计1.4.最大后验估计1.5. 注意2. 贝叶斯原理3. 朴素贝叶斯分类离散数据的分类连续数据的分类4. 实战有关文本分类4.1. 开始实战4.2. 读取...
  • -在上篇文章中,介绍了假设检验的基本方法和原理,并在文章的最后用Excel实现了主要的假设检验,见下文:数据分析 | 统计之参数假设检验这篇文章,用Python实现常用的假设检验!服从什么分布,就用什么区间估计方式...
  • -在上篇文章中,介绍了假设检验的基本方法和原理,并在文章的最后用Excel实现了主要的假设检验,见下文:数据分析 | 统计之参数假设检验这篇文章,用Python实现常用的假设检验!服从什么分布,就用什么区间估计方式...

空空如也

空空如也

1 2 3
收藏数 50
精华内容 20
关键字:

参数区间估计原理