精华内容
下载资源
问答
  • 三、区间估计 给出参数的取值范围 1. 区间估计的一般概念 2. 单个正太总体参数的置信区间 3. 两个正态总体参数的置信区间

    三、区间估计

    给出参数的取值范围

    1. 区间估计的一般概念

    2. 单个正太总体参数的置信区间

    3. 两个正态总体参数的置信区间

    展开全文
  • 【R参数估计】区间估计

    千次阅读 2020-01-20 21:36:42
    【R参数估计】区间估计区间估计(interval estimation) 区间估计(interval estimation) 区间估计是用两个统计量所构成的区间来估计一个未知的...缺点:不能直接地告诉人们“未知参数具体是多少”这一明确的概念 ...

    估计量的优良性准则

    无偏性

    估计量是随机变量,对于不同的样本值就会得到不同的估计值,这样,要确定一个估计量的好坏,就必须由多次抽样结果决定。对此,一个自然而基本的衡量标准是要求估计量无系统偏差,即在大量重复抽样(样本容量相同)时,所得的估计值平均起来应与待估参数的真值相同,这就是所谓的无偏性要求。

    有效性

    在许多情况下,总体参数Θ的无偏估计量不是唯一的,要衡量一个参数的两个无偏估计量哪一个更好,一个重要的标准就是观察它们谁的取值更集中于待估参数的真值附近,即哪一个估计量的方差更小,这就是所谓的有效性要求。

    相合性(一致性)

    一个好的估计量,当样本容量n越大时,由于关于总体的信息也随之增加,该估计理应越精确越可靠,特别是当n→∞时,估计值将与参数真值几乎完全一致,这就是估计量的相合性(一致性)。

    区间估计(interval estimation)

    对于前文提到的点估计方法,我们无法回答它的精确性如何?可信程度如何?为了解决这些问题,需要讨论参数的区间估计。

    区间估计是用两个统计量所构成的区间来估计一个未知的参数,并同时指明此区间可以覆盖住这个参数的可靠程度(置信度)
    缺点:不能直接地告诉人们“未知参数具体是多少”这一明确的概念

    一个正态总体的情况

    均值μ的方差估计

    总体方差已知和方差未知两种情况均值μ区间估计的R程序:

    interval_estimate1<-function(x,sigma=-1,alpha=0.05){ 
       n<-length(x); xb<-mean(x)
       if (sigma>=0){
          tmp<-sigma/sqrt(n)*qnorm(1-alpha/2); df<-n
       }
       else{
          tmp<-sd(x)/sqrt(n)*qt(1-alpha/2,n-1); df<-n-1
       }
       data.frame(mean=xb, df=df, a=xb-tmp, b=xb+tmp)
    }
    

    得到观测数据后,利用此函数对参数μ作区间估计:

    source("interval_estimate1.R")
    X<-c(14.6, 15.1,14.9, 14.8, 15.2,15.1)
    interval_estimate1(X, sigma=0.2)
    

    得到的结果如下
    在这里插入图片描述
    故该组观测数据的置信系数为0.95的置信区间为[14.79,15.11]

    R软件中的t.test检验函数可以完成相应的区间估计工作

    t.test(X)
    

    结果如下:
    在这里插入图片描述

    方差σ²的区间估计

    总体均值已知和均值未知两种情况方差σ²区间估计的R程序:

    interval_var1<-function(x,mu=Inf,alpha=0.05){ 
       n<-length(x) 
       if (mu<Inf){
          S2 <- sum((x-mu)^2)/n; df <- n
       }
       else{
          S2 <- var(x); df <- n-1
       }
       a<-df*S2/qchisq(1-alpha/2,df)
       b<-df*S2/qchisq(alpha/2,df)
       data.frame(var=S2, df=df, a=a, b=b)
    }
    

    输入数据,调用程序

    source("interval_var1.R")
    X<-c(10.1,10,9.8,10.5,9.7,10.1,9.9,10.2,10.3,9.9)
    interval_var1(X,mu=10)
    

    得到结果如下
    在这里插入图片描述
    从计算结果可以看出,在均值已知的情况下,计算结果更好一些

    两个正态总体的情况

    均值差μ1-μ2的区间估计

    均值差μ1-μ2区间估计的R程序:

    interval_estimate2<-function(x, y, 
       sigma=c(-1,-1),var.equal=FALSE, alpha=0.05){ 
       n1<-length(x); n2<-length(y)
       xb<-mean(x); yb<-mean(y)
       if (all(sigma>=0)){
          tmp<-qnorm(1-alpha/2)*sqrt(sigma[1]^2/n1+sigma[2]^2/n2)
          df<-n1+n2
       }
       else{
          if (var.equal ==  TRUE){
             Sw<-((n1-1)*var(x)+(n2-1)*var(y))/(n1+n2-2)
             tmp<-sqrt(Sw*(1/n1+1/n2))*qt(1-alpha/2,n1+n2-2)
             df<-n1+n2-2
          }
          else{
             S1<-var(x); S2<-var(y)
             nu<-(S1/n1+S2/n2)^2/(S1^2/n1^2/(n1-1)+S2^2/n2^2/(n2-1))
             tmp<-qt(1-alpha/2, nu)*sqrt(S1/n1+S2/n2)
             df<-nu
          }
       }
       data.frame(mean=xb-yb, df=df, a=xb-yb-tmp, b=xb-yb+tmp)
    }
    

    首先产生200个随机数,再调用函数interval_estimate2()进行计算

    source("interval_estimate2.R")
    x<-rnorm(100, 5.32, 2.18)
    y<-rnorm(100, 5.76, 1.76)
    interval_estimate2(x,y, sigma=c(2.18,1.76))
    

    得到结果如下:
    在这里插入图片描述
    故μ1-μ2的置信系数为0.95的区间估计为[-1.044,0.546]

    R软件中的t.test()函数也可以给出双样本差的区间估计

    t.test(x,y)
    

    得到的结果如下:
    在这里插入图片描述

    配对数据的区间估计

    例如:
    在这里插入图片描述
    输入数据,调入t.test()函数

    X<-c(11.3,15.0,15.0,13.5,12.8,10.0,11.0,12.0,13.0,12.3)
    Y<-c(14.0,13.8,14.0,13.5,13.5,12.0,14.7,11.4,13.8,12.0)
    t.test(X-Y)
    

    得到的结果如下:
    在这里插入图片描述
    由于0包含在区间估计的区间内,因此可以认为:治疗前后病人的血红蛋白的含量无明显差异。

    方差比σ1²/σ2²的区间估计

    方差比σ1²/σ2²区间估计的R程序:

    interval_var2<-function(x,y, 
       mu=c(Inf, Inf), alpha=0.05){ 
       n1<-length(x); n2<-length(y) 
       if (all(mu<Inf)){
          Sx2<-1/n1*sum((x-mu[1])^2); Sy2<-1/n2*sum((y-mu[2])^2)
          df1<-n1; df2<-n2
       }
       else{
          Sx2<-var(x); Sy2<-var(y); df1<-n1-1; df2<-n2-1
       }
       r<-Sx2/Sy2
       a<-r/qf(1-alpha/2,df1,df2)
       b<-r/qf(alpha/2,df1,df2)
       data.frame(rate=r, df1=df1, df2=df2, a=a, b=b)
    }
    

    输入数据,调用函数

    A<-scan()
    79.98 80.04 80.02 80.04 80.03 80.03 80.04 79.97
    80.05 80.03 80.02 80.00 80.02
    
    B<-scan()
    80.02 79.94 79.98 79.97 79.97 80.03 79.95 79.97
    
    source("interval_var2.R")
    interval_var2(A,B, mu=c(80,80)) #均值已知
    
    interval_var2(A,B) #均值未知
    
    var.test(A,B)
    

    得到的结果如下:
    在这里插入图片描述
    1包含在区间估计的区间中,即有理由认为两总体的方差比为1,即可认为两总体的方差是相同的。

    非正态总体的区间估计

    当数据不服从正态分布时,估计均值的一种有效的方法就是所谓的大样本方法,即要求样本的量比较大,利用中心极限定理进行分析。
    非正态总体区间估计的R程序:

    interval_estimate3<-function(x,sigma=-1,alpha=0.05){ 
       n<-length(x); xb<-mean(x)
       if (sigma>=0)
          tmp<-sigma/sqrt(n)*qnorm(1-alpha/2)
       else
          tmp<-sd(x)/sqrt(n)*qnorm(1-alpha/2)
       data.frame(mean=xb, a=xb-tmp, b=xb+tmp)
    }
    

    例如:
    在这里插入图片描述
    先产生随机数,再调用函数

    source("interval_estimate3.R")
    > x<-rexp(50,1/2.266)
    > interval_estimate3(x)
    

    得到结果如下:
    在这里插入图片描述

    单侧置信区间估计

    对于某些问题,人们只关心在某一方向上的界限,这类区间估计问题就被称为单侧区间估计。

    一个总体求均值

    根据计算公式及双侧置信区间的公式写出R程序,并可控制求上、下置信区间或双侧置信区间。

    interval_estimate4<-function(x, sigma=-1, side=0, alpha=0.05){ 
       n<-length(x); xb<-mean(x)
       if (sigma>=0){
          if (side<0){
             tmp<-sigma/sqrt(n)*qnorm(1-alpha)
             a <- -Inf; b <- xb+tmp
          }
          else if (side>0){
             tmp<-sigma/sqrt(n)*qnorm(1-alpha)
             a <- xb-tmp; b <- Inf
          }
          else{
             tmp <- sigma/sqrt(n)*qnorm(1-alpha/2)
             a <- xb-tmp; b <- xb+tmp
          }
          df<-n
       }
       else{
          if (side<0){
             tmp <- sd(x)/sqrt(n)*qt(1-alpha,n-1)
             a <- -Inf; b <- xb+tmp
          }
          else if (side>0){
             tmp <- sd(x)/sqrt(n)*qt(1-alpha,n-1)
             a <- xb-tmp; b <- Inf
          }
          else{
             tmp <- sd(x)/sqrt(n)*qt(1-alpha/2,n-1)
             a <- xb-tmp; b <- xb+tmp
          }
          df<-n-1
       }
       data.frame(mean=xb, df=df, a=a, b=b)
    }
    

    一个总体求方差

    interval_var3<-function(x,mu=Inf,side=0,alpha=0.05){ 
       n<-length(x)
       if (mu<Inf){
          S2<-sum((x-mu)^2)/n; df<-n
       }
       else{
          S2<-var(x); df<-n-1
       }
       if (side<0){
          a <- 0
          b <- df*S2/qchisq(alpha,df)
       }
       else if (side>0){
          a <- df*S2/qchisq(1-alpha,df)
          b <- Inf
       }
       else{
          a<-df*S2/qchisq(1-alpha/2,df)
          b<-df*S2/qchisq(alpha/2,df)
       }
       data.frame(var=S2, df=df, a=a, b=b)
    }
    

    两个总体求均值差

    interval_estimate5<-function(x, y, 
       sigma=c(-1,-1), var.equal=FALSE, side=0, alpha=0.05){ 
       n1<-length(x); n2<-length(y)
       xb<-mean(x); yb<-mean(y); zb<-xb-yb
       if (all(sigma>=0)){
          if (side<0){
             tmp<-qnorm(1-alpha)*sqrt(sigma[1]^2/n1+sigma[2]^2/n2)
             a <- -Inf; b <- zb+tmp
          }
          else if (side>0){
             tmp<-qnorm(1-alpha)*sqrt(sigma[1]^2/n1+sigma[2]^2/n2)
             a <- zb-tmp; b <- Inf
          }
          else{
             tmp<-qnorm(1-alpha/2)*sqrt(sigma[1]^2/n1+sigma[2]^2/n2)
             a <- zb-tmp; b <- zb+tmp
          }
          df<-n1+n2
       }
       else{
          if (var.equal ==  TRUE){
             Sw<-((n1-1)*var(x)+(n2-1)*var(y))/(n1+n2-2)
             if (side<0){
                tmp<-sqrt(Sw*(1/n1+1/n2))*qt(1-alpha,n1+n2-2)
                a <- -Inf; b <- zb+tmp
             }
             else if (side>0){
                tmp<-sqrt(Sw*(1/n1+1/n2))*qt(1-alpha,n1+n2-2)
                a <- zb-tmp; b <- Inf
             }
             else{
                tmp<-sqrt(Sw*(1/n1+1/n2))*qt(1-alpha/2,n1+n2-2)
                a <- zb-tmp; b <- zb+tmp
             }
             df<-n1+n2-2
          }
          else{
             S1<-var(x); S2<-var(y)
             nu<-(S1/n1+S2/n2)^2/(S1^2/n1^2/(n1-1)+S2^2/n2^2/(n2-1))
             if (side<0){
                tmp<-qt(1-alpha, nu)*sqrt(S1/n1+S2/n2)
                a <- -Inf; b <- zb+tmp
             }
             else if (side>0){
                tmp<-qt(1-alpha, nu)*sqrt(S1/n1+S2/n2)
                a <- zb-tmp; b <- Inf
             }
             else{
                tmp<-qt(1-alpha/2, nu)*sqrt(S1/n1+S2/n2)
                a <- zb-tmp; b <- zb+tmp
             }
             df<-nu
          }
       }
       data.frame(mean=zb, df=df, a=a, b=b)
    }
    

    求两个总体方差的情况

    interval_var4<-function(x,y, 
       mu=c(Inf, Inf), side=0, alpha=0.05){ 
       n1<-length(x); n2<-length(y) 
       if (all(mu<Inf)) {
          Sx2<-1/n1*sum((x-mu[1])^2); df1<-n1
          Sy2<-1/n2*sum((y-mu[2])^2); df2<-n2
       }
       else{
          Sx2<-var(x); Sy2<-var(y); df1<-n1-1; df2<-n2-1
       }
       r<-Sx2/Sy2
       if (side<0) {
          a <- 0
          b <- r/qf(alpha,df1,df2)
       }
       else if (side>0) {
          a <- r/qf(1-alpha,df1,df2)
          b <- Inf
       }
       else{
          a<-r/qf(1-alpha/2,df1,df2)
          b<-r/qf(alpha/2,df1,df2)
       }
       data.frame(rate=r, df1=df1, df2=df2, a=a, b=b)
    }
    
    展开全文
  • 点估计和区间估计是通过样本统计量估计总体参数的两种方法。点估计是在抽样推断中不考虑抽样误差,直接以抽样指标代替全体指标一种推断方法。因为个别样本抽样指标不等于全体指标,所以,用抽样指标直接代替...

    概念简介:

            点估计和区间估计是通过样本统计量估计总体参数的两种方法。点估计是在抽样推断中不考虑抽样误差,直接以抽样指标代替全体指标的一种推断方法。因为个别样本的抽样指标不等于全体指标,所以,用抽样指标直接代替全体指标,不可避免的会有误差。区间估计是抽样推断中根据抽样指标和抽样误差去估计全体指标的可能范围的一种推断方法。在从抽样指标推断全体指标时,用一定概率保证误差不超出某一给定范围。

    点估计:

            点估计是使用抽样数据得到总体有样本参数。比如,针对某市房租平均价格的统计,全部统计成本会比较大,因此我们随机选择某一部分的在租房屋进行统计,计算均值用来表示某市房租价格的整体均值。但是点估计和抽样的样本量强相关,样本量占总体越少越可能会出现误差。比如,随机抽样中存在较多的极值,导致我们点估计的结果偏高。或者样本不够随机,选择市中心的房租对某市的房租估计显然也是不准确的。

    区间估计:

            区间估计估计不同于点估计,能够提供待估计参数的置信区间和置信度(即保证XX%的可能性该参数的值位于*~*之间,例如,有95%的可能性全市房租均价在2000~2500之间),区间估计虽然不能得出精确的估计值,但是能够提供保证程度,代表了有多大把握总体参数会在相应的置信区间内。在对全体样本进行多次抽样,根据中心极限定理,多次抽样的样本均值会服从均值为总体样本均值的正态分布。     

      

    其中,μ为均值,σ为标准差,由于总体的均值μ和总体的μ是未知参数,因此我们使用抽样样本的均值和标准差作为总体均值和标准差的估计值。

    因此可以根据正态分布的图像可知,

    μ±σ时,概率为68.26%;

    μ±2σ时,概率为95.44%;

    μ±3σ时,概率为99.74%。

    在统计学中,常用的置信度一般取95%和99%,因此更为精确的值参考下图。

    附区间估计的python代码实现:

    # 代码来源网路,使用时将house_price换成自己的Dataframe,price换成要估计的参数即可
    se = house_price.price.std() / len(house_price_gr) ** 0.5 #均值标准误差
    LB = house_price.price.mean() - 1.96 * se #置信区间下界
    UB = house_price.price.mean() + 1.96 * se #置信区间上界
    

     

    展开全文
  • 参数估计(点估计和区间估计

    万次阅读 多人点赞 2019-09-06 12:07:06
    概念理解:当我们想知道某一总体某个指标情况时,测量整体该指标数值 工作量太大,或者不符合实际,这时我们可以采用抽样方法选取一部分样本测量出他们数值,然后用样本统计量值来估计总体情况。...

    “参数估计是以抽样分布为中介,用样本的参数特征对总体的参数进行数值估计的过程。”

    一、点估计
    1.点估计就是用样本统计量来估计总体参数。
    概念理解:当我们想知道某一总体的某个指标的情况时,测量整体该指标的数值 的工作量太大,或者不符合实际,这时我们可以采用抽样的方法选取一部分样本测量出他们数值,然后用样本统计量的值来估计总体的情况。
    例如:想了解一个学校学生的身高情况,就可以随机抽取一部分学生测量他们的身高,得到一个平均值,再用这个样本的均值去估计整体学生的身高情况,就是点估计。

    常用的点估计有:用样本均值估计总体均值,用样本方差估计总体方差,用样本的分位数估计总体分位数,用样本的中位数估计总体的中位数。

    2.点估计方法
    矩估计法、顺序统计量法、最大似然法、
    最小二乘法(对于点估计方法,放在另一篇文章中详细介绍)

    3.由于用样本推断总体的过程一定存在估计误差,而点估计的估计误差无法衡量,所以点估计主要用于为定性研究提供数据参考,或者在对于总体参数估计精度要求不高时使用。

    二、区间估计
    1.区间估计就是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。
    另外一种说法,区间估计是从点估计值和抽样标准误差出发,按给定的概率值建立包含待估参数的区间,这个给定的概率值称为置信度或置信水平,这个建立起来的包含待估计参数的区间称为置信区间。

    2.关于置信水平(置信度)、置信区间和显著性水平:
    置信区间是根据样本信息推导出来的可能包含总体参数的数值区间,置信水平表示置信区间的可信度;例如某学校学生的平均身高的区间估计:有95%的置信水平可以认为该校学生的平均身高为1.4米到1.5米之间,(1.4,1.5)为置信区间,95%是置信水平,即有95%的信心认为这个区间包含该校学生的平均身高。
    置信水平用百分数表示,表示成(1-a)100%a指的是显著性水平,表示总体参数不落在置信区间的可能性。

    3.关于置信区间的计算:
    通过部分样本来计算总体参数的一个置信区间有以下步骤:
    a.明确要解决的问题,要估计的指标或参数是什么,
    b.求抽样样本的平均值和标准误差,
    注意区分标准差和标准误差:标准差反映的是整个样本对样本平均数的离散程度,标准差等于方差开根号;标准误差反映的是样本平均数对总体平均数的变异程度,标准误差等于样本标准差除n的开根号。
    c.确定需要的置信水平,
    d.查询z表,得到z值,
    e. 计算置信区间,[a,b],a=样本均值-z标准误差,b=样本均值+z标准误差。

    区间估计分为一个总体参数的估计和两个总体参数的估计

    4.一个总体参数的区间估计:总体均值的区间估计,总体方差的区间估计,总体比例的区间估计;

    4.1总体均值的区间估计:
    均值抽样分布即样本均值组成的抽样分布,总体参数的估计方法跟样本均值的抽样分布有关;
    Z分布其实就是标准正态分布,如果样本均值组成的抽样分布服从正态分布,那么将该正态分布标准化后即可得到Z分布,
    Z分布的适用条件有两种:一是总体服从正态分布且总体标准差已知;二是总体分布未知,但是样本容量大于或等于30;
    T分布:对于服从正态分布的总体且总体标准差未知的情况下 ,T分布是非常适用的均值抽样分布类型;
    切比雪夫不等式:对于非正态分布总体或总体分布未知并且小样本的情况下,只能用切比雪夫不等式来近似估计总体均值的置信区间。
    在这里插入图片描述截图来自《人人都会数据分析:从生活实例学统计》

    4.2 总体方差的区间估计:
    总体方差的区间估计要用到卡方分布,如果数据总体服从正态分布,从中抽取样本容量为n的样本,样本方差为s^2,那么包含样本方差的卡方统计量服从自由度为n-1的卡方分布。卡方统计量是由总体方差和样本方差的比值组成的统计量,用于总体方差的区间估计。
    卡方统计量的计算公式:
    χα2(n1)=(n1)s2σz2\chi^2_\alpha(n-1)=\frac{(n-1)s ^2}{\sigma ^2_z}
    总体方差的双侧置信区间估计公式为:
    (n1)s2χα22(n1)σz2(n1)s2χ12α2(n1)\frac{(n-1)s^2}{\chi ^2_\frac{\alpha}{2}(n-1)} \leq \sigma ^2_z \leq \frac{(n-1)s ^2}{\chi ^2_1-\frac{\alpha}{2} (n-1)}
    其中带有a/2的为下标;
    如果是单侧置信区间的话,只需要取上面式子的前半部分或者后半部分,并将a/2改成a即可得到单侧置信区间。

    4.3 总体比例的区间估计:
    或者叫总体比率的区间估计,跟二项分布有关,二项分布的理论是:事件发生概率是p,进行n次实验,其中x次实验该事件发生,则发生次数的概率分布服从二项分布;均值、方差为np,npq。
    若将发生的次数转换成比率(x/n),则比率的概率分布也服从二项分布。
    二项分布的特性:当抽取的样本容量n很大,是大 样本,使得np和nq(q为事件不发生的概率,等于1-p)的值都大于 5, 此时二项分布将近似于正态分布。
    由于事件发生比率x/n服从二项分布,所以如果比率的二项分布近似于正态分布,就可以得到不利的区间估计。

    在事件发生概率p已知的情况下,总体比率pzˉ\bar{p_z}在置信度为1-a时,总体比率的置信区间为:
    pyˉ±Zα2p(1p)n\bar{p_y} \pm Z_\frac{\alpha}{2} \sqrt{\frac{p(1-p)}{n}}
    其中,pyˉ\bar{p_y}为样本比率,pzˉ\bar{p_z}为总体比率,
    当事件发生概率p未知,可用样本中事件发生的概率即样本比率代替。

    5. 两个总体参数的区间估计
    两个总体均值之差的估计,两个总体方差比的区间估计
    两个总体与多个总体参数的区间估计在实际生活中的应用不是很多,更常用的是两个总体和多个总体参数的假设检验。 区间估计虽不常用,但是其与假设检验的应用原理是想通的。

    5.1 两个总体均值之差的区间估计:
    可以将单个总体均值的抽样分布推广到两个总体均值差的抽样分布,然后利用两个总体均值差的抽样分布推导出两个总体均值差的置信区间公式。
    方差齐性/方差不齐:对于配对样本来说其方差可被认为是想等的,即方差齐性。
    在这里插入图片描述
    截图来自《人人都会数据分析:从生活实例学统计》

    独立样本和配对样本:
    独立样本:是指如果从一个总体中选取样本,抽样形式无论怎样改变都不会影响从另一个总体中抽取样本的概率,则这两个随机样本为独立样本;
    配对样本:是指如果从一个总体中抽取样本的行为以某种方式决定了从另一个总体中抽取样本的概率,则这两个样本为成对样本或配对样本。

    均值和方差的特点:
    两个总体合并(相加或相减),那么合并后的总体均值等于原来两个总体的均值之和或均值之差;而合并后的总体方差都等于两个总体方差之和。

    差值抽样分布可以看做单个总体的均值抽样分布,因此可套用“均值抽样分布适用条件表”,将公式修改一下即可:

    截图来自《人人都会数据分析:从生活实例学统计》

    5.2 两个总体方差比的区间估计
    F分布可用于求取两个正态分布总体方差比的置信区间。
    F统计量可被看做是两个卡方统计量的商,F分布也被称为方差比分布。因为卡方分布要求总体服从正态分布,所以F分布也要求F统计量的两个总体都服从正态分布。
    当给定置信水平时,可推出两个正态分布总体方差比的置信区间。

    三、样本量的确定

    1总体均值区间估计的样本量确定
    在总体标准差已知的情况下,如果数据总体服从正态分布,则样本均值的抽样分布适用Z分布,就可以利用总体均值的置信区间公式来计算样本容量,总体均值的置信区间为:
    xˉ±Zα2σn\bar{x}\pm Z_\frac{\alpha}{2} \frac{\sigma}{\sqrt{n}}xˉ±Zα2σnNnN1\bar{x}\pm Z_\frac{\alpha}{2} \frac{\sigma}{\sqrt{n}} \sqrt{\frac{N-n}{N-1}}

    则总体均值的区间估计误差为:
    Δμ=Zα2σn\Delta\mu=Z_\frac{\alpha}{2} \frac{\sigma}{\sqrt{n}}
    进而可以求得样本容量的公式:
    n=(Zα2σΔμ)2n=(\frac{Z_\frac{\alpha}{2} \sigma}{\Delta\mu})^2

    以上是总体标准差已知时,当总体标准差未知时,一是可以用样本标准差代替,但是前提条件是样本容量要大于等于30;二是可以用过去试点调查的样本标准差代替;三是,如果知道总体数据中的最大和最小值,可用四分之一的最大与最小值的差值来代替总体标准差。

    2.总体方差区间估计的样本量确定
    总体方差的区间估计适用的抽样分布为卡方分布。卡方统计量为:
    χ2=(n1)s2σ2\chi^2=\frac{(n-1)s ^2}{\sigma ^2}
    由卡方分布的性质可知,当样本量足够大时,卡方分布近似于正态分布。卡方分布的均值为自由度(n-1),卡方分布的方差为两倍的自由度2(n-1),那么在大样本的情况下,总体方差的置信区间为:
    s2=±Zα2s22ns^2=\pm Z_\frac{\alpha}{2} s^2 \sqrt{\frac{2}{n}}
    则总体方差的估计精度为:
    Δσ2=Zα2s22n\Delta \sigma^2=Z_\frac{\alpha}{2} s^2 \sqrt{\frac{2}{n}}
    由此可得到样本容量公式为:
    n=2Zα2s2Δσ2n=\frac{\sqrt{2} Z_\frac{\alpha}{2} s^2}{\Delta \sigma^2}

    3.总体比率区间估计的样本量确定
    在确定总体比率的区间估计时,利用的是二项分布近似于正态分布的性质,即当抽取的样本量n很大时,是大样本,使得np>5且nq>5(p是事件发生的概率,q是事件不发生的概率,q=1-p)时,二项分布近似于正态分布。
    总体比率的置信区间为:
    pyˉ±Zα2p(1p)n\bar{p_y} \pm Z_\frac{\alpha}{2} \sqrt{\frac{p(1-p)}{n}}
    则总体比率的估计误差为:
    Δpzˉ=Zα2p(1p)n\Delta \bar{p_z} =Z_\frac{\alpha}{2} \sqrt{\frac{p(1-p)}{n}}
    由此可得到样本容量为:
    n=Zα22p(1p)Δpzˉ2n=\frac{Z_\frac{\alpha}{2} ^2 p(1-p)}{\Delta \bar{p_z} ^2}

    注:本文主要参考《人人都会数据分析:从生活实例学统计》

    展开全文
  • 第四章、区间估计4.1区间估计基本概念4.1.1区间估计参数估计分为点估计和区间估计,第三章中我们已经对众多点估计方法有了比较详细介绍。而现在我们思考下,用点估计量来估计参数,估计正确概率是多少呢?如果是...
  • 参数估计概念整理

    千次阅读 2018-05-15 14:29:51
    分为点估计和区间估计两个部分统计量:可以简单理解为根据样本构造概率密度函数参数空间:参数估计中,我们假设总体概率密度函数已知,而未知是函数中几个参数,用Θ表示。Θ所有可能取值即为参数空间。...
  • 我们知道随机事件通过随机变量数学化,而随机变量特征由分布律或分布概率密度函数来表征...从名字上直观就可以理解,点估计是估计参数的具体值,区间估计不光给出值还要给出估计值可信范围!这里先介绍点估计。1、...
  • 区间估计

    千次阅读 2018-03-17 15:01:31
    一.实验目的 分别使用Excel、SPSS和Python软件做区间估计,探究哪种软件可以实现哪几种区间估计。二.实验内容参数的点估计给出了一个具体的...1. 区间估计的概念设 是总体的一个参数, 是样本,在得到样本观测值后...
  • 对于一个未知参数,我们通过点估计得到其近似值,但我们并不以此为满足,有时还需...接着我们可以引出置信区间的概念。在上面的例子中,(8.7,9.2)是参数θ的置信水平为1-α的置信区间。此时置信水平为0.95,α为0.05...
  • FRM 17.1 区间估计

    2021-01-03 22:56:20
    二、区间估计的基本概念 区间估计是指估计未知参数的区间范围。如给定概率水平,估计出来的置信区间以的概率覆盖未知总体参数,其中称为显著性水平,称为置信区间。 置信区间的宽度与置信水平正相关,与显著性水平...
  • 一、区间估计的基本概念1、在第7章抽样中,我们知道点估计量是用于估计总体参数的样本统计量。但是点估计量不可能给出总体参数的精确值,所以这里就需要用到区间估计。区间估计的目的就在于比较基于样本得出的点估计...
  • 文章目录1. 区间估计2....区间估计参数估计的一种形式,通常也是对均值或方差进行估计。主题思想就是通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体...
  • 有两种形式:点估计和区间估计 (2)假设检验问题:总体X分布函数形式完全未知,或只知其形式,但不知其参数,为了推断总体某些未知特性,提出某些关于总体假设。 区间估计 引入:点估计值仅仅是未知参数的...
  • 参数估计——点估计

    2020-05-20 21:59:20
    区间估计的一般概念2. 单个正太总体参数的置信区间3. 两个正态总体参数的置信区间 一、点估计 1. 参数估计 2. 矩法估计 3. 极大似然估计 二、估计量的优劣标准 1. 无偏性 2. 一致性 三、区间估计 1. 区间估计的一般...
  • 点估计与区间估计的区别3.评价估计量优良性的标准4.点估计:矩估计法5.区间估计6.样本容量的确定一、估计量与估计值的概念估计量:用于估计总体参数的随机变量(如:样本均值就是总体均值的一个估计量)估计值:估计量...
  • 0x1:数理统计中为什么要引入总体和个体这个概念 概率论与数理统计中,一个很重要研究对象就是总体概率分布,理论上说,我们希望获得被研究对象总体样本,基于这份总体样本进一步研究其概率分布,但是遗憾地...
  • 参数估计

    2018-12-03 17:43:50
    参数的点估计 设总体XXX服从某种已知分布,如正态分布N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2),泊松分布P(λ)P(\lambda)P(λ),指数分布E(λ)E(\lambda)E(λ),但是其中的一个或多个参数为未知...区间估计的基本概念 ...
  • 今天来讲解数理统计中的参数估计问题,前面内容已经更新完毕,需要自取10分钟掌握一维随机变量及其分布问题(考研、期末复习均可以用)10分钟掌握多维随机变量及其分布问题(考研、期末复习均可以用)10分钟掌握...
  • 目录 1. 置信区间、置信限 2. 枢轴量法 3. 单个正态总体均值的区间估计 ...但这种判断的把握有多大,点估计本身并没有告诉人们,为弥补这种不足,提出区间估计的概念。 定义1 例题 定义2 单侧...
  •     索引—— 基本概念 连续变量统计描述 分类变量统计描述 ... 参数估计与可信区间 假设检验   六、抽样估计与可信区间   1、抽样误差与统计推断 1.1 统计推断/统计估计(statiscal inference...
  • 统计学 参数估计 总体比例的估计 总体比例的估计 样本容量的估计 1.概念 2.假定条件 因为只有大样本条件下可以采用中心极限定理 3.统计量z 3.置信区间 实际计算时用p代替π 4.大样本判定 大样本选取...
  • 参数估计(点估计、区间估计) 假设检验(参数检验、非参数检验) 一、 置信区间 在实际中,我们通常得不到总体在某方面真值,比如总体均值。或者说,如果我们现在要估计公司某个产品用户满意度,就可以通过...
  • 数据分析|参数估计

    2019-12-21 13:03:37
    参数估计 在统计方法中的地位参数估计 是为了判定总体数据特征性质,而从中抽取部分样本数据,通过样本的参数进而估计总体数据的特征目录1.估计量与估计值的概念2.点估计与区间估计的区别3.评...
  • 理解略肤浅,所以该博文更适合像我一样初学者...根据对象是一个值,还是一个区间,可分为点估计和区间估计 3、矩估计 首先我们应该了解什么是矩呢?这是一个数理统计概念: 中心矩,原点矩一个意思。 矩估计...
  • 推断统计:参数估计和假设检验

    千次阅读 多人点赞 2020-03-03 00:35:24
    目录 ...  3、参数估计(点估计和区间估计)    1)参数估计、点估计和区间统计的概念    2)点估计说明    3)区间估计说明   4、中心极限定理    1)中心极限定理的概念    2...
  • 熟知点估计与区间估计的概念与区别。 熟知中心极限定理的含义。 熟知正态分布及其特征。 1、推断统计分析 (1)总体、个体与样本 总体:是包含我们要研究的所有数据,总体中的某个数据,就是个体。总体是所有个体...
  • 估计量评价标准二、参数的区间估计1. 基本概念2. 理解3. 置信区间求解3. 正态总体均值置信区间 (置信水平为 1−α1-\alpha1−α)三、假设检验1. 思想方法2. 理解3. 正态总体下六大检验及拒绝域4. 示例四、...
  • 点估计、区间估计3.推断统计概念二、代码实现1.点估计2.区间估计三、作业 前言 本节知识要点:推断统计分析——参数估计 目标: 熟知点估计与区间估计 中心极限定理 正态分布及其特性 python实现与分析思路是重点 一...

空空如也

空空如也

1 2 3 4 5
收藏数 94
精华内容 37
关键字:

参数区间估计的概念