精华内容
下载资源
问答
  • 用MATLAB进行区间估计
    千次阅读
    2020-12-01 14:55:43

    数据正态总体分布normfit()命令来完成对参数的点估计和区间估计。此命令以alpha为显著性水平,在数据X下,对参数进行估计(alpha缺省时设定为0.05)

    [muhat,sigmahat,muci,sigmaci]= normfit(X,alpha)
    muhat是正态分布的均值的点估计值 
    sigmahat是标准差的点估计 
    muci是均值的区间估计
    sigmaci是标准差的区间估计

    y=[1050,1100,1080,1120,1200,1250,1040,1130,1300,1200];
    [muhat,sigmahat,muci,sigmaci]= normfit(y,0.05)
    %输出
    muhat =
    
            1147
    
    
    sigmahat =
    
       87.0568
    
    
    muci =
    
       1.0e+03 *
    
        1.0847
        1.2093
    
    
    sigmaci =
    
       59.8807
      158.9318

    % muhat是正态分布的均值的点估计值 1147
    % sigmahat是标准差的点估计 87.0568
    % muci是均值的区间估计[1084.7 1209.3]
    % sigmaci是标准差的区间估计[59.8807,158.9318] 

    [muhat,muci]=expfit(X,alpha)

    %在显著性水平alpha下,指数分布的数据X的均值的点估计及其区间估计。

    [lamhat,lamaci]=poissfit(X,alpha)

    %在显著性水平alpha下,泊松分布的数据X的参数的点估计及其区间估计。

    [phat,pci]=weibfit(X,alpha)

    %在显著性水平alpha下,求Weibull分布的数据X的参数的点估计及其区间估计。

    [ahat,bhat,aci,bci]=unifit(X,alpha)

    %在显著性水平alpha下,求均匀分布的数据X的参数a和b的点估计及其区间估计。

    %标准差已知的正态均值区间估计
    x=[14.6,14.7,15.1,19.9,14.8,15.0,15.1,15.2,14.8];
    a=0.05;%给定显著水平
    sigma=0.15;%已知标准差
    n=length(x);%样本容量
    mu=mean(x);%均值
    u=norminv(1-a/2,0,1);%正态分布临界值
    muci=[mu-u*sqrt(sigma^2/n),mu+u*sqrt(sigma^2/n)]%输出置信区间
    [muhat,sigmahat,muci,sigmaci]= normfit(x,0.05)


    muci =

       15.3687   15.5647


    muhat =

       15.4667


    sigmahat =

        1.6748


    muci =

       14.1793
       16.7540


    sigmaci =

        1.1313
        3.2086
    可以在这种情况下看出直接计算和用公式计算误差较大

    %均值已知时正态总体标准差的区间估计
    x=[14.6,14.7,15.1,19.9,14.8,15.0,15.1,15.2,14.8];
    a=0.05;%给定显著水平
    n=length(x);%样本容量
    mu=14.5;%已知均值
    chi2=sum((x-mu).^2);
    lambda1=chi2inv(1-a/2,n);
    lambda2=chi2inv(a/2,n);
    sigma=[sqrt(chi2/lambda1),sqrt(chi2/lambda2)]
    
    y=[1050,1100,1080,1120,1200,1250,1040,1130,1300,1200];
    %p139 22
    z=[2.14,2.10,2.13,2.15,2.13,2.12,2.13,2.10,2.15,2.12,2.14];
    mu=mean(z);
    [muhat,sigmahat,muci,sigmaci]= normfit(z,0.1)
    % 数据正态总体分布normfit()命令来完成对参数的点估计和区间估计。此命令以alpha为显著性水平,在数据X下,对参数进行估计(alpha缺省时设定为0.05)
    % muhat是正态分布的均值的点估计值 1147
    % sigmahat是标准差的点估计 87.0568
    % muci是均值的区间估计[1084.7 1209.3]
    % sigmaci是标准差的区间估计[59.8807,158.9318]
    %%
    [muhat,muci]=expfit(X,alpha)
    
    %在显著性水平alpha下,指数分布的数据X的均值的点估计及其区间估计。
    
    [lamhat,lamaci]=poissfit(X,alpha)
    
    %在显著性水平alpha下,泊松分布的数据X的参数的点估计及其区间估计。
    
    [phat,pci]=weibfit(X,alpha)
    
    %在显著性水平alpha下,求Weibull分布的数据X的参数的点估计及其区间估计。
    
    [ahat,bhat,aci,bci]=unifit(X,alpha)
    
    %在显著性水平alpha下,求均匀分布的数据X的参数a和b的点估计及其区间估计。
    
    %%
    %标准差已知的正态均值区间估计
    x=[14.6,14.7,15.1,19.9,14.8,15.0,15.1,15.2,14.8];
    a=0.05;%给定显著水平
    sigma=0.15;%已知标准差
    n=length(x);%样本容量
    mu=mean(x);%均值
    u=norminv(1-a/2,0,1);%正态分布临界值
    muci=[mu-u*sqrt(sigma^2/n),mu+u*sqrt(sigma^2/n)]%输出置信区间
    [muhat,sigmahat,muci,sigmaci]= normfit(x,0.05)
    %%
    %均值已知时正态总体标准差的区间估计
    x=[14.6,14.7,15.1,19.9,14.8,15.0,15.1,15.2,14.8];
    a=0.05;%给定显著水平
    n=length(x);%样本容量
    mu=14.5;%已知均值
    chi2=sum((x-mu).^2);
    lambda1=chi2inv(1-a/2,n);
    lambda2=chi2inv(a/2,n);
    sigma=[sqrt(chi2/lambda1),sqrt(chi2/lambda2)]
    更多相关内容
  • 统计学高清思维导图-区间估计
  • 在数理统计课程中,使用R语言,进行区间估计。在数理统计课程中,使用R语言,进行区间估计
  • 区间估计

    2020-10-07 20:49:47
    区间估计 百科定义:在点估计的基础上,给出总体参数估计的一个范围,通常由样本统计量加减估计误差。 区间估计中,可以根据样本统计量的抽样分布,对样本统计量与总体参数的接近程度给出一个概率度量 个人理解:给...

    区间估计

    百科定义:在点估计的基础上,给出总体参数估计的一个范围,通常由样本统计量加减估计误差。

    区间估计中,可以根据样本统计量的抽样分布,对样本统计量总体参数接近程度给出一个概率度量


    个人理解:给出总体参数在当前给定区间的概率

    解释:

    点估计未知参数θ的估计量θ^是一个随机变量,随着样本选取的不同,得到的值也不同的,所以在此基础上,我们就希望能够找到一个区间,使得总体参数落到这个区间上的概率尽可能大(这个概率其实也就是可信度(置信水平)),而这个区间就是区间估计的解。

    目标:区间越小越好,概率越大越好(其实两者在一定程度上是矛盾的)

    公式定义

    P { θ 1 ^ ≤ θ ≤ θ 2 ^ } = 1 − α θ : 总 体 未 知 参 数 θ ^ 1 、 θ ^ 2 : 置 信 下 限 和 置 信 上 限 1 − α : 置 信 水 平 P\{\hat{\theta_1}\le\theta\le\hat{\theta_2}\}=1-\alpha\\ \theta:总体未知参数\\ \hat\theta_1、\hat\theta_2:置信下限和置信上限\\ 1-\alpha:置信水平 P{θ1^θθ2^}=1αθ:θ^1θ^2:1α:

    转化:
    P { g ( θ 1 ) ^ ≤ T ( x ) ≤ g ( θ 2 ) ^ } = 1 − α T ( x ) : ( 关 键 ) 需 要 构 造 的 统 计 量 , 通 常 是 正 态 、 卡 方 、 t 、 F 分 布 , 这 样 才 能 写 成 分 位 数 形 式 P\{\hat{g(\theta_1)}\le{T(x)}\le{\hat{g(\theta_2)}}\}=1-\alpha\\ T(x):(关键)需要构造的统计量,通常是正态、卡方、t、F分布,这样才能写成分位数形式 P{g(θ1)^T(x)g(θ2)^}=1αT(x):()tF


    单个正态总体参数的区间估计

    例:总体服从X~N(μ,σ2),现有样本统计量(X1、X2、X3…Xn)求μ和σ2的置信度为1-α的区间

    估计μ

    • 情况一:σ2已知,(正态分布求解)

    根 据 总 体 分 布 可 得 到 样 本 分 布 : X ˉ − N ( μ , σ 2 n ) 构 造 统 计 量 : ( X ˉ − μ ) σ n − N ( 0 , 1 ) P { − μ ( 1 − α 2 ) ≤ ( X ˉ − μ ) σ n ≤ μ ( 1 − α 2 ) } = 1 − α p { X ˉ − σ n μ ( 1 − α 2 ) ≤ μ ≤ X ˉ + σ n μ ( 1 − α 2 ) } 于 是 估 计 区 间 为 : [ X ˉ − σ n μ ( 1 − α 2 ) , X ˉ + σ n μ ( 1 − α 2 ) ] 注 : 其 中 μ ( 1 − α 2 ) 需 查 表 , σ 、 X ˉ 为 已 知 值 根据总体分布可得到样本分布:\bar{X}-N(\mu,\frac{\sigma^2}{n})\\ 构造统计量:\frac{(\bar{X}-\mu)}{\frac{\sigma}{\sqrt{n}}}-N(0,1)\\ P\{-\mu_{(1-\frac{\alpha}{2})}\le\frac{(\bar{X}-\mu)}{\frac{\sigma}{\sqrt{n}}}\le\mu_{(1-\frac{\alpha}{2})}\}=1-\alpha\\ p\{\bar{X}-\frac{\sigma}{\sqrt{n}}\mu_{(1-\frac{\alpha}{2})}\le\mu\le\bar{X}+\frac{\sigma}{\sqrt{n}}\mu_{(1-\frac{\alpha}{2})}\}\\ 于是估计区间为:[\bar{X}-\frac{\sigma}{\sqrt{n}}\mu_{(1-\frac{\alpha}{2})},\bar{X}+\frac{\sigma}{\sqrt{n}}\mu_{(1-\frac{\alpha}{2})}]\\ 注:其中\mu_{(1-\frac{\alpha}{2})}需查表,\sigma、\bar{X}为已知值 XˉN(μ,nσ2)n σ(Xˉμ)N(0,1)P{μ(12α)n σ(Xˉμ)μ(12α)}=1αp{Xˉn σμ(12α)μXˉ+n σμ(12α)}[Xˉn σμ(12α),Xˉ+n σμ(12α)]μ(12α)σXˉ

    • 情况二:σ2未知,(t分布求解)

    X ˉ − μ S n − 1 − t ( n − 1 )        详 情 可 见 P 25 页 P { − t ( 1 − α 2 ) ( n − 1 ) ≤ ( X ˉ − μ ) S n − 1 ≤ t ( 1 − α 2 ) ( n − 1 ) } = 1 − α 于 是 估 计 区 间 为 : [ X ˉ − S n − 1 t ( 1 − α 2 ) ( n − 1 ) , X ˉ + S n − 1 t ( 1 − α 2 ) ( n − 1 ) ] \frac{\bar{X}-\mu}{\frac{S}{\sqrt{n-1}}}-t(n-1)~~~~~~详情可见P_{25}页\\ P\{-t_{(1-\frac{\alpha}{2})}(n-1)\le\frac{(\bar{X}-\mu)}{\frac{S}{\sqrt{n-1}}}\le{t}_{(1-\frac{\alpha}{2})}(n-1)\}=1-\alpha\\ 于是估计区间为:[\bar{X}-\frac{S}{\sqrt{n-1}}t_{(1-\frac{\alpha}{2})}(n-1),\bar{X}+\frac{S}{\sqrt{n-1}}t_{(1-\frac{\alpha}{2})}(n-1)] n1 SXˉμt(n1)      P25P{t(12α)(n1)n1 S(Xˉμ)t(12α)(n1)}=1α[Xˉn1 St(12α)(n1),Xˉ+n1 St(12α)(n1)]

    估计σ2

    • 此时只有一种情况,(卡方分布求解)

    n S 2 σ 2 − χ 2 ( n − 1 ) 或 : ( n − 1 ) S ∗ 2 σ 2 − χ 2 ( n − 1 ) p { χ σ 2 2 ( n − 1 ) ≤ n S 2 σ 2 ≤ χ 1 − σ 2 2 ( n − 1 ) } = 1 − α p { n S 2 χ 1 − σ 2 2 ( n − 1 ) ≤ σ 2 ≤ n S 2 χ σ 2 2 ( n − 1 ) } = 1 − α 于 是 , 估 计 区 间 为 : [ n S 2 χ 1 − σ 2 2 ( n − 1 ) , n S 2 χ σ 2 2 ( n − 1 ) ] , 或 [ ( n − 1 ) S ∗ 2 χ 1 − σ 2 2 ( n − 1 ) , ( n − 1 ) S ∗ 2 χ σ 2 2 ( n − 1 ) ] 注 : 当 求 标 准 差 的 估 计 区 间 时 , 只 需 要 对 应 的 开 方 即 可 \frac{nS^2}{\sigma^2}-\chi^2(n-1)\\ 或:\frac{(n-1)S_*^2}{\sigma^2}-\chi^2(n-1)\\ p\{\chi^2_{\frac{\sigma}{2}}(n-1)\le\frac{nS^2}{\sigma^2}\le\chi^2_{1-\frac{\sigma}{2}}(n-1)\}=1-\alpha\\ p\{\frac{nS^2}{\chi^2_{1-\frac{\sigma}{2}}(n-1)}\le{\sigma^2}\le\frac{nS^2}{\chi^2_{\frac{\sigma}{2}}(n-1)}\}=1-\alpha\\ 于是,估计区间为:[\frac{nS^2}{\chi^2_{1-\frac{\sigma}{2}}(n-1)},\frac{nS^2}{\chi^2_{\frac{\sigma}{2}}(n-1)}],或[\frac{(n-1)S_*^2}{\chi^2_{1-\frac{\sigma}{2}}(n-1)},\frac{(n-1)S_*^2}{\chi^2_{\frac{\sigma}{2}}(n-1)}]\\ 注:当求标准差的估计区间时,只需要对应的开方即可 σ2nS2χ2(n1)σ2(n1)S2χ2(n1)p{χ2σ2(n1)σ2nS2χ12σ2(n1)}=1αp{χ12σ2(n1)nS2σ2χ2σ2(n1)nS2}=1α[χ12σ2(n1)nS2,χ2σ2(n1)nS2],[χ12σ2(n1)(n1)S2,χ2σ2(n1)(n1)S2]

    双正态总体参数的区间估计

    注:需要先求σ~1~^2^/σ~2~^2^的估计区间,如果其包含1,则认为σ~1~^2^=σ~2~^2^(方差齐性),在利用t分布求解μ~1~-μ~2~的估计区间

    估计σ1222的区间
    n 1 ( n 2 − 1 ) S 1 2 / σ 1 2 n 2 ( n 1 − 1 ) S 2 2 / σ 2 2 − F ( n 1 − 1 , n 2 − 1 ) p { F σ 2 ( n 1 − 1 , n 2 − 1 ) ≤ n 1 ( n 2 − 1 ) S 1 2 / σ 1 2 n 2 ( n 1 − 1 ) S 2 2 / σ 2 2 ≤ F 1 − σ 2 ( n 1 − 1 , n 2 − 1 ) } = 1 − α p { n 1 ( n 2 − 1 ) S 1 2 n 2 ( n 1 − 1 ) S 2 2 F σ 2 ( n 2 − 1 , n 1 − 1 ) ≤ σ 1 2 σ 2 2 ≤ n 1 ( n 2 − 1 ) S 1 2 n 2 ( n 1 − 1 ) S 2 2 F 1 − σ 2 ( n 2 − 1 , n 1 − 1 ) } = 1 − α 于 是 估 计 区 间 为 : [ n 1 ( n 2 − 1 ) S 1 2 n 2 ( n 1 − 1 ) S 2 2 F σ 2 ( n 2 − 1 , n 1 − 1 ) , n 1 ( n 2 − 1 ) S 1 2 n 2 ( n 1 − 1 ) S 2 2 F 1 − σ 2 ( n 2 − 1 , n 1 − 1 ) ] 或 者 [ S ∗ 1 2 S ∗ 2 2 F σ 2 ( n 2 − 1 , n 1 − 1 ) , S ∗ 1 2 S ∗ 2 2 F 1 − σ 2 ( n 2 − 1 , n 1 − 1 ) ] \frac{n_1(n_2-1)S_1^2/\sigma_1^2}{n_2(n_1-1)S_2^2/\sigma_2^2}-F(n_1-1,n_2-1)\\ p\{F_{\frac{\sigma}{2}}(n_1-1,n_2-1)\le\frac{n_1(n_2-1)S_1^2/\sigma_1^2}{n_2(n_1-1)S_2^2/\sigma_2^2}\le F_{1-\frac{\sigma}{2}}(n_1-1,n_2-1)\}=1-\alpha\\ p\{\frac{n_1(n_2-1)S_1^2}{n_2(n_1-1)S_2^2}F_{\frac{\sigma}{2}}(n_2-1,n_1-1)\le\frac{\sigma_1^2}{\sigma_2^2}\le\frac{n_1(n_2-1)S_1^2}{n_2(n_1-1)S_2^2} F_{1-\frac{\sigma}{2}}(n_2-1,n_1-1)\}=1-\alpha\\ 于是估计区间为:[\frac{n_1(n_2-1)S_1^2}{n_2(n_1-1)S_2^2}F_{\frac{\sigma}{2}}(n_2-1,n_1-1),\frac{n_1(n_2-1)S_1^2}{n_2(n_1-1)S_2^2} F_{1-\frac{\sigma}{2}}(n_2-1,n_1-1)]\\ 或者[\frac{S_{*1}^2}{S_{*2}^2}F_{\frac{\sigma}{2}}(n_2-1,n_1-1),\frac{S_{*1}^2}{S_{*2}^2} F_{1-\frac{\sigma}{2}}(n_2-1,n_1-1)] n2(n11)S22/σ22n1(n21)S12/σ12F(n11,n21)p{F2σ(n11,n21)n2(n11)S22/σ22n1(n21)S12/σ12F12σ(n11,n21)}=1αp{n2(n11)S22n1(n21)S12F2σ(n21,n11)σ22σ12n2(n11)S22n1(n21)S12F12σ(n21,n11)}=1α[n2(n11)S22n1(n21)S12F2σ(n21,n11),n2(n11)S22n1(n21)S12F12σ(n21,n11)][S22S12F2σ(n21,n11),S22S12F12σ(n21,n11)]
    估计μ12的区间

    • 情况一:σ12和σ22已知,(正态分布求解)

    ( X ˉ − Y ˉ ) − N ( μ 1 − μ 2 , σ 1 2 n 1 + σ 2 2 n 2 ) ( X ˉ − Y ˉ ) − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 − N ( 0 , 1 ) P { − μ 1 − α 2 ≤ ( X ˉ − Y ˉ ) − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ≤ μ 1 − α 2 } = 1 − α 于 是 估 计 区 间 为 : [ ( X ˉ − Y ˉ ) − μ 1 − α 2 σ 1 2 n 1 + σ 2 2 n 2 , ( X ˉ − Y ˉ ) + μ 1 − α 2 σ 1 2 n 1 + σ 2 2 n 2 ] (\bar{X}-\bar{Y})-N(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2})\\ \frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}-N(0,1)\\ P\{-\mu_{1-\frac{\alpha}{2}}\le\frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\le\mu_{1-\frac{\alpha}{2}}\}=1-\alpha\\ 于是估计区间为:[(\bar{X}-\bar{Y})-\mu_{1-\frac{\alpha}{2}}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}},(\bar{X}-\bar{Y})+\mu_{1-\frac{\alpha}{2}}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}] (XˉYˉ)N(μ1μ2,n1σ12+n2σ22)n1σ12+n2σ22 (XˉYˉ)(μ1μ2)N(0,1)P{μ12αn1σ12+n2σ22 (XˉYˉ)(μ1μ2)μ12α}=1α[(XˉYˉ)μ12αn1σ12+n2σ22 ,(XˉYˉ)+μ12αn1σ12+n2σ22 ]

    • 情况二:σ12和σ22未知,(t分布求解)

    M ( X ˉ − Y ˉ ) − ( μ 1 − μ 2 ) n 1 n 2 ( n 1 + n 2 − 2 ) n 1 + n 2 − t ( n 1 + n 2 − 2 ) 其 中 : M = n 1 n 2 ( n 1 + n 2 − 2 ) n 1 + n 2 可 得 估 计 区 间 为 : [ X ˉ − Y ˉ − t 1 − α 2 ( n 1 + n 2 − 2 ) M n 1 S 1 2 + n 2 S 2 2 , X ˉ − Y ˉ + t 1 − α 2 ( n 1 + n 2 − 2 ) M n 1 S 1 2 + n 2 S 2 2 ] M\frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{n_1n_2(n_1+n_2-2)}{n_1+n_2}}}-t(n_1+n_2-2)\\ 其中:M=\sqrt{\frac{n_1n_2(n_1+n_2-2)}{n_1+n_2}}\\ 可得估计区间为:[\bar{X}-\bar{Y}-\frac{t_{1-\frac{\alpha}{2}}(n_1+n_2-2)}{M}\sqrt{n_1S_1^2+n_2S_2^2},\bar{X}-\bar{Y}+\frac{t_{1-\frac{\alpha}{2}}(n_1+n_2-2)}{M}\sqrt{n_1S_1^2+n_2S_2^2}] Mn1+n2n1n2(n1+n22) (XˉYˉ)(μ1μ2)t(n1+n22)M=n1+n2n1n2(n1+n22) :[XˉYˉMt12α(n1+n22)n1S12+n2S22 ,XˉYˉ+Mt12α(n1+n22)n1S12+n2S22 ]


    以上为个人总结,难免有疏漏之处,请见谅,若任有疑问可加QQ:1372931501

    展开全文
  • R语言bootstrap置信区间估计函数,通过三种方法估计置信区间
  • 对于固定设计点情形下的非参数...考虑到窗宽的选取对核估计和区间估计的重要影响,给出了适合所给置信区间的核估计窗宽的迭代选取方法。模拟结果显示迭代法收敛,且选取的窗宽表现良好,置信区间有令人满意的覆盖率。
  • 本文介绍了MATLAB软件的normfit()函数在求解正态总体参数的区间估计中的长处和短处,结合实例编写了MATLAB程序求解标准差σ已知时均值μ的置信区间和均值μ已知时标准差σ的置信区间,弥补了normfit()函数在该方面的...
  • 《数理统计》第7章4区间估计.ppt
  • 两个正态总体均值差的区间估计.pdf
  • 系统可靠性信息分析技术:第六章 可靠性指标的区间估计.pdf
  • 电商集群的流量预测与不确定性区间估计.pdf
  • 论文研究-层次分析的区间估计.pdf, 提出了利用数学规划和约束锥的方法 ,对层次分析法权重向量进行区间估计的理论和模型 .该模型把决策者的偏好信息视为一种约束 ,而非...
  • 应用雷达的基数据资料,提取雷达反射率,利用分组Z—I关系转化雷达反射率为雨强,运用地面雨量站网实测雨量对其进行卡尔曼滤波校准,将其结果作为洪水预报模型的降雨输入,并将该方法应用于湖北省白莲河流域。
  • 次序统计量与百分位点的区间估计,赵琳琳,,本文给出了未知连续型总体百分位点的一种次序统计量的区间估计方法。首先介绍次序统计量的定义及其概率密度函数和分布函数,然后
  • R语言区间估计实验报告.rar
  • 参数估计(点估计和区间估计

    万次阅读 多人点赞 2019-09-06 12:07:06
    一、点估计 1.点估计就是用样本统计量来估计总体参数。 概念理解:当我们想知道某一总体的某个指标的情况时,测量整体该指标的数值 的工作量太大,或者不符合实际,这时我们可以采用抽样的方法选取一部分样本测量出...

    “参数估计是以抽样分布为中介,用样本的参数特征对总体的参数进行数值估计的过程。”

    一、点估计
    1.点估计就是用样本统计量来估计总体参数。
    概念理解:当我们想知道某一总体的某个指标的情况时,测量整体该指标的数值 的工作量太大,或者不符合实际,这时我们可以采用抽样的方法选取一部分样本测量出他们数值,然后用样本统计量的值来估计总体的情况。
    例如:想了解一个学校学生的身高情况,就可以随机抽取一部分学生测量他们的身高,得到一个平均值,再用这个样本的均值去估计整体学生的身高情况,就是点估计。

    常用的点估计有:用样本均值估计总体均值,用样本方差估计总体方差,用样本的分位数估计总体分位数,用样本的中位数估计总体的中位数。

    2.点估计方法
    矩估计法、顺序统计量法、最大似然法、
    最小二乘法(对于点估计方法,放在另一篇文章中详细介绍)

    3.由于用样本推断总体的过程一定存在估计误差,而点估计的估计误差无法衡量,所以点估计主要用于为定性研究提供数据参考,或者在对于总体参数估计精度要求不高时使用。

    二、区间估计
    1.区间估计就是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。
    另外一种说法,区间估计是从点估计值和抽样标准误差出发,按给定的概率值建立包含待估参数的区间,这个给定的概率值称为置信度或置信水平,这个建立起来的包含待估计参数的区间称为置信区间。

    2.关于置信水平(置信度)、置信区间和显著性水平:
    置信区间是根据样本信息推导出来的可能包含总体参数的数值区间,置信水平表示置信区间的可信度;例如某学校学生的平均身高的区间估计:有95%的置信水平可以认为该校学生的平均身高为1.4米到1.5米之间,(1.4,1.5)为置信区间,95%是置信水平,即有95%的信心认为这个区间包含该校学生的平均身高。
    置信水平用百分数表示,表示成(1-a)100%a指的是显著性水平,表示总体参数不落在置信区间的可能性。

    3.关于置信区间的计算:
    通过部分样本来计算总体参数的一个置信区间有以下步骤:
    a.明确要解决的问题,要估计的指标或参数是什么,
    b.求抽样样本的平均值和标准误差,
    注意区分标准差和标准误差:标准差反映的是整个样本对样本平均数的离散程度,标准差等于方差开根号;标准误差反映的是样本平均数对总体平均数的变异程度,标准误差等于样本标准差除n的开根号。
    c.确定需要的置信水平,
    d.查询z表,得到z值,
    e. 计算置信区间,[a,b],a=样本均值-z标准误差,b=样本均值+z标准误差。

    区间估计分为一个总体参数的估计和两个总体参数的估计

    4.一个总体参数的区间估计:总体均值的区间估计,总体方差的区间估计,总体比例的区间估计;

    4.1总体均值的区间估计:
    均值抽样分布即样本均值组成的抽样分布,总体参数的估计方法跟样本均值的抽样分布有关;
    Z分布其实就是标准正态分布,如果样本均值组成的抽样分布服从正态分布,那么将该正态分布标准化后即可得到Z分布,
    Z分布的适用条件有两种:一是总体服从正态分布且总体标准差已知;二是总体分布未知,但是样本容量大于或等于30;
    T分布:对于服从正态分布的总体且总体标准差未知的情况下 ,T分布是非常适用的均值抽样分布类型;
    切比雪夫不等式:对于非正态分布总体或总体分布未知并且小样本的情况下,只能用切比雪夫不等式来近似估计总体均值的置信区间。
    在这里插入图片描述截图来自《人人都会数据分析:从生活实例学统计》

    4.2 总体方差的区间估计:
    总体方差的区间估计要用到卡方分布,如果数据总体服从正态分布,从中抽取样本容量为n的样本,样本方差为s^2,那么包含样本方差的卡方统计量服从自由度为n-1的卡方分布。卡方统计量是由总体方差和样本方差的比值组成的统计量,用于总体方差的区间估计。
    卡方统计量的计算公式:
    χ α 2 ( n − 1 ) = ( n − 1 ) s 2 σ z 2 \chi^2_\alpha(n-1)=\frac{(n-1)s ^2}{\sigma ^2_z} χα2(n1)=σz2(n1)s2
    总体方差的双侧置信区间估计公式为:
    ( n − 1 ) s 2 χ α 2 2 ( n − 1 ) ≤ σ z 2 ≤ ( n − 1 ) s 2 χ 1 2 − α 2 ( n − 1 ) \frac{(n-1)s^2}{\chi ^2_\frac{\alpha}{2}(n-1)} \leq \sigma ^2_z \leq \frac{(n-1)s ^2}{\chi ^2_1-\frac{\alpha}{2} (n-1)} χ2α2(n1)(n1)s2σz2χ122α(n1)(n1)s2
    其中带有a/2的为下标;
    如果是单侧置信区间的话,只需要取上面式子的前半部分或者后半部分,并将a/2改成a即可得到单侧置信区间。

    4.3 总体比例的区间估计:
    或者叫总体比率的区间估计,跟二项分布有关,二项分布的理论是:事件发生概率是p,进行n次实验,其中x次实验该事件发生,则发生次数的概率分布服从二项分布;均值、方差为np,npq。
    若将发生的次数转换成比率(x/n),则比率的概率分布也服从二项分布。
    二项分布的特性:当抽取的样本容量n很大,是大 样本,使得np和nq(q为事件不发生的概率,等于1-p)的值都大于 5, 此时二项分布将近似于正态分布。
    由于事件发生比率x/n服从二项分布,所以如果比率的二项分布近似于正态分布,就可以得到不利的区间估计。

    在事件发生概率p已知的情况下,总体比率 p z ˉ \bar{p_z} pzˉ在置信度为1-a时,总体比率的置信区间为:
    p y ˉ ± Z α 2 p ( 1 − p ) n \bar{p_y} \pm Z_\frac{\alpha}{2} \sqrt{\frac{p(1-p)}{n}} pyˉ±Z2αnp(1p)
    其中, p y ˉ \bar{p_y} pyˉ为样本比率, p z ˉ \bar{p_z} pzˉ为总体比率,
    当事件发生概率p未知,可用样本中事件发生的概率即样本比率代替。

    5. 两个总体参数的区间估计
    两个总体均值之差的估计,两个总体方差比的区间估计
    两个总体与多个总体参数的区间估计在实际生活中的应用不是很多,更常用的是两个总体和多个总体参数的假设检验。 区间估计虽不常用,但是其与假设检验的应用原理是想通的。

    5.1 两个总体均值之差的区间估计:
    可以将单个总体均值的抽样分布推广到两个总体均值差的抽样分布,然后利用两个总体均值差的抽样分布推导出两个总体均值差的置信区间公式。
    方差齐性/方差不齐:对于配对样本来说其方差可被认为是想等的,即方差齐性。
    在这里插入图片描述
    截图来自《人人都会数据分析:从生活实例学统计》

    独立样本和配对样本:
    独立样本:是指如果从一个总体中选取样本,抽样形式无论怎样改变都不会影响从另一个总体中抽取样本的概率,则这两个随机样本为独立样本;
    配对样本:是指如果从一个总体中抽取样本的行为以某种方式决定了从另一个总体中抽取样本的概率,则这两个样本为成对样本或配对样本。

    均值和方差的特点:
    两个总体合并(相加或相减),那么合并后的总体均值等于原来两个总体的均值之和或均值之差;而合并后的总体方差都等于两个总体方差之和。

    差值抽样分布可以看做单个总体的均值抽样分布,因此可套用“均值抽样分布适用条件表”,将公式修改一下即可:

    截图来自《人人都会数据分析:从生活实例学统计》

    5.2 两个总体方差比的区间估计
    F分布可用于求取两个正态分布总体方差比的置信区间。
    F统计量可被看做是两个卡方统计量的商,F分布也被称为方差比分布。因为卡方分布要求总体服从正态分布,所以F分布也要求F统计量的两个总体都服从正态分布。
    当给定置信水平时,可推出两个正态分布总体方差比的置信区间。

    三、样本量的确定

    1总体均值区间估计的样本量确定
    在总体标准差已知的情况下,如果数据总体服从正态分布,则样本均值的抽样分布适用Z分布,就可以利用总体均值的置信区间公式来计算样本容量,总体均值的置信区间为:
    x ˉ ± Z α 2 σ n \bar{x}\pm Z_\frac{\alpha}{2} \frac{\sigma}{\sqrt{n}} xˉ±Z2αn σ x ˉ ± Z α 2 σ n N − n N − 1 \bar{x}\pm Z_\frac{\alpha}{2} \frac{\sigma}{\sqrt{n}} \sqrt{\frac{N-n}{N-1}} xˉ±Z2αn σN1Nn

    则总体均值的区间估计误差为:
    Δ μ = Z α 2 σ n \Delta\mu=Z_\frac{\alpha}{2} \frac{\sigma}{\sqrt{n}} Δμ=Z2αn σ
    进而可以求得样本容量的公式:
    n = ( Z α 2 σ Δ μ ) 2 n=(\frac{Z_\frac{\alpha}{2} \sigma}{\Delta\mu})^2 n=(ΔμZ2ασ)2

    以上是总体标准差已知时,当总体标准差未知时,一是可以用样本标准差代替,但是前提条件是样本容量要大于等于30;二是可以用过去试点调查的样本标准差代替;三是,如果知道总体数据中的最大和最小值,可用四分之一的最大与最小值的差值来代替总体标准差。

    2.总体方差区间估计的样本量确定
    总体方差的区间估计适用的抽样分布为卡方分布。卡方统计量为:
    χ 2 = ( n − 1 ) s 2 σ 2 \chi^2=\frac{(n-1)s ^2}{\sigma ^2} χ2=σ2(n1)s2
    由卡方分布的性质可知,当样本量足够大时,卡方分布近似于正态分布。卡方分布的均值为自由度(n-1),卡方分布的方差为两倍的自由度2(n-1),那么在大样本的情况下,总体方差的置信区间为:
    s 2 = ± Z α 2 s 2 2 n s^2=\pm Z_\frac{\alpha}{2} s^2 \sqrt{\frac{2}{n}} s2=±Z2αs2n2
    则总体方差的估计精度为:
    Δ σ 2 = Z α 2 s 2 2 n \Delta \sigma^2=Z_\frac{\alpha}{2} s^2 \sqrt{\frac{2}{n}} Δσ2=Z2αs2n2
    由此可得到样本容量公式为:
    n = 2 Z α 2 s 2 Δ σ 2 n=\frac{\sqrt{2} Z_\frac{\alpha}{2} s^2}{\Delta \sigma^2} n=Δσ22 Z2αs2

    3.总体比率区间估计的样本量确定
    在确定总体比率的区间估计时,利用的是二项分布近似于正态分布的性质,即当抽取的样本量n很大时,是大样本,使得np>5且nq>5(p是事件发生的概率,q是事件不发生的概率,q=1-p)时,二项分布近似于正态分布。
    总体比率的置信区间为:
    p y ˉ ± Z α 2 p ( 1 − p ) n \bar{p_y} \pm Z_\frac{\alpha}{2} \sqrt{\frac{p(1-p)}{n}} pyˉ±Z2αnp(1p)
    则总体比率的估计误差为:
    Δ p z ˉ = Z α 2 p ( 1 − p ) n \Delta \bar{p_z} =Z_\frac{\alpha}{2} \sqrt{\frac{p(1-p)}{n}} Δpzˉ=Z2αnp(1p)
    由此可得到样本容量为:
    n = Z α 2 2 p ( 1 − p ) Δ p z ˉ 2 n=\frac{Z_\frac{\alpha}{2} ^2 p(1-p)}{\Delta \bar{p_z} ^2} n=Δpzˉ2Z2α2p(1p)

    注:本文主要参考《人人都会数据分析:从生活实例学统计》

    展开全文
  • 点估计和区间估计 点估计 矩估计法 正态分布是一种统计量,目的是描述总体的某一性质。而矩则是描述这些样本值的分布情况,无论几阶矩,无外乎是描述整体的疏密情况。K阶矩分为原点矩和中心矩:前者是绝对的:1阶...

    点估计和区间估计

    点估计


    矩估计法

    正态分布是一种统计量,目的是描述总体的某一性质。而则是描述这些样本值的分布情况,无论几阶矩,无外乎是描述整体的疏密情况。K阶矩分为原点矩和中心矩:

    前者是绝对的:1阶就是平均值;2阶则是平方的平均值;3阶是立方的平均值,如此类推。

    后者是相对于平均值而言:1阶即期望;2阶即方差的估计;如此类推。

    原点矩

    μ k ′ = E ( Y k ) {μ}'_{k}=E(Y^k) μk=E(Yk)  (k=1,2,…)

    中心矩

    μ k = E [ ( Y − μ ) k ] μ_k=E[(Y-μ)^k] μk=E[(Yμ)k]

    k表示阶数


    原点矩方法

    对于总体:原点矩- E ( Y k ) E(Y^k) E(Yk)

    对于样本: m k = ∑ i = 1 n y i k n m_k=\frac{\sum_{i=1}^{n}y_{i}^{k}}{n} mk=ni=1nyik

    Y:观测值

    举例:

    y 1 , y 2 , y 3 , . . . y n y_1,y_2,y_3,...y_n y1,y2,y3,...yn代表一个随机样本的n个观测值,随机变量Y代表总体的分布,随机变量Y中有 θ 1 , θ 2 , θ 3 , . . . θ k θ_1,θ_2,θ_3,...θ_k θ1,θ2,θ3,...θkk个参数,矩估计需要估计出k个参数 θ ^ 1 , θ ^ 2 , θ ^ 3 , . . . θ ^ k \hat{θ}_1,\hat{θ}_2,\hat{θ}_3,...\hat{θ}_k θ^1,θ^2,θ^3,...θ^k


    θ ^ \hat{θ} θ^: E ( Y ) = 1 n ∑ y i E(Y)=\frac{1}{n}\sum y_i E(Y)=n1yi

    θ ^ 2 \hat{θ}_2 θ^2: E ( Y 2 ) = 1 n ∑ y i 2 E(Y^2)=\frac{1}{n}\sum {y_i}^2 E(Y2)=n1yi2

    一个参数使用一个方程,若K个参数则使用K个方程。求总体的平均值只有一个参数,使用一个方程就可。

    假设:总体的期望为μ
    则有E(Y)=μ

    假设只有一个参数

    此时使用矩估计的方法,只有一个参数,即使用一个方程:

    Y的一阶原点矩 μ 1 ′ = E ( Y 1 ) {μ}'_{1}=E(Y^1) μ1=E(Y1)既他的期望本身 μ 1 ′ = E ( Y 1 ) {μ}'_{1}=E(Y^1) μ1=E(Y1)

    样本的一阶原点矩,既样本求和: μ = 1 n ∑ y i μ=\frac{1}{n}\sum y_i μ=n1yi

    这时发现公式似乎很眼熟:
    x ˉ = 1 n ∑ y i \bar{x}=\frac{1}{n}\sum y_i xˉ=n1yi
    平均值不就是这么来的么。

    当有两个参数时呢

    可以设置第二个参数 E ( Y 2 ) = 1 n ∑ y i 2 E(Y^2)=\frac{1}{n}\sum {y_i}^2 E(Y2)=n1yi2

    然后结合第一个式子用两个方程求解。


    中心矩方法

    其他参考上文

    对于样本公式: ∑ ( y i − y ˉ ) k n \frac{\sum (y_i-\bar{y})^k}{n} n(yiyˉ)k

    其他方法


    最大似然法/极大似然法,最小二乘法,刀切法,稳健估计,Bayes方法

    区间估计


    区间估计是一个区间,区间分别由Lower和Upper构成–>(Lower,Upper)称为置信区间,其中包含着被估计参数的概率称为置信水平/置信系数[概率]
    如置信水平为95%,那么这个区间也叫95%置信区间。

    虚轴法

    假设有一个估计量 θ ^ \hat{θ} θ^ E ( θ ^ ) E(\hat{θ}) E(θ^)=θ,即 θ ^ \hat{θ} θ^的期望=θ,θ为要估计的参数。
    Z = θ ^ − θ σ θ ^ Z=\frac{\hat{θ}-θ}{\sigma _{\hat{θ}}} Z=σθ^θ^θ

    假设Z符合正态分布,整个正态分布图的面积为1,
    阴影部分的面积为0.05,非阴影部分的面积则为1-0.05=0.95

    可以将面接还原成概率,整体的概率为100%,那么Z落在非阴影区域的概率便为95%。
    Z–>( − Z α / 2 -Z_{\alpha/2} Zα/2, Z α / 2 Z_{\alpha/2} Zα/2)即( − Z α / 2 -Z_{\alpha/2} Zα/2≤Z≤ Z α / 2 Z_{\alpha/2} Zα/2)

    在分布中,阴影部分的面积为α,空白区域即为1-α,分布的两翼阴影面积各为α/2,所以有Z=1-α:可推出如下公式。

    LCL= θ ^ − z α 2 σ θ ^ \hat{θ}-z\frac{\alpha}{2}\sigma _{\hat{θ}} θ^z2ασθ^  UCL= θ ^ + z α 2 σ θ ^ \hat{θ}+z\frac{\alpha}{2}\sigma _{\hat{θ}} θ^+z2ασθ^

    所以确定了如下步骤:

    • 确定统计量θ
    • 确定概率分布(利用概率密度函数)
    • 求置信区间

    同理,如果是卡方分布,t分布也可以依照相同的理论求值。

    展开全文
  • 参数估计是数理统计中重要的统计推断问题之一。
  • 同时根据估计区间最狭原则,实现一定置信水平下风电功率的波动区间估计。利用所建优化模型、正态分布模型和优化前的贝塔分布模型分别对某风电场历史数据进行分析,对比结果验证了优化贝塔分布模型能更有效地对功率...
  • 置信区间与区间估计

    2022-04-22 10:15:21
    置信区间与区间估计
  • 区间估计——置信区间

    千次阅读 2020-06-09 19:28:43
    1. 区间估计 1.1 区间估计 总体参数估计的一个区间,确信该区间将参数值纳入其中。 区间估计的形式:点估计±边际误差 1.2 置信区间 区间估计中,由样本估计量构造出的总体参数在一定置信水平下的估计区间。 ...
  • SIUS已知样本均值和样本方差做区间估计总体X~N(μ,σ2), 其中μ是总体均值,σ2是总体方差,σ是总体标准差,样本容量为n, 样本均值为x。在下面输入n,x和σ的值后,单击“开始计算”按钮进行计算:n=x=σ=总体X~N(μ...
  • 利用区间估计得出矿井涌水量均值在置信度为95%时的置信区间,并依据小概率事件原理将该置信区间的上限值设为矿井突水预警值。再以该矿-500 m水平某测点1999—2000年的涌水量实测值为样本,在地质条件稳定且无人为因素...
  • 置信区间估计 预测区间估计Estimation implies finding the optimal parameter using historical data whereas prediction uses the data to compute the random value of the unseen data. 估计意味着使用历史数据...
  • 论文研究-一种基于区间估计的多属性决策组合赋权方法 .pdf,
  • 【概率论】- (1)区间估计

    千次阅读 2019-12-11 20:04:09
    区间估计 在数据分析过程中,一个完整的闭环是从数据中得到洞察,根据洞察得到某种假设,通过实验检验这一假设。 实验环节中会涉及到一些概率论知识,比如统计推断中重要的两类问题,区间估计和假设检验。之前概率论...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 47,744
精华内容 19,097
关键字:

区间估计