精华内容
下载资源
问答
  • 区间估计——置信区间

    千次阅读 2020-06-09 19:28:43
    1. 区间估计 1.1 区间估计 总体参数估计的一个区间,确信该区间将参数值纳入其中。 区间估计的形式:点估计±边际误差 1.2 置信区间 区间估计中,由样本估计量构造出的总体参数在一定置信水平下的估计区间。 ...

    可参考上一篇博文

     抽样与抽样分布——中心极限定理、点估计

    1. 区间估计

    1.1 区间估计

    总体参数估计的一个区间,确信该区间将参数值纳入其中。

    区间估计的形式:点估计±边际误差

    1.2 置信区间

    区间估计中,由样本估计量构造出的总体参数在一定置信水平下的估计区间。

    区间的最小值是置信下限,区间的最大值是置信上限。

    1.3 置信水平/置信度/置信系数

    假定抽取100个样本,构造100个置信区间,这100个置信区间中有95%的区间包含了总体参数的真值,5%没包含,95%被称为置信水平。

    如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占比例称为置信水平。


    2.总体均值的区间估计

    2.1总体均值的区间估计:σ已知

     

    对置信区间的理解,要注意:

    (1)总体参数的真值是固定的,样本构造的区间是不固定的,置信区间是一个随机区间,会因样本的不同而变化,而且不是所有的区间都包含总体参数。

    一个特定的区间总是“包含”和“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题。

    置信水平知识告诉我们在多次估计得到的区间中大概有多少个区间包含了参数的真值,而不是针对所抽取的这个样本所构建的区间而言的。

    (2)使用一个较大的置信水平会得到一个比较宽的置信区间,而使用一个较大的样本则会得到一个较准确的区间,

    2.2总体均值的区间估计:σ未知

    2.3样本容量确定

    σ已知,直接用上面的式子计算。

    σ未知,可以根据以下任一方法确定:

    (1)根据以前研究中的数据计算总体标准差的估计值作为σ的计划值

    (2)利用实验研究,选取一个初始样本,以初始样本的标准差作为σ的计划值。

    2.4 总结

    在绝大部分应用中n≥30已经够大。如果总体服从或者近似服从正态分布,可以利用更小的样本容量。

    对于σ未知,如果总体的分布严重偏斜或者包含异常点,将样本容量增加到n≥50。


    3.总体比率的区间估计

    3.1总体比率的区间估计

    3.2样本容量的确定

    令E代表希望达到的边际误差

    得到下面的结论

    总体比率区间估计中的样本容量

    可选择如下方法确定计划值p*

    (1)用以前相同或类似样本的样本比率代替

    (2)利用实验性研究,选取一个初始样本,以该样本的样本比率作为计划值

    (3)使用判断或最优猜测作为计划值

    (4)如果上述方法均不适用,则去计划值p*=0.5

    参考

    统计学

    商务与经济统计

     

    展开全文
  • 概率论上机课程设计,关于区间估计置信度的模拟实验。期间利用R软件的编程
  • 区间估计中,由样本统计量所构造的总体参数的估计区间 置信水平 置信区间中包含总体参数真值的次数所占的比例 ...
    • 点估计
    用样本统计量   17002819_1osR.png 的某个取值直接作为总体参数 17002819_R3Wh.png 的估计值

    例如说抽样的结果是多少,总体也当作多少

    • 区间估计
    在点估计的基础上,给出一个总体参数估计的一个区间范围,区间通常由统计量加减估计误差

    17002820_2kUV.png
    转化为
    17002820_LbfV.png
    解释:
    以样本均值为中心所构造的这样一个区间,他包含总体参数μ的概率是等于0.6827

    • 置信区间
    在区间估计中,由样本统计量所构造的总体参数的估计区间

    • 置信水平
     置信区间中包含总体参数真值的次数所占的比例
    17002820_Mx35.png
     

     

     



    转载于:https://my.oschina.net/u/1785519/blog/1511493

    展开全文
  • 参数估计是数理统计中重要的统计推断问题之一。


    Preliminaries

    了解参数估计,需要知道以下先导知识:

    数学期望、方差与协方差

    参见:[数理知识]机器学习入门: 概率论与信息论基础 - 数学期望、方差与协方差

    常用概率分布及其期望、方差

    参见:[数理知识]机器学习入门: 概率论与信息论基础 - 常用概率分布及其期望、方差


    参数估计问题

    参数估计是数理统计中重要的统计推断问题之一。
    给定 xP(x;θ)x \sim P(x;\theta),参数 θ\theta 控制了 xx 的分布“范围”:

    • 我们在已知其概率分布模型和一系列随机变量 xx 的值之后,试图推测出 θ\theta 的值;(点估计)
    • 在点估计的基础上,从抽样数据的统计计算中可以对其与总体样本的真实参数的接近程度求出一个概率度量,在此概率下给出总体参数估计的一个可信的区间范围。(区间估计)

    这类问题就被统称为参数估计问题。

    一、大数定律及中心极限定理

    在正式开始参数估计之前,需要了解一下其先导知识——大数定律及中心极限定理。

    1 切比雪夫不等式(Chebyshev)

    xx 是随机变量,如果其期望 E\mathbb E 和方差 Var(x)Var(x) 存在,则 ε>0\forall \varepsilon>0 有:
    Var(x)ε2P(xEε)\frac{Var(x)}{\varepsilon^2} \ge P(\vert x-\mathbb E \vert \ge \varepsilon)

    证明:因为 xEε\vert x-\mathbb E \vert \ge \varepsilonε0\varepsilon \ge 0 所以有 (xEε)21(\frac{\vert x-\mathbb E \vert}{\varepsilon})^2 \ge 1
    xx 的概率密度函数为 p(x)p(x),则有:
    P(xEε)=xEεp(x)dxxEε(xEε)2p(x)dxε2+(xE)2p(x)dxP(xEε)Var(x)ε2\begin{aligned} P(\vert x-\mathbb E \vert \ge \varepsilon) &= \int_{\vert x-\mathbb E \vert \ge \varepsilon}p(x)dx\\ &\le \int_{\vert x-\mathbb E \vert \ge \varepsilon}(\frac{\vert x-\mathbb E \vert}{\varepsilon})^2p(x)dx\\ &\le {\varepsilon}^{-2} \int_{-\infin}^{+\infin}(\vert x-\mathbb E \vert)^2 p(x)dx \\ P(\vert x-\mathbb E \vert \ge \varepsilon) &\le \frac{Var(x)}{\varepsilon^2} \end{aligned}∴ 原命题得证。

    • 显然,1Var(x)ε2P(xE<ε)1-\frac{Var(x)}{\varepsilon^2} \le P(\vert x-\mathbb E \vert < \varepsilon)
    • 切比雪夫不等式给出了如何在随机变量的分布未知而期望和方差已知的情况下估计P(xEε)P(\vert x-\mathbb E \vert \ge \varepsilon)的极限。
    • 下文中的切比雪夫大数定律等几个大数定律变形均可由切比雪夫不等式证明得到。

    2 大数定律(Law of Large Numbers)

    依概率收敛 : 设有随机变量序列 x1,x2, ,xn,x_1,x_2,\cdots ,x_n,\cdots 对 随机变量 xx 使得 ε>0\forall \varepsilon>0 有:limnP(xxnε)=0\lim_{n \rightarrow \infin}P\left( \vert x-x_n \vert \ge \varepsilon \right)=0则称序列xix_i依概率收敛于 xx, 记为 xiPxx_i \stackrel{P}{\longrightarrow}x

    大数定律:设有随机变量序列 x1,x2, ,xn,x_1,x_2,\cdots ,x_n,\cdots ,其任意划分的互斥组合的期望值从小到大排列为 a1,a2, ,ana_1,a_2,\cdots ,a_n 使得 ε>0\forall \varepsilon>0 有:
    limnP(1ni=1nxianε)=0\lim_{n \rightarrow \infin}P \left( \vert \frac{1}{n}\sum_{i=1}^{n}x_i-a_n \vert \ge \varepsilon \right)=0或记作:
    1ni=1nxiPan, n\frac{1}{n}\sum_{i=1}^nx_i \stackrel{P}{\longrightarrow }a_n,~n \rightarrow \infin

    Tip:大数定律说明了随机变量序列前若干项的算术平均值在某种条件下收敛到这些项的数学期望。(注意:数学期望 E\mathbb E在概念上不等于算术平均值 1ninxi\frac{1}{n}\sum_i^n x_i,只有在xix_i等概率分布时二者等值。)

    • 大数定律以严格的数学形式表现了随机事件在足够的广度上的频率稳定性。利用这一性质,我们可以基于抽样样本中的均值来估计整体的均值。

    它具有以下几个变形:

    • 切比雪夫大数定律 设相互独立的随机变量序列(集合) x1,x2, ,xn,x_1,x_2,\cdots ,x_n,\cdots 具有相同的数学期望 μi=μ\mu_i=\mu ,若其也具有相同的方差或方差 σi2<C\sigma_i^2<CCC为一个大于零的常数,则对于 ε>0\forall \varepsilon>0 有:
      limnP(1ni=1nxiμε)=01ni=1nxiPμ\begin{aligned} \lim_{n \rightarrow \infin}P&\left( \vert \frac{1}{n}\sum_{i=1}^{n}x_i-\mu \vert \ge \varepsilon \right)=0\\ &\frac{1}{n}\sum_{i=1}^nx_i \stackrel{P}{\longrightarrow }\mu \end{aligned}该定律说明了在方差满足一定条件时,序列服从大数定律。

    • khintchine大数定律 设相互独立的随机变量序列(集合) x1,x2, ,xn,x_1,x_2,\cdots ,x_n,\cdots 满足同分布且具有有限的数学期望时,序列服从大数定律。该定理在切比雪夫大数定律的基础上,补充了当方差未知或不存在时,序列是否满足大数定律的问题。

    3 中心极限定理(central limit theorems)

    Lindeberg-Levy中心极限定理:设随机变量序列x1,x2, ,xn,x_1,x_2,\cdots ,x_n,\cdots 满足独立同分布假设 ,记 inxi=X\sum_i^n x_i = X ,若 μi=μ\mu_i=\muσi2=σ2\sigma_i^2=\sigma^2,当 nn 足够大时,XX 近似满足 XN(nμ,nσ2)X \sim N(n\mu,n\sigma^2) 或者说 1ninxiN(μ,σ2n)\frac{1}{n}\sum_i^n x_i \sim N(\mu,\frac{\sigma^2}{n})

    Lyapunov中心极限定理:(一般化推广) 设随机变量序列 x1,x2, ,xn,x_1,x_2,\cdots ,x_n,\cdots 满足独立同分布假设,记 inxi=X\sum_i^n x_i = X,当 nn 足够大时,XX 近似满足 XN(inμi,inσi2)X \sim N(\sum_i^n \mu_i,\sum_i^n \sigma_i^2) 或者说 1ninxiN(inμin,inσi2n)\frac{1}{n}\sum_i^n x_i \sim N(\frac{\sum_i^n \mu_i}{n},\frac{\sum_i^n \sigma_i^2}{n})

    4 大数定理和中心极限定理的理解

    1. 大数定理告诉我们:当抽样样本的量逐渐增大,其均值将依概率收敛到总体样本的均值。此时我们不必关心真实的分布究竟是怎样的。
    2. 中心极限定理告诉我们:当抽样样本的量逐渐增大,这些抽样样本的均值将会满足 N(inμin,inσi2n)N(\frac{\sum_i^n \mu_i}{n},\frac{\sum_i^n \sigma_i^2}{n})。显然,当 nn 逐渐变大,该正态分布的方差越小最终将塌缩为 Dirac delta function

    带图的直观体验:怎样理解和区分中心极限定理与大数定律?

    >返回目录

    二、 点估计(point estimator)

    事实上,对 θ\theta 的计就是点估计问题,我们一般把其点估计值记为 θ^\hat \theta ,称为点估计值。

    1 矩估计

    矩估计法用一阶样本的原点矩来估计总体的期望,而用二阶样本的中心矩来估计总体的方差。

    由Khintchine大数定理可知,若样本总体的数学期望有限,则样本均值依概率收敛于其数学期望。因此在估计时可以使用样本的矩来作为总体矩的估计量。

    我们使用矩估计来估计时,有:
    {μ1(θ1,θ2, ,θk)=1ni=1nXiμ2(θ1,θ2, ,θk)=1ni=1nXi2μk(θ1,θ2, ,θk)=1ni=1nXik\begin{cases} \mu_1(\theta_1,\theta_2,\cdots,\theta_k) &= \frac{1}{n}\sum_{i=1}^{n}X_i \\ \mu_2(\theta_1,\theta_2,\cdots,\theta_k) &= \frac{1}{n}\sum_{i=1}^{n}X_i^2 \\ & \vdots\\ \mu_k(\theta_1,\theta_2,\cdots,\theta_k) &= \frac{1}{n}\sum_{i=1}^{n}X_i^k \end{cases}

    原点矩:对于自然数 kkaR\forall a \in \R,随机变量 xx 的期望值 E[(xa)k]\mathbb E[(x-a)^k] 叫做随机变量 xxaakk 阶矩(若 a=0a=0 则称为 kk 阶原点矩)。当 a=0,k=1a=0,k=1 时即为 xx 的数学期望。

    中心矩:若对于随机变量 xx 存在 E[xE[x]]k\mathbb E[x-\mathbb E[x]]^k,则称其为 xxkk 阶中心矩。

    示例:对于均匀分布 x U(a,b)x~U(a,b),欲对 a,ba,b 进行估计,已知均匀分布的期望为 E[x]=a+b2\mathbb E[x]=\frac{a+b}{2},方差 Var(x)=(ba)212Var(x)=\frac{(b-a)^2}{12},则 E[x2]=Var(x)+E[x]2\mathbb E[x^2]=Var(x)+\mathbb E[x]^2,利用矩估计则有:
    {E[x]=a+b2=1ni=1nXiE[x2]=(ba)212+(a+b2)2=1ni=1nXi2\begin{cases} \mathbb E[x]&=\frac{a+b}{2}=\frac{1}{n}\sum_{i=1}^{n}X_i\\ \mathbb E[x^2]&=\frac{(b-a)^2}{12}+(\frac{a+b}{2})^2=\frac{1}{n}\sum_{i=1}^{n}X_i^2 \end{cases}解得:
    {μx=1ni=1nXia^=μx3ni=1n(xiμx)2b^=μx+3ni=1n(xiμx)2\begin{cases} \mu_x &= \frac{1}{n}\sum_{i=1}^{n}X_i\\ \hat a &= \mu_x - \sqrt{\frac{3}{n}\sum_{i=1}^n(x_i-\mu_x)^2}\\ \hat b &= \mu_x + \sqrt{\frac{3}{n}\sum_{i=1}^n(x_i-\mu_x)^2} \end{cases}

    2 最大似然估计(maximum Likelihood)

    最大似然估计的参考:[数理知识]贝叶斯公式和最大似然估计笔记

    示例:对于伯努利分布(即重复次数为1的二项分布) xB(1,p)x \sim B(1,p),欲对 pp 进行估计:
    L(p)=i=1npxi(1p)1xi=pi=1nxi(1p)ni=1nxi\begin{aligned} L(p)&=\prod_{i=1}^{n}p^{x_i}(1-p)^{1-x_i}\\ &=p^{\sum_{i=1}^nx_i} (1-p)^{n-\sum_{i=1}^nx_i}\\ \end{aligned}取自然对数:
    lnL(p)=i=1npxi(1p)1xi=(i=1nxi)lnp+(ni=1nxi)ln(1p)\begin{aligned} \ln L(p)&=\prod_{i=1}^{n}p^{x_i}(1-p)^{1-x_i}\\ &=\left(\sum_{i=1}^nx_i \right)\ln p + \left(n-\sum_{i=1}^n x_i \right) \ln \left(1-p \right) \end{aligned}lnL(p)p=0\frac{\partial \ln L(p)}{\partial p}=0 解得:
    p^=1ni=1nxi\hat p = \frac{1}{n}\sum_{i=1}^{n}x_i

    >返回目录

    三、 区间估计(interval estimate)

    在点估计的基础上,根据样本统计量的抽样分布可以对样本统计量与总体样本的真实参数的接近程度求出一个概率度量,在此概率下给出总体参数估计的一个可信的区间范围。与区间估计常常一同出现的,还有置信区间的概念。

    对于区别点估计和区间估计,有个很通俗的解释:

    • 我对待定参数只估计一个值(点估计),只笃定了这个值是最精确的;
    • 我给出待定参数的一个估计范围(区间估计),猜测这个区间内至少有一个值使得待定参数最接近于真实值;
    • 对于这个区间,给出一个概率(置信度)来说明这个区间内有多大的把握存在至少有一个值使得待定参数最接近于真实值;给出置信度的区间估计就是置信区间。
    • 显然,区间估计的精确度更高,但其“成本”也提升了,即获得精确值所需要进行尝试的次数变多。

    置信区间(confidence interval)

    补充理解: 如何理解 95% 置信区间?- 知乎

    置信区间 设总体样本集 XX 的分布函数 F(x;θ)F(x;\theta) 已知,先准备对 θ\theta 进行估计,如果对  0<a<1\forall ~ 0<a<1 可以得知子样本集 XXX' \in X 可以得到待定参数的下界(置信下限)与下界(置信上限θˉθ\bar \theta,\underline \theta,使得:
    P(θ(X))<θ<P(θˉ(X))=1aP(\underline \theta(X'))<\theta<P(\bar \theta(X'))=1-a则称随即区间 (θˉ,θ)(\bar \theta,\underline \theta) 为参数 θ\theta1a1-a置信水平(或置信度)的置信区间,或称双侧置信区间。

    例题:(脱敏数据裁剪于我们的一次爬虫实验) 已知某大学某组织的学生在总计3613场的某游戏对局中,每局时间服从正态分布N(μ,25.62)N(\mu,25.6^2)。现从中抽取100场的数据,根据矩估计求得点估计μ^=1100i=1100xi=43.2\hat \mu=\frac{1}{100}\sum_{i=1}^{100}x_i=43.2(分钟),给定95%置信区间,试求得其平均游戏时长(分钟)的范围。
    解:根据大数定律所得到的中心极限定理,可以得知100场游戏的抽样集点估计均值 μ^\hat \mu 的分布满足 μ^N(μ,25.62100)\hat \mu\sim N(\mu, \frac{25.6^2}{100})
    a=0.05a=0.05 ,查标准正态分布(xμσN(0,1)\frac{x-\mu}{\sigma}\sim N(0,1))表可知 za2=1.96z_{\frac{a}{2}}=1.96,即:
    P(z0.052<μ^μσn<z0.052)=10.05=0.951.96<μ^μσn<1.96\begin{aligned} P(-z_{\frac{0.05}{2}}<\frac{\hat \mu - \mu}{\frac{\sigma}{ \sqrt n}}<z_{\frac{0.05}{2}})&=1-0.05=0.95 \\ -1.96<\frac{\hat \mu - \mu}{\frac{\sigma}{ \sqrt n}}&<1.96\end{aligned}∴在置信度为95%的置信区间中,有:
    μ^1.96σn<μ<μ^+1.96σn\hat \mu - 1.96 \frac{\sigma}{\sqrt n}< \mu <\hat \mu + 1.96 \frac{\sigma}{\sqrt n}代入 μ^=43.2\hat \mu =43.2n=100n=100σ=25.6\sigma = 25.6 得:
    38.1824<μ<48.217638.1824< \mu < 48.2176也就是说,我们有95%的把握认为,总计3613场的游戏平均每局时间落在这个范围内(实际上的真实值为40.2分钟),在区间估计的情况下,我们修正点估计值 μ^\hat \mu ,用区间估计 (43.2±1.9625.6100)0.95(43.2 \pm 1.96 \frac{25.6}{\sqrt 100})\vert_{0.95} 来替代对 μ\mu 的估计。

    >返回目录

    四、 估计的评价标准

    1 无偏性(unbias)

    估计的偏差被定义为:bias(θ^)=E(θ^)θbias(\hat \theta)=\mathbb E(\hat \theta)-\theta其中 θ\theta 为真实值,E\mathbb E 是数学期望。

    伯努利分布 P(x=k)=pk(1p)(1k)P(x=k)=p^k(1−p)^{(1−k)} 为例,我们给出参数估计 p^=1ni=1nxi\hat p=\frac{1}{n}\sum_{i=1}^{n}x_i,则其偏差为:
    bias(p^)=E[1ni=1nxi]p=1ni=1nE[xi]p=pp=0 \begin{aligned} bias(\hat p)&=\mathbb E[\frac{1}{n}\sum_{i=1}^{n}x_i]-p\\ &=\frac{1}{n}\sum_{i=1}^{n}\mathbb E[x_i]-p\\ &=p-p=0 \end{aligned}

    Tip:伯努利分布的期望是 pp,参见: >离散型概率分布或范畴分布(categorical distribution)

    bias(θ^)=0bias(\hat \theta)=0,我们称其为无偏(unbiased)的或无偏估计。当其为无偏估计时,则意味着我们对 nn 个分布值 xix_i 所得到的参数估计值的均值(期望)与真实值相等。

    • 无偏性的意义在于,在多次重复下,估计值产生的偏差虽会在真实值周围波动,但在大范围实验中它仍旧最接近真实值。
    • 若某个估计值当且仅当样本量趋近于无穷时才具有无偏性,我们称其为渐进无偏(asymptotically unbiased)。

    2 有效性

    对于一个参数来说,其可能具有多个无偏估计,因此我们需要有更进一步的衡量标准。

    • 如果一种估计的方差比另一种估计的方差小,则称方差较小的估计值更有效。

    从上文的例题中,我们不难得知参数估计 p^=1ni=1nxi\hat p=\frac{1}{n}\sum_{i=1}^{n}x_i的方差为:pn(1p)\frac{p}{n}(1-p)

    3 一致性(相合性)

    无偏性和有效性在统计意义上给出了估计值地性能,但其并不能保证保证每一次具体估计时的性能,因此我们引入了参数估计的一致性。给定任意正实数 ε\varepsilon 都有:
    limnP(θ^θ>ε)=0\lim_{n \rightarrow \infin}P(\vert \hat \theta - \theta \vert>\varepsilon)=0或者:
    limnθ^=θ\lim_{n \rightarrow \infin}\hat \theta = \theta

    • 一致性保证了当样本数量非常大时,每一次的估计量总能在概率意义上任意地接近真实值;
    • 一致性保证了估计量的偏差会随着样本量的增多而减少;
    • 要注意的是,渐进无偏并不等于一致性。

    >返回目录

    展开全文
  • 1.统计量: 说到统计量说的一定是样本,是由样本构造的一个函数,例如我们常说的样本均值、样本方差等。 2.参数估计: 很多时候我们只能获取到样本的统计量,难以获得总体的参数,...区间估计 (1)点估计 用样本统计

    本文着重讲解概念,公式大家在网上都很容易查到,这里就免了,理解和融会贯通最重要。

    1.统计量:

    说到统计量说的一定是样本,是由样本构造的一个函数,例如我们常说的样本均值、样本方差等。

    2.参数估计:

    很多时候我们只能获取到样本的统计量,难以获得总体的参数,因此参数估计就是用样本统计量去估计总体的参数。例如:用样本均值去估计总体均值,用样本方差去估计总体方差等。

    3.估计量与估计值:

    • 估计量:在参数估计中,用来估计总体参数的统计量称为估计量。例如:样本均值,样本方差等都可以是一个估计量。
    • 估计值:是估计量的具体数值。

    4. 参数估计的方法

    • 点估计
    • 区间估计

    (1)点估计

    用样本统计量的某个取值作为总体参数的估计值

    (2)区间估计

    在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。
    有95%的样本均值所构造的2个标准差的区间会包含总体均值。也即是,如果抽取100个样本来估计总体均值,那么这100个样本就可以构造100个上述区间,其中会有95个区间包含总体均值,剩余5个区间不包含总体均值。

    (3)置信区间

    由样本统计量所构造的总体参数的估计区间称为置信区间。由于统计学家在某种程度上确信这个区间会包含真正的总体参数,因此称为置信区间。

    (4)置信水平

    如果将够着置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平,也称为置信度置信水平。一般我们说的95%,就是置信水平。

    5.小结+举例

    下面这个例子可以更清晰的解释上述概念间的关系:

    • 现在要估计班里同学的平均身高,我们从班里抽取一个随机样本。
    • 全班的平均身高是未知的, 称为参数
    • 抽取出的样本的平均身高,称为统计量,因为要用它来估计总体的平均身高,因此也是估计量
    • 假设样本的平均身高为1.6m,那1.6m就是估计量的具体数值,即为估计值
    • 现在我们要用样本均值1.6m作为全班的平均身高,这是点估计
    • 由于抽样是随机的,我们得到的估计值很有可能不等于总体均值,因此我们想用点估计加减2个样本标准差所构成的区间来估计总体参数,这是区间估计。我们所构造的区间称为置信区间

    6. 一个总体参数的区间估计

    • 若为大样本(样本容量n≥30),则不论总体是否服从正态分布,不论总体方差是否已知,均采用z分布。
    • 若为小样本(样本容量n<30),但总体方差已知,则采用z分布。
    • 若为小样本(样本容量n<30),但总体方差未知,则采用t分布。
    展开全文
  • 固定样本量 n = 100 n = 100 n=100和 α = 0.05 \alpha = 0.05 α=0.05,观察重复次数100、200和400时置信区间包含真值 μ = 15 \mu = 15 μ=15的频率是否接近置信度 1 − α = 0.95 1- \alpha = 0.95 1−α=0.95 # k...
  • 小白都能看懂的95%置信区间

    万次阅读 多人点赞 2018-09-14 22:56:35
    1.点估计与区间估计 首先我们看看点估计的含义: 是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。点估计虽然给出了未知参数的估计值,但是未给...
  • 尽力搞懂统计学概念——点估计、区间估计置信区间 在统计学的应用过程中,总有那么几个重要的基础概念似懂非懂,就像雾里看花,你对它有一个总体的印象,但说道具体细节又似是而非。我也深受其扰,现在就结合...
  • 3、参数估计:区间估计——求置信区间 1)置信区间是什么? 在样本估计总体均值时,我们需要知道估计的准确度,因此选定一个区间[a,b],目的是让这个区间包含总体均值,这个区间叫做置信区间。 对于这个区间有...
  • 统计推断的三大基本形式: 抽样分布 参数估计(点估计、区间估计) 假设检验(参数检验、非参数检验) 一、 置信区间 在实际中,我们通常得...参数估计包括:点估计与区间估计 点估计实际上就是利用样本算出一个值来
  • 置信区间与置信水平

    千次阅读 2017-05-31 09:54:02
    在统计学中,一个概率样本的置信区间(Confidence interval),是对这个样本的某个总体参数的区间估计置信区间展现的是,这个总体参数的真实值有一定概率落在该测量结果有关的某对应区间。置信区间给出的是,...
  • 数理统计——点估计与置信区间一、样本估计总体总体均值的估计总体方差的估计二、总体估计样本(样本Xs∼B(n,p)X_{s}\sim{B(n,p)}Xs​∼B(n,p))三、总体估计样本均值(已知μ\muμ和σ2\sigma^2σ2) 一、样本估计总体 ...
  • 置信区间估计 预测区间估计Estimation implies finding the optimal parameter using historical data whereas prediction uses the data to compute the random value of the unseen data. 估计意味着使用历史数据...
  • 3.点估计与区间估计 那么什么是点估计?什么是区间估计呢? 之前看到过这样一个例子,简直可以很完美的解释这个问题~ 以前很流行一种刮刮卡: 游戏规则是(假设只有一个大奖): · 大奖事先就固定好了,一定印在某...
  • 参数估计与置信区间

    千次阅读 2012-10-09 15:29:51
    区间估计一般是在一个既定的置信水平下计算得到总体均值或者总体概率的置信区间(Confidence Interval),一般会根据样本的个数和标准差估算得到总体的标准误差,根据点估计中用样本均值或样本概率估计总体均值或...
  • 区间估计引言前面,我们讨论了参数点估计.它是用样本算得的一个值去估计未知参数.但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不了.区间估计正好弥补了点估计的这个...
  • R语言bootstrap置信区间估计函数,通过三种方法估计置信区间
  • 置信度,置信区间区间估计

    千次阅读 2015-12-19 14:26:28
    置信区间(间距)是指,在某一置信度下,总体参数所在区域的长度。 置信度(置信水平)是也称为可靠度,或置信系数,即在抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。是指正确的概率。(1-...
  • 1 点估计 2 基于截尾样本的最大似然估计 3 估计量的评选标准 4 区间估计 5 正态总体均值方差的区间估计 6 (0-1)分布参数的区间估计 7 单侧置信区间

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 8,797
精华内容 3,518
关键字:

区间估计与置信区间