精华内容
下载资源
问答
  • T分布

    千次阅读 2019-03-13 15:09:27
    样本不足30——选择T分布 样本超过30——样本平均值符合正态分布

    样本不足30——选择T分布

    样本超过30——样本平均值符合正态分布

    展开全文
  • t分布

    千次阅读 2019-01-08 00:55:44
    t分布 如果有一点点的统计学基础都知道,t分布和χ2\chi^2χ2分布有着密不可分的联系,t随机变量的构造是基于χ2\chi^2χ2随机变量的。 设随机变量X1X_1X1​与X2X_2X2​独立,X1∼N(0,1)X_1\sim N(0,1)X1​∼N(0,1...

    t分布

    如果有一点点的统计学基础都知道,t分布和χ2\chi^2分布有着密不可分的联系,t随机变量的构造是基于χ2\chi^2随机变量的。

    设随机变量X1X_1X2X_2独立,X1N(0,1)X_1\sim N(0,1), X2χ2(n)X_2\sim \chi^2(n), 则t=X1X2/nt(n)t=\frac{X_1}{\sqrt{X_2/n}}\sim t(n).

    已经知道χ2\chi^2分布是GammaGamma分布的特例,那么 tt 的密度函数一定也是与Γ\Gamma函数密切相关的,通过令t2=F(1,n)t^2=F(1,n)以及根据 tt分布的对称性,可以求出 tt 的密度函数, 求 tt 密度函数的过程如下:
    P(0<t<y)=12P(t2<y2)=12P(F<y2)P(0<t<y)=\frac{1}{2}P({t^2}<{y^2})=\frac{1}{2}P(F<y^2)两边求导,得ft(y)=yfF(y2).f_t(y)=yf_F(y^2).

    1 n(xμ)s\frac{\sqrt n(\overline{x}-\mu)}{s}服从tt分布

    tt分布的峰比标准正态分布略低一些,尾部比标准正态分布的大一些。是由英国统计学家Gosset发现,由Fisher完善的。当数据量很大时,根据中心极限定理,总是可以将统计量归结到正态分布。但当数据量较小时,就与正态分布产生偏差。Gosset发现n(xμ)s\frac{\sqrt n(\overline{x}-\mu)}{s}并不是完全服从正态分布的,而是服从一种全新的分布 – tt分布。由于上面已经介绍了tt分布的定义,下面证明统计量n(xμ)s\frac{\sqrt n(\overline{x}-\mu)}{s}服从tt分布。

    x1,x2,...,xnx_1,x_2,...,x_n是来自总体N(μ,σ2)N(\mu,\sigma^2)的样本,s2s^2是样本标准差,则有:(n1)s2σ2χ2(n1).\frac{(n-1)s^2}{\sigma^2}\sim\chi^2(n-1).
    构造一个矩阵AA,将(x1,x2,...,xn)(x_1,x_2,...,x_n)正交变换为(y1,y2,...,yn)(y_1,y_2,...,y_n),即:

    Y=(y1,y2,...,yn)=A(x1,x2,...,xn)=AXY=(y_1,y_2,...,y_n)'=A(x_1,x_2,...,x_n)'=AX

    A=(1n1n1n...1n1211210...0132132232...01n(n1)1n(n1)1n(n1)...n1n(n1))n×nA =\left( \begin{array}{} \frac{1}{\sqrt n}& \frac{1}{\sqrt n}& \frac{1}{\sqrt n}&...&\frac{1}{\sqrt n} \\ \frac{1}{\sqrt{2\cdot1}}& -\frac{1}{\sqrt{2\cdot1}} & 0&...&0 \\ \frac{1}{\sqrt{3\cdot2}}& \frac{1}{\sqrt{3\cdot2}} &- \frac{2}{\sqrt{3\cdot2}}&...&0\\ \vdots&\vdots&\vdots&\vdots&\vdots\\ \frac{1}{\sqrt{n\cdot(n-1)}}&\frac{1}{\sqrt{n\cdot(n-1)}}&\frac{1}{\sqrt{n\cdot(n-1)}}&...&-\frac{n-1}{\sqrt{n\cdot(n-1)}}\\ \end{array} \right)_{n\times n}
    则有y1=1ni=0nxiy_1=\frac{1}{\sqrt{n}}\sum\limits_{i=0}^nx_i,即x=1ny1\overline{x}=\frac{1}{\sqrt{n}}y_1,所以有:
    (n1)s2=i=0n(xix)2=i=1nxi2nx2=XXy12(n-1)s^2=\sum\limits_{i=0}^n(x_i-\overline{x})^2 =\sum\limits_{i=1}^nx_i^2-n\overline{x}^2 =X'X-y_1^2       =XAAXy12=YYy12=i=2nyi2~~~~~~~=X'A'AX-y_1^2 =Y'Y-y_1^2 =\sum\limits_{i=2}^ny_i^2
    由于x1,x2,...,xnx_1,x_2,...,x_n均服从N(μ,σ2)N(\mu,\sigma^2)y1,y2,...,yny_1,y_2,...,y_nx1,x2,...,xnx_1,x_2,...,x_n的线性组合,所以y1,y2,...,yny_1,y_2,...,y_n也服从正态分布,其中 y1N(nμ,σ2)y_1\sim N(\sqrt{n}\mu,\sigma^2)y2,...,ynN(0,σ2)y_2,...,y_n\sim N(0,\sigma^2), 根据多元正态分布的密度函数表达式容易得出y2,...,yny_2,...,y_n也是互相独立的。可得:
    (n1)s2σ2=i=2n(yiσ)2χ2(n1).\frac{(n-1)s^2}{\sigma^2}=\sum\limits_{i=2}^n(\frac{y_i}{\sigma})^2\sim\chi^2(n-1).
    又由于x\overline{x}s2s^2独立 (x\overline{x}只与y1y_1有关,s2s^2只与y2,...,yny_2,...,y_n有关),则:

    n(xμ)s=xμσ/n(n1)s2/σ2n1t(n1)\frac{\sqrt n(\overline{x}-\mu)}{s}=\frac{{\frac{\overline{x}-\mu}{\sigma/\sqrt{n}}}} {\sqrt{\frac{{(n-1)s^2}/{\sigma^2}}{n-1}}}\sim t(n-1)
    证明完毕。

    2 比较期望的t检验

    在正态总体的参数假设检验中,t检验是经常使用的一种检验方法,使用t检验可以

    • 检验总体期望与某一个常数是否有显著差异(样本均数与总体均数的比较)
    • 检验两个独立总体的总体期望是否有显著差异(两独立样本均数的比较)
    • 检验两个相关总体的总体期望是否有显著差异(两相关样本均数的比较)

    下面用两独立样本均数的比较做例子解释一下统计量n(xμ)s\frac{\sqrt n(\overline{x}-\mu)}{s}的应用。

    口服多糖铁复合物是治疗肾性贫血的传统方法,为研究右旋糖酐氢氧化铁注射液在治疗肾性贫血的效果,选择血红蛋白水平相似的患者随机分为口服多糖铁复合物组和静脉注射右旋糖酐氢氧化铁组,每组分别n1,n2n_1,n_2个人,在接受治疗后,收集每个患者血红蛋白含量的增值。口服多糖铁复合物组患者的血红蛋白含量的增值记为 (x1,x2,...,xn1x_1,x_2,...,x_{n_1});静脉注射右旋糖酐氢氧化铁组患者的血红蛋白含量的增值记为 (y1,y2,...,yn2)(y_1,y_2,...,y_{n_2})

    可以把(x1,x2,...,xn1x_1,x_2,...,x_{n_1})看作来自总体XX,把(y1,y2,...,yn2)(y_1,y_2,...,y_{n_2})看作来自总体YY, 即:

    XN(μ1,σ2)     YN(μ2,σ2)X\sim N(\mu_1,\sigma^2)~~~~~Y\sim N(\mu_2,\sigma^2)

    从而有:

    xN(μ1,σ2n1)       yN(μ2,σ2n2)\overline{x}\sim N(\mu_1,\frac{\sigma^2}{n_1})~~~~~~~\overline{y}\sim N(\mu_2,\frac{\sigma^2}{n_2})

    由于服从正态分布的随机变量的线性组合也服从正态分布,所以有:

    xyN(μ1μ2,σ2n1+σ2n2)\overline{x}-\overline{y}\sim N(\mu_1-\mu_2,\frac{\sigma^2}{n_1}+\frac{\sigma^2}{n_2})
    即:
    xy(μ1μ2)σ1n1+1n2N(0,1)\frac{\overline{x}-\overline{y}-(\mu_1-\mu_2)}{\sigma\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim N(0,1)
    构造统计量n(xμ)s\frac{\sqrt n(\overline{x}-\mu)}{s}

    (n11)s12σ2+(n21)s22σ2χ2(n1+n22)\frac{(n_1-1)s_1^2}{\sigma^2}+\frac{(n_2-1)s_2^2}{\sigma^2}\sim\chi^2(n_1+n_2-2)
    xy(μ1μ2)σ1n1+1n2(n11)s12σ2+(n21)s22σ2(n1+n22)=xy(μ1μ2)1n1+1n2(n11)s12+(n21)s22(n1+n22)\frac{\frac{\overline{x}-\overline{y}-(\mu_1-\mu_2)}{\sigma\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}} {\sqrt{\frac{\frac{(n_1-1)s_1^2}{\sigma^2}+\frac{(n_2-1)s_2^2}{\sigma^2}}{(n_1+n_2-2)}}}= \frac{\frac{\overline{x}-\overline{y}-(\mu_1-\mu_2)}{\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}} {\sqrt{\frac{{(n_1-1)s_1^2}+{(n_2-1)s_2^2}}{(n_1+n_2-2)}}}
    =xy(μ1μ2)i=1n1(xix)2+i=1n2(yiy)2(n1+n22)1n1+1n2                =\frac{{\overline{x}-\overline{y}-(\mu_1-\mu_2)}} {\sqrt{\frac{\sum_{i=1}^{n_1}(x_i-\overline x)^2+\sum_{i=1}^{n_2}(y_i-\overline{y})^2}{(n_1+n_2-2)}} {\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}} ~~~~~~~~~~~~~~~
    =xy(μ1μ2)sc2(1n1+1n2)t(n1+n22)              =\frac{{\overline{x}-\overline{y}-(\mu_1-\mu_2)}} { {\sqrt{s_c^2(\frac{1}{n_1}+\frac{1}{n_2})}}}\sim t(n_1+n_2-2)~~~~~~~~~~~~~

    3 线性模型中单个变量的显著性检验

    多元线性模型 (p个变量,n个样本) 的表达式为:
    Yi=βTxi+ϵiY_i=\beta^T x_i+\epsilon_i
    在这里将YiY_iϵi\epsilon_i视为随机变量
    E(Yi)=E(Yixi)=βTxi=μiE(Y_i)=E(Y_i|x_i)=\beta^T x_i=\mu_i
    即:
    Yi=μi+ϵiY_i=\mu_i+\epsilon_i

    Xn×(p+1)X_{n\times (p+1)}为样本阵,则有:
    Y=Xβ+ϵ=μ+ϵY=X\beta+\epsilon=\mu+\epsilon
    再使用最小化残差平方和的方法求β^\hat\beta:
    β^=(XTX)1XTY\hat\beta=(X^TX)^{-1}X^TY
    然后有:
    Y^=μ^=Xβ^=Xβ^=X(XTX)1XTY=HY\hat Y=\hat \mu=X\hat\beta=X\hat\beta=X(X^TX)^{-1}X^TY=HY
    HH是对称阵,也是幂等阵,且tr(H)=tr(X(XTX)1XT)=p+1tr(H)=tr(X(X^TX)^{-1}X^T)=p+1,H=(hij)H=(h_{ij})

    e=YY^=(IH)Yei=YiY^ie=Y-\hat Y=(I-H)Y,e_i=Y_i-\hat Y_i, 所以:
    E(σ2^)=E(1np1i=1nei2)=1np1i=1n((Eei)2+Dei)E(\hat{\sigma^2})=E(\frac{1}{n-p-1}\sum\limits_{i=1}^{n}e_i^2)=\frac{1}{n-p-1}\sum\limits_{i=1}^{n}((Ee_i)^2+De_i)
                      =1np1i=1n(1hii)σ2=1np1(n(p+1))σ2=σ2~~~~~~~~~~~~~~~~~~=\frac{1}{n-p-1}\sum\limits_{i=1}^{n}(1-h_{ii})\sigma^2=\frac{1}{n-p-1}(n-(p+1))\sigma^2=\sigma^2
    σ2^=1np1i=1nei2\hat{\sigma^2}=\frac{1}{n-p-1}\sum\limits_{i=1}^{n}e_i^2σ2\sigma^2 的无偏估计。

    假定ϵN(0,Σ0)    Σ0=(σ20...00σ2...000...σ2)\epsilon\sim N(0,\Sigma_0)~~~~\Sigma_0=\left( \begin{array}{ccc} \sigma^2 & 0 & ...&0 \\ 0 & \sigma^2 & ...&0 \\ \vdots & \vdots &\vdots&\vdots\\ 0 & 0 & ...&\sigma^2 \\ \end{array} \right), 则YN(μ,Σ0)Y\sim N(\mu,\Sigma_0). 然后有:

    E(β^)=βE(\hat\beta)=\beta
    D(β^)=D((XTX)1XTY)=(XTX)1XTD(Y)X(XTX)1=σ2(XTX)1D(\hat\beta)=D((X^TX)^{-1}X^TY)=(X^TX)^{-1}X^TD(Y)X(X^TX)^{-1}=\sigma^2(X^TX)^{-1}
    又因为 β^\hat\betaYiY_i 的线性组合,所以:
    β^N(β,σ2(XTX)1)\hat\beta\sim N(\beta,\sigma^2(X^TX)^{-1})
    再记 (XTX)1=(kij),(X^TX)^{-1}=(k_{ij}), 所以有:
    β^iN(βi,σ2kii)\hat\beta_i\sim N(\beta_i,\sigma^2k_{ii})
    βi\beta_i进行显著性检验,原假设为系数βi\beta_i不显著,即:
    H0:βi=0H_0:\beta_i=0
    σ^=σ2^\hat\sigma=\sqrt{\hat{\sigma^2}},在原假设成立的条件下,就可以构造tt统计量:
    ti=β^ikiiσ^t(np1)t_i=\frac{\hat\beta_i}{\sqrt{k_{ii}}\hat\sigma}\sim t(n-p-1)

    展开全文
  • 有很多统计推断是基于正态分布的假设,以标准正态分布变量为...这三大抽样分布即为著名的卡方分布,t分布和F分布。 目录 1 卡方分布(分布) 1.1 定义 1.2 性质 2 t分布 2.1 定义 2.2 性质 3 F分布 3.1 ...

    有很多统计推断是基于正态分布的假设,以标准正态分布变量为基石而构造的三个著名统计量在实际中有广泛的应用,这是因为这三个统计量不仅有明确背景,而且其抽样分布的密度函数有显式表达式,它们被称为统计中的“三大抽样分布”。这三大抽样分布即为著名的卡方分布,t分布F分布

    目录

    1 卡方分布(\chi ^{2}分布)

    1.1 定义

    1.2 性质

    2 t分布

    2.1 定义

    2.2 性质

    3 F分布

    3.1 定义

    3.2 性质

    4 正态总体样本均值和样本方差的分布

    4.1 正态变量线性函数的分布​

    4.2 正态变量样本均值和样本方差的分布

    5 几个重要推论

    6 总结

     



    1 卡方分布(\chi ^{2}分布)

    1.1 定义

    设随机变量 X 是自由度为 n 的 χ2 随机变量, 则其概率密度函数为

    \Gamma(\cdot )表示的是一个gamma函数,它是整数k的封闭形式。gamma函数的介绍如下伽马函数的总结

    \chi _{n}^{2} 的密度函数 g_{n}(x) 形状如下图

    \chi _{n}^{2}密度函数的支撑集 (即使密度函数为正的自变量的集合) 为(0, +∞), 从上图可见当自由度 n 越大, \chi _{n}^{2} 的密度曲线越趋于对称, n
    越小, 曲线越不对称. 当 n = 1, 2 时曲线是单调下降趋于 0. 当 n ≥ 3时曲线有单峰, 从 0 开始先单调上升, 在一定位置达到峰值, 然后单下降趋向于 0。

    若 X ∼ \chi _{n}^{2}, 记 P(x> c)=\alpha,则 c=\chi _{n}^{2}(\alpha ) 称为 \chi _{n}^{2} 分布的上侧 \alpha 分位数, 如下图所示。当\alphan 给定时可查表求出 \chi _{n}^{2}(a) 之值,如\chi _{10}^{2}(0.01)=23.209\chi _{5}^{2}(0.05)=12.592 等。

    1.2 性质

    χ2 变量具有下列性质:


    2 t分布

    说起t分布,首先要提一句u分布,正态分布(normal distribution)是许多统计方法的理论基础。正态分布的两个参数μ和σ决定了正态分布的位置和形态。为了应用方便,常将一般的正态变量X通过u变换[(X-μ)/σ]转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布(standard normaldistribution),亦称u分布。根据中心极限定理,通过抽样模拟试验表明,在正态分布总体中以固定 n 抽取若干个样本时,样本均数的分布仍服从正态分布,即N(μ,σ)。所以,对样本均数的分布进行u变换,也可变换为标准正态分布N (0,1)

    由于在实际工作中,往往σ(总体方差)是未知的,常用s(样本方差)作为σ的估计值,为了与u变换区别,称为t变换统计量t 值的分布称为t分布

    2.1 定义

    设随机变量 T ∼ t_{n}, 则其密度函数为

    该密度函数的图形如下

    t_{n}的密度函数与标准正态分布 N(0, 1) 密度很相似, 它们都是关于原点对称, 单峰偶函数, 在 x = 0 处达到极大. 但 t_{n} 的峰值低于
    N(0, 1) 的峰值, t_{n} 的密度函数尾部都要比 N(0, 1) 的两侧尾部粗一些. 容易证明:

    此处 \varphi (x)N(0, 1) 变量的密度函数。

    若T ∼ t_{n},记P(\left | T \right |> c)=\alpha,则c={t_{n}}(\alpha /2)为自由度为nt分布的双侧\alpha分位数(如上图所示). 当给定 \alpha 时, {t_{n}}(\alpha ), {t_{n}}(\alpha /2)
    等可通过查表求出. 例如 {t_{12}}(0.05)=1.782 ,{t_{9}}(0.025)=2.262等。

    t 分布是英国统计学家 W.S. Gosset 在 1908 年以笔名 Student发表的论文中提出的, 故后人称为 “学生氏 (Student) 分布” 或 “t
    布”。

    2.2 性质

    t 变量具有下列的性质:


    3 F分布

    3.1 定义

    若随机变量 Z ∼F_{m,n}, 则其密度函数为

    自由度为 m, n F 分布的密度函数如下图:

     

    注意 F 分布的自由度 m n 是有顺序的, 当 m\neq n时, 若将自由度 m n 的顺序颠倒一下, 得到的是两个不同的 F 分布. 从上图
    可见对给定 m = 10, n 取不同值时f_{m,n}(x) 的形状, 我们看到曲线是偏态的, n 越小偏态越严重。

    若 F ∼ F_{m,n}, 记 P(F> c)=\alpha, 则 c=F_{m,n}(\alpha ) 称为 F 分布的上侧 \alpha 分位数 (见上图). 当 m, n\alpha 给定时, 可以通过查表求出
    F_{m,n}(\alpha )之值, 例如F_{4,10}(0.05)=3.48,F_{10,15}(0.01)=3.80 等. 在区间估计和假设检验问题中常常用到.

    3.2 性质

    F 变量具有下列的性质:

    以上性质中 (1) 和 (2) 是显然的, (3) 的证明不难. 尤其性质 (3)在求区间估计和假设检验问题时会常常用到. 因为当 α 为较小的数,
    如 α = 0.05 或 α = 0.01, m, n 给定时, 从已有的 F 分布表上查不到 F_{m,n}(1-0.05)F_{m,n}(1-0.01) 之值, 但它们的值可利用性质(3) 求得, 因为 F_{n,m}(0.05)F_{n,m}(0.01) 是可以通过查 F 分布表求得的.


    4 正态总体样本均值和样本方差的分布

    为方便讨论正态总体样本均值和样本方差的分布, 我们先给出正态随机变量的线性函数的分布.

    4.1 正态变量线性函数的分布

    4.2 正态变量样本均值和样本方差的分布

    下述定理给出了正态变量样本均值和样本方差的分布和它们的独立性.


    5 几个重要推论

    下面几个推论在正态总体区间估计和假设检验问题中有着重要应用.


    6 总结

    数据在使用前要注意采用有效的方法收集数据, 如设计好抽样方案, 安排好试验等等. 只有有效的收集了数据, 才能有效地使用数据,开展统计推断工作.获得数据后, 根据问题的特点和抽样方式确定抽样分布, 即统计模型. 基于统计模型, 统计推断问题可以按照如下的步骤进行:

    1. 确定用于统计推断的合适统计量;
    2. 寻求统计量的精确分布; 在统计量的精确分布难以求出的情形,可考虑利用中心极限定理或其它极限定理找出统计量的极限分布.
    3. 基于该统计量的精确分布或极限分布, 求出统计推断问题的精确解或近似解.
    4. 根据统计推断结果对问题作出解释

    其中第二步是最重要, 但也是最困难的一步. 统计三大分布及正态总体下样本均值和样本方差的分布, 在寻求与正态变量有关的统计量精确分布时, 起着十分重要作用. 尤其在求区间估计和假设检验问题时可以看得十分清楚

     

    展开全文
  • 关于t分布

    万次阅读 2019-03-11 13:57:15
    上一篇文章提及了卡方分布,本文接着介绍另一类重要的抽样分布–t分布。 简单说一下背景,“t”,是Fisher为之取的名字。Fisher最早将这一分布命名为“Student’s distribution”,并以“t”为之标记。Student,则...

    上一篇文章提及了卡方分布,本文接着介绍另一类重要的抽样分布–t分布。
    简单说一下背景,“t”,是Fisher为之取的名字。Fisher最早将这一分布命名为“Student’s distribution”,并以“t”为之标记。Student,则是William Sealy Gosset(戈塞特)的笔名。他当年在爱尔兰都柏林的一家酒厂工作,设计了一种后来被称为t检验的方法来评价酒的质量。因为行业机密,酒厂不允许他的工作内容外泄,所以当他后来将其发表到至今仍十分著名的一本杂志《Biometrika》时,就署了student的笔名。所以现在很多人知道student,知道t,却不知道Gosset。
    一、t分布的定义:
    设随机变量X~ N(0,1),Y~x^2 (n)(自由度为n的卡方分布),且X与Y相互独立,则称随机变量
    在这里插入图片描述
    服从自由度为n的t分布。
    t分布的概率密度函数为:
    在这里插入图片描述
    特别的,n=1时,t分布就是柯西分布(柯西分布:无期望,无方差):
    在这里插入图片描述
    当n→∞时,t分布就是标准正态分布。(均值为0,方差为1):
    在这里插入图片描述
    二、t分布的特征:
    一般来看,t分布只有一个参数,就是自由度,那么如何从这个参数来理解分布的特征呢?
    首先,t分布是关于Y轴对称的,故t分布的均值为0;
    其次,t分布的方差计算较为复杂,实际情况中,更多的使用样本方差。这也说明,对于t分布,需要了解图形随着自由度的变化趋势。
    下图是t分布的概率密度函数图形。可以看出当自由度小的时候,t分布相较于正态分布,更“温和”。当自由度越来越大的时候,t分布更接近于正态分布。(这是因为正态分布的一个特征就是可以描述多种因素共同作用的效果)
    在这里插入图片描述
    三、t分布在统计学上的应用:
    1、首先引出上∝分位数的概念:由于t分布也是抽样分布,所以对于t分布也需要关注上∝分位数。给定∝,0<∝<1,称满足条件
    在这里插入图片描述
    的点t_α (n)为t(n)分布的上α分位数。由于t分布是关于Y轴对称的,所以有t_(1-α) (n)=-t_α (n).
    在这里插入图片描述
    2、基础定理:
    构造t分布的关键点是卡方分布,因为t分布里面包含了一个卡方分布。根据上文,正态分布总体样本方差与总体方差的比值结合一个系数(自由度)构成卡方分布。故引出抽样统计中二个重要定理:单个正态总体的抽样分布、两个正态总体的抽样分布。
    1)、单个正态总体的抽样分布:
    设总体X~N(μ,σ^2),x_1,x_2,⋯x_n是样本,样本均值
    在这里插入图片描述
    样本方差
    在这里插入图片描述

    在这里插入图片描述
    此处需要注意的是自由度是n-1。原因是
    在这里插入图片描述
    2)、两个正态总体的抽样分布
    设样本(x_1,x_2,⋯x_n)和(y_1,y_2,⋯y_n)分别来自总体N(μ_1,σ_1^2) 和N(μ_2,σ_2^2),并且它们相互独立,样本均值分别为x ̅,y ̅;样本方差分别是S_1^2, S_2^2,则可以得到下面的抽样分布:
    在这里插入图片描述
    当σ_1^2 =σ_2^2 =σ^2时,
    在这里插入图片描述
    其中,
    在这里插入图片描述
    3、应用
    基于以上2个定理,可以构造枢轴量,进而操作区间估计和假设检验;另一方面,t分布在回归模型中也有涉及。以下分别介绍:
    1)、枢轴量
    单个正态总体的均值μ(方差未知):
    在这里插入图片描述
    基于这个枢轴量进行单个正态总体的均值的估计,和检验(此处有个别名为t检验)。
    两个独立正态总体的均值差(方差相等但是未知):
    在这里插入图片描述
    另外,有一种特殊的情况在以上两种之外,就是小样本(样本量小于30),两个独立正态总体的均值差(方差不相等同时也未知),此处的统计量是近似服从t(k)分布。
    在这里插入图片描述
    在这里插入图片描述
    基于以上的枢轴量操作的两个独立正态总体均值差的估计,和检验(t检验)。
    2)、回归模型
    回归模型所描述的是一系列独立同分布的正态分布,它们的共同特征。模型为
    在这里插入图片描述
    由最小二乘法计算出β_1的估计值。有以下的结论,
    在这里插入图片描述
    由此构造t检验量:
    在这里插入图片描述
    其中:
    在这里插入图片描述
    在这里插入图片描述
    照旧:
    在这里插入图片描述
    由以上可知,t分布描述了基于正态分布抽样,描述由抽样样本标准化后形成的标准正态分布/样本方差与总体方差形成的卡方分布。显而易见的是样本数量越大,样本越接近总体,t检验也越接近正态分布。

    展开全文
  • t分布与t检验详解

    万次阅读 多人点赞 2019-01-25 16:39:10
    最近又遇到了t分布及t检验方面的内容,发现有些地方自己当初没有很明白,就又查了些资料,加深了一下自己的理解,这里也将自己的一些理解记录下来。 1. 理论基础——大数定理与中心极限定理  在正式介绍t分布前,...
  • 标准正态分布 T分布 F分布 卡方分布
  • 统计分析 -- t分布

    2019-10-25 14:01:16
    t分布曲线是一簇曲线,其形态变化与自由度的大小有关。自由度越小,则t 值越分散,t分布曲线的峰部越矮而尾部翘得越高;说明尾部面积(概率P)就越大;与u分布曲线相比,t 分布低平; 自由度逐渐增大时,t 分布...
  • 正态分布小样本抽样分布—t分布 运用t分布构建小样本抽样均值的置信区间 运用t分布进行小样本抽样均值检验 大样本抽样分布 对于大样本的抽样分布,由中心极限定理,无论总体分布是否为正态分布,其均值x_bar的...
  • 一、正态分布 正态分布(Normal distribution)又名高斯分布(Gaussiandistribution),若随机变量X服从一个数学期望为μ、方差为σ^2的高斯分布,记为N(μ,σ^2)。...三、t分布 四、F分布 ...
  • 卡方分布、t分布 和F分布

    万次阅读 多人点赞 2018-08-19 22:14:03
    统计学之重要分布介绍 一、卡方分布 二、t分布 小样本分布: 推导: 三、F分布 内容转载自 https://blog.csdn.net/liangzuojiayi/article/details/77947797...
  • 如何理解t检验、t分布、t值?

    千次阅读 2019-08-07 00:03:00
    t检验、t分布、t值其实都是同一个数学概念中的不同部分。1 t检验的历史阿瑟·健力士公司(Arthur Guinness Son Co.)是一家由阿瑟·健力士(Arthu...
  • 有很多统计推断是基于正态分布的假设,以标准正态分布变量为基石...这三大抽样分布即为著名的卡方分布,t分布和F分布。 1 卡方分布 1.1 定义 1.2 性质 2 t分布 2.1 定义 2.2 性质 3 F分布 3.1 定义 3.2 性质 4...
  • 比如卡方分布(chi-square distribution, χ²-distribution,或写作χ²分布),已知样本X都是服从正态分布的样本,而且方差未知,那么,检验X的均值就会用到t分布,其他的情况也类似,可以看看数理统计相关内容...
  • 数理统计三大分布:卡方分布、t分布、F分布正态分布卡方分布定义概率密度函数性质t分布定义概率密度函数性质F分布定义概率密度函数性质Attention 正态分布 由于χ2\chi^2χ2(chi-squard)分布、t分布、F分布都是由...
  • 015 t分布、卡方分布、F分布习题及正态总体下常用分布
  • t分布噪声图像

    千次阅读 2015-12-15 19:24:34
    t分布 由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布。 假设X服从标准正态分布N(0,1),Y服从χ2(n)分布,那么Z=X/sqrt(Y/n)的分布称为...
  • 在统计学上,我们会遇到一些常见的分布,除了正态分布外,,如t检验对应的t分布,检验对应的分布,方差分析对应的F分布等。这些分布是统计学的基础,在假设检验、方差分析等领域都起着至关重要的作用。在此,我们对...
  • 014 数理统计概念、卡方分布、t分布

    千次阅读 2017-11-30 07:40:14
    014 数理统计概念、卡方分布、t分布
  • 最近写项目书需要用到T分布表、卡方分布表,但是网上搜到的图片清晰度都不够高,放在项目书里不好看,而且想要的参数也不一定在表中,还是用excel自己来计算比较方便,记录一下用excel计算分位值的过程~(以T分布表...
  • Student‘s t分布

    千次阅读 2019-10-15 23:02:08
    1.St(x|u,w,v)是由一个单变量高斯分布N(x|u,t^-1)和一个gamma分布Gam(t|a,b)相乘得到的...3.学生t分布具有很好的健壮性,这是由于在其概率密度函数中没有指数的限制,所以在有噪声数据的时候会显示很好的鲁棒性。 ...
  • 文章目录卡方分布卡方分布的期望和方差t分布t分布的期望和方差F分布F分布的期望和方差 卡方分布 设X1,X2,……Xn独立同分布,且服从公共分布N(0,1),则Y=X12+X22+……Xn2服从自由度为n的卡方分布. 设X_1,X_2,……X_n...
  • T分布:温良宽厚 本文由“医学统计分析精粹”小编“Hiu”原创完成,文章采用知识共享Attribution-NonCommercial-NoDerivatives 4.0国际许可协议(http://creativecommons.org/licenses/by-nc-nd/4...
  • t分布与t检验的一点理解

    千次阅读 2019-05-18 16:26:00
    最近又遇到了t分布及t检验方面的内容,发现有些地方自己当初没有很明白,就又查了些资料,加深了一下自己的理解,这里也将自己的一些理解记录下来。 1. 理论基础——大数定理与中心极限定理 在正式介绍t分布前,...
  • 用Python学分析 - t分布

    千次阅读 2019-03-22 15:17:00
    1. t分布形状类似于标准正态分布2. t分布是对称分布,较正态分布离散度强,密度曲线较标准正态分布密度曲线更扁平3. 对于大型样本,t-值与z-值之间的差别很小 作用- t分布纠正了未知的真实标准差的不确定性- t分布...
  • T 分布(近似标准正态分布

    千次阅读 2018-01-12 15:42:00
    定义:假设X服从标准正态分布N(0,1),Y服从卡方分布,那么的分布称为自由度为n的t分布,记为。 T分布密度函数其中,Gam(x)为伽马函数。 可用于两组独立计量资料的假设检验。 由于在实际工作中,往往σ...
  • Z就是正态分布,X^2分布是一个正态分布的平方,t分布是一个正态分布除以(一个X^2分布除以它的自由度然后开根号),F分布是两个卡方分布分布除以他们各自的自由度再相除比如X是一个Z分布,Y(n)=X1
  • χ^2分布,t分布,f分布 χ^2分布: χ2(n)=X12+X22+……+Xn2χ^2(n)=X_1^2+X_2^2+……+X_n^2χ2(n)=X12​+X22​+……+Xn2​ t分布 t(n)=XY/nt(n)=\frac{X}{\sqrt{Y/n}}t(n)=Y/n​X​ f分布 F(m,n)=Y1/mY2/nF(m,n)=\...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 270,279
精华内容 108,111
关键字:

t分布