精华内容
下载资源
问答
  • u检验和t检验区别与联系

    万次阅读 2017-09-13 10:55:20
    u检验的应用条件是:样本例数n较大或样本例数虽小但是总体标准差已知

    u

    检验和

    t

    检验可用于样本均数与总体均数的比较以及两样本均数的比较。

    理论

    上要求样本来自正态分布总体。

    但在实用时,

    只要样本例数

    n

    较大,

    n

    小但总

    体标准差

    σ

    已知时,就可应用

    u

    检验;

    n

    小且总体标准差

    σ

    未知时,可应用

    t

    检验,

    但要求样本来自正态分布总体。

    两样本均数比较时还要求两总体方差相等。

     

    u

    检验和

    t

    检验可用于样本均数与总体均数的比较以及两样本均数的比较。

    理论

    上要求样本来自正态分布总体。

    但在实用时,

    只要样本例数

    n

    较大,

    n

    小但总

    体标准差

    σ

    已知时,就可应用

    u

    检验;

    n

    小且总体标准差

    σ

    未知时,可应用

    t

    检验,

    但要求样本来自正态分布总体。

    两样本均数比较时还要求两总体方差相等。

     

    u

    检验和

    t

    检验可用于样本均数与总体均数的比较以及两样本均数的比较。

    理论

    上要求样本来自正态分布总体。

    但在实用时,

    只要样本例数

    n

    较大,

    n

    小但总

    体标准差

    σ

    已知时,就可应用

    u

    检验;

    n

    小且总体标准差

    σ

    未知时,可应用

    t

    检验,

    但要求样本来自正态分布总体。

    两样本均数比较时还要求两总体方差相等。

     

    u

    检验和

    t

    检验可用于样本均数与总体均数的比较以及两样本均数的比较。

    理论

    上要求样本来自正态分布总体。

    但在实用时,

    只要样本例数

    n

    较大,

    n

    小但总

    体标准差

    σ

    已知时,就可应用

    u

    检验;

    n

    小且总体标准差

    σ

    未知时,可应用

    t

    检验,

    但要求样本来自正态分布总体。

    两样本均数比较时还要求两总体方差相等。

     

    u

    检验和

    t

    检验可用于样本均数与总体均数的比较以及两样本均数的比较。

    理论

    上要求样本来自正态分布总体。

    但在实用时,

    只要样本例数

    n

    较大,

    n

    小但总

    体标准差

    σ

    已知时,就可应用

    u

    检验;

    n

    小且总体标准差

    σ

    未知时,可应用

    t

    检验,

    但要求样本来自正态分布总体。

    两样本均数比较时还

    t

    检验可用于样本均数与总体均数的比较以及两样本均数的比较。

    理论

    上要求样本来自正态分布总体。

    但在实用时,

    只要样本例数

    n

    较大,

    n

    小但总

    体标准差

    σ

    已知时,就可应用

    u

    检验;

    n

    小且总体标准差

    σ

    未知时,可应用

    t

    检验,

    但要求样本来自正态分布总体。

    两样本均数比较时还要求两总体方差相等。

     

     

    一、样本均数与总体均数比较

     

     

    比较的目的是推断样本所代表的未知总体均数

    μ

    与已知总体均数

    μ

    0

    有无差别。

    通常把理论值、标准值或经大量调查所得的稳定值作为

    μ

    0.

    根据

    t

    检验可用于样本均数与总体均数的比较以及两样本均数的比较。

    理论

    上要求样本来自正态分布总体。

    但在实用时,

    只要样本例数

    n

    较大,

    n

    小但总

    体标准差

    σ

    已知时,就可应用

    u

    检验;

    n

    小且总体标准差

    σ

    未知时,可应用

    t

    检验

    但要求样本来自正态分布总体。

    两样本均数比较时还要求两总体方差相等。

     

     

    一、样本均数与总体均数比较

     

     

    比较的目的是推断样本所代表的未知总体均数

    μ

    与已知总体均数

    μ

    0

    有无差别。

    通常把理论值、标准值或经大量调查所得的稳定值作为

    μ

    0.



    u检验和t检验区别与联系           
      
    u检验和t检验可用于样本均数与总体均数的比较以及两样本均数的比较。

    理论上要求样本来自正态分布总体。

    但在实用时,只要 样本例数n较大,或n小但总体标准差σ已知 时,就可应用 u检验

    n小且总体标准差σ未知时 ,可应用 t检验 ,但要求样本来自正态分布总体。两样本均数比较时还要求两总体方差相等。 
    展开全文
  • t检验和u检验的差别

    千次阅读 2020-12-07 16:29:31
    t检验的分类: t检验的应用条件: (1)方差未知并且样本量比较小 (2)样本来自于正态总体分布,两样本均数比较要求总体方差相等 (3)独立性

    t检验的分类:
    在这里插入图片描述
    t检验的应用条件:
    (1)方差未知并且样本量比较小
    (2)样本来自于正态总体分布,两样本均数比较要求总体方差相等
    (3)独立性

    在这里插入图片描述

    展开全文
  • U 检验

    2021-04-13 23:53:11
    假设检验![思维导图](https://img-blog.csdnimg.cn/2021041311142098.jpeg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,...t_70#pic_center '文章思维导图')U 检验单总体应用条件Technical Not.


    U 检验也叫 Z 检验,指检验统计量服从方差已知的正态分布的假设检验。



    思维导图内容

    单样本 U 检验

    U 检验也叫 Z 检验,定义为:检验的检验统计量 Z 由:
    Z = n ( X ˉ − μ 0 ) σ Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma} Z=σn (Xˉμ0)
    求出,其中 n n n 为样本容量, μ 0 \mu_0 μ0 是通过假设知晓的常数, σ \sigma σ 为总体的标准差。

    且满足如下条件:
    服从正态分布 ⏟ 中心极限定理   +   且 分 布 的 σ 已知 ⏟ 有精准估计 \underbrace{\text{服从正态分布}}_{\text{中心极限定理}}~+~ \underbrace{且分布的 \sigma \text{已知}}_{\text{有精准估计}} 中心极限定理 服从正态分布 + 有精准估计 σ已知
    U 检验一般用于:位置参数(location parameter)检验,例如总体的均值

    中心极限定理
    多个样本和的标准化,在 n → ∞ n\to\infin n 的情况下服从正态分布。一般的,当 n > 30 n>30 n>30 时,可以视为正态分布,采用 U 检验
    有精确估计:
    很多情况下 σ \sigma σ 本质上都是测量而来,是一种精确的估计。因此,若 σ \sigma σ 未知,若能够保证精确度,也可以用估计值,样本标准差 S S S 代替。一般需要 n > 50 n>50 n>50

    返回目录

    应用条件

    根据定义

    前提    :       样 本 i . i . d , 且 分 布 等 于 总 体 分 布 1.    Z 服 从 正 态 分 布 , 且 分 布 的 σ 已 知 或    : 2.    样 本 容 量 n > 30 , 且 分 布 σ 已 知 或    : 3.    样 本 容 量 n > 50 \begin{aligned} && &\textbf{前提}~~:\\ && &~~~~~ 样本 i.i.d, 且分布等于总体分布\\ \\ && &1.~~ Z服从正态分布,且分布的 \sigma已知 \\ && &\textbf{或}~~:\\ && &2.~~ 样本容量 n>30,且分布\sigma已知 \\ && &\textbf{或}~~:\\ && &3.~~ 样本容量 n>50 \\ \end{aligned} 前提  :     i.i.d1.  Zσ  :2.  n>30σ  :3.  n>50

    返回目录

    应用过程

    设总体 X 服从正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) μ \mu μ 未知, σ \sigma σ 已知。现从总体中抽出 n n n i . i . d i.i.d i.i.d 的样品 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn,共同的分布为总体分布。

    验证假设:
    1 ∘ : H 0 : μ = μ 0      H 1 : μ ≠ μ 0 1^{\circ}:H_0:\mu=\mu_0~~~~H_1:\mu\neq\mu_0 1:H0:μ=μ0    H1:μ=μ0
    2 ∘ : H 0 : μ ≤ μ 0      H 1 : μ > μ 0 2^{\circ}:H_0:\mu\leq\mu_0~~~~H_1:\mu>\mu_0 2:H0:μμ0    H1:μ>μ0
    3 ∘ : H 0 : μ ≥ μ 0      H 1 : μ < μ 0 3^{\circ}:H_0:\mu\geq\mu_0~~~~H_1:\mu<\mu_0 3:H0:μμ0    H1:μ<μ0

    对于第一种假设,原假设取值为一个点,备选假设取值为两边,这类假设对应的检验,也叫双边检验。根据定义,检验统计量为:
    Z = n ( X ˉ − μ 0 ) σ Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma} Z=σn (Xˉμ0)
    根据样本的性质,可知 X ˉ ∼ N ( μ , σ 2 n ) \bar{X}\sim N(\mu,\frac{\sigma^2}{n}) XˉN(μ,nσ2) ,于是 Z ∼ N ( n ( μ − μ 0 ) σ , 1 ) Z\sim N(\frac{\sqrt{n}(\mu-\mu_0)}{\sigma},1) ZN(σn (μμ0),1)

    根据假设检验的一般步骤
    给 定 显 著 水 平 α , ∵ ∣ Z ∣ ↑ , H 0 越 难 成 立 , ⇓ 令 : P { ∣ Z = n ( X ˉ − μ 0 ) σ ∣ > C ∣ H 0 } ≤ α 在 原 假 设 和 成 立 时 , X ˉ ∼ N ( μ 0 , σ 2 / n ) , Z ∼ N ( 0 , 1 ) ⇓ C = u α / 2 , u 1 − α / 2 ⇓ 求 得 拒 绝 域 为 Z ∈ ( − ∞ , u α / 2 ) ∪ ( u 1 − α / 2 , + ∞ ) 给定显著水平 \alpha,\because |Z|\uarr ,H_0 越难成立,\\ \Darr \\ 令:P\{\vert Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma}\vert>C|H_0\}\leq \alpha \\ \\ 在原假设和成立时,\bar{X}\sim N(\mu_0,\sigma^2/n),Z\sim N(0,1)\\ \Darr\\ C=u_{\alpha/2},u_{1-\alpha/2}\\ \Darr\\ 求得拒绝域为 Z\in(-\infin,u_{\alpha/2})\cup(u_{1-\alpha/2},+\infin) αZ,H0P{Z=σn (Xˉμ0)>CH0}αXˉN(μ0,σ2/n)ZN(0,1)C=uα/2,u1α/2Z(,uα/2)(u1α/2,+)
    故只要求出检验统计量的观察值,根据拒绝域做出判断即可。

    注意,检验是否属于双边,不是由拒绝域是否双边决定的,而是由假设决定,下文读者将会体会到其中的差异。

    返回目录

    根据定义,检验统计量为:
    Z = n ( X ˉ − μ 0 ) σ Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma} Z=σn (Xˉμ0)
    根据假设检验的一般步骤
    给 定 显 著 水 平 α , ∵ Z ↑ , H 0 越 难 成 立 , ⇓ 令 : P { Z = n ( X ˉ − μ 0 ) σ > C ∣ H 0 } ≤ α   P { n ( X ˉ − μ 0 ) σ > C ∣ μ ≤ μ 0 } ≤ α ⇓ P { n ( X ˉ − μ ) σ > C + n ( μ 0 − μ ) σ ∣ μ ≤ μ 0 } ⇓ ∵ n ( μ 0 − μ ) σ 随 着 μ ↑ 单 调 递 增   ∴ μ = μ 0 时 , P { n ( X ˉ − μ ) σ > C + n ( μ 0 − μ ) σ } 最 大 ⇓ 此 时 n ( X ˉ − μ ) σ ∼ N ( 0 , 1 ) ⇓ C = u 1 − α ⇓ 求 得 拒 绝 域 为 Z ∈ ( u 1 − α , + ∞ ) 给定显著水平 \alpha,\because Z\uarr,H_0 越难成立,\\ \Darr \\ 令:P\{ Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma}>C|H_0\}\leq \alpha \\ ~\\ P\{\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma}>C|\mu\leq\mu_0\}\leq \alpha \\ \Darr \\ P\{\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma}>C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}|\mu\leq\mu_0\}\\ \Darr\\ \because\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}随着\mu\uarr 单调递增\\ ~\\ \therefore \mu=\mu_0时,P\{\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma}>C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}\}最大\\ \Darr\\ 此时\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \sim N(0,1)\\ \Darr\\ C=u_{1-\alpha}\\ \Darr\\ 求得拒绝域为 Z\in(u_{1-\alpha},+\infin) αZ,H0P{Z=σn (Xˉμ0)>CH0}α P{σn (Xˉμ0)>Cμμ0}αP{σn (Xˉμ)>C+σn (μ0μ)μμ0}σn (μ0μ)μ μ=μ0P{σn (Xˉμ)>C+σn (μ0μ)}σn (Xˉμ)N(0,1)C=u1αZ(u1α,+)
    对于这类假设为单边,也称为单边(one-tailed)检验。单边检验的显著水平 α \alpha α,是对每个 μ \mu μ 都成立的上确界。而相反的,双边检验的原假设,往往对应一个值。

    返回目录

    根据定义,检验统计量为:
    Z = n ( X ˉ − μ 0 ) σ Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma} Z=σn (Xˉμ0)
    根据假设检验的一般步骤
    给 定 显 著 水 平 α , ∵ Z ↓ , H 0 越 难 成 立 , ⇓ 令 : P { Z = n ( X ˉ − μ 0 ) σ < C ∣ H 0 } ≤ α   P { n ( X ˉ − μ 0 ) σ < C ∣ μ ≥ μ 0 } ≤ α ⇓ P { n ( X ˉ − μ ) σ < C + n ( μ 0 − μ ) σ ∣ μ ≤ μ 0 } ⇓ ∵ n ( μ 0 − μ ) σ 随 着 μ ↑ 单 调 ↓   ∴ μ = μ 0 时 , P { n ( X ˉ − μ ) σ < C + n ( μ 0 − μ ) σ } 最 大 ⇓ 此 时 n ( X ˉ − μ ) σ ∼ N ( 0 , 1 ) ⇓ C = u α ⇓ 求 得 拒 绝 域 为 Z ∈ ( − ∞ , u α ) 给定显著水平 \alpha,\because Z\darr,H_0 越难成立,\\ \Darr \\ 令:P\{ Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma}<C|H_0\}\leq \alpha \\ ~\\ P\{\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma}<C|\mu\geq\mu_0\}\leq \alpha \\ \Darr \\ P\{\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma}<C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}|\mu\leq\mu_0\}\\ \Darr\\ \because\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}随着\mu\uarr单调\darr\\ ~\\ \therefore \mu=\mu_0时,P\{\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma}<C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}\}最大\\ \Darr\\ 此时\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \sim N(0,1)\\ \Darr\\ C=u_{\alpha}\\ \Darr\\ 求得拒绝域为 Z\in(-\infin,u_\alpha) αZ,H0P{Z=σn (Xˉμ0)<CH0}α P{σn (Xˉμ0)<Cμμ0}αP{σn (Xˉμ)<C+σn (μ0μ)μμ0}σn (μ0μ)μ μ=μ0P{σn (Xˉμ)<C+σn (μ0μ)}σn (Xˉμ)N(0,1)C=uαZ(,uα)

    返回目录

    实验设计

    在进行采样时,通常需要事前确定 n n n

    为例,给定显著水平 α \alpha α ∵ Z ↑ , H 0 \because Z\uarr,H_0 Z,H0 越难成立, ∴ \therefore 设定检验标准(拒绝)为: Z > C Z>C Z>C

    定义势函数为:
    p ( μ ) = P { Z > C ∣ μ ∈ ( − ∞ , ∞ ) } = P { n ( X ˉ − μ ) σ ≥ C + n ( μ 0 − μ ) σ ∣ μ ∈ ( − ∞ , ∞ ) } ∵    n ( X ˉ − μ ) σ ∼ N ( 0 , 1 ) = 1 − Φ ( C + n ( μ 0 − μ ) σ ) \begin{aligned} p(\mu)&=P\{ Z > C| \mu\in(-\infin,\infin)\} \\ &= P\{ \frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \geq C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}| \mu\in(-\infin,\infin)\} \\ \because ~~&\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \sim N(0,1)\\ &=1-\Phi(C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) \end{aligned} p(μ)  =P{Z>Cμ(,)}=P{σn (Xˉμ)C+σn (μ0μ)μ(,)}σn (Xˉμ)N(0,1)=1Φ(C+σn (μ0μ))
    α \alpha α,则根据检验标准的临界值求取法则,有:
    s u p μ { 1 − Φ ( C + n ( μ 0 − μ ) σ ) ∣ μ ∈ ( − ∞ , μ 0 ) } < = α \underset{\mu}{sup} \{1-\Phi(C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma})|\mu\in(-\infin,\mu_0)\} <= \alpha μsup{1Φ(C+σn (μ0μ))μ(,μ0)}<=α
    最后得到检验标准的临界值 C = u 1 − α C=u_{1-\alpha} C=u1α

    回代入势函数,可得:
    p ( μ ) = 1 − Φ ( u 1 − α + n ( μ 0 − μ ) σ ) p(\mu) = 1-\Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) p(μ)=1Φ(u1α+σn (μ0μ))
    其中有两个重要的性质:

    1. 势函数是 n ( μ 0 − μ ) σ \frac{\sqrt{n}(\mu_0-\mu)}{\sigma} σn (μ0μ) 的函数,且是连续的、非减的。
    2. l i m μ → μ 0 Φ ( u 1 − α + n ( μ 0 − μ ) σ ) = α l i m μ → + ∞ Φ ( u 1 − α + n ( μ 0 − μ ) σ ) = 1 \underset{\mu\to\mu_0}{lim} \Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma})=\alpha\\ \underset{\mu\to+\infin}{lim} \Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma})=1 μμ0limΦ(u1α+σn (μ0μ))=αμ+limΦ(u1α+σn (μ0μ))=1

    设无差别区域为 μ ∈ ( μ 0 , Δ ) \mu\in(\mu_0,\Delta) μ(μ0,Δ),则对于 [ Δ , + ∞ ] [\Delta,+\infin] [Δ,+],给定一个 β \beta β,使得 p ( μ ) ≥ 1 − β p(\mu)\geq1-\beta p(μ)1β。由于势函数是非减的,故问题转换为临界问题:
    p ( μ ) = 1 − Φ ( u 1 − α + n ( μ 0 − μ ) σ ) = 1 − β Φ ( u 1 − α + n ( μ 0 − μ ) σ ) = β \begin{aligned} p(\mu) = 1- \Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) = 1-\beta \\ \Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) = \beta \end{aligned} p(μ)=1Φ(u1α+σn (μ0μ))=1βΦ(u1α+σn (μ0μ))=β
    从而得出适当的 n , σ n, \sigma n,σ ,前者对应采样容量,后者是在测量问题上,可考虑提高测量精度。

    其中, β \beta β 是当备选假设成立时,原假设被错误地接受的概率的临界值。

    通过 β , α , Δ \beta,\alpha, \Delta β,α,Δ,即可知道我们进行试验设计,得出适当的 n n n

    返回目录

    双样本 U 检验

    双样本 U 检验的检验统计量为:
    Z = X 1 ˉ − X 2 ˉ − d 0 σ 1 2 n 1 + σ 2 2 n 2 Z=\frac{\bar{X_1}-\bar{X_2}-d_0} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} Z=n1σ12+n2σ22 X1ˉX2ˉd0
    其中 X 1 ˉ , X 2 ˉ \bar{X_1},\bar{X_2} X1ˉ,X2ˉ 为总体 X 1 , X 2 X_1,X_2 X1,X2样本均值, d 0 d_0 d0 是根据假设得出的已知常数, n 1 , n 2 n_1,n_2 n1,n2 分别为总体 X 1 , X 2 X_1,X_2 X1,X2 的样本容量, σ 1 , σ 2 \sigma_1,\sigma_2 σ1,σ2 为总体的方差。

    单样本 U 检验,其应用条件亦需要 Z 服从正态分布,且分布的方差已知。当然,在大样本情况下,亦可以将 Z 视为正态分布,并用样本方差估计 σ \sigma σ

    返回目录

    应用条件

    应用条件

    应用过程

    设总体 X 1 , X 2 X_1,X_2 X1,X2 服从正态分布 N ( μ 1 , σ 1 2 ) , N ( μ 2 , σ 2 2 ) N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2) N(μ1,σ12),N(μ2,σ22) μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2 未知, σ 1 , σ 2 \sigma_1,\sigma_2 σ1,σ2 已知。现从总体中抽出 n n n 个独立同分布的样品 X 1 ( 1 ) , X 2 ( 1 ) , ⋯   , X n ( 1 ) ; X 1 ( 2 ) , X 2 ( 2 ) , ⋯   , X n ( 2 ) X_1^{(1)},X_2^{(1)},\cdots,X_n^{(1)};X_1^{(2)},X_2^{(2)},\cdots,X_n^{(2)} X1(1),X2(1),,Xn(1)X1(2),X2(2),,Xn(2)

    验证假设
    1 ∘ : H 0 : μ 1 − μ 2 = d      H 1 : μ 1 − μ 2 ≠ d 1^{\circ}:H_0:\mu_1-\mu_2=d~~~~H_1:\mu_1-\mu_2\neq d 1:H0:μ1μ2=d    H1:μ1μ2=d
    2 ∘ : H 0 : μ 1 − μ 2 ≤ d      H 1 : μ 1 − μ 2 > d 2^{\circ}:H_0:\mu_1-\mu_2\leq d~~~~H_1:\mu_1-\mu_2>d 2:H0:μ1μ2d    H1:μ1μ2>d
    3 ∘ : H 0 : μ 1 − μ 2 ≥ d      H 1 : μ 1 − μ 2 < d 3^{\circ}:H_0:\mu_1-\mu_2\geq d~~~~H_1:\mu_1-\mu_2<d 3:H0:μ1μ2d    H1:μ1μ2<d

    对于第一种假设,原假设取值为一个点,备选假设取值为两边。根据定义,检验统计量为:
    Z = X 1 ˉ − X 2 ˉ − d 0 σ 1 2 n 1 + σ 2 2 n 2 Z=\frac{\bar{X_1}-\bar{X_2}-d_0} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} Z=n1σ12+n2σ22 X1ˉX2ˉd0
    根据样本的性质,可知 X 1 ˉ − X 2 ˉ ∼ N ( μ 1 − μ 2 , σ 1 2 n 1 + σ 2 2 n 2 ) \bar{X_1}-\bar{X_2} \sim N(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}) X1ˉX2ˉN(μ1μ2,n1σ12+n2σ22) ,于是 Z ∼ N ( ( μ 1 − μ 2 − d 0 ) σ 1 2 n 1 + σ 2 2 n 2 , 1 ) Z\sim N\lparen\frac{(\mu_1-\mu_2-d_0)} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}},1\rparen ZN(n1σ12+n2σ22 (μ1μ2d0),1)

    根据假设检验的一般步骤(补充):
    给 定 显 著 水 平 α , ∵ ∣ Z ∣ ↑ , H 0 越 难 成 立 , ⇓ 令 : P { ∣ Z ∣ > C ∣ H 0 } ≤ α 在 原 假 设 和 成 立 时 , X 1 ˉ − X 2 ˉ ∼ N ( d 0 , σ 1 2 n 1 + σ 2 2 n 2 ) , Z ∼ N ( 0 , 1 ) ⇓ C = u α / 2 , u 1 − α / 2 ⇓ 求 得 拒 绝 域 为 Z ∈ ( − ∞ , u α / 2 ) ∪ ( u 1 − α / 2 , + ∞ ) 给定显著水平 \alpha,\because |Z|\uarr ,H_0 越难成立,\\ \Darr \\ 令:P\{\vert Z\vert>C|H_0\}\leq \alpha \\ 在原假设和成立时, \bar{X_1}-\bar{X_2} \sim N(d_0,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}),Z\sim N(0,1)\\ \Darr\\ C=u_{\alpha/2},u_{1-\alpha/2}\\ \Darr\\ 求得拒绝域为 Z\in(-\infin,u_{\alpha/2})\cup(u_{1-\alpha/2},+\infin) αZ,H0P{Z>CH0}αX1ˉX2ˉN(d0,n1σ12+n2σ22)ZN(0,1)C=uα/2,u1α/2Z(,uα/2)(u1α/2,+)
    故只要求出检验统计量的观察值,根据拒绝域做出判断即可。

    对比单边检验,可以看到临界值 C C C 是相同的,以 d 0 = 0 d_0=0 d0=0 为例:

    双边检验

    返回目录

    给 定 显 著 水 平 α , ∵ Z ↑ , H 0 越 难 成 立 , ⇓ 令 : P { Z > C ∣ H 0 } ≤ α   P { X 1 ˉ − X 2 ˉ − d 0 σ 1 2 n 1 + σ 2 2 n 2 > C ∣ d ≤ d 0 } ≤ α ⇓ P { X 1 ˉ − X 2 ˉ − d σ 1 2 n 1 + σ 2 2 n 2 > C + d 0 − d σ 1 2 n 1 + σ 2 2 n 2 ∣ d ≤ d 0 } ⇓ ∵ d 0 − d σ 1 2 n 1 + σ 2 2 n 2 随 着 d ↑ 单 调 递 增   ∴ d = d 0 时 , P { X 1 ˉ − X 2 ˉ − d σ 1 2 n 1 + σ 2 2 n 2 > C + d 0 − d σ 1 2 n 1 + σ 2 2 n 2 ∣ d ≤ d 0 } 最 大 ⇓ 此 时 X 1 ˉ − X 2 ˉ − d σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) ⇓ C = u 1 − α ⇓ 求 得 拒 绝 域 为 Z ∈ ( u 1 − α , + ∞ ) 给定显著水平 \alpha,\because Z\uarr,H_0 越难成立,\\ \Darr \\ 令:P\{ Z>C|H_0\}\leq \alpha \\ ~\\ P\{\frac{\bar{X_1}-\bar{X_2}-d_0} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}>C|d\leq d_0\}\leq \alpha \\ \Darr \\ P\{\frac{\bar{X_1}-\bar{X_2}-d} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}>C+\frac{d_0-d}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}|d\leq d_0\}\\ \Darr\\ \because \frac{d_0-d}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}随着d\uarr 单调递增\\ ~\\ \therefore d=d_0时, P\{\frac{\bar{X_1}-\bar{X_2}-d} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}>C+\frac{d_0-d}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}|d\leq d_0\}最大\\ \Darr\\ 此时\frac{\bar{X_1}-\bar{X_2}-d} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim N(0,1)\\ \Darr\\ C=u_{1-\alpha}\\ \Darr\\ 求得拒绝域为 Z\in(u_{1-\alpha},+\infin) αZ,H0P{Z>CH0}α P{n1σ12+n2σ22 X1ˉX2ˉd0>Cdd0}αP{n1σ12+n2σ22 X1ˉX2ˉd>C+n1σ12+n2σ22 d0ddd0}n1σ12+n2σ22 d0dd d=d0P{n1σ12+n2σ22 X1ˉX2ˉd>C+n1σ12+n2σ22 d0ddd0}n1σ12+n2σ22 X1ˉX2ˉdN(0,1)C=u1αZ(u1α,+)

    返回目录

    同 2°,可以得出拒绝域为: Z ∈ ( − ∞ , u α ) Z\in(-\infin, u_\alpha) Z(,uα)

    在这里插入图片描述
    返回目录

    附录

    中心极限定理

    Lindeberg–Lévy 极限定理:
    X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn 是一组独立同分布的随机变量序列,其中 E ( X i ) = μ , V a r ( X i ) = σ 2 E(X_i)=\mu,Var(X_i)=\sigma^2 E(Xi)=μ,Var(Xi)=σ2,则统计量 n ( X i ˉ − μ ) \sqrt{n}(\bar{X_i}-\mu) n (Xiˉμ) n → ∞ n\to \infin n 时,收敛于正态分布,记为:
    n ( X i ˉ − μ ) → p N ( 0 , σ 2 ) \sqrt{n}(\bar{X_i}-\mu) \xrightarrow{p} N(0,\sigma^2) n (Xiˉμ)p N(0,σ2)
    σ > 0 \sigma>0 σ>0 ,则:
    lim ⁡ n → ∞ P r [ n ( X ˉ n − μ ) ≤ z ] = lim ⁡ n → ∞ P r [ n ( X ˉ n − μ ) σ ≤ z σ ] = Φ ( z σ ) \lim _{n \rightarrow \infty} \mathcal{P} r\left[\sqrt{n}\left(\bar{X}_{n}-\mu\right) \leq z\right]=\lim _{n \rightarrow \infty} \mathcal{P} r\left[\frac{\sqrt{n}\left(\bar{X}_{n}-\mu\right)}{\sigma} \leq \frac{z}{\sigma}\right]=\Phi\left(\frac{z}{\sigma}\right) nlimPr[n (Xˉnμ)z]=nlimPr[σn (Xˉnμ)σz]=Φ(σz)
    其中 Φ ( z σ ) \Phi(\frac{z}{\sigma}) Φ(σz) 是标准正态分布,在取值为 z / σ z/\sigma z/σ 的概率。

    上式告诉我们,在样本容量达到一定数目时,U 检验的检验统计量 Z 是可以视为服从正态分布的。

    不仅如此,实际上,样本均值的标准化,都收敛于正态分布。当标准差大于 0 时,可以用正态分布来估计。

    返回目录

    假设检验一般步骤

    1. 制定原假设、备选假设
    2. 制定检验统计量
    3. 取显著水平 α \alpha α,得出接受域、拒绝域
    4. [取 β \beta β,根据势函数得出 n n n]
    5. 判断检验统计量的观察值,所处的域,决定是否接受原假设

    1. [取 α , β \alpha, \beta α,β,根据势函数得出 n n n]
    2. 根据检验统计量的观察值,求出其 p-值,并据此做出决策

    详见博文:假设检验

    势函数

    势函数是包含了所有检验下,犯第一类错误的概率,和识别备选假设的能力。

    详见博文:假设检验

    返回目录

    Technical Note

    概念含义
    ZZ-test 的检验统计量
    势函数包含了所有检验下,犯第一类错误的概率,和识别备选假设的能力
    位置参数决定分布位置的参数,如正态分布的均值
    i . i . d i.i.d i.i.d独立同分布

    推荐资源

    • 上海市教育委员会,叶慈南,曹伟丽《应用数理统计》,机械工业出版社,2007年1月第一版,第二次印刷(P112~114)
    • 陈希孺 《概率论与数理统计》,中国科学技术大学出版社,2015年8月第一版,第7次印刷(P200~204)
    • 统计王国网站
    • 维基百科——Z检验
    • 统计方案网站

    返回目录

    展开全文
  • u检验、t检验、F检验、卡方检验详细分析

    万次阅读 多人点赞 2019-09-10 17:30:29
    一、正态分布是统计学的基础,它对于各种假设检验极其的重要,t分布,F分布,卡方分布都是基于正态分布衍生出来的,而且中心极限定理也证明了,多数分布在样本量n足够大的情况下,其样本均值服从正态分布。...

    要点:

    一、正态分布是统计学的基础,它对于各种假设检验极其的重要,t分布,F分布,卡方分布都是基于正态分布衍生出来的,而且中心极限定理也证明了,多数分布在样本量n足够大的情况下,其样本均值服从正态分布。

    二、假设检验的步骤

           1 提出假设,包括无效假设H0和备择假设H1。

           2 预设检验水准\alpha,一般设为0.05,概率小于0.05为小概率事件

           3 选定检验方法,检验方法的选定要依据抽样的样本数量等因素进行确定

           4 依据检验方法,确定在H0假设下的发生概率,如果小于0.05,则证明,H0假设为小概率事件,就可以拒绝H0

    三、假设检验的实质是否定,是为了否定H0。


    一、u检验(总体均值,总体方差已知的情况下使用)

           u检验,又称为z检验,是基于正态分布的检验。举个简单的例子:

     一台机器生成某种金属球,直径服从正态分布N(10,0.04)。抽取100个样本后,发现样本的均值为9.8cm,请问该机器生产的产品直径的均值是否为10cm。在0.05的显著性水平下

    1、H0:u_{0}=10cm   H1:u_{0}\neq 10cm

    2、取\alpha=0.05

    3、样本量为100,所以这里选择u检验(为什么会选择u检验,而不选择t检验?在总体方差已经知道的情况下,不管样本数量多少都可以选择u检验。而如果总体方差未知,且样本数量小于40,则应该选择t检验。那么如果总体方差未知,但是样本数量超过40了,则u检验和t检验都可以使用,因为样本量大的情况下,t分布趋向于正态分布

    4、计算

    u=\frac{9.8-10}{0.2/\sqrt{100}}=-10

    可以发现这里是双边检验,所以查u_{0.025}=1.96。所以拒绝H0

    二、t检验(总体均值已经知道,但总体方差未知,只知道样本的方差)

      (一)、单总体t检验

     一台机器生成某种金属球,直径服从正态分布。抽取16个样本后,发现样本的均值为9.8cm,方差为0.04,请问该机器生产的产品直径的均值是否为10cm。在0.05的显著性水平下

    1、H0:u_{0}=10cm   H1:u_{0}\neq 10cm

    2、取\alpha=0.05

    3、总体方差未知,样本量为16,所以这里选择t检验(如果样本数量较大,比如超过40,亦可以选择u检验)

    4、计算

    t=\frac{9.8-10}{0.2/\sqrt{16}}=-4

    t_{0.025}(15)=2.49,所以拒绝H0

     (二)、两总体t检验(这两个总体的方差齐,且服从正态分布)

    两台机器A,B生产某种金属球,从A生产的产品中取16件,发现其均值为9.8cm,方差为0.04,从B生产的产品中取9件,发现其均值为9.7cm,方差为0.015,是否可以认定A,B产品的直径有显著性差异,在0.05的显著性水平下。

    1、H0:\mu _{A} =\mu_{B}   H1:\mu _{A} \neq \mu_{B}

    2、取\alpha=0.05

    3、判断两个总体的均值是否有显著性差异,要用t检验

    4、计算

    t=\frac{9.8-9.7}{\sqrt{\frac{0.04}{16}+\frac{0.015}{9}}}=1.5506

    t_{0.025}(16+9-2)=2.3978,所以接受H0。

    三、卡方检验(总体均值未知,单个正态总体的卡方检验,卡方检验的目标是为了检验样本的总体是否符合某种分布)

    一台机器生成某种金属球,直径服从正态分布。抽取16个样本后,发现样本的均值为9.8cm,方差为0.04,请问该机器生产的金属球的直径的方差是否为0.02。

    1、H0:\sigma ^{2}=0.02   H1:\sigma ^{2}\neq 0.02

    2、取\alpha=0.05

    3、总体均值未知,样本量为16,所以这里选择卡方检验

    4、计算

    \chi ^{2}=\frac{(n-1)s^{2}}{\sigma ^{2}}=\frac{(16-1)*0.04^{2}}{0.02 ^{2}}=60

    \chi ^{2}_{0.05}(15)=24.995,所以拒绝H0,说明金属球的直径不符合方差为0.02的正态分布。

    注:卡方检验还有另一种计算方式为

    \sum_{i}^{n}\frac{A_{i}-np_{i}}{np_{i}}

    四、F检验(总体均值未知,两个正态总体的F检验,F检验的目标是为了检验两个样本的总体的方差是否相同,t检验中的方差齐是可以用F检验来进行检验的)

    两台机器A,B生产某种金属球,从A生产的产品中取10件,发现其方差为0.02,从B生产的产品中取10件,发现其方差为0.015,是否可以认定A,B产品的方差相等,在0.05的显著性水平下。

    1、H0:\sigma_{A} ^{2}=\sigma_{B} ^{2}   H1:\sigma_{A} ^{2}\neq \sigma_{B} ^{2}

    2、取\alpha=0.05

    3、判断两个总体的方差是否齐,要用F检验

    4、计算

    F=\frac{\frac{1}{n}\sum_{i}^{n}X_{i}^{2}}{\frac{1}{m}\sum_{j}^{m}X_{j}^{2}}=\frac{D_{i}}{D_{j}}

    将数据带入得到F=1.333,查F_{0.05}(10,10)=2.978,所以接受H0,说明在0.05的显著性水平下可以认为方差相等。

    展开全文
  • 卡方检验,U检验,t检验,F检验

    千次阅读 2019-08-17 16:08:27
    卡方检验:主要用于等级资料 。 t检验:适用于计量资料、正态分布、方差...U检验:检验应用条件与t检验基本一致,只是当大样本时用U检验,而小样本时则用t检验,t 检验可以代替U检验。t检验就是统计量为t,u的假...
  • 基于构造 U统计量提出了检验对称随机变量分布对称中心的一种新的检验统计量,获得了该检验统计量在原假设与备择假设下的极限分布,并用Bootstrap方法来获得检验拒绝域的临界值,对几类重要对称分布下该检验统计量的检验...
  • 假设检验-U检验、T检验、卡方检验、F检验

    万次阅读 多人点赞 2019-06-20 16:47:41
    假设检验的基本思想是小概率反证法思想,小概率思想认为小概率事件在一次试验中基本上不可能发生,在这个方法下,我们首先对总体作出一个假设,这个假设大概率会成立,如果在一次试验中,试验结果原假设相背离,也...
  • 正态分布方法判别,独立样本T检验及Mann-Whitney U 检验操作正态性校验数据整体是否符合正态分布SPSS中的操作步骤某分组上是否符合正态分布SPSS中的操作步骤独立样本t检验SPSS中的操作步骤Mann-Whitney U 检验SPSS中...
  • python曼·惠特尼U检验(Mann-Whitney U Test) 两独立样本t检验要求数据服从正态分布,且两组样本数据的方差齐次。如果数据不满足正态分布又该怎么办呢? 首先强调一点,独立样本t检验对正态分布的要求有...
  • u检验粗浅理解

    2019-04-01 10:31:00
    u检验的定义: 已知从正态母体N(u,σ2)中抽得容量为n的子样,求得子样的均值x,而且假设母体的方差σ2 为已知值,那么可利用统计量 u = (x -μ) / (σ / √n) ~ N(0,1) 检验母体期望μ是否与某一常数相符进行检....
  • 【—–总体标准差已知时的单个正态总体均值的U检验——】(1)分析:建立如下假设 (2)matlab进行检验:% 调用ztest函数作总体均值的双侧检验, % 返回变量h,检验的p值,均值的置信区间muci,检验统计量的观测值...
  • MannWhitney U-test 曼-惠特尼U检验 ...参考曼-惠特尼U检验与威尔科克森符号秩检验是最常用的两独立样本非参数检验方法,无需对总体分布做出假定,可以用来比较两组分布未知的样品差异。Mann–Whitney U-test (曼-惠特
  • 曼-惠特尼U检验Mann–Whitney U Test

    千次阅读 2017-05-14 11:57:00
    曼-惠特尼U检验Mann–Whitney Test 两个独立样本,均匀分布,非正太分布 两组样本量必须大于20   例子:A方案治疗B方案治疗是否有显著差异?a=0.05  此例子简单说明计算过程,但不准确,因为样本数...
  • 曼-惠特尼U检验

    千次阅读 2016-01-15 15:46:58
    曼-惠特尼U检验又称“曼-惠特尼秩检验”,是由H.B.MannD.R.Whitney于1947年提出的。它假设两个样本分别来自除了总体均值以外完全相同的两个总体,目的是检验这两个总体的均值是否有显著的差别。 一.定义 曼-...
  • 曼-惠特尼U检验(Mann-Whitney检验) How the Mann-Whitney test works Mann-Whitney检验又叫做秩检验,是比较没有配对的两个独立样本的非参数检验。思想是这样的:假定要检验两组数据之间有没有差异。...
  • 对于8个单细胞转录组数据集,...统计上述8个数据集的ARINMI均值,作为NMISE聚类的性能评估,但均值可能是随机采样导致的结果更优,如果要严格说明需进行统计学分析,如Mann-Whitney U等统计方法,如果得到pval...
  • Mann-Whitney 秩和检验,也被称为 Mann-Whitney-U 检验。在笔者另一篇博客 ( https://blog.csdn.net/Raider_zreo/article/details/101380293 ) 中已经对 Wilcoxon 秩和检验有过介绍,事实上,Wilcoxon 统计量与 Mann...
  • MySQL命令大全

    2018-01-15 11:19:17
    mysqldump -u 用名 -p –default-character-set=latin1 数据库名 > 导出的文件名(数据库默认编码是latin1) mysqldump -u wcnc -p smgp_apps_wcnc > wcnc.sql 2.导出一个表 mysqldump -u 用户名 -p 数据库名 表名...
  • 示例:[SW, SF] = swft(x_list, names, 1) 输入参数: 1) x_list - 要测试的数据的数值或单元矩阵。 行是观察。 列被视为自变量。... swft 函数计算正态分布的 Shapiro-Wilk Shapiro-Francia 检
  • 使用python实现正态分布检验

    千次阅读 2019-08-12 07:27:35
    本次的正态分布检验的数据描述为What’s Normal? – Temperature, Gender, and Heart Rate中的数据,其中数据源中包含体温、性别心率三个数据。这次我们选择文章中的一个问题来实现,即样本的中的体温是否符合正态...
  • u检验和t检验

    2008-10-25 22:12:00
    u检验和t检验 u检验和t检验可用于样本均数与总体均数的比较以及两样本均数的比较。理论上要求样本来自正态分布总体。但在实用时,只要样本例数n较大,或n小但总体标准差σ已知时,就可应用u检验;n小且总体标准差σ...
  • 数据分析之正态分布检验及python实现

    万次阅读 多人点赞 2019-02-22 10:30:54
    正态分布(Normal distribution),...拉普拉斯高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。  正态曲线呈钟型,两头低,中间高,左右对称因...
  • 但是,当样本分布非正态,且经过一定的数值转换尝试后,仍然无法满足正态性要求时,两独立样本的Wilcoxon秩和检验成为备选方法,它将两独立样本组的非正态样本值进行比较。它是一种非参数样本检验,基于样本的秩次...
  • 原文地址:U 秩和检验)" style="text-decoration:none; color:rgb(6,65,131)">SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney U 秩和检验)作者:王江源 一、概述  Mann-Whitney U 检验是用得最...
  • 根据总体分布(T分布或者Z分布规定的置信度计算总体均值在指定置信度下的置信区间,然后将实验值置信区间比较,若在置信区间之外(小概率事件发生)则表示实验统计量总体统计量存在显著差异 1.1 总体方差...
  • Python检验样本是否服从正态分布

    千次阅读 2020-09-06 16:41:10
    在进行t检验、F检验之前,我们往往要求样本大致服从正态分布,下面介绍两种检验样本是否服从正态分布的方法。 1 可视化 我们可以通过将样本可视化,看一下样本的概率密度是否是正态分布来初步判断样本是否服从正态...
  • 常见分布与假设检验

    2020-06-27 21:04:04
    描述随机变量分布律/分布情况的方法:离散型随机变量使用概率质量函数(PMF),如二项分布、泊松分布;连续性随机变量使用概率密度函数(PDF),如均匀分布、正态分布、指数分布。 对于连续性随机变量,我们通常还会...
  • 这次借着在Datawhale组织的概率统计专题学习的机会再重新温习一遍数学基础,所谓机器学习深度学习, 背后的逻辑都是数学, 所以数学基础在这个领域非常关键, 而统计学又是重中之重, 机器学习从某种意义上来说...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 12,759
精华内容 5,103
关键字:

u检验和u分布