精华内容
下载资源
问答
  • 本文系统地讨论多元正态分布中均值的假设检验问题。

    七、均值的假设检验

    1.单总体均值向量假设检验

    本节探讨单个 p p p元正态总体 N p ( μ , Σ ) N_p(\mu,\Sigma) Np(μ,Σ)的均值假设检验问题,可以具体地细分为 Σ \Sigma Σ已知和 Σ \Sigma Σ未知的情形,当然,生活中大多的正态总体是 Σ \Sigma Σ未知的。我们需要检验的问题是: H 0 : μ = μ 0 ⇔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0\Leftrightarrow H_1:\mu\ne \mu_0 H0:μ=μ0H1:μ=μ0

    Σ = Σ 0 \Sigma=\Sigma_0 Σ=Σ0时,有 X ˉ ∼ N p ( μ , Σ 0 / n ) \bar X\sim N_p(\mu,\Sigma_0/n) XˉNp(μ,Σ0/n),所以 n ( X ˉ − μ ) ∼ N p ( 0 , Σ ) \sqrt n(\bar X-\mu)\sim N_p(0,\Sigma) n (Xˉμ)Np(0,Σ),故
    T 0 2 = n ( X ˉ − μ 0 ) ′ Σ − 1 ( X ˉ − μ 0 ) ∼ H 0 χ 2 ( p ) . T_0^2=n(\bar X-\mu_0)'\Sigma^{-1} (\bar X-\mu_0)\stackrel {H_0}\sim \chi^2(p). T02=n(Xˉμ0)Σ1(Xˉμ0)H0χ2(p).
    显然检验的拒绝域是 { T 0 2 > χ α 2 ( p ) } \{T_0^2>\chi^2_\alpha(p)\} {T02>χα2(p)},检验的p-value是 p = P ( T 0 2 ≥ d ) p={\rm P}(T_0^2\ge d) p=P(T02d),这里 d d d T 0 2 T_0^2 T02的观测值。

    Σ \Sigma Σ未知时, X ˉ ∼ N p ( μ , Σ / n ) , A ∼ W p ( n , Σ ) \bar X\sim N_p(\mu,\Sigma/n),A\sim W_p(n,\Sigma) XˉNp(μ,Σ/n),AWp(n,Σ),所以
    T 2 = n ( X ˉ − μ 0 ) ′ S − 1 ( X ˉ − μ 0 ) ∼ H 0 T 2 ( p , n − 1 ) , n − p ( n − 1 ) p T 2 ∼ F ( p , n − p ) . T^2=n(\bar X-\mu_0)'S^{-1}(\bar X-\mu_0)\stackrel {H_0}\sim T^2(p,n-1),\\ \frac{n-p}{(n-1)p}T^2\sim F(p,n-p). T2=n(Xˉμ0)S1(Xˉμ0)H0T2(p,n1),(n1)pnpT2F(p,np).
    于是检验的拒绝域是 { T 2 > ( n − 1 ) p n − p F α } \{T^2>\frac{(n-1)p}{n-p}F_\alpha \} {T2>np(n1)pFα}

    如果在此基础上要检验的问题改为 μ \mu μ服从某种线性约束,就可以将检验问题改为 H 0 : C μ = r H_0:C\mu=r H0:Cμ=r,这里 C C C是一个 k × p k\times p k×p矩阵,秩为 k < p k<p k<p。此时对所有的样本做线性变换 Y ( α ) = C X ( α ) Y_{(\alpha)}=CX_{(\alpha)} Y(α)=CX(α),这样 Y ˉ = C X ˉ ∼ N p ( C μ , C Σ C ′ n ) , A y ∼ W p ( n , C Σ C ′ ) \bar Y=C\bar X\sim N_p(C\mu,\frac{C\Sigma C'}n),A_y\sim W_p(n,C\Sigma C') Yˉ=CXˉNp(Cμ,nCΣC),AyWp(n,CΣC),于是
    T 2 = n ( Y ˉ − r ) ′ S y − 1 ( Y ˉ − r ) ∼ H 0 T 2 ( k , n − 1 ) . T^2=n(\bar Y-r)'S_y^{-1}(\bar Y-r)\stackrel {H_0}\sim T^2(k,n-1). T2=n(Yˉr)Sy1(Yˉr)H0T2(k,n1).
    类似地拒绝域是 { T 2 > ( n − 1 ) k n − k F α } \{T^2>\frac{(n-1)k}{n-k}F_\alpha\} {T2>nk(n1)kFα}

    2.双总体均值向量的假设检验

    在多总体的情况下,类似一元总体,比较简单的是两个总体有相同自协方差矩阵的情形,而如果两个总体自协方差矩阵不同,则会更麻烦。设 X ( α ) ∼ N p ( μ ( 1 ) , Σ ) , Y ( α ) ∼ N p ( μ ( 2 ) , Σ ) X_{(\alpha)}\sim N_p(\mu^{(1)},\Sigma),Y_{(\alpha)}\sim N_p(\mu^{(2)},\Sigma) X(α)Np(μ(1),Σ),Y(α)Np(μ(2),Σ),样本容量分别为 n , m n,m n,m,检验的问题是 H 0 : μ ( 1 ) = μ ( 2 ) ⇔ H 1 : μ ( 1 ) ≠ μ ( 2 ) H_0:\mu^{(1)}=\mu^{(2)}\Leftrightarrow H_1:\mu^{(1)}\ne \mu^{(2)} H0:μ(1)=μ(2)H1:μ(1)=μ(2)

    在一元总体时,检验统计量为
    t = X ˉ − Y ˉ ∑ i = 1 n ( X i − X ˉ ) 2 + ∑ j = 1 n ( Y i − Y ˉ ) 2 n + m − 2 1 n + 1 m ∼ H 0 t ( m + n − 2 ) . t=\frac{\bar X-\bar Y}{\sqrt{\sum_{i=1}^n (X_i-\bar X)^2+\sum_{j=1}^n(Y_i-\bar Y)^2}}\sqrt{\frac{n+m-2}{\frac 1n+\frac 1m}}\stackrel {H_0}\sim t(m+n-2). t=i=1n(XiXˉ)2+j=1n(YiYˉ)2 XˉYˉn1+m1n+m2 H0t(m+n2).
    类似前面的处理,我们化 t t t t 2 t^2 t2,进行如下一元到多元的推广:
    T 2 = n m n + m ( X ˉ − Y ˉ ) ′ ( A 1 + A 2 n + m − 2 ) − 1 ( X ˉ − Y ˉ ) ∼ H 0 T 2 ( p , n + m − 2 ) . T^2=\frac{nm}{n+m}(\bar X-\bar Y)'\left(\frac{A_1+A_2}{n+m-2} \right)^{-1}(\bar X-\bar Y)\stackrel {H_0}\sim T^2(p,n+m-2). T2=n+mnm(XˉYˉ)(n+m2A1+A2)1(XˉYˉ)H0T2(p,n+m2).
    这里 A 1 , A 2 A_1,A_2 A1,A2分别是两个总体的样本离差阵。接下来对此结论进行证明。

    因为在假设 H 0 H_0 H0下, X ˉ − Y ˉ ∼ N p ( 0 , ( 1 n + 1 m ) Σ ) \bar X-\bar Y\sim N_p(0,(\frac 1n+\frac 1m)\Sigma) XˉYˉNp(0,(n1+m1)Σ),所以
    n + m n m ( X ˉ − Y ˉ ) ∼ N p ( 0 , Σ ) . \sqrt{\frac{n+m}{nm}}(\bar X-\bar Y)\sim N_p(0,\Sigma). nmn+m (XˉYˉ)Np(0,Σ).
    因为在假设 H 0 H_0 H0下, A 1 ∼ W p ( n − 1 , Σ ) , A 2 ∼ W p ( m − 1 , Σ ) A_1\sim W_p(n-1,\Sigma),A_2\sim W_p(m-1,\Sigma) A1Wp(n1,Σ),A2Wp(m1,Σ),所以由Wishart分布的可加性,有
    A 1 + A 2 ∼ W p ( n + m − 2 , Σ ) . A_1+A_2\sim W_p(n+m-2,\Sigma). A1+A2Wp(n+m2,Σ).
    结合以上两点,我们得到 T 2 ∼ H 0 T 2 ( p , n + m − 2 ) T^2\stackrel {H_0}\sim T^2(p,n+m-2) T2H0T2(p,n+m2)的结论,所以
    n + m − p − 1 ( n + m − 2 ) p T 2 ∼ F ( p , n + m − p − 1 ) . \frac{n+m-p-1}{(n+m-2)p}T^2\sim F(p,n+m-p-1). (n+m2)pn+mp1T2F(p,n+mp1).
    于是拒绝域为
    { T 2 > ( n + m − 2 ) p n + m − p − 1 F α } . \left\{T^2>\frac{(n+m-2)p}{n+m-p-1}F_{\alpha} \right\}. {T2>n+mp1(n+m2)pFα}.
    如果两个总体协方差阵不等,但样本容量相等,则可以构造 Z ( α ) = X ( α ) − Y ( α ) Z_{(\alpha)}=X_{(\alpha)}-Y_{(\alpha)} Z(α)=X(α)Y(α)进行成对数据的等均值检测。如果两个总体甚至样本容量也不等,则要保留尽可能多的信息则会有些麻烦。课本中提到如下构造方式:
    Z ( i ) = X ( i ) − n m Y ( i ) + 1 n m ∑ j = 1 n Y ( j ) − 1 m ∑ j = 1 m Y ( j ) . Z_{(i)}=X_{(i)}-\sqrt{\frac nm}Y_{(i)}+\frac1{\sqrt {nm}}\sum_{j=1}^nY_{(j)}-\frac 1m\sum_{j=1}^m Y_{(j)}. Z(i)=X(i)mn Y(i)+nm 1j=1nY(j)m1j=1mY(j).
    这样构造出来的 Z ( i ) Z_{(i)} Z(i)独立同分布与 N p ( μ ( 1 ) − μ ( 2 ) , Σ 1 + n m Z 2 ) N_p(\mu^{(1)}-\mu^{(2)},\Sigma_1+\frac nm Z_2) Np(μ(1)μ(2),Σ1+mnZ2)

    3.多总体均值向量的假设检验

    k k k个同方差的 p p p元正态总体 N p ( μ ( t ) , Σ ) N_p(\mu^{(t)},\Sigma) Np(μ(t),Σ),从第 t t t个总体中抽取 n t n_t nt个样本 X ( α ) ( 1 ) X_{(\alpha)}^{(1)} X(α)(1),需要检验的假设是
    H 0 : μ ( 1 ) = ⋯ = μ ( k ) ⇔ H 1 : ∃ i ≠ j , μ ( i ) ≠ μ ( j ) . H_0:\mu^{(1)}=\cdots =\mu^{(k)}\Leftrightarrow H_1:\exist i\ne j,\mu^{(i)}\ne \mu^{(j)}. H0:μ(1)==μ(k)H1:i=j,μ(i)=μ(j).
    我们先讨论一维的情形。当 p = 1 p=1 p=1时,我们将每一个总体中的样本排在一行中,即将样本排成
    X ( 1 ) ( 1 ) X ( 2 ) ( 1 ) ⋯ X ( n 1 ) ( 1 ) , X ( 1 ) ( 2 ) X ( 2 ) ( 2 ) ⋯ X ( n 2 ) ( 2 ) , ⋯ ⋯ ⋯ ⋯ X ( 1 ) ( k ) X ( 2 ) ( k ) ⋯ X ( n k ) ( k ) . \begin{matrix} X_{(1)}^{(1)} & X_{(2)}^{(1)} & \cdots & X_{(n_1)}^{(1)},\\ X_{(1)}^{(2)} & X_{(2)}^{(2)} & \cdots & X_{(n_2)}^{(2)},\\ \cdots &\cdots&\cdots&\cdots \\ X_{(1)}^{(k)} & X_{(2)}^{(k)} & \cdots & X_{(n_k)}^{(k)}. \end{matrix} X(1)(1)X(1)(2)X(1)(k)X(2)(1)X(2)(2)X(2)(k)X(n1)(1),X(n2)(2),X(nk)(k).
    n = ∑ t = 1 k n t n=\sum _{t=1}^k n_t n=t=1knt
    X ˉ = 1 n ∑ t = 1 k ∑ i = 1 n t X ( i ) ( t ) , X ˉ ( t ) = 1 n t ∑ i = 1 n t X ( i ) ( t ) . \bar X=\frac 1n\sum_{t=1}^k \sum_{i=1}^{n_t} X_{(i)}^{(t)},\quad \bar X^{(t)}=\frac{1}{n_t}\sum_{i=1}^{n_t} X_{(i)}^{(t)}. Xˉ=n1t=1ki=1ntX(i)(t),Xˉ(t)=nt1i=1ntX(i)(t).
    X ˉ \bar X Xˉ是所有样本的均值, X ˉ ( t ) \bar X^{(t)} Xˉ(t)是从 t t t总体抽取的样本均值。记
    S S T = ∑ t = 1 k ∑ i = 1 n t ( X ( i ) ( t ) − X ˉ ) 2 ; — — 总 偏 差 平 方 和 , S S E = ∑ t = 1 k ∑ i = 1 n t ( X ( i ) ( t ) − X ˉ ( t ) ) 2 — — 组 内 偏 差 平 方 和 , S S A = ∑ t = 1 k n t ( X ˉ ( t ) − X ˉ ) 2 — — 组 间 偏 差 平 方 和 , {\rm SST}=\sum_{t=1}^k\sum_{i=1}^{n_t}(X_{(i)}^{(t)}-\bar X)^2;——总偏差平方和,\\ {\rm SSE}=\sum_{t=1}^{k}\sum_{i=1}^{n_t}(X_{(i)}^{(t)}-\bar X^{(t)})^2——组内偏差平方和,\\ {\rm SSA}=\sum_{t=1}^k n_t(\bar X^{(t)}-\bar X)^2——组间偏差平方和, SST=t=1ki=1nt(X(i)(t)Xˉ)2;,SSE=t=1ki=1nt(X(i)(t)Xˉ(t))2,SSA=t=1knt(Xˉ(t)Xˉ)2,
    则有 S S T = S S E + S S A {\rm SST=SSE+SSA} SST=SSE+SSA。如果 H 0 H_0 H0成立,则组间偏差平方和 S S A {\rm SSA} SSA应该很小,所以取检验统计量为
    F = S S A / ( k − 1 ) S S E / ( n − k ) ∼ H 0 F ( k − 1 , n − k ) . F=\frac{{\rm SSA}/(k-1)}{{\rm SSE}/(n-k)}\stackrel {H_0}\sim F(k-1,n-k). F=SSE/(nk)SSA/(k1)H0F(k1,nk).

    引理:这里在 H 0 H_0 H0成立的条件下,也就是所有的 X ( i ) ( t ) ∼ N ( μ , σ 2 ) X_{(i)}^{(t)}\sim N(\mu,\sigma^2) X(i)(t)N(μ,σ2),则有:

    1. S S E σ 2 ∼ χ 2 ( n − k ) \dfrac{{\rm SSE}}{\sigma^2}\sim \chi^2(n-k) σ2SSEχ2(nk)
    2. S S A σ 2 ∼ χ 2 ( k − 1 ) \dfrac{\rm SSA}{\sigma^2}\sim \chi^2(k-1) σ2SSAχ2(k1)
    3. S S E , S S A {\rm SSE,SSA} SSE,SSA相互独立;
    4. S S T σ 2 ∼ χ 2 ( n − 1 ) \dfrac{\rm SST}{\sigma^2}\sim \chi^2(n-1) σ2SSTχ2(n1)

    自然而然得到拒绝域为 { F > F α } \{F>F_\alpha\} {F>Fα},这里 F α F_\alpha Fα F ( k − 1 , n − k ) F(k-1,n-k) F(k1,nk)的上 α \alpha α分位数。

    而如果推广到 p p p元总体,则类似地可以对总离差阵进行分解,为
    T = ∑ t = 1 k ∑ i = 1 n t ( X ( i ) ( t ) − X ˉ ) ( X ( i ) ( t ) − X ˉ ) ′ = A + B , A = ∑ t = 1 k A t = ∑ t = 1 k ∑ i = 1 n t ( X ( i ) ( t ) − X ˉ ( t ) ) ( X ( i ) ( t ) − X ˉ ( t ) ) ′ , B = ∑ t = 1 k n t ( X ˉ ( t ) − X ˉ ) ( X ˉ ( t ) − X ˉ ) ′ . T=\sum_{t=1}^k\sum_{i=1}^{n_t}(X_{(i)}^{(t)}-\bar X)(X_{(i)}^{(t)}-\bar X)'=A+B,\\ A=\sum_{t=1}^k A_t=\sum_{t=1}^k \sum_{i=1}^{n_t}(X_{(i)}^{(t)}-\bar X^{(t)})(X_{(i)}^{(t)}-\bar X^{(t)})',\\ B=\sum_{t=1}^k n_t(\bar X^{(t)}-\bar X)(\bar X^{(t)}-\bar X)'. T=t=1ki=1nt(X(i)(t)Xˉ)(X(i)(t)Xˉ)=A+B,A=t=1kAt=t=1ki=1nt(X(i)(t)Xˉ(t))(X(i)(t)Xˉ(t)),B=t=1knt(Xˉ(t)Xˉ)(Xˉ(t)Xˉ).
    T T T为总离差阵, A A A为组内离差阵, B B B为组间离差阵。与一元情况类似地有
    A ∼ H 0 W p ( n − k , Σ ) , B ∼ H 0 W p ( k − 1 , Σ ) , A\stackrel {H_0}\sim W_p(n-k,\Sigma),B\stackrel {H_0}\sim W_p(k-1,\Sigma), AH0Wp(nk,Σ),BH0Wp(k1,Σ),
    A , B A,B A,B相互独立,所以类似地建立统计量为
    Λ = ∣ A ∣ ∣ A + B ∣ = ∣ A ∣ ∣ T ∣ ∼ H 0 Λ ( p , n − k , k − 1 ) . \Lambda=\frac{|A|}{|A+B|}=\frac{|A|}{|T|}\stackrel {H_0}\sim \Lambda(p,n-k,k-1). Λ=A+BA=TAH0Λ(p,nk,k1).
    这里 n n n是总样本数, k k k是总组数, p p p是向量维数。拒绝域就应该是 { Λ < Λ α } \{\Lambda <\Lambda_\alpha\} {Λ<Λα},而 Λ \Lambda Λ统计量可以用 χ 2 \chi^2 χ2统计量或 F F F统计量来近似替代,即
    − r ln ⁡ Λ ∼ χ 2 ( p n 2 ) , r = n 1 − 1 2 ( p − n 2 + 1 ) . -r\ln \Lambda\sim \chi^2(pn_2),\quad r=n_1-\frac 12(p-n_2+1). rlnΛχ2(pn2),r=n121(pn2+1).
    但一般情况下,我们只会检验三组同均值问题,也就是 μ ( 1 ) = μ ( 2 ) = μ ( 3 ) \mu^{(1)}=\mu^{(2)}=\mu^{(3)} μ(1)=μ(2)=μ(3)的检验,此时 k = 3 k=3 k=3 Λ \Lambda Λ分布可以转化为 F F F统计量,即
    Λ ( p , n − 3 , 2 ) : n − 3 − p + 1 n − 3 1 − Λ Λ ∼ F ( 2 p , 2 ( n − 3 − p + 1 ) ) . \Lambda(p,n-3,2):\frac{n-3-p+1}{n-3}\frac{1-\sqrt \Lambda}{\sqrt\Lambda}\sim F(2p,2(n-3-p+1)). Λ(p,n3,2):n3n3p+1Λ 1Λ F(2p,2(n3p+1)).
    所以拒绝域是 { F > F α } \{F>F_\alpha\} {F>Fα} F α F_\alpha Fα F ( 2 p , 2 ( n − 3 − p + 1 ) ) F(2p,2(n-3-p+1)) F(2p,2(n3p+1))的上 α \alpha α分位数。

    回顾总结

    1. 单总体 N p ( μ , Σ ) N_p(\mu,\Sigma) Np(μ,Σ)情况检验 H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0,如果 Σ \Sigma Σ未知,构造的检验统计量是
      T 2 = n ( X ˉ − μ 0 ) S − 1 ( X ˉ − μ 0 ) ∼ H 0 T 2 ( p , n − 1 ) . T^2=n(\bar X-\mu_0)S^{-1}(\bar X-\mu_0)\stackrel {H_0}\sim T^2(p,n-1). T2=n(Xˉμ0)S1(Xˉμ0)H0T2(p,n1).
      如果 Σ = Σ 0 \Sigma=\Sigma_0 Σ=Σ0已知,构造的检验统计量是
      T 2 = n ( X ˉ − μ 0 ) Σ 0 − 1 ( X ˉ − μ 0 ) ∼ H 0 T 2 ( p , n ) . T^2=n(\bar X-\mu_0)\Sigma_0^{-1}(\bar X-\mu_0)\stackrel {H_0}\sim T^2(p,n). T2=n(Xˉμ0)Σ01(Xˉμ0)H0T2(p,n).

    2. 双同方差总体 N p ( μ ( 1 ) , Σ ) , N p ( μ ( 2 ) , Σ ) N_p(\mu^{(1)},\Sigma),N_p(\mu^{(2)},\Sigma) Np(μ(1),Σ),Np(μ(2),Σ)情况检验 μ ( 1 ) = μ ( 2 ) \mu^{(1)}=\mu^{(2)} μ(1)=μ(2),构造的检验统计量是
      T 2 = n m n + m ( X ˉ − Y ˉ ) ′ ( A 1 + A 2 n + m − 2 ) ( X ˉ − Y ˉ ) ∼ H 0 T 2 ( p , n + m − 2 ) . T^2=\frac{nm}{n+m}(\bar X-\bar Y)'\left(\frac{A_1+A_2}{n+m-2} \right)(\bar X-\bar Y)\stackrel {H_0}\sim T^2(p,n+m-2). T2=n+mnm(XˉYˉ)(n+m2A1+A2)(XˉYˉ)H0T2(p,n+m2).

    3. 如果双总体方差不同为 N p ( μ ( 1 ) , Σ 1 ) , N p ( μ ( 2 ) , Σ 2 ) N_p(\mu^{(1)},\Sigma_1),N_p(\mu^{(2)},\Sigma_2) Np(μ(1),Σ1),Np(μ(2),Σ2),成对数据则构造 Z ( α ) = X ( α ) − Y ( α ) Z_{(\alpha)}=X_{(\alpha)}-Y_{(\alpha)} Z(α)=X(α)Y(α),如果不是成对数据,则进行以下处理(设 n < m n<m n<m
      Z ( α ) = X ( α ) − n m Y ( α ) + 1 m n ∑ i = 1 n Y ( i ) − 1 m ∑ i = 1 m Y ( i ) Z_{(\alpha)}=X_{(\alpha)}-\sqrt{\frac nm}Y_{(\alpha)}+\sqrt{\frac 1{mn}}\sum_{i=1}^n Y_{(i)}-\frac 1m\sum_{i=1}^m Y_{(i)} Z(α)=X(α)mn Y(α)+mn1 i=1nY(i)m1i=1mY(i)
      得到的 Z ( α ) Z_{(\alpha)} Z(α)是相互独立,服从 N p ( μ Z , Σ Z ) N_p(\mu_Z,\Sigma_Z) Np(μZ,ΣZ),这里 μ Z = μ ( 1 ) − μ ( 2 ) \mu_Z=\mu^{(1)}-\mu^{(2)} μZ=μ(1)μ(2) Σ Z = Z 1 + n m Z 2 \Sigma_Z=Z_1+\frac nmZ_2 ΣZ=Z1+mnZ2

    4. 多总体同方差情况,总体为 N p ( μ ( t ) , Σ ) , t = 1 , ⋯   , k N_p(\mu^{(t)},\Sigma),t=1,\cdots,k Np(μ(t),Σ),t=1,,k,每个总体中抽取 n t n_t nt件样本,检验 μ ( 1 ) = ⋯ = μ ( k ) \mu^{(1)}=\cdots =\mu^{(k)} μ(1)==μ(k),构造的检验统计量是
      Λ = ∣ A ∣ ∣ A + B ∣ = ∣ A ∣ ∣ T ∣ ∼ H 0 Λ ( p , n − k , k − 1 ) . \Lambda=\frac{|A|}{|A+B|}=\frac{|A|}{|T|}\stackrel {H_0}\sim \Lambda(p,n-k,k-1). Λ=A+BA=TAH0Λ(p,nk,k1).
      这里 n n n为总样本容量, A A A是组内离差阵, T T T为总离差阵,若设 X ˉ \bar X Xˉ为总均值, X ˉ ( t ) \bar X^{(t)} Xˉ(t)是第 t t t组均值,则
      n = ∑ t = 1 k n t , A = ∑ t = 1 k ∑ i = 1 n t ( X ( i ) ( t ) − X ˉ ( t ) ) ( X ( i ) ( t ) − X ˉ ( t ) ) ′ , B = ∑ t = 1 k n t ( X ˉ ( t ) − X ˉ ) 2 , T = ∑ t = 1 k ∑ i = 1 n t ( X ( i ) ( t ) − X ˉ ) ( X ( i ) ( t ) − X ˉ ) ′ . n=\sum_{t=1}^k n_t,\\ A=\sum_{t=1}^k \sum_{i=1}^{n_t}(X_{(i)}^{(t)}-\bar X^{(t)})(X_{(i)}^{(t)}-\bar X^{(t)})',\\ B=\sum_{t=1}^k n_t(\bar X^{(t)}-\bar X)^2,\\ T=\sum_{t=1}^k \sum_{i=1}^{n_t}(X_{(i)}^{(t)}-\bar X)(X_{(i)}^{(t)}-\bar X)'. n=t=1knt,A=t=1ki=1nt(X(i)(t)Xˉ(t))(X(i)(t)Xˉ(t)),B=t=1knt(Xˉ(t)Xˉ)2,T=t=1ki=1nt(X(i)(t)Xˉ)(X(i)(t)Xˉ).

    5. 本节中常用的转换公式:
      T 2 ( p , n − 1 ) : n − p ( n − 1 ) p T 2 ∼ F ( p , n − p ) . T 2 ( p , n + m − 2 ) : n + m − 1 − p ( n + m − 2 ) p T 2 ∼ F ( p , n + m − 1 − p ) . Λ ( p , n − 3 , 2 ) : n − 3 − p + 1 n − p 1 − Λ Λ ∼ F ( 2 p , 2 ( n − 3 − p + 1 ) ) . \begin{array}l T^2(p,n-1):\dfrac{n-p}{(n-1)p}T^2\sim F(p,n-p). \\ T^2(p,n+m-2):\dfrac{n+m-1-p}{(n+m-2)p}T^2\sim F(p,n+m-1-p). \\ \Lambda(p,n-3,2):\dfrac{n-3-p+1}{n-p}\dfrac{1-\sqrt\Lambda}{\sqrt \Lambda}\sim F(2p,2(n-3-p+1)). \end{array} T2(p,n1):(n1)pnpT2F(p,np).T2(p,n+m2):(n+m2)pn+m1pT2F(p,n+m1p).Λ(p,n3,2):npn3p+1Λ 1Λ F(2p,2(n3p+1)).

    展开全文
  • 针对多元正态总体均值向量和协差阵的假设检验
  • 多元正态分布的均值向量的检验及R实现

    万次阅读 多人点赞 2018-05-05 21:59:35
    ppp维正态总体NP(μ,∑)NP(μ,∑)N_P(\mu,\sum)的均值向量检验,X1,X2,⋯,XnX1,X2,⋯,XnX_1,X_2,\cdots,X_n是来自正态总体的样本: 1.∑∑\sum已知时单个总体均值向量的检验: 具体步骤: 作统计假设:H0:μ=...

    p p 维正态总体NP(μ,)的均值向量检验, X1,X2,,Xn X 1 , X 2 , ⋯ , X n 是来自正态总体的样本:

    1. 已知时单个总体均值向量的检验:

    具体步骤:

    • 作统计假设: H0:μ=μ0,H1:μμ0 H 0 : μ = μ 0 , H 1 : μ ≠ μ 0
    • 计算样本的均值
    • 计算统计量的具体值:
      {U=X¯μ0σnT02=n(X¯μ0)1(X¯μ0) if p=1 if p>1 { U = X ¯ − μ 0 σ n  if  p = 1 T 0 2 = n ( X ¯ − μ 0 ) ′ ∑ − 1 ( X ¯ − μ 0 )  if  p > 1
    • 按规定的小概率标准 α α ,查 χ2 χ 2 分布表,得临界值 χ2α(p) χ α 2 ( p ) ,并做出判断:
      -当 T02χ2α(p) T 0 2 ⩽ χ α 2 ( p ) ,接受原假设,即认为没有显著差异
      -当 T02>χ2α(p) T 0 2 > χ α 2 ( p ) ,拒绝原假设,即认为有显著差异

    *R实现:

    mu.test.known=function(data, mu0, Sigma0, alpha=0.05)   
    ###############################################################
    ## H0: mu=mu0 when Sigma0 is known
    ## this is a Chisq testing
    ##############  Input  ########################################
    ## data  = design matrix with the ith sample in the ith line
    ## mu0   = mu0 for null hypothesis
    ## Sigma0= the known variance matrix
    ## alpha = the significant level, default value = 0.05
    ############## Output  ########################################
    ## Reject.area = reject region
    ## p.value     = p value
    ###############################################################
    {
      data=as.matrix(data) #将数据框转化为矩阵#
      n=nrow(data) #n行#
      p=ncol(data) #p列#
    
      X.bar=apply(data, 2, mean) #按列求均值#
      T1=n*t(X.bar-mu0)%*%solve(Sigma0)%*%(X.bar-mu0)
    
      a2=qchisq(1-alpha, p) #求下侧分位点,上侧:lower.tail = FALSE#
    
      reject=matrix(c(T1, a2), nrow=1) #按行排#
      rownames(reject)=c("Reject") #行名#
      colnames(reject)=c("Obs", ">1-alpha") #列名#
    
      pv=1-pchisq(T1, p) #右半累积概率,T越大,P越小,越拒绝#
      return(list(Reject.area=reject, p.value=pv))
    }

    2. 未知时单个总体均值向量的检验:

    具体步骤:

    • 作统计假设: H0:μ=μ0,H1:μμ0 H 0 : μ = μ 0 , H 1 : μ ≠ μ 0
    • 计算样本的均值 X¯ X ¯ 和样本协方差 V=1n1ni=1(XiX¯)(XiX¯) V = 1 n − 1 ∑ i = 1 n ( X i − X ¯ ) ( X i − X ¯ ) ′
    • 计算统计量的具体值:
      T2=n(X¯μ0)V1(X¯μ0),np(n1)pT2F(p,np) T 2 = n ( X ¯ − μ 0 ) ′ V − 1 ( X ¯ − μ 0 ) , n − p ( n − 1 ) p T 2 ∼ F ( p , n − p )
    • 按规定的小概率标准 α α ,查 F F 分布表,得临界值Fα(p,np),并做出判断:
      -当 F0Fα(p,np) F 0 ⩽ F α ( p , n − p ) ,接受原假设,即认为没有显著差异
      -当 F0>Fα(p,np) F 0 > F α ( p , n − p ) ,拒绝原假设,即认为有显著差异

    *R实现:

    mu.test=function(data, mu0)   
    ###############################################################
    ## H0: mu=mu0 when Sigma is unknown
    ## this is an F testing
    ##############  Input  ########################################
    ## data  = design matrix with the ith sample in the ith line
    ## mu0   = mu0 for null hypothesis
    ############## Output  ########################################
    ## p.value     = p value
    ###############################################################
    {
      data=as.matrix(data)
      n=nrow(data)
      p=ncol(data)
    
      X.bar=apply(data, 2, mean)
      A=(n-1)*var(data)
    
      T2=(n-1)*n*t(X.bar-mu0)%*%solve(A)%*%(X.bar-mu0)
      F=(n-p)/((n-1)*p)*T2
    
      p.two=1-pf(F, p, n-p)
      return(list(p.value=p.two))
    }

    补充:R生成多元正态分布

    ######################生成多元正态分布####################
    library(MASS)
    Sigma <- matrix(c(10,3,3,2),2,2)
    Sigma
    mvrnorm(n=1000, rep(0, 2), Sigma) 
    ##########################模拟##########################
    library(MASS)
    source("Norm Mean Test.r")
    error=0
    alpha=0.05
    Sigma0 = matrix(c(1,0.5,0.5,1),2,2)
    for(i in 1:1000){
    data=mvrnorm(n=200, rep(0, 2), Sigma0) 
    mu0=c(0,0)
    result1=mu.test.known(data, mu0, Sigma0, alpha=0.05)
    if (result1[2]<alpha) error=error+1
    }
    EERROR=error/1000

    3. 未知但相等时两个总体均值向量的检验:

    具体步骤:

    • 作统计假设: H0:μ1=μ2,H1:μ1μ2 H 0 : μ 1 = μ 2 , H 1 : μ 1 ≠ μ 2
    • 计算样本的均值 X¯ X ¯ Y¯ Y ¯ ,样本离差阵 A1=ni=1(XiX¯)(XiX¯) A 1 = ∑ i = 1 n ( X i − X ¯ ) ( X i − X ¯ ) ′ A2=ni=1(YiY¯)(YiY¯) A 2 = ∑ i = 1 n ( Y i − Y ¯ ) ( Y i − Y ¯ ) ′
    • 计算统计量的具体值:
      T2=nmn+m(X¯Y¯)V1e(X¯Y¯) T 2 = n m n + m ( X ¯ − Y ¯ ) ′ V e − 1 ( X ¯ − Y ¯ )
      其中 Ve=1n+m2(A1+A2) V e = 1 n + m − 2 ( A 1 + A 2 )
      n+mp1(n+m2)pT2F(p,n+mp1) n + m − p − 1 ( n + m − 2 ) p T 2 ∼ F ( p , n + m − p − 1 )
    • 按规定的小概率标准 α α ,查 F F 分布表,得临界值Fα(p,n+mp1),并做出判断:
      -当 F0Fα(p,n+mp1) F 0 ⩽ F α ( p , n + m − p − 1 ) ,接受原假设,即认为没有显著差异
      -当 F0>Fα(p,n+mp1) F 0 > F α ( p , n + m − p − 1 ) ,拒绝原假设,即认为有显著差异

    *R实现:

    #### two independent normal distribution  ##################
    two.mu.test=function(data1, data2)   
    ###################################################################
    ## H0: mu1=mu2 
    ## this is an F testing
    ##############  Input  ############################################
    ## data1  = design matrix for X with the ith sample in the ith line
    ## data2  = design matrix for X with the ith sample in the ith line
    ############## Output  ####################################### p.value     = p value
    ############################################################
    {
      data1=as.matrix(data1)
      data2=as.matrix(data2)
      n1=nrow(data1)
      n2=nrow(data2)
      p=ncol(data1)
    
      X.bar=apply(data1, 2, mean) 
      A1=(n1-1)*var(data1)
      Y.bar=apply(data2, 2, mean)
      A2=(n2-1)*var(data2) 
      A=(A1+A2)/(n1+n2-2)
    
      T2=(n1*n2/(n1+n2))*t(X.bar-Y.bar)%*%solve(A)%*%(X.bar-Y.bar)
      F=(n1+n2-2-p+1)/((n1+n2-2)*p)*T2
    
      p.two=1-pf(F, p, (n1+n2-p-1))
      return(list(p.value=p.two))
    }

    4.多个正态总体均值向量的检验-多元方差分析:

    k k Np(μt,),其中 t=1,,k t = 1 , ⋯ , k ,样本 X(t)(i)(t=1,,k)(i=1,,ni) X ( i ) ( t ) ( t = 1 , ⋯ , k ) ( i = 1 , ⋯ , n i ) )
    实验数据:

    水平数重复数平均
    X1(p×n1) X 1 ( p × n 1 ) X(1)(1),,X(1)(n1) X ( 1 ) ( 1 ) , ⋯ , X ( n 1 ) ( 1 ) X¯(1) X ¯ ( 1 )
    X2(p×n2) X 2 ( p × n 2 ) X(2)(1),,X(2)(n2) X ( 1 ) ( 2 ) , ⋯ , X ( n 2 ) ( 2 ) X¯(2) X ¯ ( 2 )
    Xk(p×nk) X k ( p × n k ) X(k)(1),,X(k)(nk) X ( 1 ) ( k ) , ⋯ , X ( n k ) ( k ) X¯(k) X ¯ ( k )

    具体步骤:

    • 作统计假设: H0:μ1==μk,H1:ij使μiμj H 0 : μ 1 = ⋯ = μ k , H 1 : 至 少 存 在 i ≠ j 使 得 μ i ≠ μ j
    • 计算离差阵:
      ST=ki=1njj=1(X(i)(j)X¯)(X(i)(j)X¯)SA=ki=1ni(X¯(i)X¯)(X¯(i)X¯)SE=ki=1njj=1(X(i)(j)X¯(i))(X(i)(j)X¯(i))ST=SA+SE { 总 离 差 阵 : S T = ∑ i = 1 k ∑ j = 1 n j ( X ( j ) ( i ) − X ¯ ) ( X ( j ) ( i ) − X ¯ ) ′ 组 间 离 差 阵 : S A = ∑ i = 1 k n i ( X ¯ ( i ) − X ¯ ) ( X ¯ ( i ) − X ¯ ) ′ 组 内 离 差 阵 : S E = ∑ i = 1 k ∑ j = 1 n j ( X ( j ) ( i ) − X ¯ ( i ) ) ( X ( j ) ( i ) − X ¯ ( i ) ) ′ 离 差 阵 分 解 公 式 : S T = S A + S E
    • 计算统计量的具体值:
      Λ=|SE||SE+SA|=|SE||ST|Λ(p,nk,k1) Λ = | S E | | S E + S A | = | S E | | S T | ∼ Λ ( p , n − k , k − 1 )

      rlnΛχ2(p(k1)),r=(nk)12(p(k1)+1) − r l n Λ ∼ χ 2 ( p ( k − 1 ) ) , r = ( n − k ) − 1 2 ( p − ( k − 1 ) + 1 )

      其中 SAWp(k1,),SEWp(nk,) S A ∼ W p ( k − 1 , ∑ ) , S E ∼ W p ( n − k , ∑ )
    • 按规定的小概率标准 α α ,查 wilks w i l k s 分布表并做出判断:
      -当 Λ<Λ1α(p,nk.k1) Λ < Λ 1 − α ( p , n − k . k − 1 ) ,拒绝原假设,即认为有显著差异

    *R实现:

    #### k independent normal distribution ######### 
    ###################################################################
    ## H0: mu1=mu2=...=muk
    ## this is asymptotically a Chisq testing
    ##############  Input  ############################################
    ## data  = design matrix with a group index ind
    ############## Output  ############################################
    ## p.value     = p value
    ###################################################################
    multi.mu.test=function(data, k)            
    
    {
      ind=data$ind
    
      n=nrow(data)
      p=ncol(data)-1
    
      data=data[ ,1:p]
      T=(n-1)*var(data)
    
      A=0
      for (i in 1:k)                                
      {
        datai=data[ind==i, ]
        ni=nrow(datai)                                 
        A=A+(ni-1)*var(datai)
      }
    
      Lambda=det(A)/det(T)
      n1=n-k
      n2=k-1
      r=n1-(p-n2+1)/2
      Chi=(-1)*r*log(Lambda)
    
      p.value=1-pchisq(Chi, p*n2)
      return(p.value=p.value)
    }
    展开全文
  • 均值向量和协方差阵的检验——spss上机实验 #参考书目为《多元统计分析》(第五版)——何晓群.中国人民大学出版社 #如有错误,请指正!谢谢~ #关注公众号搜索同名文章获取数据~ 习题2.3 现选取内蒙古、广西、贵州...

    均值向量和协方差阵的检验——spss上机实验

    #参考书目为《多元统计分析》(第五版)——何晓群.中国人民大学出版社
    #如有错误,请指正!谢谢~
    #关注公众号搜索同名文章获取数据~
    关注一下啦~
    习题2.3
    现选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等9个内陆边远省区。选取人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口的比例等5项能较好的说明各地区社会经济发展水平的指标,验证边远及少数民族聚居区的社会经济发展水平与全国平均水平间有无显著差异。
    数据预览
    将数据导入spss-26
    导入spss数据预览

    一、检验变量是否来自于正态总体,服从正态分布

    分析-描述统计-探索
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    得到结果
    检验样本是否来自于正态总体可以通过直观的图像观察和正态检验分布表得到结论。

    在这里插入图片描述
    正态性检验表给出了正态性检验的结果,因为题目中样本量较少,因此只适用于Shapiro-Wilk统计量,由Sig.(即P值)可以得到,在0.05的显著性水平下,5个变量大于显著性水平值,即大于0.05,因此,可以认为这五个变量都是来自于正态分布的总体中。
    下面是每一个变量的QQ图
    在这里插入图片描述
    在这里插入图片描述
    箱型图可以用于鉴别数据中是否存在离群点,即异常数据的检测
    箱型图

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    从上述箱型图我们可以看到数据中并不存在离群点,即不存在异常值,因此不需要对数据进行预处理。通过QQ图,点都聚集在拟合曲线的周围,因此认为数据来源于正态分布的总体。

    二、多元正态分布有关均值和方差的检验

    这里需要先对数据进行分组对比,将全国平均水平记为组别2,9个内地地区记为组别1.
    分析-一般线性模型-多变量
    将变量放入因变量框,固定因子为组别
    将各省市的指标值与全国的平均指标做分组区分,其中组一为全国各省市的指标值,组二为全国平均指标,主体间因子图如下
    在这里插入图片描述
    对各主体间的因子进行多变量分析,由Sig.可以看到两个分组之间存在着显著的差异,一般线性回归模型对多变量进行了模型的拟合:
    在这里插入图片描述
    其中,Y=(人均GDP,第三产业比重,人均消费支出,人口自然增长率,文盲半文盲人口占比)’,X为各省市和全国均值。显著性存在差异,即各省市与全国平均的社会经济发展水平存在着一定的差异。

    主体间的效应检验是显示了每个指标的分析结果,分别是对不同的指标从各个不同的方差来源进行说明,Ⅲ类平方和是指用typeⅢ的方法计算偏差平方和,偏差平方和是判断原假设是否成立的重要标准,本题原假设为各省市经济发展水平与全国平均水平无明显差异,偏差平方和越大证明各个自变量之间的水平差异大,也就是各省市与全国间存在较大的水平差异,其中存在显著差异的是人均GDP和人均消费支出,其他变量如第三产业比重、人口自然增长率和文盲半文盲人口占比等因素差异不大。

    在这里插入图片描述

    三、检验协方差矩阵

    步骤:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述在这里插入图片描述
    对每个自变量之间的协方差进行检验,得到项间协方差矩阵,其中,第三产业比重、人均消费支出与人均GDP呈正相关,且人均GDP与人均消费支出具有显著的相关关系。
    四、单样本的T检验和多变量对比检验
    单样本T检验的目的是控制变量在不同水平下,观测变量值看做是来自不同水平下总体的样本,检验均值与是否来自某个指定的检验值之间存在显著差异,即检测其他各省市各个指标之间与全国平均指标之间是否存在显著差异。在单样本T检验的情况下,sig值约为0.00,小于0.05,所以,样本均值与检验值有差异性。
    单样本统计表-单样本检验表
    用一般线性模型对协方差矩阵相等进行检验,由于只创设了各省市和全国两个分组,因此不能计算协方差矩阵的BOX’M等同性检验,不足三个分组,因此无法对T进行事后检验。
    在这里插入图片描述
    在这里插入图片描述
    输出描述性统计,求出各个组别之间的各个变量的均值、标准偏差;可以得到在人均消费支出项中,样本地区的人均消费支出、人均GDP均值均小于全国人均消费支出,而第三产业比重、人口自然增长率和文盲半文盲人口比重均大于全国平均水平。因此证明,边远地区、少数民族聚居地区与全国经济社会发展水平存在着一定差异。
    在这里插入图片描述
    在这里插入图片描述
    由于非空组不足两个,因此未计算误差方差的莱文等同性检验,莱文等同性检验可以说明不同指标之间的多重比较与检验以及检验之间的可信度统计量。

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    通过对比估算得到人均GDP组别1与组别2之间,即边远及少数民族聚居区和全国平均水平之间,人均GDP为-2003.232,即说明边远及少数民族聚居区比全国平均水平少2003.232,人均消费支出少1005.111,人口自然增长率与全国相比多出2.712,文盲半文盲人口占比比全国多12.014,因此存在显著性差异。

    在这里插入图片描述
    在这里插入图片描述
    对比得到,当显著性大于0.05时,则该变量具有显著性,因此可以看到人均GDP、第三产业比重、人口自然增长率和文盲半文盲人口占比都与边远地区及少数民族聚居区的社会经济发展水平相关。

    试验总结:

    本次实验中,通过对自变量进行正态性检验,检验样本中的自变量是否来源于正态总体,从而证明该样本可以完成多元正态分布有关均值和方差的检验。对全国和边远民族聚居地区分别进行分组,进行均值和方差的检验,得到模型拟合的方程,在主体间效应检验中,得到了每个自变量中的方差的来源,可以明显看出两组之间的变量存在明显差异,再通过协方差相等的检验和输出比较检验,可以看出是哪些变量导致了边远或少数民族地区与全国平均水平存在差异,可以看出人均GDP、第三产业比重、人口自然增长率和文盲半文盲人口占比都与边远地区及少数民族聚居区的社会经济发展水平相关,边远及少数民族聚居区的社会经济发展水平与全国平均水平存在显著差异。

    #参考链接:https://www.cnblogs.com/huangjing1994/p/9959557.html

    展开全文
  • 多元统计:多元正太分布均值向量和协方差的检验 检验思想和步骤: 第一 提出待检验的假设Ho和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临界 值,从而得到否定...

    多元统计:多元正太分布均值向量和协方差的检验

    检验思想和步骤:

    第一 提出待检验的假设Ho和H1;

    第二,给出检验的统计量及其服从的分布;

    第三,给定检验水平,查统计量的分布表,确定相应的临界 值,从而得到否定域;

    第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。

    均值向量的检验:

    在这里插入图片描述
    在这里插入图片描述

    在这里插入图片描述

    协差阵的检验:

    在这里插入图片描述

    展开全文
  • 本文简要介绍多元正态总体均值的区间估计,并提出假设检验的一种重要方法——似然比检验
  • AB test系列文章目录:冒烟指数:21.AB test(1)初识AB test​zhuanlan.zhihu.com冒烟指数:21.... (3)假设检验基础​zhuanlan.zhihu.com冒烟指数:21.(4)假设检验有哪几类​zhuanlan.zhihu.com冒烟指数:21.(5)AB...
  • R语言中对多元正态的样本进行参数估计和正态性、均值检验、协差阵检验可以用的简单函数
  • 本文探讨协方差阵的假设检验问题。
  • 1.单个ppp元正态总体协方差阵的检验 具体步骤: 作统计假设(1):H0:∑=Ip,H1:∑≠IpH0:∑=Ip,H1:∑≠IpH_0:\sum =I_p,H_1:\sum \neq I_p 统计量:λ=supθ∈Θ0L(μ,Ip)supθ∈ΘL(μ,∑)=(en)np/2|S|n/2exp[−12...
  • 首先讨论正态分布分量间的独立性检验,最后,讨论对于给定总体的正态性检验
  • 一、概述(F检验)显著性检验:检测自变量是否真正影响到因变量的波动。(t检验)回归系数检验:单个自变量在模型中是否有效。二、回归模型检验检验回归模型的好坏常用的是F检验和t检验。F检验验证的是偏回归系数...
  • MATLAB 多元数据统计分析

    千次阅读 2016-10-21 12:43:56
    四元总体正态性检验;3正态总体均值差异性检验;3正态总体间协方差差异性检验;2正态总体均值差异性检验
  • ©PaperWeekly 原创 ·作者|苏剑林单位|追一科技研究方向|NLP、神经网络正态分布是最常见的连续型概率分布之一。它是给定均值和协方差后的最大熵分布(参考《“熵”不...
  • Matlab正态分布性检验

    2021-04-18 05:25:10
    通常总是假定总体服从正态分布,虽然在许多情况下这假定是合理的,但是当要以此为前提进行重要的参数估计或假设检验,或者人们对它有较大怀疑的时候,就确有必要对这假设进行检验,进行总体正态性检验的方法有很...
  • 2、检验是否每一组二维散点图都没有线性趋势——如果数据服从多元正态分布,那么两个维度之间要么独立,要么成线性关系; 3、根据QQ图,检验统计距离 {d1,⋯ ,dn}\{d_1,\cdots,d_n\}{d1​,⋯,dn​}是否距离 χ2(p)...
  • 第4章 Stata参数检验

    千次阅读 2021-06-30 10:59:31
    目录 4.1单一样本T检验 案例延伸 4.2独立样本T检验 ...参数检验一般假设统计总体的具体分布为已知,但是其中一些参数或者取值范围不确定,分析的主要目的是估计这些未知参数的取值,或者对这些参数进...
  • 导读 从系列17到系列25我们介绍了单变量数据的假设检验方法和SAS实现。今天开始介绍双变量数据的假设检验...在医学研究和实践中,也经常会遇到两个变量间关系的研究,如儿童体重与体表面积间的关系,某人群发硒值与...
  • Independent two-samples test in MatlabYang Runhuai1杨润怀(1987-),男,讲师,生物3D打印Zhang Zhen1Yang Siqiao1Liang Zhen1梁振(1981-),男,副教授,临床工程1、Life Science School, Anhui medical ...
  • 用R语言解读统计检验-F检验

    千次阅读 2020-12-30 20:01:24
    0.96567, p-value = 0.4284 # 正态分布检验 > shapiro.test(len_OJ) Shapiro-Wilk normality test data: len_OJ W = 0.91784, p-value = 0.02359 两个样本的W统计量都接近1,且p-value都大于0.05,不能拒绝原假设,...
  • Hotelling T2检验多元方差分析

    千次阅读 2016-12-28 16:49:00
     设两个含量分析为n,m的样本来自具有公共协方差阵的q维正态分布N(μ1,∑),N(μ2,∑),欲检验 H0:μ1=μ2 H1:μ1≠μ2 分别计算出两样本每个变量的均值构成的均向量X、Y及合并的组内协方差阵S,则统计量T2为 其中...
  • 传送门:数理统计|笔记整理(1)——引入,重要分布函数,特征函数及计算————————————————————————————————...当然如果你对研究生的内容并不感兴趣,其实上一节你只需要掌握两个重...
  • 统计假设检验之显著性检验(significance test)

    千次阅读 多人点赞 2019-07-14 17:52:03
    无论你从事何种领域的科学研究还是统计调查,显著性检验作为判断两个乃至多个数据集之间是否存在差异的方法被广泛应用于各个科研领域。笔者作为科研界一名新人也曾经在显著性检验方面吃过许多苦头。后来醉心于统计...
  • 理解什么是组间差异检验参数检验与非参数检验抽样分布展示差异的常用图表箱线图(boxplot)散点图(Scatter ...坦率地讲,所有的差异检验都基于一假设:组间没有差异,变量之间没有关系(即原假设,H0H_0H0​)。也说
  • www.biostatistic.net/... R语言 Multivariate Statistics (多元统计) 网址:http://cran.r-project.org/web/views/Multivariate.html 转:http://rbbs.biosino.org/Rbbs/posts/list/223.page 基本的R包已经实现
  • 第一节是一元回归统计推断在多元回归中的推广,主要针对的是单个系数的假设检验和置信区间,除了在假设阶段有所不同(比如是在固定其他变量的情况下,被检验变量对因变量没有影响),基本步骤是一样的,理论基础也都...
  • 笔记内容来源:拉勾教育数据分析实战训练营我是一在教育留学行业8年的老兵,受疫情的影响留学行业受挫严重,让我也不得不积极寻找新的职业出路。虽然我本身是留学行业,但对数据分析一直有浓厚的兴趣,日常工作中...
  • 组间差异检验,终于有人讲清楚了!

    千次阅读 2020-12-01 00:14:53
    坦率地讲,所有的差异检验都基于一假设:组间没有差异,变量之间没有关系(即原假设,)。上海交大王成老师也说方差分析其实研究的就是不同水平下是否有差异化的假设检验问题。而假设检验就是先对总体参数提出某种...
  • T检验与Z检验

    千次阅读 2020-07-22 14:59:48
    五.T检验和Z检验 文章目录五.T检验和Z检验0. 检验学习先知知识离散变量与连续变量为什么要做比较分析1.假设检验2.单样本t检验3. 配对设计资料均数的t检验4. 独立样本的t检验与t'检验独立样本的方差齐性检验独立样本t...
  • 第四章 多元正太总体的推断统计课堂代码整理及注释第五次作业 课堂代码整理及注释 第五次作业

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,492
精华内容 1,396
关键字:

多元两个总体的均值检验

友情链接: DOSCopy_con.rar