精华内容
下载资源
问答
  • 总体方差的检验和推断
    2020-04-21 17:56:08

    总体方差的检验和推断

    需求:

    1. 实际需求:某些实际问题中,需要对方差有严格的控制,如药品。所以需要对方差进行检验
    2. 比较方法的稳定性,即多样本的方差比较
    3. 方差相等是其他检验的前提条件,所以需要方差检验

    点估计

    无偏估计
    σ ^ 2 = s 2 = ∑ i ( y i − y ˉ ) 2 n − 1 \hat{\sigma}^2 = s^2= \frac{\sum_i(y_i-\bar{y})^2}{n-1} σ^2=s2=n1i(yiyˉ)2
    最大似然估计
    σ ^ M L E 2 = ∑ i ( y i − y ˉ ) 2 n \hat{\sigma}^2_{MLE} = \frac{\sum_i(y_i-\bar{y})^2}{n} σ^MLE2=ni(yiyˉ)2

    注意这里的估计对所有分布都是适用的

    当总体分布为正态分布时,可以证明 ( n − 1 ) s 2 σ 2 \frac{(n-1)s^2}{\sigma^2} σ2(n1)s2符合 χ ( n − 1 ) \chi(n-1) χ(n1)分布

    区间估计

    适用条件:总体为正态分布

    σ \sigma σ的置信度为 ( 1 − α ) (1-\alpha) (1α)的置信区间为
    ( ( n − 1 ) s 2 χ U 2 , ( n − 1 ) s 2 χ L 2 ) \Big(\frac{(n-1)s^2}{\chi_U^2},\frac{(n-1)s^2}{\chi_L^2}\Big) (χU2(n1)s2,χL2(n1)s2)
    χ 2 \chi^2 χ2的自由度为 n − 1 n-1 n1 χ U 2 = q c h i q ( 1 − α / 2 , n − 1 ) \chi^2_{U}=qchiq(1-\alpha/2,n-1) χU2=qchiq(1α/2,n1) χ L 2 = q c h i q ( α / 2 , n − 1 ) \chi^2_{L}=qchiq(\alpha/2,n-1) χL2=qchiq(α/2,n1)

    单样本检验

    总体分布为正态分布

    H 0 : σ 2 ≤ σ 0 2   v s   H a : σ 2 > σ 0 2 H_0: \sigma^2\le\sigma^2_0\ vs\ H_a:\sigma^2>\sigma^2_0 H0:σ2σ02 vs Ha:σ2>σ02

    T . S . : χ 2 = ( n − 1 ) s 2 σ 0 2 T.S.:\chi^2=\frac{(n-1)s^2}{\sigma_0^2} T.S.:χ2=σ02(n1)s2

    R . R . : χ 2 > χ U 2 R.R.: \chi^2>\chi^2_U R.R.:χ2>χU2

    其他两种类型的检验类似,此处略。

    非正态性对检验的影响较大

    两样本检验

    适用条件:两个总体均为正态分布
    H 0 : σ 1 2 ≤ σ 2 2   v s   H a : σ 1 2 > σ 2 2 H_0: \sigma^2_1\le\sigma^2_2\ vs\ H_a:\sigma^2_1>\sigma^2_2 H0:σ12σ22 vs Ha:σ12>σ22

    T . S . : F = s 1 2 s 2 2 T.S.:F=\frac{s_1^2}{s_2^2} T.S.:F=s22s12

    R . R . : F > F α R.R.: F>F_{\alpha} R.R.:F>Fα

    其中 F α F_\alpha Fα自由度为 ( n 1 − 1 , n 2 − 1 ) (n_1-1,n_2-1) (n11,n21)

    若只能查表,须记住如下关系
    F 1 − α , d f 1 , d f 2 = 1 / F α , d f 2 , d f 1 F_{1-\alpha,df_1,df_2}=1/F_{\alpha,df_2,df_1} F1α,df1,df2=1/Fα,df2,df1

    σ 1 2 / σ 2 2 \sigma_1^2/\sigma^2_2 σ12/σ22的区间估计

    适用条件:两个总体均为正态分布
    ( s 1 2 s 2 2 F L , s 1 2 s 2 2 F U ) \Big(\frac{s^2_1}{s_2^2}F_L,\frac{s^2_1}{s_2^2}F_U\Big) (s22s12FL,s22s12FU)
    注意非正态性对检验和估计的影响很大。

    分布数量大于2的方差检验

    BFL test(Brown-Forsythe-Levene test)

    定义
    z i j = ∣ y i j − y ˉ i ⋅ ∣ z_{ij}=\lvert y_{ij}-\bar{y}_{i\cdot}\rvert zij=yijyˉi
    y ˉ i ⋅ \bar{y}_{i\cdot} yˉi为第i类样本的中位数

    BFL test
    H 0 : σ 1 2 = σ 2 2 = ⋯ = σ t 2 H a : 至 少 一 对 方 差 不 等 H_0: \sigma^2_1=\sigma_2^2=\cdots=\sigma_t^2\\H_a: 至少一对方差不等 H0:σ12=σ22==σt2Ha:

    T . S . : L = ∑ i = 1 t n i ( z ˉ i ⋅ − z ˉ ⋅ ⋅ / ( t − 1 ) ) ∑ i = 1 t ∑ j = 1 n i ( z i j − z ˉ i ⋅ ) 2 / ( N − t ) ) T.S.: L=\frac{\sum_{i=1}^tn_i(\bar{z}_{i\cdot}-\bar{z}_{\cdot\cdot}/(t-1))}{\sum_{i=1}^t\sum_{j=1}^{n_i}(z_{ij}-\bar{z}_{i\cdot})^2/(N-t))} T.S.:L=i=1tj=1ni(zijzˉi)2/(Nt))i=1tni(zˉizˉ/(t1))

    L ≥ F α d f 1 , d f 2 d f 1 = t − 1 , d f 2 = N − t L\ge F_{\alpha_df_1,df_2}\\df_1=t-1,df_2=N-t LFαdf1,df2df1=t1,df2=Nt

    更多相关内容
  • 总体方差和样本方差

    万次阅读 多人点赞 2018-05-09 22:44:37
    讨论了总体方差和样本方差的区别

    我们知道,统计学上方差的计算公式如下:
    σ 2 = ∑ i = 1 n ( x i − μ ) n \sigma^2=\frac{\sum_{i=1}^{n}(x_i-\mu)}{n} σ2=ni=1n(xiμ)
    这是统计学中方差的定义,已知条件有总体的均值 μ \mu μ,以及总体个数 n n n,公式的另一种写法为:
    σ 2 = E [ ( x − μ ) 2 ] = ∑ ( x − μ ) 2 p ( x ) \sigma^2=E[(x-\mu)^2]=\sum{(x-\mu)^2}p(x) σ2=E[(xμ)2]=(xμ)2p(x)
    其中 p ( x ) p(x) p(x) x x x出现的概率,所以这个公式只对于离散变量有效


    那么,如果总体量很大,不能做到全部采样,那么就需要用样本来估计总体,假设从总体为 N N N的总数中抽取 n n n个样本,其中 ( N > > n ) (N>>n) (N>>n),采样值为 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn
    样本均值为:
    x ˉ = ∑ i = 1 n x i n \bar{x}=\frac{\sum_{i=1}^{n}{x_i}}{n} xˉ=ni=1nxi
    样本的方差为:
    S 2 = ∑ i = 1 n ( x i − x ˉ ) 2 n S^2=\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n} S2=ni=1n(xixˉ)2
    但是样本的方差和总体的方差是有差别的,计算样本方差的期望值,来估计样本方差和实际方差 σ 2 \sigma^2 σ2之间差了多少:
    E [ S 2 ] = E [ ∑ i = 1 n ( x i − x ˉ ) 2 n ] E[S^2]=E[\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n}] E[S2]=E[ni=1n(xixˉ)2]
    = E [ 1 n ∑ i = 1 n ( ( x i − μ ) − ( x ˉ − μ ) ) 2 ] =E[\frac{1}{n}\sum_{i=1}^{n}{((x_i-\mu)-(\bar{x}-\mu))^2}] =E[n1i=1n((xiμ)(xˉμ))2]
    = E [ 1 n ∑ i = 1 n ( ( x i − μ ) 2 − 2 ( x i − μ ) ( x ˉ − μ ) + ( x ˉ − μ ) 2 ) ] =E[\frac{1}{n}\sum_{i=1}^{n}{((x_i-\mu)^2-2(x_i-\mu)(\bar{x}-\mu)+(\bar{x}-\mu)^2)}] =E[n1i=1n((xiμ)22(xiμ)(xˉμ)+(xˉμ)2)]
    = E [ 1 n ∑ i = 1 n ( x i − μ ) 2 − 2 n ( x ˉ − μ ) ∑ i = 1 n ( x i − μ ) + ( x ˉ − μ ) 2 ] =E[\frac{1}{n}\sum_{i=1}^{n}{(x_i-\mu)^2}-\frac{2}{n}(\bar{x}-\mu)\sum_{i=1}^{n}{(x_i-\mu)}+(\bar{x}-\mu)^2] =E[n1i=1n(xiμ)2n2(xˉμ)i=1n(xiμ)+(xˉμ)2]
    其中
    ∑ i = 1 n ( x i − μ ) \sum_{i=1}^{n}{(x_i-\mu)} i=1n(xiμ)
    = ∑ i = 1 n x i − ∑ i = 1 n μ =\sum_{i=1}^{n}{x_i}-\sum_{i=1}^{n}{\mu} =i=1nxii=1nμ
    = n ( x ˉ − μ ) =n(\bar{x}-\mu) =n(xˉμ)
    所以
    = E [ 1 n ∑ i = 1 n ( x i − μ ) 2 − 2 n ( x ˉ − μ ) ∑ i = 1 n ( x i − μ ) + ( x ˉ − μ ) 2 ] =E[\frac{1}{n}\sum_{i=1}^{n}{(x_i-\mu)^2}-\frac{2}{n}(\bar{x}-\mu)\sum_{i=1}^{n}{(x_i-\mu)}+(\bar{x}-\mu)^2] =E[n1i=1n(xiμ)2n2(xˉμ)i=1n(xiμ)+(xˉμ)2]
    = E [ 1 n ∑ i = 1 n ( x i − μ ) 2 − 2 ( x ˉ − μ ) 2 + ( x ˉ − μ ) 2 ] =E[\frac{1}{n}\sum_{i=1}^{n}{(x_i-\mu)^2}-2(\bar{x}-\mu)^2+(\bar{x}-\mu)^2] =E[n1i=1n(xiμ)22(xˉμ)2+(xˉμ)2]
    = σ 2 − E [ ( x ˉ − μ ) 2 ] =\sigma^2-E[(\bar{x}-\mu)^2] =σ2E[(xˉμ)2]
    (这里 σ 2 \sigma^2 σ2是因为样本方差的期望值是总体方差)
    E [ ( x ˉ − μ ) 2 ] E[(\bar{x}-\mu)^2] E[(xˉμ)2]
    = E ( x ˉ − E [ x ˉ ] ) 2 =E(\bar{x}-E[\bar{x}])^2 =E(xˉE[xˉ])2
    = v a r ( x ˉ ) =var(\bar{x}) =var(xˉ)
    = 1 n 2 v a r ( ∑ i = 1 n x i ) =\frac{1}{n^2}var(\sum_{i=1}^{n}{x_i}) =n21var(i=1nxi)
    = 1 n 2 ∑ i = 1 n v a r ( x i ) =\frac{1}{n^2}\sum_{i=1}^{n}{var(x_i)} =n21i=1nvar(xi)
    = n σ 2 n 2 =\frac{n\sigma^2}{n^2} =n2nσ2
    = σ 2 n =\frac{\sigma^2}{n} =nσ2
    根据上面推导的式子,有以下计算:
    σ 2 − E [ ( x ˉ − μ ) 2 ] \sigma^2-E[(\bar{x}-\mu)^2] σ2E[(xˉμ)2]
    = σ 2 − σ 2 n =\sigma^2-\frac{\sigma^2}{n} =σ2nσ2
    = n − 1 n σ 2 =\frac{n-1}{n}\sigma^2 =nn1σ2
    也就是说,样本估计的方差是总体方差的 n − 1 n \frac{n-1}{n} nn1倍,即所谓的有偏估计。要转换成无偏估计,只需要乘以倍数就可以了
    n n − 1 S 2 = n n − 1 ∑ i = 1 n ( x i − x ˉ ) n = ∑ i = 1 n ( x i − x ˉ ) n − 1 \frac{n}{n-1}S^2=\frac{n}{n-1}\frac{\sum_{i=1}^{n}(x_i-\bar{x})}{n}=\frac{\sum_{i=1}^{n}(x_i-\bar{x})}{n-1} n1nS2=n1nni=1n(xixˉ)=n1i=1n(xixˉ)
    这即是所谓的无偏估计


    当然,还有一种比较直接的解释,由于是求样本中的方差,所以在求解样本均值时,已经用掉了一个自由度的值,所以求方差时,其实有用的值会少一个。例如在只有一个样本时,这时求样本方差是不能估计总体方差的。
    所以,总体方差和样本方差的区别是在于信息量,总体的信息是完全确定的,即这时求出来的统计参数都是能确定地表征总体的分布信息。但是用样本的信息去估计总体,则不能确定表征总体的分布信息,之间相差了一个自由度。

    展开全文
  • 样本方差与总体方差

    万次阅读 多人点赞 2018-12-08 11:59:00
    样本方差与总体方差 一、方差(variance):衡量随机变量或一组数据时离散程度的度量。 概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。  统计中的方差(样本方差)是每个...

    样本方差与总体方差

    一、方差(variance):衡量随机变量或一组数据时离散程度的度量。                                

    概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。

     统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。                                        

    概率论中的方差表示方法 :                        

    样本方差,无偏估计、无偏方差(unbiased variance)。对于一组随机变量,从中随机抽取N个 样本,这组样本的方差就 是Xi^2平方和除以N-1。

    总体方差,也叫做有偏估计,其实就是我们从初高中就学到的那个标准定义的方差,除数是N。

    统计中的方差表示方法 :  
                

    二、为什么样本方差的分母是n-1?为什么它又叫做无偏估计?

    简单的回答,是因为因为均值你已经用了n个数的平均来做估计在求方差时,只有(n-1)个数和均值信息是不相关的。

    而你的第n个数已经可以由前(n-1)个数和均值来唯一确定,实际上没有信息量。所以在计算方差时,只除以(n-1)。

    那么更严格的证明呢?

    样本方差计算公式里分母为n-1的目的是为了让方差的估计是无偏的。

    无偏的估计(unbiased estimator)比有偏估计(biased estimator)更好是符合直觉的,尽管有的统计学家认为让mean square error即MSE最小才更有意义,这个问题我们不在这里探讨;

    不符合直觉的是,为什么分母必须得是n-1而不是n才能使得该估计无偏。

    首先,我们假定随机变量的数学期望是已知的,然而方差未知。在这个条件下,根据方差的定义我们有

    \mathbb{E}\Big[\big(X_i -\mu\big)^2 \Big]=\sigma^2, \quad\forall i=1,\ldots,n,

    由此可得

    \mathbb{E}\Big[\frac{1}{n} \sum_{i=1}^n\Big(X_i -\mu\Big)^2 \Big]=\sigma^2

    \frac{1}{n} \sum_{i=1}^n\Big(X_i -\mu\Big)^2是方差\sigma^2的一个无偏估计,注意式中的分母不偏不倚正好是n

    这个结果符合直觉,并且在数学上也是显而易见的。

    现在,我们考虑随机变量X的数学期望\mu是未知的情形。这时,我们会倾向于无脑直接用样本均值\bar{X}替换掉上面式子中的\mu。这样做有什么后果呢?后果就是,

    如果直接使用\frac{1}{n} \sum_{i=1}^n\Big(X_i -\bar{X}\Big)^2作为估计,那么你会倾向于低估方差!

    这是因为:
    \begin{eqnarray}\frac{1}{n}\sum_{i=1}^n(X_i-\bar{X})^2 &=&\frac{1}{n}\sum_{i=1}^n\Big[(X_i-\mu) + (\mu -\bar{X}) \Big]^2\\&=&\frac{1}{n}\sum_{i=1}^n(X_i-\mu)^2 +\frac{2}{n}\sum_{i=1}^n(X_i-\mu)(\mu -\bar{X})+\frac{1}{n}\sum_{i=1}^n(\mu -\bar{X})^2 \\&=&\frac{1}{n}\sum_{i=1}^n(X_i-\mu)^2 +2(\bar{X}-\mu)(\mu -\bar{X})+(\mu -\bar{X})^2 \\&=&\frac{1}{n}\sum_{i=1}^n(X_i-\mu)^2 -(\mu -\bar{X})^2 \end{eqnarray}
    换言之,除非正好\bar{X}=\mu,否则我们一定有
    \frac{1}{n}\sum_{i=1}^n(X_i-\bar{X})^2 <\frac{1}{n}\sum_{i=1}^n(X_i-\mu)^2,
    而不等式右边的那位才是的对方差的“正确”估计!
    这个不等式说明了,为什么直接使用\frac{1}{n} \sum_{i=1}^n\Big(X_i -\bar{X}\Big)^2会导致对方差的低估。

    那么,在不知道随机变量真实数学期望的前提下,如何“正确”的估计方差呢?答案是把上式中的分母n换成n-1,通过这种方法把原来的偏小的估计“放大”一点点,我们就能获得对方差的正确估计了:
    \mathbb{E}\Big[\frac{1}{n-1} \sum_{i=1}^n\Big(X_i -\bar{X}\Big)^2\Big]=\mathbb{E}\Big[\frac{1}{n} \sum_{i=1}^n\Big(X_i -\mu\Big)^2 \Big]=\sigma^2.

    三、理论推导

     

    为了方便叙述,在这里说明好数学符号:

    前面说过样本方差之所以要除以(n-1)是因为这样的方差估计量才是关于总体方差的无偏估计量。在公式上来讲的话就是样本方差的估计量的期望要等于总体方差。如下:

    但是没有修正的方差公式,它的期望是不等于总体方差的

                                

    也就是说,样本方差估计量如果是用没有修正的方差公式来估计总计方差的话是有偏差的

    下面给出比较好理解的公式推导过程:

    也就是说,除非否则一定会有

    需要注意的是不等式右边的才是的对方差的“正确”估计,但是我们是不知道真正的总体均值是多少的,只能通过样本的均值来代替总体的均值。

    所以样本方差估计量如果是用没有修正的方差公式来估计总计方差的话是会有偏差,是会低估了总体的样本方差的。为了能无偏差的估计总体方差,所以要对方差计算公式进行修正,修正公式如下:

    这种修正后的估计量将是总体方差的无偏估计量,下面将会给出这种修正的一个来源;

    为了能搞懂这种修正是怎么来的,首先我们得有下面几个等式:

    1.方差计算公式:  

                 

    2. 均值的均值、方差计算公式:

                 

    对于没有修正的方差计算公式我们有: 

    因为:

                      

    所以有:

                      

    在这里如果想修正的方差公式,让修正后的方差公式求出的方差的期望为总体方差的话就需要在没有修正的方差公式前面加上来进行修正,即:

                      
    所以就会有这样的修正公式:

        

    而我们看到的都是修正后的最终结果:

                           

    这就解释了为什么要对方差计算公式进行修正,且为什么要这样修正。

    上面的解释如果有什么错误,或者有哪些解释不正确的地方欢迎大家指正。谢谢大家。希望能对大家有点帮助。

     

    参考:

    https://blog.csdn.net/zxyhhjs2017/article/details/79149111

    https://blog.csdn.net/qq_39521554/article/details/79633207

    https://blog.csdn.net/cqfdcw/article/details/78173839

    https://www.matongxue.com/madocs/607.html

    https://www.matongxue.com/madocs/808.html

    posted @ 2018-12-08 11:59 小时候挺菜 阅读( ...) 评论( ...) 编辑 收藏
    展开全文
  • 两正态总体方差比的置信区间的优化研究,蔡洁,,置信区间端点比值最小的意义下,推导出求解优化置信区间的条件,得到这一区间实际上也就是UMAU(一致最准确无偏)置信区间,并证明
  • 前言: 目前 假设检验主要讨论的服从正态分布... 一 单个总体方差的情况 二 两个总体的情况 三 代码以及 例子 一 单个总体方差的情况 单个总体 均值未知 1.1 原假设假设: 右边检验 左边检验 ...

    前言:

          目前 假设检验 主要 讨论的服从正态分布的对象

         均值 和方差的情况。

         分为 单个总体 和 两个总体的情况

       例子 来自 《概率论与数理统计》第八章

     目录:

         一  单个总体方差的情况

        二   两个总体的情况

       三   代码 以及 例子


    一  单个总体方差的情况

          单个总体 均值 未知

      1.1  原假设假设:

             \sigma^2\leq \sigma_0^2  右边检验

             \sigma^2\geq \sigma_0^2  左边检验

              \sigma^2=\sigma_0^2 双边检验

       1.2 统计量

                 Z = \frac{(n-1)S^2}{\sigma_0^2} \sim \chi (n-1)

       应用见例8

    二  两个总体的情况

            X_1,X_2,....X_n 来自总体的样本N(u_1,\sigma_1^2)

            Y_1,Y_2,....,Y_n 来自总体的样本N(u_2,\sigma_2^2)

            样本方差S_1^2,S_2^2,且总体均值,方差未知

        则统计量为

       Z= \frac{s_1^2}{s_2^2} \geq F(n_1-1,n_2-1)

       见例9 

    三  例子

    ​​​​​​

    # -*- coding: utf-8 -*-
    """
    Created on Fri Aug  6 17:37:24 2021
    
    @author: chengxf2
    假设检验
    
    """
    import numpy as np
    from scipy.stats import chi2  # 卡方分布
    from scipy.stats import norm
    from scipy.stats import t
    from scipy.stats import f
    import matplotlib.pyplot as plt
    class hypothesis :
        
        
        def Draw(self):
            
            fig, ax = plt.subplots(1, 1)
            x = np.linspace(norm.ppf(0.01), norm.ppf(0.99), 100)
            ax.plot(x, norm.pdf(x), 'r-', lw=5, alpha=0.6, label='norm pdf')
            
        '''
        随机变量服从正太分布,方差均值已知情况
        Args
           H0 假设样本均值和总体无偏差
           已知参数:
              总体均值,总体方差,
              样本均值,样本个数
         return 
             样本均值和总体均值的拟合情况
        '''
        def example_1(self):
            u = 0.5
            sigma = 0.015
            alpha = 0.05
            
            x = [0.497, 0.506, 0.518, 0.524, 0.498, 0.511, 0.520, 0.515, 0.512]
            x_bar = np.mean(x)
            n = len(x)
    
            
            print("\n step1 H0 假设样本均值和总体无偏差")
            z = (x_bar-u)/(sigma/np.sqrt(n))
            
            print("\n step2 统计量 %5.2f"%z,"\t 样本个数 ",n)
            w =  norm.ppf(alpha/2)  #
            w1 = norm.ppf(1-alpha/2)
            
            print("\n step3 : 拒绝区域  [-, %5.2f] [ %5.2f ,+]"%(w,w1))
            
            if z> w and z<w1:
                print("\n step4: 结论: 假设H0 成立")
            else:
                print("\n step4: 结论 假设H1 成立")
        
        '''
        右边检验:
        Args
           牛奶的例子
        return
           
        '''
        def example_2(self):
            
            #已知条件
            u = -0.545 #总体均值
            sigma = 0.008     #总体方差
            n = 5 #样本个数
            x_bar = -0.535 #样本均值
            alpha = 0.05 #置信度
            
            print("\n step1 H0 牛奶无掺水 u<u0 ")
            z = (x_bar-u)/(sigma/np.sqrt(n))
            print("\n step2 统计量 %5.2f"%z,"\t 样本个数 ",n)
            
            w = norm.ppf(1-alpha)
            print("\n step3 : 拒绝区域  [ %5.2f ,+]"%w)
            
            if z>w:
               print("\n step1 4 拒绝H0 牛奶掺水  ")
            else:
               print("\n step1 4 接受H0 牛奶无掺水  ")
               
               
        '''
        总体服从正态分布,均值方差未知,样本均值,方差已知
        Args
           样本的均值
        return
           
        '''
        def example_3(self):
            
            #已知条件
            u = -0.545 #总体均值
            sigma = 0.008     #总体方差
            n = 5 #样本个数
            x_bar = -0.535 #样本均值
            alpha = 0.05 #置信度
            
            print("\n step1 H0 牛奶无掺水 u<u0 ")
            z = (x_bar-u)/(sigma/np.sqrt(n))
            print("\n step2 统计量 %5.2f"%z,"\t 样本个数 ",n)
            
            w = norm.ppf(1-alpha)
            print("\n step3 : 拒绝区域  [ %5.2f ,+]"%w)
            
            if z>w:
               print("\n step1 4 拒绝H0 牛奶掺水  ")
            else:
               print("\n step1 4 接受H0 牛奶无掺水  ")
               
        '''
        原件寿命的例子,右边检验
        单个总体服从标准正态分布,方差,均值未知
        样本均值,方差已知,统计量服从t分布
        '''
        def example_4(self):
            X = np.array([159, 280, 101, 212, 224, 379, 179 ,264,
                          222, 362, 168, 250, 149, 260, 485, 170 ])
        
            alpha = 0.05
        
            x_bar = np.mean(X)
            s = np.std(X,ddof=1)#样本差,必须使ddof=1:
            n = len(X)
            
            z =(x_bar-225)/(s/np.sqrt(n))
            
            print("\n step2: 统计量 %5.2f  样本方差 %5.2f"%(z,s))
            
            w = t.ppf(1-alpha,df=n-1)
            print("\n step3 : 拒绝区域  [ %5.2f ,+]"%w)
            
            
            if z>w:
               print("\n step1 4 拒绝H0 寿命大于225h  ")
            else:
               print("\n step1 4 接受H0 寿命小于等于225h  ")
               
        '''
        两个正态分布差值的检验,方差相等符合t分布。如果方差不等,但是已知,符合正太分布
        测定冰的例子,右边检验
        Args
          方差相等
          样本方差,均值已知
          跟例题结果有点偏差是因为 小数点精度不一致导致的。
          
        '''
        def example_5(self):
            
            x_A = np.array([79.98, 80.04, 80.02, 80.04, 80.03, 80.03, 80.04,
                            79.97, 80.05, 80.03, 80.02, 80.00, 80.02])
            x_B = np.array([80.02, 79.94, 79.98, 79.97, 79.97, 80.03, 79.95, 79.97])
            
            x_barA = np.mean(x_A)
            x_barB = np.mean(x_B)
            
            print("\n xa %5.2f  xb %5.2f"%(x_barA,x_barB))
            
            x_bar = x_barA-x_barB
            n1 = len(x_A)
            n2 = len(x_B)
            sa = np.std(x_A,ddof=1)
            sb = np.std(x_B,ddof=1)
            
            saa = np.power(sa,2)
            sbb = np.power(sb,2)
    
            s = (n1-1)*saa+(n2-1)*sbb
            
            print("\n sa  %8.7f  sb:  %8.7f"%(sa,sb))
            print("\n n1 %d n2 %d"%(n1,n2))
            sww= s/(n1+n2-2)
            #sww = 0.0007178
            print("\n sww %8.7f  "%sww)
            
            z = (x_bar)/(np.sqrt(sww)*np.sqrt(1/n1+1/n2))
            print("\n step2: 统计量:  %5.3f  "%z)
            
            df = n1+n2-2
            alpha = 0.05 #置信度
            w = t.ppf(1-alpha,df)
         
            print("\n step3 : 拒绝区域  [ %5.3f ,+]"%w)
            
            
            if z>w:
               print("\n step1 4 拒绝H0  方法A 比方法B测得的融化热要大  ")
            else:
               print("\n step1 4 接受H0   方法A 测得的温度小于等于方法B   ")
               
        '''
        成对数据的检验,逐对比较法, t 分布,双边检验
        Args
           在同样的方法下得到成对数的观测值
           其差值假设服从正太分布
           样本的均值,方差已知
           
        '''
        def example_6(self):
            x = np.array([0.20, 0.30, 0.40, 0.50, 0.60, 0.70, 0.80, 0.90, 1.00])
            y = np.array([0.10, 0.21, 0.52, 0.32, 0.78, 0.59, 0.68, 0.77, 0.89])
            
            d = x-y
            n = len(d)
            x_bar = np.mean(d)
            sd = np.std(d, ddof=1)
            
            z = x_bar/(sd/np.sqrt(n))
            
            print("\n 统计量 %5.3f"%z)
            
            
            alpha = 0.01
            df = n-1
            w = t.ppf(alpha/2, df)
            
            print("\n step3 : 拒绝区域  [ %5.3f ,+]"%w)
            
            
            if np.abs(z)>np.abs(w):
               print("\n step1 4 拒绝H0  两台仪器测量有差异  ")
            else:
               print("\n step1 4 接受H0   两台仪器测量无差异   ")
               
        
        '''
        成对数据的检验,逐对比较法, t 分布,左边检验
        Args
           在同样的方法下得到成对数的观测值
           其差值假设服从正太分布
           样本的均值,方差已知
           
        '''
        def example_7(self):
            x = np.array([0.30, 0.23, 0.41, 0.53, 0.24, 0.36, 0.38, 0.51])
            y = np.array([0.43, 0.32, 0.58, 0.46, 0.27, 0.41, 0.38, 0.61])
            
            d = x-y
            n = len(d)
            x_bar = np.mean(d)
            sd = np.std(d, ddof=1)
            
            z = x_bar/(sd/np.sqrt(n))
            
            print("\n 统计量 %5.3f"%z)
            
            
            alpha = 0.05
            df = n-1
            w = t.ppf(alpha, df)
            
            print("\n step3 : 拒绝区域  [-, %5.3f]"%w)
            
            
            if z<w:
               print("\n step1 4 拒绝H0  红光反应时间小于绿光  ")
            else:
               print("\n step1 4 接受H0   红绿光反应的时间相等   ")
               
            
            
        '''
        单个总体情况
        样本服从标准正太分布,均值未知
        Args
           统计量服从卡方分布
        
        '''    
        def  example_8(self):
            sigma = 5000
            n = 26
            alpha = 0.02
            s= 9200
            
            z = (n-1)*s/sigma
            print("\n 统计量 %5.3f"%z)
            
            df = n-1
            wLeft = chi2.ppf(alpha/2,df)
            wRight = chi2.ppf(1-alpha/2,df)
            
            print("\n step3 : 拒绝区域  [-, %5.3f] [%5.3f +]"%(wLeft,wRight))
            
            
            if z<wLeft or z>wRight:
                print("\n 拒绝H0 有显著的波动")
            else:
                print("\n 接受H0 无显著差异")
    
        '''
        单个总体情况
        样本服从标准正太分布,均值未知
        Args
           统计量服从卡方分布
        
        '''    
        def  example_9(self):
            
            n1 = 13
            n2 = 8
            alpha = 0.01
            s1 = 0.024**2
            s2 = 0.031**2
            
            
            z= s1/s2
            print("\n 统计量 %5.3f"%z)
            
            df1 = n1-1
            df2 = n2-1
            wLeft = f.ppf(alpha/2,df1,df2)
            wRight = f.ppf(1-alpha/2,df1,df2)
            
            print("\n step3 : 拒绝区域  [-, %5.3f] [%5.3f +]"%(wLeft,wRight))
            
            
            if z<wLeft or z>wRight:
                print("\n 拒绝H0 有显著的波动")
            else:
                print("\n 接受H0 无显著差异")
            
            
            
    
    
            
            
            
                
                
            
        def __init__(self):
            pass 
        
    if __name__ =="__main__":
        
        hy =hypothesis()
        
        hy.example_9()
        

         

         

    展开全文
  • 具体问题中,选择什么统计量,需要考虑的因素有:总体方差已知还是未知,用于进行检验的样本是大样本还是小样本,等等。 3.选取显著性水平,确定接受域和拒绝域 4.计算检验统计量的值 5.作出统计决策 总体均值的...
  • ③各总体方差相等,即方差齐。2、方差分析的用途:①两个或多个样本均数间的比较;②分析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元线性回归分析中偏回归系数的假设检验;⑤两样本的方差齐性...
  • 7.1 参数估计的基本原理 ...比如用样本量计算出来的平均值作为总体的平均值,那么这个平均值这时就称为估计值。 7.1.2 点估计与区间估计 excel中计算指定概率对应的面积公式:=normsinv(指定的概率) 例:
  • 点估计(Point Estimate) 就是用样本统计量作为总体参数的估计,...点估计的基础上,在一定的置信水平下,给样本统计量加上一个区间范围作为总体参数的取值范围,这个 区间叫置信区间(Confidence Interval) ...
  • 讨论了养渔业中终重固定时,各个正态总体样本容量不等条件下,考虑方差与均 值均成比例,且比例系数相等时的异方差分析法,以及该方法饲料配方的选取中的应用。通 过实例和数值模拟表明该方法的有效性、实用性。
  • 第二个值为该统计量对应的P值 0.75>>0.05,说明显著性水平0.05条件下, 没有充分证据表明应当拒绝原假设 ''' print(sm.stats.DescrStatsW(mobile['csi']).ttest_mean(value=82, alternative='larger')) ...
  • 3、总体方差在1- a 置信水平下的置信区间为   ------------------------------------------------------------------------------------------------------------------------------------------------...
  • 正态总体的样本均值与样本方差的分布定理

    千次阅读 多人点赞 2020-09-15 20:41:51
    正态总体的样本均值与样本方差的分布相关定理
  • 正态总体均值与方差的置信区间
  • 在总体方差未知下,当样本容量n>30时,即为大样本时,可用正态分布近似替代t分布,因此无论方差是否可知,根据中心极限定理,只要抽取样本足够大,抽样分布就会服从正态分布。” 有个遗留问题,既然...
  • 方差分析知识点汇总

    千次阅读 2021-11-07 03:45:17
    三、方差分析的应用条件 四、方差分析的主要内容 一、什么是方差分析 方差分析(ANOVA)又称“变异数分析”或“F检验”,是R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验。 由于各种因素的影响,...
  • 这个测试不% 要求满足方差齐性的条件。 % 对于后期测试,建议运行“multicmp”功能。 % % 数据应单个向量 y 中给出,组由% 组标签 g 的相应向量(例如,从 1 到% k)。 这是不施加任何限制的一般形式每组或组标签...
  • “通常,总体方差是无法获知的,此时可以用能计算出的样本的标准差s来代替未知的总体的标准差σ,但此时新的统计量不再服从正态分布,而是服从自由度为n-1的t分布” 解答:
  • 方差|初中方差的计算公式

    千次阅读 2021-02-12 05:39:39
    教学设计示例1第一课时素质教育目标(一)知识教学点使学生了解方差、标准差的意义,会计算一组数据的方差与标准差.(二)能力训练点1.培养学生的计算能力.2.培养学生观察问题、分析问题的能力,培养学生的发散思维...
  • Matlab方差分析

    万次阅读 多人点赞 2018-11-01 19:57:33
    Matlab 方差分析(T检验) 工农业生产和科学研究中,经常遇到这样的问题:...在方差分析中,把试验中变化的因素称为因子,用A、B、C、…表示;因子试验中所取的不同状态称为水平,因子A的r个不同水平用A1、A2、…、...
  • R语言——方差分析

    千次阅读 2021-01-17 15:07:32
    一、方差分析的基本概念方差分析是20世纪20年代发展起来的一种统计方法,它是由英国统计学家费希尔进行实验设计时为解释实验数据而首先引入的。从形式上看,方差分析是比较多个总体的均值是否相等;但是其本质上...
  • ANOVA方差分析

    千次阅读 2022-01-06 22:05:28
    1 前言 上回书说到最小样本量的选择更侧重单样本或两样本均值和比率的检验。...比如新药的有效性受到适应症、剂量、给药途径和方法、每日给药次数等条件的影响,比如商品销量受到广告投放,商品价格,淡旺季等等条件
  • 这项研究中,我们提出了一种修正比率类型估计器,用于简单随机抽样下研究变量y的总体方差,而无需使用峰度系数和辅助变量x的中值进行替换。 估计器的属性已推导至泰勒级数展开的一阶。 从理论上推导出的效率条件...
  • excel 重复方差分析Recently, we looked at how to Perform a One-Way Analysis of Variance in Excel. In today’s article, we will take that a step further and a...最近,我们研究了如何Excel中执行方差的单...
  • R | 方差分析

    千次阅读 2018-11-21 13:44:51
    方差分析(analysisofvariance ,ANOVA ): 用于 两个或两个以上 样本均数的比较 , 还可分析两个或多个研究因素的 交互作用 以及回归方程的 线性假设检验 等。(涉及总变异、组内变异、组...方差分析的前提条件 ...
  • 使用R语言进行单因素方差分析

    千次阅读 2021-01-17 15:07:28
    1、方差分析的基本概念方差...它直接对多个总体的均值是否相等进行检验。方差分析能够解决多个均值是否相等的检验问题。方差分析是要检验各个水平的均值是否相等,采用的方法是比较各水平的方差。如研究不同的销售点...
  • 假设检验之F检验-方差分析

    千次阅读 2021-02-09 09:45:40
    F检验(F-test),最常用的别名叫做联合假设检验(英语:joint hypotheses test),此外也称方差比率检验、方差齐性检验,方差分析,它是一种(H0)之下,统计值服从的检验。其通常是用来分析用了超过一个参数的统计模型...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 13,737
精华内容 5,494
关键字:

在总体方差一定的条件