精华内容
下载资源
问答
  • 一、单样本均数假设检验(一元数据)(1)样本所在的总体方差已知单样本假设检验: 也就是说样本所在总体的的离散程度已知,只是均数未知。只需要对均数进行假设检验即可,这样做原因是:对于正态分布而言,只有...

    一、单样本均数假设检验(一元数据)

    (1)样本所在的总体方差已知的单样本假设检验:

    也就是说样本所在总体的的离散程度已知,只是均数未知。只需要对均数进行假设检验即可,这样做的原因是:对于正态分布而言,只有两个参数——均数和方差,只有均数和方差都定了,这个正态分布才能确定下来,如果只知道均数,或只知道方差,那么剩下的那个参数依然是可变的,这个正态分布就不唯一,也就不能确定下来。

    举例(例子纯属虚构):海南省高中生平均身高是170cm,标准差是10cm,(1)现在调查了海口市的所有高中生,得到平均身高:173cm,标准差12cm。(2)现在在海口市的高中生中随机抽取1000名学生,平均身高:171cm,标准差14cm。问题:海口市的高中的平均身高和海南省的平均身高有统计学差异吗?

    两个总体:海口市的所有高中生是一个总体,海南省的所有高中生也是一个总体,比较这两个总体的差异。对于问题(1),貌似不需要做假设检验,因为调查了海口市的所有高中生。如果这个调查和海口市的高中生的总体身高一摸一样,没有半点出入,那么可以说这次测量得到的数据就是总体的数据。然而,这是不可能做到的,因为只要是测量就存在测量误差(测不准原理),测量误差也属于随机误差。同理,海南省高中生的平均身高也是测量得到的,也存在测量误差。因此,既然有随机误差,那么这两侧测量结果之间的差异究竟是由随机误差造成的还是由于本身总体的不同造成的呢?所以,就需要假设检验。

    对于已知样本方差的情况,其实也是一种估计,用其他的方差代替本次抽样的样本方差,因为如果知道了样本所在总体的方差,就一定知道这个总体所在的均数,否则这就是一个人为的没有保存好数据的错误了。样本方差已知的情况,有助于理解假设检验原理,实际上是不存在的,最多也是一种估计。

    现在换一个简单的例子并用R代码实现:

    海口市高三学生的平均身高是170cm,标准差5cm,现随机抽取100名海口市的高三学生,平均身高为172,问:此次抽样结果与海口市高三学生的平均身高是否有统计学差异?

    检验方法:Z检验,用到的包:BSDA(需要下载和安装)

    a1dc8d73a79b82164eb0ce928546fffa.png

    80c66451fffdc403685168b8772a415a.png
    mu总体的均值,sigmu.x是总体标准差,X是抽样得到的随机样本

    487d0eb31b1e63fe4cc40ae191bb5781.png

    因为题目给出的是汇总数据,所以采用后者:zsum.test()

    zsum.test(mean.x = 172,sigma.x = 5,n.x = 100,mu=170)

    874bb4387d3c169b24b4a7874713fb17.png

    P < 0.05,拒绝原假设,说明这100个高三学生的身高与海口市高三学生平均身高的差异由统计学意义,且高于平均水平。

    (2)样本所在总体方差未知的单样本假设检验

    当样本所在的总体方差未知时,需要用样本的方差估计其总体的方差。此时,采用单样本的t检验。样本量较小时,自由的取n-1为总体方差的无偏估计,当样本量比较大时(>100),t分布逼近正态分布,还可采用z检验。条件:样本服从正态分布,独立性。

    如果已知的总体和样本所在的总体是同一个总体,那么两者的总体均数相同,因此由样本所计算出的统计量,在小概率原理下,就不可能落在拒绝域,如果落在了拒绝域,说明它们不是一个总体。

    举例:海口市高三学生的平均身高是170cm,现随机抽取100名海口市的高三学生,平均身高为172,标准差5cm,问:此次抽样结果与海口市高三学生的平均身高是否有统计学差异?

    检验方法:t检验,BSDA包

    9931e86431e518e671496f7839973083.png
    这是用于原始数据的

    c0cc5b5a442c80b692ae653d2f27d83c.png
    这是用于汇总数据的
    tsum.test(mean.x = 172,s.x = 5,n.x = 100,mu=170)

    34e90eea56e1bd6df98f89b48e8e3991.png

    二、单样本均值向量假设检验(多元数据)

    多元数据中,用距离来理解分布更为简单,向量与向量之间有一个距离,这个距离服从某一分布。

    (1)已知样本所在的体的协方差阵

    根据多元正态分布的性质:

    0f45bc4b51ac8891da8ccde7b01c9d78.png
    https://www.bilibili.com/video/BV1TE411j7pF?p=5

    482e7acfd2c53e8e00fecb3e8406a1b5.png
    多元正态分布的性质,d为马氏距离

    问题:为什么上述的公式中没有n,而下面的公式中有n呢?

    原因是上述公式中的X是一个随机向量,u是这个随机向量的均值向量,∑为这个随机向量的协方差阵;而下面的公式,ybar是从总体中抽样得到的一组数据的均值向量,这个均值向量服从的是由中心极限定理得到的抽样分布,这个抽样分布的协方差肯定不是原来的协方差,而且要比原协方差小。

    0e9a485170cc1b3b04b6dcbb8a7a4930.png
    Z:马氏距离

    39f50a02276ab9d4fdee4d7ef96be049.png

    由中心极限定理,从服从多元正态分布的总体中抽出部分个体组成一个样本,这个样本的均值向量服从总体均值向量U,总体协方差为∑/n的多元正态分布,且这个均值向量与总体均值向量的马氏距离服从自由度为P的卡方分布。因此,在协方差已知的情况下,只要计算出样本均值向量,就可以和给定的总体均指向量进行比较,看是否有统计学差异。举例如下:

    某市成年男性的平均身高:172,体重:65,胸围:82(cm),调查该市中的某个地区20名成年男性,数据如下,总体的协方差为∑,问:该地区的成年男性体格信息与这个市的平均水平是否有统计学差异?

    数据用R生成:

    01.先产生总体:

    set.seed(2.71828)
    mean1<-c(172,65,82)#总体均值向量
    height<-rnorm(2000,mean = 172,sd=5)
    weight<-rnorm(2000,mean = 65,sd=5)
    bust<-rnorm(2000,mean = 82,sd=5)
    men<-data.frame(height,weight,bust)
    men
    cov_t<-cov(men)
    #以下是总体协方差:cov_t
               height     weight       bust
    height 25.2256358  0.5604626  0.3351971
    weight  0.5604626 25.2183985  0.8087767
    bust    0.3351971  0.8087767 23.5177260

    02.然后产生某个地区的20名成年男性的体格数据:

    h<-rnorm(20,mean = 172,sd=5)
    w<-rnorm(20,mean = 65,sd=5)
    b<-rnorm(20,mean = 82,sd=5)
    m<-data.frame(h,w,b)

    03.统计检验

    step1:计算样本均值向量

    > mean_vector<-colMeans(m)
    > mean_vector
            h         w         b 
    169.52067  63.61668  80.90221 

    step2:计算马氏距离

    #根据样本均值向量与总体均值向量的马氏距离公式:前面的20是样本量,t()矩阵转置,solve()用来计算总体协方差矩阵的逆
    m_d_square<-20*t(mean_vector-mean1)%*%solve(cov_t)%*%(mean_vector-mean1)
    m_d_square

    step3:求出这个距离所对应的chi-square分布的概率(曲线下面积),拒绝域右侧概率

    d83eb867b2c574b53a0fdd89d8160411.png

    e074a037796d556a0b854d3847fbf223.png

    函数解释:

    • dchisq: 计算分位数所对应的密度函数的函数值,不是算概率的
    • pchisq: 计算某个分位数所对应的概率,计算的是累积概率,如算卡方值为5的累积概率
    • qchisq: 求某个概率的分位数,也就是某个概率下X轴上所对应的点
    • rchisq: 产生服从卡方分布的随机数
    • lower.tail logical; if TRUE (default), probabilities are P[X ≤ x], otherwise, P[X > x].
    • lower.tail的翻译:首先是一个逻辑参数,默认是TRUE,如果设置成TRUE,则计算的是小于等于某个值的概率,也就是左侧的概率,如果设置成FALSE,则计算X>某个值的概率,也就是右侧的概率。

    依据上述解释,应当使用pchisq()

    > pchisq(q=m_d_square,df=3,lower.tail = FALSE)
               [,1]
    [1,] 0.06685167

    显然,P=0.067>0.05

    step4:得出结论

    该地区的成年男性体格与这个市的平均水平统计学差异。

    多元统计中,均值向量的检验还可以使用ICSNP包的Hotelling's T2 Test.

    但是这个Hotelling's T2 检验不能用总体协方差矩阵,也就是说不适合做已知协方差阵的情况,这个的算法是通过样本的协方差矩阵来估计总体的协方差矩阵,所以说它适合未知总体协方差矩阵的情况。实际上,总体已知的情况还是太过理想了,现实中几乎不存在的,之所以有这个例子,是为了理解整个计算和推理的过程。

    9d89092c43c5eb83234fec03b8697157.png

    (2)未知样本所在总体的协方差阵

    当总体协方差未知时,用样本的协方差估计总体的协方差,这时在算样本协方差时,离均差乘积和除以n-1,而不是n。因为只有除n-1才是对总体协方差的无偏估计。

    在马氏距离的计算中,S11其实是总体的方差,同样S22...也是总体的方差,因此,对于任一个体均值向量与总体均值向量马氏距离的计算用的是总体的协方差阵。马氏距离的关键就在明白协方差阵A到底是用什么计算的,样本均值向量所对应的总体协方差阵是总体协方差阵除以n,记为∑/n,所以,要计算样本均值向量与总体均值向量的马氏距离,就一定要用∑/n。然而,∑是未知的,需要用样本的cov来估计。一旦如此,样本均值向量与总体均值向量的马氏距离便不服从卡方分布,而是服从自由度为P和n-1的Hotelling-T2分布。一般软件计算样本协方差是都是除以n-1。

    0ad8d665ad97d133a94ea2d92fd2d22a.png

    49039d78b04df485e5cab17d076d4eef.png

    仍然使用上面的例子:

    分别用逐步手工计算法和HotellingsT2函数法,然后比较二者的计算结果。

    在用手工计算马氏距离时其他的都无需改变,只要用样本协方差阵取代总体协方差阵即可。因为R语言中cov()函数本来就是离均差乘积和除以n-1的。当样本量足够大时,这样算出来的协方差阵就相当于总体的协方差阵了。

    set.seed(2.71828)
    mean1<-c(172,65,82)
    height<-rnorm(2000,mean = 172,sd=5)
    weight<-rnorm(2000,mean = 65,sd=5)
    bust<-rnorm(2000,mean = 82,sd=5)
    men<-data.frame(height,weight,bust)
    men
    cov_t<-cov(men)
    h<-rnorm(20,mean = 172,sd=5)
    w<-rnorm(20,mean = 65,sd=5)
    b<-rnorm(20,mean = 82,sd=5)
    m<-data.frame(h,w,b)
    mean_vector<-colMeans(m)
    mean_vector
    #使用总体协方差算马氏距离
    m_d_square<-20*t(mean_vector-mean1)%*%solve(cov_t)%*%(mean_vector-mean1)
    m_d_square
    pchisq(q=m_d_square,df=3,lower.tail = FALSE)
    #使用HotellingsT2检验算马氏距离
    library(ICSNP)
    HotellingsT2(m, mu = c(172,65,82), test = "chi")
    #使用样本协方差算马氏距离
    m_d_square2<-20*t(mean_vector-mean1)%*%solve(cov(m))%*%(mean_vector-mean1)
    m_d_square2
    pchisq(q=m_d_square2,df=3,lower.tail = FALSE)

    b845fe3cace9d10673a4b758c28fa923.png

    b48578087b611a40113f4da7cba9af14.png

    ceac55dd1b833a04a393fd2f3f2039ca.png

    结论:

    • 使用总体协方差阵和使用样本协方差阵得到的马氏距离不同;
    • 使用样本协方差阵和使用HotellingT2()得到的马氏距离相同;
    • HotellingT2其实就是马氏距离;
    • 通过距离来进行统计检验就是一种思路。
    展开全文
  • 两个正态总体均值的检验1.概述2.例题五.逐对比较法1.概述2.例题13.例题2六.卡方分布的概率密度函数 一.概述 假设检验的步骤可以归纳 如下: (1) 写出原假设和备择假设; (2) 在原假设成立的条件下,构造一个统计量...

    一.概述

    假设检验的步骤可以归纳
    如下:
    (1) 写出原假设和备择假设;
    (2) 在原假设成立的条件下,构造一个统计量,该统计量服从某一分布;
    (3) 用已知的样本数据带入统计量的公式,得到一个检验值;
    (4) 给定置信水平来得到一个接受域的区间,看检验值是否落在接受域中,或者用检验值和区间的临界值进行比较,来判断是否接受原假设(或者计算该检验值对应于其分布的p值,并将p值和指定的显著性水平比较从而来确定是否接受原假设)。

    二.规律

    在这里插入图片描述

    三.例题

    1.标准正态分布

    在这里插入图片描述
    在这里插入图片描述
    HH0:u=0.5u=0.5,HH1:u=/0.5u=/0.5
    构造统计量
    在这里插入图片描述
    在这里插入图片描述
    然后求利用新的统计量的值
    在这里插入图片描述
    根据置信区间判断是否拒绝原假设
    在这里插入图片描述
    从p值的结果重新判断
    在这里插入图片描述

    2.单侧检验

    在这里插入图片描述
    在这里插入图片描述

    3.tt检验例题

    在这里插入图片描述
    在这里插入图片描述

    三.了解一些单个检验

    1.zz检验

    在这里插入图片描述
    Z检验法的核心是总体服从正态分布,且该正态分布的均值未知,需要我们检验,但方差已知。

    2.tt检验

    在这里插入图片描述

    四.两个正态总体均值差的检验

    1.概述

    在这里插入图片描述

    2.例题

    在这里插入图片描述
    在这里插入图片描述

    五.逐对比较法

    1.概述

    有时为了比较两种产品、两种仪器 、两种方法等的差异,我们常在相同的条件下做对比试验,得到一批成对的观察值,然后分析观察数据作出推断。这种方法常称为逐对比较法。这个方法在数学建模中用的也比较多

    2.例题1

    在这里插入图片描述
    问:能否认为这两台仪器的测量结果有显著的差异
    a=0.01
    在这里插入图片描述

    3.例题2

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    六.卡方分布的概率密度函数

    在这里插入图片描述

    展开全文
  • 文章目录抽样抽样方法:概率抽样和非概率抽样样本量估计总体概率公式样本量公式汇总均值差异显著性检验单样本总体比例的检验总体比例之差的显著性检验 抽样 抽样方法:概率抽样和非概率抽样 样本量估计 样本...

    抽样

    抽样方法:概率抽样和非概率抽样

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    样本量估计

    在这里插入图片描述

    • 样本量:取样时选出的样本量,能代表整体的最小样本量

    • 有效样本量:有效响应的样本量

    总体概率公式

    • 总体率:又称为总体比例,指总体中具有某一相同特征表现的单位数量的比重,一般用π表示。
    • 常见的总体率:点击率、展示率、响应率等。
      在这里插入图片描述
      在这里插入图片描述
      计算出的样本量,不一定全部有效,在试验时,需初步确定有效样本比例。用计算出的样本量/有效样本比例得到最终样本量。

    在这里插入图片描述
    在这里插入图片描述

    样本量公式汇总

    样本量估计—z检验,适用于正态总体或大样本(n>30)
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    均值差异显著性检验

    • 正态分布下均值差异显著性检验
    • 非正态分布下均值差异显著性检验

    均值差异是否显著的主要决定因素

    • 均值差异是否显著主要受均值之差和标准差的影响
    • 均值差异的衡量指标统计量,在正态分布的假设检验中最终转化为均值之差/标准差这一比值的形式;在非正态分布的假设检验中最终转化为取值的排序差异

    组间数据产生数据差异的原因

    • 差异完全由抽样误差导致
    • 存在抽样误差之外的因素导致的差异

    样本观测值:试验中样本所有个体的取值。在广告展示率的案例中,广告展示只有两个值,要么展示要么不展示,即要么取1要么取0;样本观测值就是由样本个体取值组成的一个数组(向量)

    在这里插入图片描述

    单样本总体比例的检验

    检验统计量:当n很大(>30),且np和n(1-p)两者均>=5时,样本比率的抽样分布近似服从于正态分布,因此,我们可用z统计量作为检验统计量。
    在这里插入图片描述
    其中,π0为假设的总体比例。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    两总体比例之差的显著性检验

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    展开全文
  • 非参数检验适用于不了解样本所来自的总体的分布律时情形--由于不了解分布律,便不可能选用任何参数(例如方差或是均值)。本文总结了alevel further statistics chapter 11中全部三大类型无参检验(对应样本大时...

    非参数检验适用于不了解样本所来自的总体的分布律时的情形--由于不了解分布律,便不可能选用任何参数(例如方差或是均值)。

    本文总结了alevel further statistics chapter 11中全部三大类型的无参检验(对应样本大时转换为正态分布的三个公式),其中sign test(符号检验)与signed-rank test(有符号秩检验)分为single-samples(单项样本)与 paired- samples(两关联样本)两种情况,故一共有五种具体的检验方式。

    本文适合复习使用...


    零假设与备择假设选定规则:

    一般规则:

    中为等式,例如
    或否定句式例如"两组样本的中位数之间没有差别"或是"某变量的改变没有起到效果”等。

    中为不等式,例如
    或各类肯定句式如"有差别","有效果"之类。

    显著性水平与临界值:

    单边检验(备择假设中使用>或<,增长,恶化等词)则直接使用题干中显著性水平的数据,例如显著性水平significance level=5%=0.05.

    双边检验(备择假设中使用≠,无差别,无效果等词)则使用题干中的显著性水平除以2得到的数值,例如显著性水平为5%,0.05/2=0.025.

    取决于检验类型是单边检验还是双边检验,各类sign test(符号检验)中,critical value(临界值)=significance level(显著性水平)或是等于显著性水平除以2;而各类有符号秩检验和秩和检验中,为读取临界值则应当查阅秩和表。

    显著性水平越大则越难通过检验,例如significance level 10%的拒绝率要大于5%的拒绝率。

    警告:若解题过程中发现由于样本量过大而无法在秩和表中读取到相应的临界值则应当考虑使用正态分布重新计算test statistic(检验统计量)后查阅正态分布表以读取临界值(具体方法见下文)

    结论:

    test statistic检验统计量>critical value临界值则'do not reject',即通过原假设。

    test statistic检验统计量≤critical value临界值则'reject',即拒绝原假设。

    注意这一点是针对各类非参数检验而言的,对于诸如t检验与卡方检验则正好相反。

    • 有符号秩检验相比符号检验的优点在于其不仅仅考虑了符号还考虑了magnitude(大小)这一因素。但若要使用,则需满足更严格的条件‘样本来自symmetrical(对称分布)的总体‘。
    • 非参数检验与t检验在针对对照试验的应用上的差别:1.非参数检验不要求已知总体的分布律,而t检验需要样本来自正态总体。2.无参数检验针对中位数,而t检验则针对均值。

    Single-samples sign test 单项样本符号检验:

    是binomial test(二项检验)的一种,要求样本组满足:

    1.属于连续性数据-continuous

    2.每个数据之间互相独立-independent

    其检验某单组数据的中位数是否=/≠/>/<一个给定常数c。

    处理步骤:

    1.提出假设。

    2.把大于c的数据标记上'+',把小于c的数据标记上'-'

    Exception:若某数据=c则去除这个数据。

    3.将'+'的总个数记作

    ,这便是这组数据的test statistic(检验统计量)了。

    4.使用二项分布,若

    则计算
    ,若
    则计算
    .

    5.临界值=显著性水平(单边检验)或临界值=

    (双边检验).

    6.结论.

    当样本量大(n>10)则应当对检验统计量的分布使用正态模型,

    ,此时检验统计量变更为
    ,分子处的+0.5系连续性校正(如果
    ,即计算
    时,则以-0.5校正)然后再求得;而临界值则变更为
    (单边检验)或是
    (双边检验),最后比较Z与临界值的大小。

    注:为方便起见,此处及以下全部假设题干中给出的显著性水平为5%。

    Wilcoxon signed-rank test 有符号秩检验:

    这要求样本组满足:

    1.属于连续性数据-continuous

    2.每个数据之间互相独立-independent

    3.来自一个对称分布的总体-symmetrical

    其检验某单组数据的中位数是否=/≠/>/<一个给定常数c。

    处理步骤:

    1.提出假设。

    2.求出每一个数据与c的差,若为正数的则在数值前上'+',差为负数的在数值前标记上'-',这形成了一个新的数据组'difference'。

    Exception:若某数据=c则去除这个数据。

    3.对数组difference中每个数据的绝对值的大小进行排序,并标上由小到大的顺序(1,2,3..n)

    Exception:若排序中第r个数据与第r+1个数据相等,则两个数据都标作

    4.对数组difference中所有正数所对应的的排序求和,得出P;对所有负数所对应的排序求和,得出N。

    5.检验统计量:T=min(N,P)

    5.临界值参考秩和表.

    6.结论.

    当样本量大(n>10)则应当对检验统计量的分布使用正态模型,

    ,此时检验统计量变更为
    ,分子处的+0.5系连续性校正;而临界值则变更为
    (单边检验)或是
    (双边检验),最后比较Z与临界值的大小。

    Paired-samples sign test 两关联样本符号检验

    这与单项样本的符号检验是高度类似的,只是这里比较的是每一对的两个数据之间的大小,这要求样本组满足:

    1.属于连续性数据-continuous

    2.每个数据之间互相独立-independent

    3.两组样本中的数据可进行一一对应-paired

    其检验两组数据的中位数是否相等,常见于对照试验。

    处理步骤:

    1.提出假设。

    2.对于每一对对应的数据,当第一组中的数据小于第二组中的数据时,标记'-',反之标记'+'

    Exception:若某一对数据相等则去除这对数据。

    3.将'+'的总个数记作

    ,这便是这组数据的test statistic(检验统计量)了。

    4.使用二项分布,若

    则计算
    ,若
    则计算
    .

    5.临界值=显著性水平(单边检验)或临界值=

    (双边检验).

    6.结论.

    Paired-samples Wilcoxon signed-rank test 两关联样本的有符号秩检验:

    这是在单项样本的有符号秩检验的基础上进行了少量调整后的检验,其要求样本组满足:

    1.属于连续性数据-continuous

    2.每个数据之间互相独立-independent

    3.来自一个对称分布的总体-symmetrical

    4.两组样本中的数据可进行一一对应-paired

    其检验某两组数据的中位数是否相等,常用于比对对照组与实验组。

    处理步骤:

    1.提出假设。

    2.求出每一对对应数据之间的差,若为正数的则在数值前上'+',差为负数的在数值前标记上'-',这形成了一个新的数据组'difference'。

    Exception:若某一对数据相等则去除这对数据。

    3.对数组difference中每个数据的绝对值的大小进行排序,并标上由小到大的顺序(1,2,3..n)

    Exception:若排序中第r个数据与第r+1个数据相等,则两个数据都标作

    4.对数组difference中所有正数所对应的的排序求和,得出P;对所有负数所对应的排序求和,得出N。

    5.检验统计量:T=min(N,P)

    5.临界值参考秩和表.

    6.结论.
    Wilcoxon rank-sum test 秩和检验

    其检验某两组数据的中位数是否相等,常用于比对对照组与实验组,与两关联样本的有符号秩检验的差别在于,秩和检验不要求两组样本中的数据可以一一对应(paired),故两组样本可以是不同容量的。使用这个检验应该满足三条条件:

    1.属于连续性数据-continuous

    2.每个数据之间互相独立-independent

    3.两组数据均来自对称分布的总体-symmetrical

    处理步骤:

    1.提出假设。

    2.将这两组数据写成一行,但应该能够对着两组数据的成员加以区分(个人习惯写成一行后在两组数据的交界处画一条竖线)

    3.对写成一行的数据进行大小排序,并标上由小到大的顺序(1,2,3..n)

    Exception:若排序中第r个数据与第r+1个数据相等,则两个数据都标作

    4.分别对两组数据中每个成员所对应的排序进行求和。

    5.m和n分别是两组数据的样本容量,其中我们规定m<n,并定义

    是样本容量较小的那一组数据中各个成员所对应排序的总和。Test statistic检验统计量:

    5.临界值参考秩和表.

    6.结论.

    当样本量大(n>10)则应当对检验统计量的分布使用正态模型,

    ,此时检验统计量变更为
    ,分子处的+0.5系连续性校正;而临界值仍是0.05(单边检验)或是 0.025(双边检验),最后比较
    的概率与临界值的大小。
    展开全文
  • 假设检验和区间估计都依赖于抽样分布,利用抽样分布的特性推导出区间估计和假设检验的概率公式。...例如,对于总体均值的区间估计和假设检验需要用到均值抽样分布(Z 分布或 T分布),如果样本容量...
  • 两个正态总体均值的检验4.逐对比较法5.分布拟合检验总结 假设检验的步骤 (1)写出原假设和备择假设; (2)在原假设成立的条件下,构造一个统计 量,该统计量服从某一分布; (3)用已知的样本数据带入统计量的公式,...
  • 统计学中各种检验以及python实现

    万次阅读 多人点赞 2018-08-08 17:08:34
    1. T检验 ...T检验用于检验两个总体的均值差异是否显著。   计算公式:  t统计量:  自由度:v=n - 1  适用条件:  (1) 已知一个总体均数;  (2) 可得到一个样本均数及该样本标准误; ...
  • 在对两个总体均值进行比较时,有时数据是成对出现,此时若采用两独立样本T检验所得出结论有可能是不对,此时应采用成对数据T检验的方法,原因如下:成对数据差di(i=1,2,…,n)已消除数据非处理因素之间...
  • 关于单样本t检验目的:利用来自总体的样本数据,推断该总体均值是否与指定的检验值之间存在显著差异。分子为样本统计量与总体参数的偏离程度,分母为样本统计量的标准差,因此这个公式反映的是,相对于样本统计量...
  • 本书从函数功能、函数格式、参数说明、注意事项、Excel 版本提醒、案例应用、交叉参考7 个方面,全面、细致地介绍了Excel 2016/2013/2010/2007/2003 中公式和函数使用方法、实际应用和操作技巧。最后3 章还将公式...
  • 商业统计原理体会2:回顾Z ...但发现公式右边有两个未知量,其实也就是我们希望得到的总体均值和另外一个未知量总体方差。有两套著名方法去处理总体方差将它变成一个已知量。 Z 分布和student-t 分布 这两种方法其实是
  • 应用多元分析(王学民)

    热门讨论 2010-08-03 16:29:43
     4.6 多个总体均值的比较检验/多元方差分析)  4.7 总体相关系数的推断 小结 附录4-1 SAS的应用 附录4-2 霍特林T2统计量的导出 附录4-3 威尔克斯Λ统计量的基本性质 习题 第五章 判别分析  5.1 引言  5.2 ...
  • R语言经典实例(9-10章)

    千次阅读 2017-04-17 15:01:16
     样本均值算总体均值:t检验:t.test(x,mu=m)  mu为总体均值,p  样本比例:prop.test检验:prob.test(x,n,p)  样本量是n并且样本包含x次成功。p 均值置信区间:t.test(x,conf.level=0.99)  99%置信区间,...
  • 大数据统计学基础

    2018-02-04 21:53:45
    告别拍脑袋决策:基于正态总体的假设检验 第11周 扔掉正态分布:秩和检验 第12周 预测未来技术:回归分析 第13课 抓住表象背后那只手:方差分析 第14周 沿着时间轴前进,预测电子商务业绩:时间序列分析简介
  • 告别拍脑袋决策:基于正态总体的假设检验 第11课 扔掉正态分布:秩和检验! s! G1 w# i3 P* ]# e 第12课 预测未来技术:回归分析, O% b! U) k4 h# ]$ p 第13课 抓住表象背后那只手:方差分析 第14课 沿着时间轴前进...
  • 统计学方法与数据分析(上下册)

    热门讨论 2013-12-29 11:32:47
    8.2两个以上总体均值的统计检验:方差分析 8.3完全随机化设计中观测值的模型 8.4方差分析条件的检查 8.5其他的分析方法:数据变换 8.6另一种非参数方法:Kruskal-Wallis检验 8.7小结 重要公式 补充练习 第九章...
  • t—分布常用于区间估计、正态总体的假设检验以及机械概率设计之中。服从t—分布随机变量记住t。它是服从标准正态分布N(0,1)随机变量U和服从自由度为vx2分布随机变量x2(v)函数。 它概率密度函数f...
  • 数据分析复盘——基础之统计学

    千次阅读 2017-09-14 13:37:08
    (有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为(σ^2)/n 的正态分布。关于各种参数的估计,可以结合分布的定义去看。也许就更容易地理解那些公式,就...
  • R语言笔记完整版

    2018-11-25 11:19:35
    R语言与数据挖掘:公式;数据;方法 目录 R语言特征 运行 调试查错 帮助 文件目录设置 加载资源 批处理文件和结果重定向 ...向量间交、并、补集 ...正态总体的均值方差 独立性检验(原假设H0:X与Y独...
  • 1.5.4 正态总体样本均值与样本方差分布 习题 第2章 R软件使用 2.1 R软件简介 2.1.1 R软件下载与安装 2.1.2 初识R软件 2.1.3 R软件主窗口命令与快捷方式 2.2 数字、字符与向量 2.2.1向量 2.2.2 产生有...
  • 1.5.4 正态总体样本均值与样本方差分布 习题 第2章 R软件使用 2.1 R软件简介 2.1.1 R软件下载与安装 2.1.2 初识R软件 2.1.3 R软件主窗口命令与快捷方式 2.2 数字、字符与向量 2.2.1向量 2.2.2 产生有...

空空如也

空空如也

1 2
收藏数 21
精华内容 8
关键字:

总体均值的检验公式