精华内容
下载资源
问答
  • 简单理解t检验秩和检验

    万次阅读 2018-10-14 11:56:44
    t-检验 选用t-检验的基本前提假设是,两组样本都服从正态分布,且方差相同。设有两类(x, y)分别有mmm个nnn个样本,它们的总体样本方差是: sp2=(n−1)Sx2+(m−1)Sy2m+n−2s_p^2=\frac{(n-1)S_x^2+(m-1)S_y^2}{m+...

    t-检验

    选用t-检验的基本前提假设是,两组样本都服从正态分布,且方差相同。设有两类(x, y)分别有 m m m个和 n n n个样本,它们的总体样本方差是:
    s p 2 = ( n − 1 ) S x 2 + ( m − 1 ) S y 2 m + n − 2 s_p^2=\frac{(n-1)S_x^2+(m-1)S_y^2}{m+n-2} sp2=m+n2(n1)Sx2+(m1)Sy2
    其中, S x 2 S_x^2 Sx2 S y 2 S_y^2 Sy2分别是两类样本各自的估计方差,t检验的统计量是:
    t = x ˉ − y ˉ s p 1 n + 1 m t=\frac{\bar{x}-\bar{y}}{s_p\sqrt{\frac{1}{n}+\frac{1}{m}}} t=spn1+m1 xˉyˉ
    它服从自由度为 n + m − 2 n+m-2 n+m2的t分布。
    在实际问题中,首先计算出实际样本的t值,然后根据t分布可以查出在原假设下取得该t值的 p p p值,最后根据适当的显著性水平(如0.05)来决定是否拒绝原假设,推断两类样本的均值是否有显著差异。

    t t t检验属于参数化检验方法,此类方法对数据分布有一定的假设,必要时需要首先检验样本分布是否符合该假设。

    秩和检验

    Wilcoxon秩和检验(rank-sum test),有时也叫Mann-Whitney U检验,是另一类非参数检验方法,它们不对数据分布作特殊假设,因而能适用于更复杂的数据分布情况。而当数据实际上满足正态分布时,用 t t t检验更有效。
    秩和检验的做法是,首先将两类样本混合在一起,对所有样本按照所考察的特征从小到大排序。在两类样本中分别计算所得排序序号之和 T 1 T_1 T1 T 2 T_2 T2,称作秩和。两类的样本数分别是 n 1 n_1 n1个和 n 2 n_2 n2。秩和检验的基本思想是,如果一类样本的秩和显著地比另一类小(或大),则两类样本在所考察的特征上有显著差异。秩和检验的统计量就是某一类(如第一类,秩和为 T 1 T_1 T1)的秩和
    为了比较两类样本的秩和是否差异显著,需要比较T分布,当样本数目较大时,人们可以用正态分布来近似秩和 T 1 T_1 T1的分布。其中
    μ 1 = n 1 ( n 1 + n 2 + 1 ) 2 , σ 1 = n 1 n 2 ( n 1 + n 2 + 1 ) 12 \mu_1=\frac{n_1(n_1+n_2+1)}{2}, \sigma_1=\sqrt{\frac{n_1n_2(n_1+n_2+1)}{12}} μ1=2n1(n1+n2+1)σ1=12n1n2(n1+n2+1)

    t t t检验相比,秩和检验没有对样本分布作任何假设,适用于更广泛的情况。另外, t t t检验的目的是检验两类样本的均值是否有系统差异,而秩和检验不但受两类分布的均值的影响,也受到分布形状的影响。

    :如无特殊说明,以上大部分内容为摘选自张学工所著《模式识别》。

    展开全文
  • MannWhitney U-test 曼-惠特尼U检验 ...参考曼-惠特尼U检验与威尔科克森符号秩检验是最常用的两独立样本非参数检验方法,无需对总体分布做出假定,可以用来比较两组分布未知的样品差异。Mann–Whitney U-test (曼-惠特


    曼-惠特尼U检验与威尔科克森符号秩检验是最常用的两独立样本非参数检验方法,无需对总体分布做出假定,可以用来比较两组分布未知的样品差异。

    1. Mann–Whitney U-test (曼-惠特尼U检验)

    1.1 曼-惠特尼U检验定义

    曼-惠特尼U检验全称为Mann-Whitney-Wilcoxon Test,用来检验两组独立样品是否来自两组不同的样品。

    Two data samples are independent if they come from distinct populations and the samples do not affect each other. Using the Mann-Whitney-Wilcoxon Test, we can decide whether the population distributions are identical without assuming them to follow the normal distribution.

    1.2 曼-惠特尼U检验实现

    在R中利用wilcox.test函数进行曼-惠特尼U检验。

    #载入数据:
    data(mtcars)
    #1974年US,每加仑汽油行驶的英里数
    mtcars$mpg
    #0 = automatic, 1 = manual,手动挡与自动挡
    mtcars$am
    #检验
    wilcox.test(mpg ~ am, data=mtcars)
    

    检验结果:

    > wilcox.test(mpg ~ am, data=mtcars)
    
            Wilcoxon rank sum test with continuity correction
    
    data:  mpg by am
    W = 42, p-value = 0.001871
    alternative hypothesis: true location shift is not equal to 0
    
    Warning message:
    In wilcox.test.default(x = c(21.4, 18.7, 18.1, 14.3, 24.4, 22.8,  :
      cannot compute exact p-value with ties
    

    原假设为两种变速器的油耗完全相同,p-value小于0.05,拒绝原假设,因此两种变速器的油耗有显著差异。

    2. Wilcoxon Signed-Rank Test(威尔科克森符号秩检验)

    2.1 威尔科克森符号秩检验

    威尔科克森符号秩检验又叫Wilcoxon Signed-Rank Test, 用来进行配对样品的非参数检验。

    Two data samples are matched if they come from repeated observations of the same subject. Using the Wilcoxon Signed-Rank Test, we can decide whether the corresponding data population distributions are identical without assuming them to follow the normal distribution.

    2.2 威尔科克森符号秩检验实现

    immer数据包含同一块地在1931和1932年的小麦产量。

    载入数据:

    > library(MASS)         # load the MASS package
    > head(immer)
      Loc Var    Y1    Y2
    1  UF   M  81.0  80.7
    2  UF   S 105.4  82.3
        .....
    

    进行检验:

    > wilcox.test(immer$Y1, immer$Y2, paired=TRUE)
    
            Wilcoxon signed rank test with continuity correction
    
    data:  immer$Y1 and immer$Y2
    V = 368.5, p-value = 0.005318
    alternative hypothesis: true location shift is not equal to 0
    
    Warning message:
    In wilcox.test.default(immer$Y1, immer$Y2, paired = TRUE) :
      cannot compute exact p-value with ties
    

    根据p-value值,拒绝原假设,因此,产量在这两年之间存在显著的差异。

    3. 参考

    1. http://www.r-tutor.com/elementary-statistics/non-parametric-methods/mann-whitney-wilcoxon-test
    2. http://www.r-tutor.com/elementary-statistics/non-parametric-methods/wilcoxon-signed-rank-test
    展开全文
  • 原文地址:U 秩和检验)" style="text-decoration:none; color:rgb(6,65,131)">SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney U 秩和检验)作者:王江源 一、概述  Mann-Whitney U 检验是用得最...

    原文地址:SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney 秩和检验)作者:王江源

    一、概述

        Mann-Whitney U 检验是用得最广泛的两独立样本秩和检验方法。简单的说,该检验是与独立样本t检验相对应的方法,当正态分布、方差齐性等不能达到t检验的要求时,可以使用该检验。其假设基础是:若两个样本有差异,则他们的中心位置将不同。

     

    二、问题

       为了研究某项犯罪的季节性差异,警察记录了10年来春季和夏季的犯罪数量,请问该项犯罪在春季和夏季有无差异。

       下面使用Mann-Whitney U检验进行分析。 SPSS版本为20。

     

    三、统计操作

     

    SPSS变量视图: 

    SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney <wbr>U <wbr>秩和检验)

     

    SPSS数据视图:

    SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney <wbr>U <wbr>秩和检验)

     

    进入菜单如下图:

    SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney <wbr>U <wbr>秩和检验)

     

    点击进入如下的界面,“目标”选项卡不需要手动设置

    SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney <wbr>U <wbr>秩和检验)

     

    进入“字段”选项卡,将“报警数量”选入“检验字段”框,将“季节”选入“组”框中。

    SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney <wbr>U <wbr>秩和检验)

     

    再进入“设置”选项卡,选中“自定义检验”单选按钮,选择“Mann-Whitney U(二样本)”检验。点击“运行”即可。

    SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney <wbr>U <wbr>秩和检验)

     

    四、结果解读

     

    这是输出的主要结果,零假设是“报警数量的分布在季节类别上相同”,其P=0.009<0.05,故拒绝原假设,认为报警数量在季节上有统计学差异。

     

    SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney <wbr>U <wbr>秩和检验)

     

    双击该表格,可以得到更多的信息,不再叙述。

    展开全文
  • 显著性分析-秩和检验与校正

    千次阅读 2020-05-10 09:46:41
    秩和检验是一种非参数检验法,不需要对数据分布作特殊假设,因而能适用于更复杂的数据分布情况。秩和检验是通过推断总体的分布是否相同,进而判断两组样本之间的差异是否显著。 秩和检验的做法是:首先把两组样本...

    我录了一个讲解视频:https://www.bilibili.com/video/BV1Yz411z7j2?pop_share=1

    一、理论概括介绍

    显著性分析通常分为参数检验方法和非参数检验方法,参数检验法中常用的是t检验,但是t检验需要假定两组样本都服从正态分布,这样适用的情况有限。

    秩和检验是一种非参数检验法,不需要对数据分布作特殊假设,因而能适用于更复杂的数据分布情况。秩和检验是通过推断总体的分布是否相同,进而判断两组样本之间的差异是否显著。

    秩和检验的做法是:首先把两组样本混合,按照所检验的特征值大小对所有样本排序。在两类样本中分别计算所得排序序号之和T1 T2,称作秩和 。秩和检验的基本思想是,如果一类样本的秩和显著地比另一类小(或大),则两类样本在所考察的特征上有显著差异。

    假设检验的基本原理是小概率原理,即认为小概率事件在一次试验中实际上不可能发生。当同一研究问题下进行多次假设检验时,不再符合小概率原理所说的“一次试验”。如果在该研究问题下只要有检验是阳性的,就对该问题下阳性结论的话,对该问题的检验的犯一类错误的概率就会增大。

    所以当一个数据集做了多次假设检验的时候,就需要进行校正,降低假阳性的概率。显著性用P值表示,一个数据集有多少个P值就意味进行了多少次假设检验,无论这个P值是不是描述同一个基因还是通道。

    常见的多重比较情景:1.多组间比较   2.多个主要指标 

    P值校正方法:1.Bonferroni 称为“最简单严厉的方法”,直接改小显著性的阈值,阈值为:0.05/检验次或者矫正P=P×检验次数2.   FalseDiscovery Rate(FDR),有一些估算模型,常用的是BH方法,称为“温和的校正方法”,首先将各P值从小到大排序,生成顺序数排第k矫正P=P×n/k,(n是检验次数),另外要保证矫正后的各检验的P值大小顺序不发生变化。

    二、具体实例演示

    实际问题:有两组人,A组33人,B30人,把每个人的大脑按照标准模板(AAL)分成90个脑区,通过某些方法得到每个脑区之间连通性的值,现在要比较这两组人有没有显著性差异,为后来的机器学习或者深度学习分类做可行性分析

    每个通道(90*90=8100)两组人比较显著性差异,用ranksum秩和检验得到8100个P值,用FDR(BH)进行校正

                                                  

    MATLAB代码示意如下:

    clear;
    close all;
    clc;
    
    % 加载JME和NC到变量X和Y
    JME_address = "D:\python\deep-learning\JME\JME bmp\JME\ICVF\*.mat";
    jme_address = "D:\python\deep-learning\JME\JME bmp\JME\ICVF\";
    JMEnamelist = dir(JME_address);
    len = length(JMEnamelist);
    for i = 1:len
        file_name{i}=JMEnamelist(i).name;
        x{i}= load(jme_address+file_name{i});
    end
    
    NC_address = "D:\python\deep-learning\JME\JME bmp\Normal\ICVF\*.mat";
    nc_address = "D:\python\deep-learning\JME\JME bmp\Normal\ICVF\";
    NCnamelist = dir(NC_address);
    len = length(NCnamelist);
    for i = 1:len
        file_name{i}=NCnamelist(i).name;
        y{i}= load(nc_address+file_name{i});
    end
    
    % 两组人的每个通道进行秩和检验
    JME_ICVF=[];
    NC_ICVF=[];
    for i = 1:90 %行
        for j = 1:90 %列
            JME_ICVF=[];
            NC_ICVF=[];
            JME_number = 0;
            NC_number = 0;
            for jme = 1:33  %人数
                j_ICVF = x{1,jme}.ICVF(i,j);
                JME_number = JME_number + j_ICVF;
                JME_ICVF = [JME_ICVF;j_ICVF];
            end
            for nc = 1:30  % 人数
                n_ICVF = y{1,nc}.ICVF(i,j);
                NC_number = NC_number + n_ICVF;
                NC_ICVF = [NC_ICVF;n_ICVF];
            end
            
            JME_mean_number(i,j) = JME_number/33;
            NC_mean_number(i,j) = NC_number/30;
            [P_temp,H_temp]= ranksum(JME_ICVF,NC_ICVF);
             P_result(i,j) = P_temp;
             H_result(i,j) = H_temp;
             
        end
    end
    
    P_result(isnan(P_result)) = 1;  %只要一样数字的数目总数小于20就不会出现nan 
    
    P_result = reshape(P_result,1,8100);
    FDR = mafdr(P_result,'BHFDR', true);
    P_result = reshape(FDR,90,90);
    
    mycolorbar=zeros(3,1000);  %zeros(1,99)+1
    % 颜色方案1
    % mycolorbar(1,:)=zeros(1,100)+1;
    % mycolorbar(3,:)=0:0.005:0.495;
    % mycolorbar(2,:)=0:0.01:0.99;  
    % 颜色方案2
    % mycolorbar(1,:)=zeros(1,1000)+1;
    % mycolorbar(3,:)=0:0.001:0.999;
    % mycolorbar(2,:)=0:0.001:0.999; 
    mycolorbar(1,:)=zeros(1,1000)+1;  
    mycolorbar(2,:)=[1:-0.0015:0,zeros(1,333)];
    mycolorbar(3,:)=[1:-0.003:0,zeros(1,666)];
    mycolor=mycolorbar';
    
    % thr = 0.967;  % 一共是0.0517, 0.05的阈值占其96%,要实现大于所以是97%
    % col_th = 1000 * thr;
    % for i=col_th:1000
    %     mycolor(i,:) = [1,1,1];  %将大于0.05的设置为白色
    % end
    
    H = figure();      % 建立图层
    % figure(1);
    % imagesc(P_result); % 把数字矩阵可视化图像
    % figure(2);
    imagesc(NC_mean_number);
    % figure(3);
    % imagesc(NC_mean_number);
    daspect([1,1,1]);  % 让图片等比例显示
    colormap(H,mycolor);
    % caxis([0,0.0517]);      %  把colorbar的范围固定
    
    % save_address = "C:\Users\85007\Desktop\";
    % xlswrite(save_address + 'P_result.xlsx',P_result);
    % xlswrite(save_address + 'H_result.xlsx',H_result);
    % xlswrite(save_address + 'JME_mean_number.xlsx',JME_mean_number);
    % xlswrite(save_address + 'NC_mean_number.xlsx',NC_mean_number);
    

    三、结果可视化

    未校正的P值(取前8*8):

    FDRBH)校正后的P值(取前8*8

    参考资料

    清华大学张学工教授所著模式识别》

    知乎Willson Chou 的回答 https://www.zhihu.com/question/23950632

    新云旧雨的简书https://www.jianshu.com/p/e13f535a3313

     

    展开全文
  • u检验

    千次阅读 2020-12-31 09:49:36
    u检验、t检验、F检验、X2检验常用显著性检验1.t检验适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配对资料间、样本与均数间、两样本均数间比较三种,三者的计算公式不能混淆。2.t'检验应用条件与...
  • 除了使用Wilcoxon进行单样本位置检验外,其实也可以使用wilcoxon进行两样本位置检验,基本原理与单样本中心位置检验一样:将来组容量相等的样本值做差,然后分别计算差值中为负数的秩和(R−R^-R−)为正的秩和(R+...
  • Mann-Whitney 秩和检验,也被称为 Mann-Whitney-U 检验。在笔者另一篇博客 ( https://blog.csdn.net/Raider_zreo/article/details/101380293 ) 中已经对 Wilcoxon 秩和检验有过介绍,事实上,Wilcoxon 统计量与 Mann...
  • 秩和检验

    千次阅读 2020-06-06 10:56:18
    从总体中随机抽取一定量的样本,用样本指标估计总体指标,分为参数统计非参数统计。 参数统计:在总体分布类型已知的条件下,对其未知参数进行检验的...秩和检验:用秩和进行假设检验的方法。 1.配对资料符号的
  • 卡方检验,U检验,t检验,F检验

    千次阅读 2019-08-17 16:08:27
    卡方检验:主要用于等级资料 。 t检验:适用于计量资料、正态分布、方差...U检验:检验应用条件与t检验基本一致,只是当大样本时用U检验,而小样本时则用t检验,t 检验可以代替U检验。t检验和就是统计量为t,u的假...
  • 提起配对符号和检验,大家都知道,有人问符号检验和秩和检验之间的区别,另外,还有人想问如何查配对符号和检验用t界值表怎么用,你知道这是怎么回事?其实何谓非参数检验?wilcoxon符号和检验的用途是什么?...
  • Wilcoxon 秩和检验(rank-sum-test),或叫 Mann-Whitney U 检验,是一类非参数检验方法。不对数据分布做特殊假设,因而能适用于更复杂的数据分布情况,但是当数据实际上满足正态分布的时候,用t检验更有效。 秩和...
  • u检验、t检验、F检验、X2检验

    千次阅读 2020-12-31 09:49:35
    常用显著性检验适用于计量资料、正态分布、方差具有齐性的两组间小...应用条件与t检验基本一致,只是当大样本时用U检验,而小样本时则用t检验,t检验可以代替U检验。用于正态分布、方差齐性的多组间计量比较。常见的...
  • 执行 Wilcoxon 秩和检验或 Mann-Whitney U 检验(非参数检验)。 测量健康的基因/化合物/错误/代谢物等(对照)个体患有某种疾病的个体。 然后进行 Wilcoxon 秩和检验,以找出这些基因/化合物/代谢物/错误等中有...
  • Wilcoxon秩和检验简介与MATLAB实现

    万次阅读 2019-04-18 10:07:21
    Wilcoxon秩和检验(rank-sum test),有时也叫Mann-Whitney U检验,是另一类非参数检验方法,它们不对数据分布作特殊假设,因而能适用于更复杂的数据分布情况。 适用性 (1)资料的总体分布类型未知; (2)资料的总体...
  • 医学中常用的假设检验总结1 医学中常用的假设检验总结1.1 正态性检验1.2 方差齐性检验1.3 t 检验1.4 方差分析1.5 卡方检验1.6 秩和检验 1 医学中常用的假设检验总结 1.1 正态性检验 Shapiro-Wilk正态检验方法来检验...
  • R Wilcoxon秩和检验

    2021-12-19 23:29:57
    两组数据独立,可以使用Wilcoxon秩和检验(更广为人知的名字是Mann-Whitney U检验) 来评估观测是否是从相同的概率分布中抽得的(即,在一个总体中获得更高得分的概率是否比另 一个总体要大)。调用格式为: wilcox....
  • 但是,当样本分布非正态,且经过一定的数值转换尝试后,仍然无法满足正态性要求时,两独立样本的Wilcoxon秩和检验成为备选方法,它将两独立样本组的非正态样本值进行比较。它是一种非参数样本检验,基于样本的次...
  • 符号秩检验

    2018-11-26 13:48:51
    在R中,wilcox.test()函数可以用来做Wilcoxon秩和检验,也可以用于做Mann-Whitney U检验。当参数为单个样本,或者是两个样本相减,或者是两个参数,paired=F时,是Wilcoxon秩和检验。当paired = FALSE(独立样本)时...
  • 文章目录对称中心为原点的检验问题平均法对称中心的检验问题参考 如果随机变量 XXX 的密度函数 f(x)f(x)f(x) 是偶函数,则 XXX 的分布关于原点 0 对称. 关于原点0 对称的分布满足条件:对任意的实数 a>0a>0a&...
  • 说明wilcoxon秩及wilcoxon符号秩检验是对原假设的非参数检验,在不需要假设两个样本空间都为正态分布的情况下,测试它们的分布是否完全相同。
  • 曼-惠特尼U检验又称“曼-惠特尼秩和检验”,是由H.B.MannD.R.Whitney于1947年提出的。它假设两个样本分别来自除了总体均值以外完全相同的两个总体,目的是检验这两个总体的均值是否有显著的差别。 ..
  • Student t检验(Student’s t test),亦称T检验,是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著,主要用于样本含量较小...Wilcoxon秩和检验(Wilcoxon rank-sum test),也叫曼-惠特尼U...
  • 第10章 秩和检验.pptx

    2019-06-01 16:29:01
    统计学分析 秩和检验方法最早是由维尔克松提出,叫维尔克松两样本检验法。后来曼—惠特尼将其应用到两样本容量不等()的情况,因而又称为曼—惠特尼U检验。这种方法主要用于比较两个独立样本的差异。
  • 秩和检验原理解释戳这里: https://zhuanlan.zhihu.com/p/170354683 对于W值得解释戳上面链接(也可直接看下图): R语言进行秩和检验的函数 wilcox.test(c(1,3,5),c(5,3,1))#举个例子 最后得到的结果:这里看到有...
  • 后来曼—惠特尼将其应用到两样本容量不等(n1不等于n2)的情况,因而又称为曼—惠特尼U检验。这种方法主要用于比较两个独立样本的差异。 在总体分布任意的情形下,检验配对的试验数据所在总体的分布位置有无显著差异...
  • 你可能会参考另一篇博客独立性检验。 皮尔森相关系数 皮尔森相关系数(Pearson correlation coefficient)也叫皮尔森积差相关系数(Pearson product-moment correlation coefficient),是用来反应两个变量相似...
  • 在统计学中,差异显著性检验是“统计假设检验”(Statistical hypothesis testing)的一种,用于检测科学实验中实验组与对照组之间是否有差异以及差异是否显著的办法。 在实验进行过程中,尽管尽量排除随机误差的...
  • 正态分布方法判别,独立样本T检验及Mann-Whitney U 检验操作正态性校验数据整体是否符合正态分布SPSS中的操作步骤某分组上是否符合正态分布SPSS中的操作步骤独立样本t检验SPSS中的操作步骤Mann-Whitney U 检验SPSS中...
  • 昨天做论文,用了数学建模,公式是生产道格拉斯生产函数,统计软件Matlab7.0 怎么都安装不了。...1,T检验和F检验的由来一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用...
  • python曼·惠特尼U检验(Mann-Whitney U Test) 两独立样本t检验要求数据服从正态分布,且两组样本数据的方差齐次。如果数据不满足正态分布又该怎么办呢? 首先强调一点,独立样本t检验对正态分布的要求有...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,527
精华内容 610
关键字:

u检验和秩和检验