精华内容
下载资源
问答
  • 配对样本检验【例】某研究部门分别用电泳法离心法,测量10名志愿者的血清低密度脂蛋白值(表1)。两种方法的结果是否存在差异呢?表1 两种方法测定低密度脂蛋白值(mmol/L)操作1数据录入 ①点击变量视图界面进入...

    19fe6d054967af9710972f68f026287d.png

    配对样本秩和检验

    【例】某研究部门分别用电泳法和离心法,测量10名志愿者的血清低密度脂蛋白值(表1)。两种方法的结果是否存在差异呢?

    表1 两种方法测定低密度脂蛋白值(mmol/L)

    f6adc4a0da646efa9dbc2cf77ee94b69.png

    操作1数据录入

      ①点击变量视图界面进入变量定义,在“名称”列下输入“电泳法”和“离心法”两个变量。

      ②点击“数据视图”,分别在“电泳法和离心法”两栏中输入10个数据。

      ③点击“另存为”,选择合适的保存路径,数据命名为“配对秩和”。

    38b8b1055ae387ea1a659eda2ad6d521.png

    2正态检验

      先计算每对样本两种方法测定值的差值,差值的变量设为d。

    1495ffabfdf02d723ace1f51484ad22a.png

    8d82093528cc1c30df1918c822716ec8.png

      然后对差值d进行正态性检验。

     (想了解正态性检验,可查看:SPSS微课丨一学就会的正态检验)

    005201bc7c68d0d39e8c361d86763899.png

      电泳法和离心法配对的差值正态性检验P值小于0.001,提示差值不服从正态分布,须采用非参数检验进行分析。

    3

    配对秩和检验

      ①点击分析→非参数检验→相关样本,弹出相关样本非参数检验对话框。

      ②点击“字段”,选择“电泳法和离心法”转到检验字段。

      ③点击“设置→选择检验(S) →自定义检验”,选择“比较中位数和假设中位数差”下面的“Wilcoxon匹配对符号秩检验(2个样本)(W)”。

      ④点击运行。

    2298b45d2d382f3cd2d427c9d5eb31c7.png

    2afed5dda7741e3eaee4eea41c31491b.png

    524c4d01300449e679ecd04e8f0478f2.png

    0896fb93a4781429ba2328a211071b07.png

    结果解读

    c6e2e53cea991667107de1686feab0bd.png

      双击图中决策者结果“保留原假设”,出现详细分析结果。

    fb8d6b27c0602ca280a3c3d58d2c4132.png

      运算结果显示Z=-0.612,P=0.540>0.05,电泳法和离心法的测量结果差别没有统计学意义。

    论文表述

      研究表明,尚不能认为电泳法和离心法检测低密度脂蛋白值的结果有差异(Wilcoxon配对符号秩检验Z=-0.612,P=0.54)。

    448834c73f0b87c732f5aa0b78bc7461.png

    原创人员:刘志臻

    微信编辑:张俊

    展开全文
  • 本文为样本调查中的两个样本问题提供了非参数回归的乘性偏差减少估计量。 该方法包括将乘法偏差校正应用于估计器。 Linton&Nielsen,1994年提出的乘性偏差校正方法可确保得到正估计,并减少了方差可忽略不计的估计...
  • R语言详解参数检验和非参数检验二、参数检验R语言实现2.1 单样本t检验2.2 独立样本t检验2.3 配对样本t检验2.4方差分析2.5 pearson相关性检验三、非参数检验R语言实现3.1单样本wilcoxon检验3.2 Mann-Whitney检验3.3...

    一、前言

    数据基本属于两种类型:定性数据(类别变量,数字只有标签含义)及定量数据(数值型变量,每个数值有实际的含义)。

    常用的方法有正态分布检验(KM检验,shipro检验),t检验,方差分析,还有一些没那么常见的Wilcoxon秩和检验,Mann-Whitney检验及Kruskal-wallis检验等。

    本文对各种统计检验方法进行梳理、总结,帮大家省却一小部分时间,。同时,本文也将涉及到的统计检验方法的R语言实现代码罗列出来,让大家能够简单的检验自己的数据集。

    首先还是说明一下参数检验和非参数检验的区别,见下表:
    在这里插入图片描述

    我们首先会对样本数据做一个最基本的正态分布检验,以此决定,该选用参数检验派的一箩筐检验方法还是非参数检验派的方法。我们肯定是希望用参数检验,因为参数检验用的信息是真实的数据,而非参数检验用到的信息是将这些真实值,转换为秩(理解为位置,或者排序)了,检验过程中损失了大量的有效信息,除此以外还有一些其他原因共同导致了他的检验效能较低。

    正态分布检验的实现方法有很多,本文总结几种常见的,详情看下表:

    在这里插入图片描述

    • shapiro.test()
      一个参数:数值型数据,理解为你数据集的任何一列:
      Shp <- shapiro.test(test)
      小样本时使用,可以存在缺失值,非缺失样本量大于3即可
      fBasics
      基础包无需加载,函数直接用就行

    • ks.test()
      三个参数:一列数据,均值,方差
      KS <- ks.test(test,0,1)
      非参数检验方法,适用范围广。
      需要包 fBasics

    • lillie.test()
      一个参数:数值型数据
      Li <- lillie.test(test)
      基于KS的正态性检验,非缺失样本量大于4
      非基础包需要library(nortest)后,才能使用检验函数

    • ad.test()
      一个参数
      Ad <- ad.test(test)
      可以有缺失值,但非缺失样本量必须大于7
      需要加载包 nortest

    test测试数据是通过rnorm(100)随机生成的100个服从正态分布的数据,所有以上方法的统计检验结果P值都大于0.05,说明数据服从正态分布。平时见到的KS检验用的最多,非参数检验门槛低。如果数据有一两百例,就别考虑Shapiro.test()了。一般认为n>30,可以认为是大样本。

    讲了正态分布后,还需要再说一个检验:方差齐性检验。不管是t检验还是方差分析,比较的都是均值有无差异。Fisher先生在推导F分布的时候,是基于样本满足正态分布及方差同质(方差齐性)两个基础假设来的,如果两个条件不满足,F分布就会出现偏差。与此类似,双样本T检验中,如果方差不齐,合并方差需要做一定的修正,才能很好的满足t分布。但实际中的样本,大多数情况是异方差,同方差的情况才是少见。有实验表明,当样本量足够大,且两组样本量差距比较小时,可以忽略异方差的影响。如果样本量较小,且两组数据的样本差异较大时,还是老老实实按照书上的步骤,一步步把检验做了。

    本文对常见的方差齐性的检验方法总结如下:

    • bartlett.test()
      2个参数:数值型数据,因子型数据:
      Bar <- bartlett.test(count ~ spray, data = InsectSprays)
      样本服从正态分布时使用
      基础包无需加载,函数直接用即可

    • leveneTest()
      2个参数:数值型数据,因子型数据:
      Lev <-car:: leveneTest(count ~ spray, data = InsectSprays)
      相较于Bartlett检验,这一方法更为稳健
      car,这个包不是基础包,需要library加载下哦

    • fligner.test()
      2个参数:数值型数据,因子型数据:
      Fli <- stats::fligner.test(count ~ spray, data = InsectSprays)
      非参数的检验方法,完全不依赖于对分布的假设
      Stats

    在这里插入图片描述

    本表中,输入列的data通过函数“require(graphics)”获得,采用“str(InsectSprays)”函数可以看到InsectSprays数据集中的所有指标及其数据类型。

    讲了正态分布和方差齐性的检验,我们就可以进入正题了。你的数据,满足正态分布假设检验的,就进入参数检验方法,否则,选择非参数检验。本文所讲的内容基本如下:
    在这里插入图片描述

    二、参数检验R语言实现

    以下案例,均默认随机获得的样本服从正态分布,也满足方差齐性。

    2.1 单样本t检验

    案例:我有点矮,身高只有1.55米。我想知道,在广大群众之中,我的身高是不是处于一个正常水平,我能说大家的平均身高就是1.55米吗?于是,我在1.3米到2.2米的人中,随机选取100个人:

    Height <- sample(seq(1.3,2.2,by=0.1),100,replace=T) 。
    

    我对这100个人的身高进行t检验:

    Tsingle <- t.test(Height, alternative = "greater", mu =1.55 )
    

    结果如下:
    在这里插入图片描述

    P值近乎为0了,备择假设是真是均值大于1.55。So,我,太矮了.

    2.2 独立样本t检验

    案例:听说南方人普遍较北方人矮,那矮的明显吗?差异真的很大?我要验证一下,选择100个南方人,80个北方人(假设在重庆,北方人相对还是太少了),进行我的检验。

    South <- sample(seq(1.3,1.9,by=0.1),100,replace=T)
    North <- sample(seq(1.3,2.2,by=0.1),80,replace=T)
    #检验代码如下:
    IndT <- t.test(South ,North ,paired = F)
    

    结果如下:
    图片

    结果P值远低于0.05,接收备择假设:均值的真实差异不等于0.

    2.3 配对样本t检验

    案例:患者入院时和出院时均进行了各临床指标的检验,比如NLR、CRP、White Blood Cell等。按理说,其中,多项研究证明,NLR和肺损伤程度是高度正相关的,所以,入院时和出院时的NLR值,应该不在一个水平。现在,用你的100个病人,来证明它!

    Getin <- sample(seq(3.22,14.9,by=0.1),100,replace=T)
    Getout <- sample(seq(1.22,9.9,by=0.1),100,replace=T)
    #检验代码如下:
    PairT <- t.test(Getin ,Getout ,paired = T)
    

    结果如下:
    图片
    P 值远低于0.05,拒绝原假设,接受备择假设:均值的真实差异不等于0。说明治疗前后,患者的NLR指标有明显变化。

    2.4方差分析

    案例:这批新冠肺炎患者,他们有NLR、CRP、White Blood Cell等指标,还有性别、年龄等基本信息。通过核酸检测,我知道他们的病情是何情况(轻型,重型,危重型)。现在,我要看这些指标在不同病情患者中是否存在差异。此时,我们就可以使用方差分析进行检验。
    首先,还是准备数据(做三因素方差分析吧)

    NLR <- sample(seq(3.22,14.9,by=0.1),100,replace=T)
    CRP <- sample(seq(0.06,190,by=0.1),100,replace=T)
    Age <- sample(seq(20,70,by=1),100,replace=T)
    COVID_Type <- sample(c(1,2,3),100,replace=T) # 1:Mild,2:Moderate,3:Severe
    AovData <- data.frame(Type=COVID_Type,NLR=NLR,CRP=CRP,Age =Age )
    #方差分析:
    Aov <- aov(Type~.,data=AovData )  
     #Type~.是一个公式,意味着我要对AovData 表格里的所有临床指标与Type进行方差分析,如果不用~.表示的话,就得写成Type~NLR+CRP+Age。
    #查看方差分析的结果
    summary(Aov ):
    

    图片

    可以看到,3个指标的P值均大于0.05,说明这三个指标在不同的Type病人下,没有显著差异。

    2.5 pearson相关性检验

    案例:长得越好看的人(颜值评分越高,10分就是李东旭那样子的),追求者越多。

    Face_score <- sample(seq(1,10,by=1),100,replace=T)
    Admirers <- sample(seq(1,5,by=1),100,replace=T)
    #检验函数,明确method为pearson:
    Cor <- cor.test(Face_score,Admirers,method="pearson")
    

    图片

    检验结果中,P值大于0.05,不能拒绝原假设,因此认为,并不是长得越好看的人,追的人就越多(Pearson相关用于双变量正态分布的资料,其相关系数称为积矩相关系数(coefficient of product-moment correlation);当两变量不符合双变量正态分布的假设时,需用Spearman秩相关来描述变量间的相互变化关系。)

    三、非参数检验R语言实现

    本节的数据与第二节完全一致,所以,就省去编案例和随机造数据这两步过程了。

    3.1单样本wilcoxon检验

    检验代码:

    Wilsingle <- wilcox.test(Height)
    

    检验结果:
    图片

    P值小于0.05,接收备择假设:位置(中位数)差异不等于0,说明在非参数检验的情况下,我的身高也还是和锅锅姐姐们有差异的。

    3.2 Mann-Whitney检验

    检验代码:

    ManWit <- wilcox.test(South,North,paired = F)
    

    检验结果:
    图片

    同上,P值小于0.05,说明两组数据是有显著性差异的。北方人普遍就是比南方人高鸭~

    3.3配对样本wilcoxon检验

    检验代码:

    PairWil <- wilcox.test(Getin,Getout,paired = T)
    

    检验结果:
    图片

    P值小于0.05,COVID患者入院时和出院时的NLR值有显著性差异。

    3.4 Kruskal-wallis和置换多元方差分析检验

    Kruskal-wallis用于单因素方差分析:

    KS <- kruskal.test(Type~NLR,data=AovData)
    

    P值大于0.05,说明NLR在各组之间没有显著性差异。

    置换多元方差分析用于多因素方差分析

    AD <- adonis(Type~.,data=AovData)
    

    在这里插入图片描述

    可以看到,NLR,CRP和Age的P值均大于0.05,说明他们在各组之间均没有显著性差异。

    3.5 spearman相关性检验

    检验代码,明确方法用spearman:

    SCor <- cor.test(Face_score,Admirers,method="spearman")
    

    检验结果:
    图片

    P值大于0.05,不能拒绝原假设,所以不能认为长得越好看,追求者越多。

    四、列联表检验(定性资料)

    4.1 pearson卡方检验

    适合性检验:
    案例:高中学了孟德尔豌豆杂交实验,二代分离的结果为:黄圆315、黄皱101、绿圆108、绿皱32,共556粒。这个结果符合自由组合定律9:3:3:1吗?
    检验数据:

    F2split <- c(315,101,108,32)
    Ratio <- c(9/16,3/16,3/16,1/16)
    Fit <- chisq.test(F2split , p = Ratio )
    

    检验结果:
    P值大于0.05,因此不能拒绝原假设,认为二代分离结果符合自由组合定律。

    独立性检验
    案例:大学及研究生阶段,发现班上总是女生入社团很积极,男生很一般。所以,性别和加入社团与否有关系吗?
    检验数据:

    CHi <- as.table(rbind(c(62, 37), c(48, 23)))
    dimnames(CHi ) <- list(gender = c("F", "M"),
                    party = c("InParty","Notinparty"))
    Chiq <- chisq.test(CHi )
    

    检验结果:
    图片

    P值大于0.05,说明性别和加不加入社团没关系哦~

    4.2 Fisher精确检验

    案例:单身与否和化妆有关系吗?
    数据准备:

    Fisher<- rbind(c(28 ,42), c(35, 27))
    dimnames(Fisher) <- list(gender = c("Single", "Mate"),
                    party = c("Makeup","NoeMakeup"))
     
    #检验代码:
    Fish <- fisher.test(Fisher)
    

    检验结果:
    图片

    P值大于0.05,拒绝原假设,接受备择假设:真实比值不等于1 ,说明化妆对找男朋友还是有用的。Wu~

    4.3 Cochran-Mantel–Haensze卡方检验

    案例:肖战和王一博的男粉和女粉有明显差别不?在不用地区分布咋样(比如在重庆,是不是肖战的粉丝明显更多)?
    数据准备(五个城市不同男女喜欢肖战王一博的统计数据):

    Fans<- array(c(100,200,28,320,
               253,230,113,376,
               116,452,320,414,
                     123,23,456,311,
                     234,452,145,264),
               dim = c(2,2,5),
               dimnames = list(
               Sex= c('Female','Male'),
               Response = c('XZ','WYB'),
                Penicillin.Level = c('CQ','BJ','SH','GZ','CD')))
    

    检验代码:

    FanTest <- mantelhaen.test(Fans)
    

    检验结果:
    图片

    P值小于0.05,接收备择假设:两个人被喜欢的程度,还是会受到城市的影响的~

    五、一致性检验

    5.1 Kappa一致性检验(定性数据)

    一致性检验也分两组比较及多组比较。在irr包里,有一个diagnoses数据集,这里面包含了6个医生多30个病人的诊断结果。
    如果只是对其中两个医生进行一致性检验,采用Cohen’s Kappa法;如果是多个医生一起比较一致性,采用 Fleiss’s Kappa法。以上两种方法的代码及结果如下:

    Cohen’s Kappa:
    install.packages('irr')
    library(irr)
    require(irr)
    data(diagnoses)
    dat=diagnoses[,c(1,2)]
     
    #检验代码:
    kap2 <- kappa2(dat[,c(1,2)],'unweighted')
    

    检验结果:
    图片

    P值小于0.05 ,说明这两个医生的诊断结果具有一致性。

    Fleiss’s Kappa:
    检验代码:

    Flesi <- kappam.fleiss(dat)
    

    检验结果:
    图片

    P值为0,kappa值0.43,说明这六个医生的评价仍然具有显著的一致性。

    5.2 配对χ2检验(McNemar检验)

    数据准备:

    Performance <- matrix(c(794, 86, 150, 570),
          nrow = 2,
          dimnames = list("1st Survey" = c("Approve","Disapprove"),
                           "2nd Survey" =c("Approve", "Disapprove")))
    #检验代码:
    mcnemar.test(Performance)
    
    

    检验结果:
    P值小于0.05,说明第一次调查和第二次调查的支持者及反对者具有一致性,第一次调查中支持的人,在第二次调查也支持。

    5.3 ICC组内相关系数

    ICC一般是具体的值,认为大于0.8,则前后一致性好。没有碰到过像上面一样的检验函数。由于放射组学前后两次勾画ROI,需要进行提取后特征值的一致性分析,所以,作者自己有写相关的ICC批量计算代码,如下

    ICC <- function(Data){
       if(unique(Data[,1]==unique(Data[,2]))){
        ICC <- 1
        ICC
      }
      else{
        n <- nrow(Data);k <- ncol(Data)
        mean_r <- apply(Data,1,mean)
        mean_c <- apply(Data,2,mean)
        mean_all <- mean(c(Data[,1],Data[,2]))
       
    l_all <- sum((Data-mean_all)^2)
        l_r <- sum((mean_r-mean_all)^2)*k
        l_c <- sum((mean_c-mean_all)^2)*n
        l_e = l_all-l_r-l_c
       
        v_all = n*k-1
        v_r = n-1
        v_c = k-1
        v_e = v_r*v_c
       
        MSR = l_r/v_r
        MSC = l_c/v_c
        MSE = l_e/v_e
       
        ICC = (MSR-MSE)/(MSR+(k-1)*MSE+k*(MSC-MSE)/n)
        ICC
      }
     
    }
     
    ICC1 <- DataFeature;ICC2 <- DataFeature2
     
    ICCvalue <- c()
    for(i in 2:ncol(ICC1)){
      data1 <- ICC1[,i];data2 <- ICC2[,i]
      Data <- data.frame(data1=data1,data2=data2)
      Value <- ICC(Data)
      ICCvalue <- c(ICCvalue,Value)
    }
     
    length(which(ICCvalue>=0.8))# %>% length() # 哪些特征的ICC系数大于0.8,则说明这些特征的可重复性好。
    

    附录

    正文所有用到的代码皆在此处~

    ## 随机生成服从均值为0,方差为1的100个正态分布数据
    test <- rnorm(100,0,1)
     
    ## 正态分布检验
    Shp <- shapiro.test(test)
    KS <- ks.test(test,0,1)
     
    library(nortest)
    Li <- lillie.test(test)
    Ad <- ad.test(test)
     
    ## 方差齐性检验
    require(graphics)
    str(InsectSprays)
    Bar <- bartlett.test(count ~ spray, data = InsectSprays);Bar
     
    library(car)
    Lev <- car::leveneTest(count ~ spray, data = InsectSprays);Lev
    Fli <- stats::fligner.test(count ~ spray, data = InsectSprays);Fli
     
    ## 单样本t检验
    Height <- sample(seq(1.3,2.2,by=0.1),100,replace=T)
    Tsingle <- t.test(Height, alternative = "greater", mu =1.55 );Tsingle
    Wilsingle <- wilcox.test(Height )
     
    ## 独立样本t检验
    South <- sample(seq(1.3,1.9,by=0.1),100,replace=T)
    North <- sample(seq(1.3,2.2,by=0.1),80,replace=T)
    IndT <- t.test(South ,North ,paired = F);IndT
    ManWit <- wilcox.test(South,North,paired = F);ManWit
     
    ## 配对样本t检验
    Getin <- sample(seq(3.22,14.9,by=0.1),100,replace=T)
    Getout <- sample(seq(1.22,9.9,by=0.1),100,replace=T)
    PairT <- t.test(Getin ,Getout ,paired = T);PairT
    PairWil <- wilcox.test(Getin,Getout,paired = T);PairWil
    ## 方差分析
    NLR <- sample(seq(3.22,14.9,by=0.1),100,replace=T)
    CRP <- sample(seq(0.06,190,by=0.1),100,replace=T)
    Age <- sample(seq(20,70,by=1),100,replace=T)
    COVID_Type <- sample(c(1,2,3),100,replace=T)
     
    AovData <- data.frame(Type=COVID_Type,NLR=NLR,CRP=CRP,Age =Age )
    Aov <- aov(Type~.,data=AovData )
    summary(Aov )
    ## 单因素
    KS <- kruskal.test(Type~NLR,data=AovData);KS
    ## 多因素
    library(vegan)
    AD <- adonis(Type~.,data=AovData);AD
     
    ## 相关性分析
    Face_score <- sample(seq(1,10,by=1),100,replace=T)
    Admirers <- sample(seq(1,5,by=1),100,replace=T)
    Cor <- cor.test(Face_score,Admirers,method="pearson");Cor
    SCor <- cor.test(Face_score,Admirers,method="spearman");SCor
     
     
    ## 列联表检验
    ## chisq.test
    ## 适合性检验
    F2split <- c(315,101,108,32)
    Ratio <- c(9/16,3/16,3/16,1/16)
    Fit <- chisq.test(F2split , p = Ratio );Fit
     
    ## 独立性检验
    Chi <- as.table(rbind(c(62, 37), c(48, 23)))
    dimnames(Chi ) <- list(gender = c("F", "M"),
                    party = c("InParty","NotinParty"))
    Chiq <- chisq.test(Chi );Chiq
     
    ## fisher exact test
    Fisher<- rbind(c(28 ,42), c(35, 27))
    dimnames(Fisher) <- list(gender = c("Single", "Mate"),
                    party = c("Makeup","NoeMakeup"))
    Fish <- fisher.test(Fisher);Fish
     
    ## 分层检验
    Fans<- array(c(100,200,28,320,
               253,230,113,376,
               116,452,320,414,
                  123,23,456,311,
                  234,452,145,264),
               dim = c(2,2,5),
               dimnames = list(
               Sex= c('Female','Male'),
               Response = c('XZ','WYB'),
                Penicillin.Level = c('CQ','BJ','SH','GZ','CD')))
    FanTest <- mantelhaen.test(Fans);FanTest
     
    ## 一致性检验
    install.packages('irr')
    library(irr)
    require(irr)
    data(diagnoses)
    dat=diagnoses[,c(1,2)]
    kap2 <- kappa2(dat[,c(1,2)],'unweighted');kap2
     
    Flesi <- kappam.fleiss(diagnoses);Flesi
     
    ## mcnemar 检验
    Performance <- matrix(c(794, 86, 150, 570),
          nrow = 2,
          dimnames = list("1st Survey" = c("Approve","Disapprove"),
                           "2nd Survey" =c("Approve", "Disapprove")))
    Performance
    mcnemar.test(Performance)
    
    展开全文
  • 参数检验和非参数检验

    万次阅读 多人点赞 2018-05-22 21:34:33
    拒绝原假设H0的最小显著性水平称为检验的p值.5、单正态总体参数的检验(1)(2)(3)6、两正态总体参数的检验(1)(2)7、成对数据的t检验所谓成对数据, 是指两个样本样本容量相等, 且两个样本之间除均值之外...

    一、参数检验

    1、基本思想

    2、两类错误

    3.、检验步骤

    4、检验的p值

    在一个假设检验问题中, 拒绝原假设H0的最小显著性水平称为检验的p值.

    5、单正态总体参数的检验

    (1)


    (2)

     

    (3)

    6、两正态总体参数的检验

    (1)

    (2)

     

     

    7、成对数据的t检验

    所谓成对数据, 是指两个样本的样本容量相等, 且两个样本之间除均值之外没有另的差异.

    8、单样本比率的检验

    (1)比率p的精确检验

    (2)比率p的近似检验

    9、两样本比率的检验

     

    二、非参数的假设检验

    参数假设检验是在假设总体分布已知的情况下进行的.但在实
    际生活中,那种对总体的分布的假定并不是能随便作出的. 数据并不是来自所假定分布的总体, 或者,数据根本不是来自一个总体; 还有可能数据因为种种原因被严重污染. 这样,在假定总体分布已知的情况下进行推断的做法就可能产生错误甚至灾难性的结论. 于是,人们希望在不对总体分布作出假定的情况下,尽量从数据本身来获得所需要的信息, 这就是非参数统计推断的宗旨。

     

    单总体位置参数的检验

    (1)中位数的符号检验

    (2)Wilcoxon符号秩检验

    (3)

    (4)

     

    (5)

    (6)

     

    from:https://blog.csdn.net/lilanfeng1991/article/details/25914521

     
     
    展开全文
  • color:rgb(6,65,131)">SPSS学习笔记之——两独立样本非参数检验(Mann-Whitney U 秩检验)作者:王江源 一、概述  Mann-Whitney U 检验是用得最广泛的两独立样本检验方法。简单的说,该检验是与独立...

    原文地址:SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney U 秩和检验)作者:王江源

    一、概述

        Mann-Whitney U 检验是用得最广泛的两独立样本秩和检验方法。简单的说,该检验是与独立样本t检验相对应的方法,当正态分布、方差齐性等不能达到t检验的要求时,可以使用该检验。其假设基础是:若两个样本有差异,则他们的中心位置将不同。

     

    二、问题

       为了研究某项犯罪的季节性差异,警察记录了10年来春季和夏季的犯罪数量,请问该项犯罪在春季和夏季有无差异。

       下面使用Mann-Whitney U检验进行分析。 SPSS版本为20。

     

    三、统计操作

     

    SPSS变量视图: 

    SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney <wbr>U <wbr>秩和检验)

     

    SPSS数据视图:

    SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney <wbr>U <wbr>秩和检验)

     

    进入菜单如下图:

    SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney <wbr>U <wbr>秩和检验)

     

    点击进入如下的界面,“目标”选项卡不需要手动设置

    SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney <wbr>U <wbr>秩和检验)

     

    进入“字段”选项卡,将“报警数量”选入“检验字段”框,将“季节”选入“组”框中。

    SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney <wbr>U <wbr>秩和检验)

     

    再进入“设置”选项卡,选中“自定义检验”单选按钮,选择“Mann-Whitney U(二样本)”检验。点击“运行”即可。

    SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney <wbr>U <wbr>秩和检验)

     

    四、结果解读

     

    这是输出的主要结果,零假设是“报警数量的分布在季节类别上相同”,其P=0.009<0.05,故拒绝原假设,认为报警数量在季节上有统计学差异。

     

    SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney <wbr>U <wbr>秩和检验)

     

    双击该表格,可以得到更多的信息,不再叙述。

    展开全文
  • 非参数复习1(单样本)

    2020-12-31 12:59:46
    非参数样本、两独立样本、多组数据2.单样本2.1符号检验2.1.1符号检验(小样本)2.1.2符号检验(大样本)2.1.3符号检验(配对样本)2.2 Cox-Staut趋势存在性检验2.3 随机游程检验2.4 Wilcoxon符号秩检验2.4.1小样本...
  • 最近几天博主需要做一些计算生物学分析,重新温习了一遍统计学的知识。由于博主此次使用的是非参数检验,将重点介绍非参数检验相关内容,仍然是深入浅出的风格,先放一些概念,再...Q1:参数检验和非参数检验的联系...
  • SPSS-Friedman 秩检验-非参数检验-K个相关样本检验 案例解析
  • 今天我们聊聊非参数检验,之前给大家介绍到过单样本非参数检验,今天我们一起来看一下单样本非参数检验中的其中一种——卡方检验。卡方检验一般是用来对样本总体分布进行检验的非参数检验方法。比如说人的血型性格...
  • 方差分析是假设数据满足正态分布方差齐性的前提...类似于方差分析中的独立样本的方差分析区组设计的方差分析,多个样本非参数检验分为多个独立样本非参数检验多个相关样本非参数检验。此次笔记是关于多个独
  • 参数检验和非参数检验的区别

    万次阅读 2018-10-11 16:46:47
    1、参数检验是针对参数做的假设; 非参数检验是针对总体分布情况做的假设,这是区分的一个...非参数检验不需要利用总体信息,以样本信息对总体分布做出推断; 3、正态分布用参数检验,非正态分布用非参数检验。...
  • 除了使用Wilcoxon进行单样本位置检验外,...这里需要注意的是在python中使用Wilcoxon秩检验对单样本和双样本时,对应参数的差异,函数原型如下: stats.wilcoxon(x, y=None, zero_method='wilcox', correction=Fals
  • 再次使用SPSS实现Kruskal-Wallis H检验,Holm-Bonferroni Correction校正,发现忘记怎么操作了,简单记录。 声明:所有数据仅为记录SPSS操作的随意设定值,不具有...2. 选项卡:分析-非参数检验-独立样本 目标:选.
  • 一、概述Cruskal-Wallis秩检验类似于方差分析,用于检验各个样本的总体是否相同,当正太假设方差齐性不能满足时,可用该检验。二、问题某人搜集了三大公司股票每股所能获利的钱数,是比较三家公司所挣的钱是否...
  • 摘 要:本文通过一组相似度很高的数据,用常用的两样本非参数比较的方法(符号秩检验,符号秩检验,游程检验,Mann-White-Wilcoxon检验,K-S检验),来分析各个方法的不足之处。得出K-S检验更适用于数据存在重合的...
  • 今天跟大家讨论分享一下:spss-Friedman 秩检验-非参数检验-K个(多个)相关样本检验,下面以“数学,物理,生物”样本数据为例, 假设:H0: 数学,物理,生物三门课程的总体分布是相同的 H1:数学,物理,...
  • 学习笔记 学习书目:《统计学:从数据到结论》–吴喜之 非参数检验 啥是非参数检验 很多检验都假定了总体的...这种数据本身的总体分布无关的检验称为非参数检验。 非参数检验的优越性 在分布未知时,如...
  • # -*- coding: utf-8 -*-"""Created on Sun Jul 21 14:26:22 2019《Python数据分析基础》中国统计出版社@author: User"""#import numpy as npfrom scipy import statsimport pandas as pd#import statsmodels.api as...
  • 今天来总结一下参数模型和非参数模型。 一、前言 参数模型(parametric model)和非参数模型(non-parametric model)作为数理统计学中的概念,现在也常用于机器学习领域。 在统计学中,参数模型通常假设总体(样本、数据...
  • 非参数检验是在不知道总体分布的情况下所做的检验,符号检验是最简单的非参数检验 2.1.1 分位点检验 eg2.1,对城市花费指数进行分位点检验,按升序如下: 27.8 27.8 29.1 32.2 32.7 36.4 36.5 37.5 37.7 38.8 41.9 ...
  • 位置参数描述了总体的位置, 而描述总体概率分布离散程度的参数是尺度参数. 假定两独立样本X1,X2,...,XmX_1 ,X_2 , ... ,X_mX1​,X2​,...,Xm​Y1,Y2,...,YnY_1 ,Y_2 , ... ,Y_nY1​,Y2​,...,Yn​分别来自N(µ1,σ...
  • 论文研究-基于样本的企业联盟效率综合评价的非参数方法.pdf, 从系统组成成员的资源共享出发, 针对传统样本数据包络分析方法无法突破决策单元具有“可比性”的限制无法...
  • 对于8个单细胞转录组数据集,用NMISE算法聚类,得到ARINMI评估指标: 统计上述8个数据集的ARINMI均值,作为NMISE聚类的性能评估,但均值可能是随机采样导致的结果更优,如果要严格说明需进行统计学分析,如...
  • 因为有3个独立样本(3个组),因此进行非参数检验K个独立样本检验 1.输入数据 组别类型为名义,双击即可更改 2.进行非参数检验 点击分析→非参数检验→旧对话框→K个独立样本 选择分组变量检验变量列表,我的...
  • 展开全部参数检62616964757a686964616fe59b9ee7ad9431333366303234验是针对参数做的假设,非参数检验是针对总体分布情况做的假设,这个是区分参数检验和非参数检验的一个重要特征。参数检验和非参数检验的本质区别:...
  • 设置 该项目中使用的主要框架是 。 requirements.txt文件包括仅CPU版本的JAX,可以通过pip安装。... distributions.py :一组将与概率分布相关的所有属性方法捆绑在一起的类(例如,均值,方差,采样,计算似然性
  •  定义:单样本K-S检验是以两位前苏联数学家KolmogorovSmirnov命名的,也是一种拟合优度的非参数检验方法。单样本K-S检验是利用样本数据推断总体是否服从某一理论分布的方法,适用于探索连续型随机变量的分布形态...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,122
精华内容 448
关键字:

参数样本和非参数样本