精华内容
下载资源
问答
  • 2020-04-29 10:00:25

    学习笔记
    学习书目:《统计学:从数据到结论》–吴喜之;


    比较两总体中位数的Wilcoxon秩和检验

    我们之前比较两总体均值时,都要假定感兴趣的总体是近似正态分布。然而,在许多情况,这种正态总体的假定是不可靠的。

    能否在总体分布不知道的时候有办法检验两个总体的中位数是否相等呢?

    我们在这里,介绍一种常用的Wilcoxon秩和检验,该检验唯一需要的假定就是两个总体的分布有类似的形状。Wilcoxon秩和检验的原理很简单:假定第一个样本有m个观测值,第二个有了n个观测值,把两个样本混合之后将这m+n个观测值按照大小次序排序,然后记下每个观测值在混合排序下面的秩,之后分别把两个样本所得到的秩相加,记第1个样本观测值的秩的和为 W x W_x Wx,而第2个样本观测值的秩的和为 W y W_y Wy,这两个值可以互相推算,称为Wilcoxon统计量,该统计量的分布和两个总体分布无关,我们可以由此得到 p p p值。直观上看,如果 W x W_x Wx W y W_y Wy之间有一个显著的大(显著的小),则可以选择拒绝零假设。

    R语言实现

    我们现在有两个样本数据,样本x的样本量为18,样本y的样本量为22,现在我们假定这两个样本的总体分布有类似的形状:

    > (a <- new_data[1:18])
     [1] 74.3 79.5 75.0 73.5 78.8 75.6 73.5 75.0 68.8 75.0 78.8 72.0 78.0 78.8 74.3 64.3 70.4
    [18] 72.0
    > (b <- new_data[19:40])
     [1] 75.8 75.8 80.5 72.0 65.0 80.3 80.5 72.0 74.3 69.7 69.7 74.3 71.2 74.3 71.2 71.2 69.7
    [18] 73.5 73.5 72.0 68.0 73.5
    

    通过计算,我们得知样本x的中位数为 m x = 74.65 m_x=74.65 mx=74.65,样本y的中位数为 m y = 72.75 m_y=72.75 my=72.75

    现在,我做出以下假设:
    H 0 : m x = m y H 1 : m x > m y H_0:m_x=m_y \\H_1:m_x >m_y H0:mx=myH1:mx>my

    Wilcoxon秩和检验:

    > wilcox.test(a, b, alternative = "greater")
    
    	Wilcoxon rank sum test with continuity correction
    
    data:  a and b
    W = 245, p-value = 0.1023
    alternative hypothesis: true location shift is greater than 0
    

    由结果可知, p = 0.1023 p=0.1023 p=0.1023,大于0.05的显著性水平,没有充分证据拒绝原假设,即,没有理由拒绝样本x所对应的总体样本y所对应的总体中位数相等。

    更多相关内容
  • R统计计算--差异性检验

    万次阅读 2018-08-09 17:49:55
    差异性检验: t检验、秩和检验(如wilcox检验)、Kolmogorov-Smirnov检验 组间差异检验:方差分析、Fisher检验、卡方检验 相关性分析:相关性检验(pearson、spearman和kendall等)、cos相关性检验 基本概念: 1....

    假设检验

    差异性检验: t检验、秩和检验(如wilcox检验)、Kolmogorov-Smirnov检验

    间差异检验:方差分析、Fisher检验、卡方检验

    相关性分析:相关性检验(pearsonspearmankendall)、cos相关性检验

    基本概念:

    1.假设检验是统计推断的一个主要部分

    2. 对某一个事情提出疑问,解决疑问的过程往往是先做一个和疑问相关的假设,然后在这个假设下去寻找有关的证据,如果得到的证据和假设相矛盾则否定这个假设

    3. 假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P<0.01P<0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为不假设成立

     

     

    4. 解决假设检验问题的同时,可能会犯错误。否定H0时犯的错误为第一类错误,接受H0时犯的错误为第二类错误,具体
    1H0为真,统计推断的结果否定H0,犯第一类错误

    2H0为假,统计推断的结果接受H0,犯第二类错误

    5. 检验水平a控制了否定H0时犯第一类错误的概率:如果检验是显著的,否定H0后,犯第一类错误的概率不会超过a,如果检验不是显著的,就不能否定H0

    6. 参数统计:即总体分布类型已知,用样本指标对总体参数进行推断或作假设检验的统计分析方法。

    7. 非参数统计:即不考虑总体分布类型是否已知,不比较总体参数,只比较总体分布的位置是否相同的统计方法。

    过程:

    1提出检验假设又称无效假设,符号是H0;备择假设的符号是H1

               H0:样本与总体或样本与样本间的差异是由抽样误差引起的;

               H1:样本与总体或样本与样本间存在本质差异;

              预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05α=0.01

    2选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用T检验,秩和检验等。

    3根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P>α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P≤α,结论为按所取α显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。

    差异性校验:

    一、 T校验

    概念:

    学生T-检验用于检验统计服从空假设为真的正态分布。用此可判断两组独立的数据集是否存在不同。T-检验适用于基于少量样本(少于30)且标准差未知的判断问题。多组间比较时慎用T检验

    统计原理:

    1、建立空假设H0μ1 = μ2即先假定两个总体平均数之间没有显著差异; 备择假设H1 μ1 ≠ μ2

    2、 给出显著性水平a(例如0.05

    3、计算统计量t值,μ1 μ2    是全量平均值  S方差

    4、计算相应的P

    5、确定是否可以拒绝空假设

    实现

    weights<-c(84.12,85.17,62.18,83.97,76.29,76.89,61.37,70.38,90.98,85.71,89.33,74.56,82.01,75.19,80.97,93.82,78.97,73.58,85.86,76.44) 
    weights2<-c(69.35,63.21,72.57,73.23,65.26,60.32,66.96,59.78,69.71,76.88,81.39,64.9,75.53,65.05,77.21,64.9,71.93,75.04,74.29,77.53) 
     boxplot(list(weights,weights2),main='A boxplot of two weight samples')
     abline(h=mean(weights),lwd=2,col='blue') 
     abline(h=mean(weights2),lwd=2,col='red')
    pvalue<-t.test(weights,weights2)$p.value
    

    可视化展现:

    pvalue=0.00049(<0.05)

    说明两组数据的平均值有显著差异

    二、秩和检验Wilcoxon

    概念:

    秩和检验是一种非参数校验方法用样本秩来代替样本值的检验法),它使用的空假设为,不假设正态分布的情况下,两个不同组的数据来自于同一个全量。

    统计原理:

    T检验,它假设两组样本之间的差异是服从正态分布(也适用于两组样本服从正态分布的情况)。但是,当不能确定正态分布的时候,可以采用wilcoxon秩和检验来做假设检验

     1)建立假设;

            H0:比较两组的总体分布相同;

            H1:比较两组的总体分布位置不同;检验水准为0.05

    2)两组混合编秩;

    3)求样本数最小组的秩和作为检验统计量T

    4)以样本含量较小组的个体数n1、两组样本含量之差n2-n1T值查检验界值表;

    5)根据P值作出统计结论。

    当相同秩次较多时,应用校正公式计算u

    现设12两总体分别抽取容量为n1,n2的样本,且设两样本独立。这里总假定 n1<>n2

    我们将这n1 + n2个观察值放在一起,按自小到大的次序排列,求出每个观察值的秩,然后将属于第1个总体的样本观察值的秩相加,其和记为R1,称为第1样本的秩和,其余观察值的秩的总和记作R2,称为第2样本的秩和。

    显然,R1R2是离散型随机变量,且有R1+R2=( (n1+n2)(n1+n2+1) )/2.

    实现:

    likes<-c(17,40,57,30,51,35,59,64,37,49,39,41,17,53,21,28,46,23,14,13,11,17,15,21,9,17,10,11,13,16,18,17,2,11,12,5,8,4,12,7,11,8,4,8,7,3,9,9,9,12,17,6,10) 
     likes2<-c(28,152,197,25,62,39,32,202,85,74,125,32,67,29,37,297,101,45,24,63,17,92,46,60,317,85,46,61,56,59,91,54,133,87,200,28,97,28,30) 
    boxplot(list(likes,likes2))
    Pvalue<-wilcox.test(likes,likes2)$p.value
    

    可视化展示

    pvalue=2.750569e-11 (<0.05)

    说明两组数据并不来自于同一个全量

    三、Kolmogorov-Smirnov检验

    概念:

    KS检验是一种非参数的、面向连续概率分布等价性的统计检验方法。

    双样本Kolmogorov-Smirnov检验可以比较两个数据集的累积分布

    统计原理:

    H0:样本服从指定的分布

    H1:样本不服从指定的分布

    ECDF:经验累积分布函数

    KS检验使用的是两条累计分布曲线之间的最大垂直差作为D值(statistic D)作为描述两组数据之间的差异。

    实现:

    set.seed(123) 
    x<-runif(n=20,min=0,max=20) 
     y<-runif(n=20,min=0,max=20) 
    plot(ecdf(x),do.points=F,verticals = T,xlim=c(0,20)) lines(ecdf(y),lty=3,do.points=F,verticals=T) 
    pvalue<-ks.test(x,y)$p.value
    

    可视化展现:

    pvalue=0.8319696 (>0.05)

    说明两组数据可能来自同一个分布

     T检验秩和检验KS检验
    条件

    1 已知一个总体均数

    2)可得到样本均数及样本标准差

    3)样本来自正态或近似正态分布

    样本独立

    分布不清

    两个样本容量均小于10

    适用于连续概率分布

    空假设

    两个总体平均值相同

    不假设正态分布的情况下,两个不同组的数据来自于同一个全量

    两组数据来自于同一个分布

    统计平均数秩和

    两条累计分布曲线之间的最大垂直差

     

    展开全文
  • 题记:本文介绍基于PASS软件两样本比较的样本量计算,以飨读者。1. 背景介绍今天我们开始讲样本量估算系列的第三章,基于PASS两样本比较的样本量计算,计算过程相对较简单,因为计算原理被我略过了,如果我...

    题记:本文介绍基于PASS软件两样本均数比较的样本量计算,以飨读者。

    1. 背景介绍

    今天我们开始讲样本量估算系列的第三章,基于PASS两样本均数比较的样本量计算,计算过程相对较简单,因为计算原理被我略过了,如果我把原理和计算公式也放上来,估计大部分人会觉得脑袋发胀。样本量计算的基础知识各位可参考我们上一篇文章 (基于PASS两样本率比较的样本量计算),此处不再赘述。

    2. 案例分析

    [案例 1] 一项临床随机对照试验研究新型降压药物A治疗高血压的作用,对照选择安慰剂。如果A药降低收缩压的能力平均较安慰剂多降低收缩压10 mmHg,则认为该药有临床应用价值。根据既往文献报道安慰剂降低收缩压的标准差为8 mmHg,根据预实验结果,新药A降低收缩压的标准差为15 mmHg。按照3:1平行对照设计, 单侧检验,选用alpha=0.025, power=90%,每组需要多少样本?总计需要多少样本?

    分析:本例按照两组平行对照设计的优效性研究,欲证明A药较安慰剂的优效性,为了使更多的患者进入试验组,按照3:1分组。其余参数:两组均数差为10 mmHg,试验组标准差15 mmHg,对照组标准差8 mmHg,单侧检验,选用alpha=0.025, power=90%。

    PASS计算过程:

    3eac7c82508fb254cd479c0b7cb84e20.png

    图1. 如图依次做出选择。本例中两组标准差不等,所以选择“方差不齐”。

    94661c8c884ebf179586886fef9320bb.png

    图2. 依次填入参数。注意本例中试验组与安慰剂组的分配比例是3:1。

    a62eee3db5bb445cd35d954212443ad7.png

    图3. 计算所得结果。

    最终,若不考虑失访,则试验组需要48例,安慰剂组需要16例。

    [案例 2] 一项临床随机对照试验研究新型降压药物A治疗高血压的作用,对照药物选择临床确定有效的盐酸贝那普利片(洛丁新)。如果A药降低收缩压的能力低于洛丁新10 mmHg,则认为该药无临床应用价值,若不低于10 mmHg则认为该药有临床应用价值。估计新药A实际降低收缩压能力最多低于洛丁新5 mmHg。根据既往文献报道洛丁新组降低收缩压的标准差为18 mmHg,根据预实验结果,新药A降低收缩压的标准差为18 mmHg。按照1:1平行对照非劣效设计, 选用alpha=0.025, power=90%,单侧检验,每组需要多少样本?总计需要多少样本?

    分析:本例按照两组平行对照的非劣效设计,A药降低收缩压只要不低于洛丁新10 mmHg,则认为A药有用,我们可根据专业知识或者文献回顾设定这个非劣效性的界值,此处设为10 mmHg。此外,还要已知其他参数:A实际降低收缩压能力最多低于洛丁新5 mmHg,1:1平行设计,单侧检验,alpha=0.025,power=90%。

    PASS计算过程:

    7861423141b75c79d15fbde45e29122b.png

    图4. 如图依次做出选择。

    1f37adac1b03a5e5bd83c365ca932c83.png

    图5. 依次填入参数。

    fa0817bd993c8eac5e492b60d30705c0.png

    图6. 计算所得结果。

    最终,若不考虑失访,则试验组需要274例,安慰剂组需要274例。

    展开全文
  • SPSS实操个独立样本比较的t检验一、临床问题&科学问题40例患者随机分配至A、B两组。每组20例,A组接受常规液体复苏,B组在初步液体复苏后,接受限制液体复苏,72h后,利用PICCO计算测量两组患者肺水含量,...

    SPSS实操

    两个独立样本均数比较的t检验

    一、临床问题&科学问题

    40例患者随机分配至A、B两组。每组

    20例,A组接受常规液体复苏,B组在初步液体复苏后,接受限制性液体复苏,72h后,利用PICCO计算测量两组患者肺水含量,数据如下。试问不同液体复苏策略对脓毒症患者肺水含量(ml/Kg)有无影响?

    sg_trans.gif

    二、统计分析前的思考

    第一步分析资料是定量资料。

    第二部分析资料是独立的两组。

    第三部分析资料符合正态性和方差齐性。

    好了,得出该使用独立t检验。

    三、SPSS实操

    1. 数据录入SPSS

    sg_trans.gif

    2. 选择分析→比较均值→独立样本T检验

    sg_trans.gif

    3. 选项设置

    (1)主对话框设置:将分析变量(肺水)送入检验 框中→将分组变量(分组)送入分组框中

    (2)定义组别设置:定义两组的编号分别为1,2

    (3)点击“确定”

    sg_trans.gif

    四、结果解读

    sg_trans.gif

    结果包括了两个部分:

    组统计量表格给出了两组基本信息量,包括分组情况,个数,各组均值,标准差以及均值标准误。

    第二部分是重点,首先给出方差分析结果,本例种F值=0.000,P(Sig.)=1.000,说明两组数据方差齐。然后就是两组的比较,因本案例方差齐,故仅看第一行即可,P(Sig.)=0.006,小于0.05,提示两组之间有差异有统计学意义。

    五、如何撰写

    接受常规液体复苏的脓毒症患者,72h经过PICCO测量肺水的平均值为(14.23±

    4.31)ml/Kg,接受限制性复苏的脓毒症患者,72h经过PICCO测量肺水的平均值为(10.23±

    4.31)ml/Kg。两组肺水含量差异具有统计学意义(P=0.006)。

    展开全文
  • 样本量大的时候做差异性分析容易得到有显著性差异的结论,原因如下图, 求p值的过程中,n越大,Z0也越大,相对应的p就小了。当然这里默认方差变化不大的情况下,因为一般来说很多数据经过平均后方差不会变化很大,...
  • 差异性分析

    2020-12-06 13:55:33
    背景:探索实验的天数,对指标A,B,C,D,E的影响是否显著。0day,指标A的数据来自对4个实验对象的测量。...方差分析若拒绝原假设,只能说明多个样本总体均不相等或不全相等。若要得到各组均...
  • (b1-b2)/se12,其中b1和b2是被比较的回归系,se12是两者的Join Standard Error(联合标准误差),其结果是一个以自由度为n-k-2的t分布(其中n是样本量、k是原来的自变量,本案中为x和c个)。2. 在SPSS(其实是任何O.....
  • 本文:1566字 ▏18图独立样本T检验适用于:独立正态分布的计量资料,如果有原始资料,借助统计软件很容易获取T检验的统计量和P值。假如我们只知道两组资料的样本量、均值和标准差,可以根据公式法计算出t值,...
  • t检验多用于两组连续变量样本的比较。例如,研究两地正常成年男性血液红细胞均的差别,个班级期末考试成绩之间的差别。配对样本是比较特殊的,配对样本是指样本中的观察值由于存在某种联系而一一对应...
  • R的均值比较检验(参数检验

    千次阅读 2020-12-21 16:48:54
    1.由于抽样的随机样本均值在不同总体上的差距...检验两样本上的均值差是否统计显著的方法:参数检验&非参检验,步骤:h0&h1构造检验统计。该检验统计量 在原假设成立条件下,服从某个已知的理论分布,...
  • 样本检验方法

    2022-02-28 21:43:04
    并对混合后的数组(总共有N个样本)排序,最小的秩列为1,最大的列为N,值相同时,秩相同(注:如果有多个相同的样本,则先将这几个样本进行排序,然后将这几个样本的秩相加求平均值,最终这几个样本秩为平均值,...
  • 独立样本T检验平均检验、单样本T检验、配对样本T检验均属于比较平均值的检验方法。不同的是,独立样本T检验比较的是两组个案的平均...本例子检验的是饮用牛奶A组与饮用牛奶B组的初中生身高平均值是否有显著性差异
  • 日常分析工作中经常会进行对比分析,其中比较常见的场景就是对两组广告带来的访问量...平均数的显著性检验是指对样本平均数差异进行的显著性检验。若检验的结果差异显著,表明个样本间有差异。当总体分布非正
  • 在统计学中,差异显著性检验是“统计假设检验”(Statistical hypothesis testing)的一种,用于检测科学实验中实验组与对照组之间是否有差异以及差异是否显著的办法。 在实验进行过程中,尽管尽量排除随机误差的...
  • 目标:检验两个相关组别中的某个因变量的均值是否存在显著差异 数据要求:具有个有联系的组或类别的一个自变量,一个连续因变量(在数据计算过程中只有两组数据) 2.原假设:A组值=B组值 对立假设:A组值≠B...
  • 独立样本t检验、方差齐性检验

    万次阅读 2019-11-01 17:18:48
    独立样本t检验(各实验处理组之间毫无相关存在,即为独立样本),该检验用于检验两组非相关样本被试所获得的数据的差异性。 独立样本t检验统计量为: S1²和 S2²为两样本方差;n₁ 和n₂ 为两样本容量。 选用的...
  • 这里我们想指出一点的是,人们往往对正态的关注更多一些,其实样本量也很重要,这里是样本量较小的情形,如果样本量足够大(比如超过40),即使正态不满足,也可以使用t检验,而且更推荐用t检验。案例:在某小学...
  • SAS:独立样本均值检验

    万次阅读 2014-05-15 21:42:53
    1. 单一样本t检验(One-sample t test),是用来比较一组数据的平均值和一个数值有无差异。例如,你选取了5个人,测定了他们的身高,要看这五个人的身高平均值是否高于、低于还是等于1.70m,就需要用这个检验方法。 ...
  • 这种检验过程是通过分析个独立样本的均值、中位、离散趋势、偏度等描述统计量之间的差异来实现的检验类型 Mann-Whitney U检验检验两样本的总体在某些位置上是否相同,其基于对平均秩的分析实现推断。 ...
  • 两样本t检验原理与R语言实现

    千次阅读 2020-12-24 21:12:59
    t检验也称为student t检验,可以用来比较个均值的差异是否显著,可分为单总体检验、双总体检验、配对样本检验。1.1历史要了解t检验,就不得不提及他的发明者威廉·西利·戈塞特(William Sealy Gosset)。戈塞特先生...
  • t检验属于参数方法中假设检验方法,主要包括单样本t检验、独立样本t检验和配对样本t检验等,美中适用于不同情形。 单样本t检验样本t检验的意义在于检验序列X1X_1X1​的均值能否视作等于S0S_0S0​,最常见的例子...
  • 熟悉总体均值检验和单因素方差分析的应用总体均值检验两个独立样本的t检验:案例背景• 例如,在教师教学评估中,想了解男性和女性教师的教学水平是否存在明显区别。• teaching表格记录了教师的教学评估得分,...
  • 就是组间的差异分析以及显著性检验,应用统计学上的假设检验方法,检验组间是否有差异及其差异程度。 坦率地讲,所有的差异检验都基于一个假设:组间没有差异,变量之间没有关系(即原假设,H0H_0H0​)。也说
  • 其中,样本按照来源可以分为单样本两样本,按照样本容量大小可以分为大样本容量和下样本容量,根据中心极限定理,大样本容量下的总体均值、总体比例的抽验分布近似正态分布,而小样本容量下的抽样分布一般采t分布...
  • SPSS之双独立样本的T检验

    万次阅读 2022-03-20 14:34:57
    是指在样本相互独立的前提下,检验两样本的总体均数(样本各自归属的总体的平均数,如果两样本均数不存在显著差异,那么可以认为样本来自同一个总体)是否存在了显著性差异。它的零假设(即想要证明...
  • 其中,单样本T检验、独立样本T检验、配对样本T检验都是运用T分布理论来分析差异发生的概率,从而比较平均数差异是否显著的分析方法。那么,这三种T检验的分析方法有什么不同呢? 图1:SPSS比较平均值 一、...
  • 一、 独立样本T检验原理 首先我们要界定好独立样本是指样本之间彼此独立,没有任何的相关关系,用数理统计的语言来说就是相关系数为0。 然后在菜单栏依次点击Analyze -> Compare Mean ->...
  • 显著性检验是假设检验中最常用的一种方法,其基本原理是先对总体的特征做出某种假设,然后通过抽样样本的分析,对此假设应该被拒绝还是接受做出推断。常用的假设检验方法有t检验、卡方检验、F检验等。 检验的原理 ...
  • 独立性两样本相互独立,即从一总体中抽取一批样本对从另一总体中抽取一批样本没有任何影响,两组样本个案可以不同。 正态 样本来自的个总体服从正态分布 在样本的总体不满足正态条件时,如果样本的...
  • 实证分析中,经常需要对比多个变量在个子样本组中的均值或者中位是否存在显著差异。 我们选取的是在99%的置信水平下(1%的显著水平下),用P值来决定是否显著。 在stata中来计算 *-在1%水平上下进行缩尾处理 ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 18,265
精华内容 7,306
关键字:

两样本平均数差异性检验

友情链接: DownloadTableModel.rar