精华内容
下载资源
问答
  • Sign(符号)检验配对资料的符号检验,通过分析两个样本各每对数据之差的正负符号的数目,来判断两个总体分布是否相同,而不考虑差值的实际大小。它对样本是否来自正态总体没有严格规定,它常用来检验两平均值的一致...

    764622c824a5bdc7c76d0e5802cf15b5.png

    01 原理与方法

    两个相关样本检验的方法主要有:Wilcoxon检验、Sign(符号)检验、McNemar检验和Marginal Homogeneity(边际同质性)检验等。

    Sign(符号)检验

    配对资料的符号检验,通过分析两个样本各每对数据之差的正负符号的数目,来判断两个总体分布是否相同,而不考虑差值的实际大小。它对样本是否来自正态总体没有严格规定,它常用来检验两平均值的一致性。

    通常情况下,配对数据之差是正值时为“+”,是负值时为“-”。若所得的差值为“+”、“-”号的个数大致相等,则可认为两组数据的分布没有显著差异,出现“+”或“-”的概率为0.5。若配对数据之差中“+”号和“-”号出现次数悬殊,则说明就可以在一定的显著性水平α上,推断这两组数据的中值水平或总体分布是不相同的。

    Wilcoxon符号秩检验 ( Wilcoxon signedrank test )

    它是非参数统计中符号检验法的改进, 它不仅利用了观察值和原假设中心位置的差的正负,还利用了差的值的大小的信息。虽然是 简单的非参数方法,但却体现了秩的基本思想。

    将差值按大小顺序排列且编自然序号(秩)后,若其正号的秩和(记为T+)与负号的秩和(记为T−)大致相等,则说明关联样本的两组数据没有显著差异。若正秩和(T+)与负秩和(T−)相差悬殊,并超过给定显著性水平α所确定的临界点,就推断这两组数据之间存在显著差异,即总体的分布不相同。

    其他检验

    McNemar检验用于两个相关二分变量的检验;

    Marginal Homogeneity(边际同质性)检验用于两个相关定序变量的检验,是McNemar检验的扩展。

    02 SPSS实际操作

    例题:采集10名正常成年男性志愿者的血清,分别用放射免疫法和酶联免疫法测量甲胎蛋白的含量ug/L)。结果如下:

    放射免疫法:16,15,9,18,21,11,23,16,4,14

    酶联免疫法:17,13,6,20,17,14,10,16,8,47

    两种方法测量结果有无差异?

    Step 1:打开文件,点击【分析】——【非参数检验】——【相关样本】。

    5b7ee135fc5e32e1f0c0ed84e33420dc.png

    Step 2:在【目标】选项卡中选择【定制分析】。

    d65cdf4c0bddf673feb8e82f991ca89c.png

    Step 3:在【字段】选项卡选择【使用自定义字段分配】,并将下方检验字段选择到右方。

    26f0518d6bc57d078518e2a0853f69e3.png

    Step 4:在【设置】选项卡中,选择【定制检验】,勾选【威尔科克森匹配对符号秩检验(2个样本)】,点击【运行】。

    c2c8ce819d8adbbb4f3e783de883833b.png

    Step 5:结果分析。原来的零假设是“用放射免疫法和酶联免疫法测量这10名正常成年男性志愿者的血清甲胎蛋白的含量无明显差异”,这样事情的概率是0.905,大于显著性水平0.05,不是小概率事件,因此,不拒绝原假设,用放射免疫法和酶联免疫法测量这10名正常成年男性志愿者的血清甲胎蛋白的含量无显著性差异,没有统计学意义。

    86b2adf5ead1760ee460b4bbf355695c.png

    上述配对资料的Wilcoxon符号秩检验操作起来是不是很简单呢?注意多多练习哦~

    在 SPSS学堂 中回复20180223,可获得本次案例,多练习哦~

    展开全文
  • 但测试是成本的,样本量小时不能判断差异是否是由抽样误差引起,样本量太大时如果效果不好则会造成难以挽回的损失。如何科学地选择样本量呢?需要了解A/B测试的统计学原理。如果你不想了解统计学原理或者统计学...

    为了对比不同策略的效果,如新策略点击率的提升是否显著,常需要进行A/B测试。但测试是有成本的,样本量小时不能判断出差异是否是由抽样误差引起,样本量太大时如果效果不好则会造成难以挽回的损失。如何科学地选择样本量呢?需要了解A/B测试的统计学原理。

    如果你不想了解统计学原理或者统计学原理对你来说就是无字天书,请直接跳至文末福利部分,用在线计算器计算样本量就可以。不过建议您了解一下原理部分,其实并没有那么晦涩难懂。

    一、 A/B测试的统计学原理

    (一)大数定律和中心极限定理

    A/B 测试样本量的选取基于大数定律和中心极限定理。通俗地讲:

    1. 大数定律:当试验条件不变时,随机试验重复多次以后,随机事件的频率近似等于随机事件的概率。

    2. 中心极限定理:对独立同分布且有相同期望和方差的n个随机变量,当样本量很大时,随机变量

    v2-f8667d83f0d46c7bd6de7db9eda1cb8b_b.jpg

    近似服从标准正态分布N(0,1)。

    根据大数定律和中心极限定理,当样本量较大(大于30)时,可以通过Z检验来检验测试组和对照组两个样本均值差异的显著性。

    注:样本量小于30时,可进行t检验。

    (二)假设检验

    在进行假设检验时,我们有两个假设:原假设H0(两个样本没有显著性差异)和备择假设H1(两个样本有显著性差异)。相应地,我们可能会犯两类错误:

    v2-d1ec216356b818d2d06eb5c8024d334f_b.jpg

    第I类错误:H0为真,H1为假时,拒绝H0,犯第I类错误(即错误地拒绝H0)的概率记为alpha。

    第II类错误:H0为假,H1为真时,接受H0,犯第II类错误(即错误地接受H0)的概率记为beta。

    1. 犯第I类错误的概率alpha与置信水平1-alpha

    通常,将犯第I类错误的概览alpha称为显著性,把没有1-alpha称为置信水平,即有1-alpha的概率正确接受了H0。

    一般,alpha取值为0.05或更小的数值,即容忍犯第I类错误的概率最大为alpha。

    2. 犯第II类错误的概率beta与统计功效power=1-beta

    通常,将犯第II类错误的概率称为beta;将1-beta称为统计功效,即正确拒绝H0的概率。

    一般,beta取10%~20%,则统计功效的取值为80%~90%。

    v2-9850a29fd805a968e220361dece5180d_b.jpg

    犯第一类错误的概览alpha与犯第二类错误的概览beta之间的关系如下图:

    v2-36842d793f183e66941123d07e5aea82_b.jpg

    3. 统计显著性p-value

    当p-value<alpha时,即原假设成立的概率小于预设的显著性水平,可拒绝原假设。p-value只说明两个样本有没有显著性差异,并不说明差异的大小。

    根据统计学原理计算样本量,需要根据显著性水平查正态分布表,工作中用到的比较少,这里省略。

    工作中可用python中的已有的包和函数计算。

    二、样本量计算的python实现

    Python统计包statsmodels.stats.power中,有一个NormalIndPower工具,可以用其中的solve_power函数实现。

    Solve_power函数中的参数如下:

    (1)参数effect_size : 两个样本均值之差/标准差

    (2)nobs1:样本1的样本量,样本2的样本量=样本1的样本量*ratio

    (3)alpha:显著性水平,一般取0.05

    (4)power:统计功效,一般去0.8

    (5)ratio: 样本2的样本量/样本1的样本量,一般取1

    (6)alternative:字符串str类型,默认为‘two-sided’,也可以为单边检验:’larger’ 或’small’

    例:目前的点击率CTR是0.3,我们要想提升10%,将点击率提升到0.33,测试组和对照组的样本量相同。

    计算如下:

    v2-48cdea1fe4af1074aae87404a4759716_b.jpg

    输出结果为:

    3662.8015711721328

    文末福利

    A/B测试样本量在线计算器“

    https://abtestguide.com/abtestsize/

    如:想要提升的现有基准——转化率(conversion rate,可以为点击率、订阅率等)为10%;想要在此基础上提高10%(minimum detectable effect),即提高到11%;统计显著性为5%,统计功效选80%,则计算出结果为14751,即对照组和测试组需要的样本量均为14751。

    v2-1b5f746b23a03df3fdab98f68806e403_b.jpg

    检测效果变化值越小,需要的样本量越大;检测效果变化值越大,需要的样本量越小。因为,变化效果越小,越有可能是抽样误差引起的;为了避免抽样误差的影响,需要增大样本量。

    v2-ecaa822acc61f016717fedf2f627c220_b.jpg
    展开全文
  • 但测试是成本的,样本量小时不能判断差异是否是由抽样误差引起,样本量太大时如果效果不好则会造成难以挽回的损失。如何科学地选择样本量呢?需要了解A/B测试的统计学原理。如果你不想了解统计学原理或者统计学...

    为了对比不同策略的效果,如新策略点击率的提升是否显著,常需要进行A/B测试。但测试是有成本的,样本量小时不能判断出差异是否是由抽样误差引起,样本量太大时如果效果不好则会造成难以挽回的损失。如何科学地选择样本量呢?需要了解A/B测试的统计学原理。

    如果你不想了解统计学原理或者统计学原理对你来说就是无字天书,请直接跳至文末福利部分,用在线计算器计算样本量就可以。不过建议您了解一下原理部分,其实并没有那么晦涩难懂。

    一、 A/B测试的统计学原理

    (一)大数定律和中心极限定理

    A/B 测试样本量的选取基于大数定律和中心极限定理。通俗地讲:

    1. 大数定律:当试验条件不变时,随机试验重复多次以后,随机事件的频率近似等于随机事件的概率。

    2. 中心极限定理:对独立同分布且有相同期望和方差的n个随机变量,当样本量很大时,随机变量

    近似服从标准正态分布N(0,1)。

    根据大数定律和中心极限定理,当样本量较大(大于30)时,可以通过Z检验来检验测试组和对照组两个样本均值差异的显著性。

    注:样本量小于30时,可进行t检验。

    (二)假设检验

    在进行假设检验时,我们有两个假设:原假设H0(两个样本没有显著性差异)和备择假设H1(两个样本有显著性差异)。相应地,我们可能会犯两类错误:

    第I类错误:H0为真,H1为假时,拒绝H0,犯第I类错误(即错误地拒绝H0)的概率记为alpha。

    第II类错误:H0为假,H1为真时,接受H0,犯第II类错误(即错误地接受H0)的概率记为beta。

    1. 犯第I类错误的概率alpha与置信水平1-alpha

    通常,将犯第I类错误的概览alpha称为显著性,把没有1-alpha称为置信水平,即有1-alpha的概率正确接受了H0。

    一般,alpha取值为0.05或更小的数值,即容忍犯第I类错误的概率最大为alpha。

    2. 犯第II类错误的概率beta与统计功效power=1-beta

    通常,将犯第II类错误的概率称为beta;将1-beta称为统计功效,即正确拒绝H0的概率。

    一般,beta取10%~20%,则统计功效的取值为80%~90%。

    犯第一类错误的概览alpha与犯第二类错误的概览beta之间的关系如下图:

    3. 统计显著性p-value

    当p-value

    根据统计学原理计算样本量,需要根据显著性水平查正态分布表,工作中用到的比较少,这里省略。

    工作中可用python中的已有的包和函数计算。

    二、样本量计算的python实现

    Python统计包statsmodels.stats.power中,有一个NormalIndPower工具,可以用其中的solve_power函数实现。

    Solve_power函数中的参数如下:

    (1)参数effect_size : 两个样本均值之差/标准差

    (2)nobs1:样本1的样本量,样本2的样本量=样本1的样本量*ratio

    (3)alpha:显著性水平,一般取0.05

    (4)power:统计功效,一般去0.8

    (5)ratio: 样本2的样本量/样本1的样本量,一般取1

    (6)alternative:字符串str类型,默认为‘two-sided’,也可以为单边检验:’larger’ 或’small’

    例:目前的点击率CTR是0.3,我们要想提升10%,将点击率提升到0.33,测试组和对照组的样本量相同。

    计算如下:

    输出结果为:

    3662.8015711721328

    文末福利

    A/B测试样本量在线计算器“

    如:想要提升的现有基准——转化率(conversion rate,可以为点击率、订阅率等)为10%;想要在此基础上提高10%(minimum detectable effect),即提高到11%;统计显著性为5%,统计功效选80%,则计算出结果为14751,即对照组和测试组需要的样本量均为14751。

    检测效果变化值越小,需要的样本量越大;检测效果变化值越大,需要的样本量越小。因为,变化效果越小,越有可能是抽样误差引起的;为了避免抽样误差的影响,需要增大样本量。

    展开全文
  • •配对样本t检验的过程,是对两个同质的样本分别接受两种不同的处理或一个样本先后接受不同的处理,来判断不同的处理是否有差别。 •这种检验的目的在于根据样本数据对样本来自的配对总体的均值是否有显著差异进行...
    •特点:在配对样本T检验中,强调被试一定要同质(同一样本,不同变量环境),其目的就为了消除目的是额外变量的影响,更能反映自变量和因变量之间的关系。
    •配对样本t检验的过程,是对两个同质的样本分别接受两种不同的处理或一个样本先后接受不同的处理,来判断不同的处理是否有差别。
    •这种检验的目的在于根据样本数据对样本来自的配对总体的均值是否有显著差异进行判断的。
    •在数据分析时经常会遇到这样的问题:
    •某种教学方法是否对教学有效,也就是确实能提高学生成绩;
    •某种训练是否对接受训练的人的某一身体机能有改善作用;
    •或者某一种药物对某种病的治疗是否有效果等等。
    •针对以上问题,我们通常就会采取配对样本T检验的方法进行分析。
    •问题:某体育教学组织最新研究出了一种训练下肢爆发力的方法,如何才能知道该训练方法是否能提高学生的下肢爆发力??
    •检验统计量为:


    第一步:假定两次测验成绩之间没有显著差异,即该训练方法对下肢爆发力没有效果,所以原假设为:

    第二步:导入数据,分析-比较均值-配对样本T检验;

     

      

    第三步:查看分析结果;

     •由表可以看出,P<0.05,即训练前成绩与训练后成绩存在显著性差异。由此可见,这种训练方法确实能提高学生的下肢爆发力。

     

    展开全文
  • SPSS的使用方法单样本T检验研究者拟分析样本均值与总体均值的不同,即判断录入的数据均值与已知的总体均值之间是否有差异,这种情况下使用单样本T检验。分析—比较均值下—单样本T检验需在图中标记处填上检验值。...
  • 它是用 T 分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著,常被应用于小样本判断的置信度。 最常用 t 检验的情况: 单样本检验:检验一个正态分布的总体的均值是否在满足零假设的值之内,例如...
  • 一文详解假设检验、类错误和p值

    千次阅读 2020-08-20 11:00:21
    假设检验又很多不同角度的定义,比较偏统计学理论的定义说假设检验是先对总体参数提出一假设值,然后利用样本信息判断这一假设是否成立。百度百科从假设检验的原理出发,说假设检验用来判断样本样本样本与总体...
  • 统计学常用的概念

    2017-01-11 20:57:41
    F检验又叫方差齐性检验。在两样本t检验中要用到F检验。 从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,...简单的说就是 检验两个样本的 方差是否有显著性差异 这是选择何种T检验(等方差双样本检验,异
  • t检验

    千次阅读 2019-05-31 10:56:57
    t检验的目的是判断两个样本集某个属性的均值是否有显著差异 为什么需要t检验 直接比较两个样本集的均值只能给出已知差异(描述统计学), 但是无法保证两个样本集所各自代表的整体也具有同样的差异, 因为结果可能是偶然...
  • 常用统计学知识

    2017-03-30 14:00:56
    方差分析的主要功能就是验证两组样本,或者两组以上的样本均值是否有显著性差异(是否一致)。 这里有两个大点需要注意:①方差分析的原假设是:样本不存在显著性差异(即,均值完全相等);②两样本数据无交互作用...
  • 方差分析的主要功能就是验证两组样本,或者两组以上的样本均值是否有显著性差异,即均值是否一样。这里有两个大点需要注意:①方差分析的原假设是:样本不存在显著性差异(即,均值完全相等);②两样本数据无交互作用...
  • 方差分析

    千次阅读 2017-02-16 18:36:01
    方差分析的主要功能就是验证两组样本,或者两组以上的样本均值是否有显著性差异(是否一致)。 这里有两个大点需要注意:①方差分析的原假设是:样本不存在显著性差异(即,均值完全相等);②两样本数据无交互作用...
  • 方差分析的主要功能就是验证两组样本,或者两组以上的样本均值是否有显著性差异,即均值是否一样。 这里有两个大点需要注意:①方差分析的原假设是:样本不存在显著性差异(即,均值完全相等);②两样本数据无交互...
  • 单因素方差分析是两个样本平均数比较的引伸,它是用来检验多个平均数之间的差异,从而确定一种因素对试验结果有无显著性影响的统计方法。 分析: 研究者想分析不同group间的Index得分差异,可以采用单因素方差分析...
  • python实现卡方分箱Chi-Merge

    万次阅读 多人点赞 2018-05-29 14:25:25
    卡方分箱是依赖于卡方检验的分箱方法,在统计指标上选择卡方统计量(chi-Square)进行判别,分箱的基本思想是判断相邻的两个区间是否有分布差异,基于卡方统计量的结果进行自下而上的合并,直到满足分箱的限制条件...
  • 统计4:显著性检验

    2019-09-29 05:16:17
    在统计学中,显著性检验是“假设检验”中最常用的一种,显著性检验是用于检测科学实验中实验组与对照组之间是否有差异以及差异是否显著的办法。 一,假设检验 显著性检验是假设检验的一种,那什么是假设检验?假设...
  • 错分的样本可以认为是难分的样本,但是我们还想知道这样本到底是哪里的差异导致DL做出了种截然不同的判断?回答好这问题就可以进一步解释DL在分类的过程中到底学习了并依赖了图像的哪些特征。 思路是先将这...
  • t检验的价值:需要有固定又客观的标准用以判断两个群体的数值是否有差异,而不是主观題断。 独立样本t检验的前提条件 sig = 0.000拒绝原假设,所以有差别,又小于0.001,所以显著 方差分析:...
  • AB-test理解与实战

    2020-05-12 18:43:36
    显著性检验(significance test):事先对总体随机变量的参数或总体分布形式做出一假设,然后利用样本信息来判断假设(备择假设)是否合理,即判断总体的真实情况与原假设是否有显著性差异。 (注:显著性检验...

空空如也

空空如也

1 2
收藏数 25
精华内容 10
关键字:

判断两个样本是否有差异