精华内容
下载资源
问答
  • T检验

    万次阅读 多人点赞 2017-07-10 22:10:10
    什么是T检验 一个例子 思路1 思路2 p值 第一类错误与第二类错误 alpha值 另一种流程 假设形式与拒绝域的推广 t检验的分类 单总体t检验 双总体t检验 独立样本t检验 配对样本t检验 利用pythonscipystats进行t检验 单...

    什么是T检验?

    T检验是假设检验的一种,又叫student t检验(Student’s t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。
    T检验用于检验两个总体的均值差异是否显著。

    一个例子

    例1:
    “超级引擎”工厂是一家专门生产汽车引擎的工厂,根据政府发布的新排放要求,引擎排放平均值应低于20ppm,如何证明生产的引擎是否达标呢?(排放量的均值小于20ppm)

    思路1

    一个直接的想法就是,把这个工厂所有的引擎都测试一下,然后求一下排放平均值就好了。比如工厂生产了10个引擎,排放水平如下:
    15.6 16.2 22.5 20.5 16.4
    19.4 16.6 17.9 12.7 13.9
    排放平均值为
    (15.6+16.2+22.5+20.5+16.4+19.4+16.6+17.9+12.7+13.9)/10=17.17
    小于政府规定的20ppm,合格!

    这也太简单了!

    然而,随着“超级引擎”工厂规模逐渐增大,每天可以生产出10万个引擎,如果把每个引擎都测试一遍,估计要累死人了……
    有没有更好的方法?

    思路2

    由于引擎数量太多,把所有引擎测试一遍太麻烦了,“智多星”有一个好想法:
    可不可以采用“反证法”?先假设所有引擎排放量的均值为 μ ,然后随机抽取10个引擎,看看这10个引擎的排放量均值与假设是否相符,如果相符,则认为假设是正确的,反之认为假设是错误的。这样,就可以通过一小部分数据推测数据的总体,真是太棒了!

    具体怎么操作呢?

    先建立两个假设,分别为:
    H0:μ20 (原假设)
    H1:μ<20 (备择假设)
    μ 代表总体(所有引擎的排放量)均值】

    在原假设成立的基础上,求出”取得样本均值或者更极端的均值”的概率,如果概率很大,就倾向于认为原假设 H0 是正确的,如果概率很小,就倾向于认为原假设 H0 是错误的,从而接受备择假设 H1

    那么如何求这个概率p呢?
    这就需要引入一个概念——统计量
    简单的讲,统计量就类似于用样本已知的信息(如样本均值,样本标准差)构建的一个“标准得分”,这个“标准得分”可以让我们求出概率p

    由于样本服从正态分布,且样本数量较小(10),所以这里要用到的统计量为t统计量,公式如下:

    t=x¯μS/nt(n1)

    x¯:
    μ:
    S:
    n:
    t 统计量服从自由度为n1的t分布

    让我们试验一下!
    现在抽取出10台引擎供测试使用,每一台的排放水平如下:
    15.6 16.2 22.5 20.5 16.4
    19.4 16.6 17.9 12.7 13.9
    样本均值

    x¯=nk=1xkn=(15.6+16.2+22.5+20.5+16.4+19.4+16.6+17.9+12.7+13.9)10=17.17

    样本方差
    S2=nk=1(xkx¯)n1

    样本标准差
    S=S2=(15.617.17)2+(16.217.17)2++(13.917.17)2n1=2.98

    我们把原假设 μ20 拆分,先考虑 μ=20 的情况
    将数值带入t统计量公式中,可以得出 t=17.17202.98/10=3.00

    由于t统计量服从自由度为9的t分布,我们可以求出t统计量小于-3.00的概率,即下图阴影部分面积
    这里写图片描述

    p值

    通过查询t分位数表(见附录),我们可知,当自由度为9时,t统计量小于-2.821的概率为1%,而我们求得的t统计量为-3.00,所以t统计量小于-3.00的概率比1%还要小(因为-3.00在-2.81的左边,所以阴影面积更小)。
    这个概率值通常被称作“p值”,即在原假设成立的前提下,取得“像样本这样,或比样本更加极端的数据”的概率。

    到这里,我们可以总结出如下结论:
    μ=20 成立(所有引擎排放均值为20ppm)的前提下,从所有引擎中随机选出10个引擎,这10个引擎排放均值小于17.17的概率小于1%

    再考虑 μ>20 的情况:
    由t统计量的公式 t=x¯μS/n 可以看出,当 μ 增大,其他变量均保持不变时, t 统计量的值会变小,因此求概率时阴影面积也会变小,总结来看,我们得出如下结论:
    μ20成立的前提下,从所有引擎中随机选出10个引擎,这10个引擎排放均值小于17.17的概率小于1%

    由于1%的概率很小,所以我们更倾向于认为,原假设 H0:μ20 是错误的,从而接受备择假设 H1

    综上,我们认为,所有引擎的排放量均值小于20ppm,工厂生产的引擎符合标准。

    第一类错误与第二类错误

    在例1中,我们认为1%的概率很小,所以更倾向于认为原假设是错误的,从而接受了备择假设。但这样的判断是准确的吗?为了探讨这个问题,我们考虑以下四种情况:

    事实(右)/判断(下) H0 成立 H1 成立
    H0 成立判断正确第二类错误
    H1 成立第一类错误判断正确

    即:
    如果事实为 H0 成立,而我们做出了接受备择假设 H1 的判断,则犯了第一类错误——拒真
    如果事实为 H1 成立,而我们做出了接受原假设 H0 的判断,则犯了第二类错误——取伪

    所以用另外一种角度来看上面的例子:
    μ20 成立的前提下,从所有引擎中随机选出10个引擎,这10个引擎排放均值小于17.17的概率小于1%,当我们据此做出“拒绝原假设 H0 ,接受备择假设 H1 ”的结论时,有小于1%的概率犯第一类错误,因为 H0 仍有小于1%的概率是成立的,虽然这个概率很小。

    α

    所以利用t检验做出的结论并不是百分之百正确的,仍有很小的几率会犯错误。对于上面的例子,有些人会认为1%的概率已经很小了,可以拒绝原假设,还有些人会认为1%的概率虽然很小,但不足以拒绝原假设。为了解决这个问题,统计学家们提出了一个阈值,如果犯第一类错误的概率小于这个阈值,就认为可以拒绝原假设,否则认为不足以拒绝原假设。这个阈值就叫 α

    另一种流程

    现在,让我们尝试引入 α ,用另一种流程解决例1:

    1. 建立原假设和备择假设
      H0:μ20
      H1:μ<20

    2. 确定α
      α=0.05 ( α 的值通常为0.01,0.05,0.1,视具体问题而定)

    3. 确定用于决策的拒绝域
      在确定了 α 和t统计量自由度(根据样本容量可以求出,在这个例子中,自由度为[样本容量-1])的前提下,我们可以通过查询t分位数表,找出“拒绝域”,如果t统计量落入拒绝域内,就拒绝原假设,否则接收原假设。
      根据t分位数表,我们查出当自由度为9时, t1.833 的概率为0.05,因此,拒绝域为{ t |t1.833}

    4. 查看样本结果是否位于拒绝域内
      将样本均值和样本标准差带入t统计量计算公式,得出t=-3.00,落入拒绝域内

    5. 做出决策
      拒绝原假设 H0 ,接受备择假设 H1 ,认为样本均值与总体均值差异显著,认为所有的引擎排放量平均值小于20ppm

    以上就是t检验的标准化流程。

    假设形式与拒绝域的推广

    在例1中,我们的假设形式为:
    H0:μx0
    H1:μ<x0 ( x0 为某一常数)
    拒绝域的形式为{ t|tc } ( c 为某一常数),如果用数轴表示,形如:
    这里写图片描述
    假设的形式与拒绝域的形式有没有什么联系呢?
    为了进一步讨论,我们将假设的形式做如下分类:
    类别1:备择假设中包含
    1.1 H0:μ=x0 vs H1:μx0
    类别2:备择假设中包含 ><
    2.1 H0:μ=x0 vs H1:μ>x0
    2.2 H0:μ=x0 vs H1:μ<x0
    2.3 H0:μx0 vs H1:μ<x0
    2.4 H0:μx0 vs H1:μ>x0
    注意:原假设和备择假设不一定将数轴全部覆盖,在实际生活中,形如2.1和2.2的问题是存在的

    类别1称为双尾检验,由于备择假设中包含 ,拒绝域分布在两侧
    这里写图片描述
    类别2称为单尾检验
    备择假设中包含 > 的情形,拒绝域在数轴右侧
    这里写图片描述
    备择假设中包含<的情形,拒绝域在数轴左侧
    这里写图片描述

    t检验的分类

    t检验分为单总体t检验和双总体t检验

    单总体t检验

    检验一个样本平均数与一个已知的总体平均数差异是否显著。
    适用条件:
    1.总体服从正态分布
    2.样本量小于30(当样本量大于30时,用Z统计量)
    统计量:

    t=x¯μS/nt(n1)

    x¯ ——样本均值
    μ ——总体均值
    S ——样本标准差
    n——样本容量
    例1就是单样本t检验的例子。

    双总体t检验

    检验两个样本各自所代表的总体的均值差异是否显著,包括独立样本t检验和配对样本t检验

    独立样本t检验

    检验两个独立样本所代表的总体均值差异是否显著。
    适用条件:
    1.两样本均来自于正态总体
    2.两样本相互独立
    3.满足方差齐性(两总体方差相等)
    统计量:

    t=x¯y¯Sw1m+1nt(m+n2)

    其中
    Sw=1m+n+1[(m1)S21+(n1)S22]

    x¯ ——第一个样本均值
    y¯ ——第二个样本均值
    m ——第一个样本容量
    n——第二个样本容量
    S21 ——第一个样本方差
    S22 ——第二个样本方差

    配对样本t检验

    检验两个配对样本所代表的总体均值差异是否显著。
    配对样本主要包含以下两种情形:
    1.同源配对,也就是同质的对象分别接受两种不同的处理。例如:为了验证某种记忆方法对改善儿童对词汇的记忆是否有效,先随机抽取40名学生,再随机分为两组。一组使用该训练方法,一组不使用,三个月后对这两组的学生进行词汇测验,得到数据。问该训练方法是否对提高词汇记忆量有效?
    2.自身配对
    2.1某组同质对象接受两种不同的处理。例如:某公司推广了一种新的促销方式,实施前和实施后分别统计了员工的业务量,得到数据。试问这种促销方式是否有效?
    适用条件:
    每对数据的差值必须服从正态分布
    统计量:

    t=xd¯Sd/n

    两配对样本对应元素做差后形成的新样本
    xd¯ ——新样本均值
    Sd ——新样本标准差
    n ——新样本容量

    附录

    什么是t分布

    t分布的形状与正态分布很相似,都是中间高,两端低的“钟形”,当t分布的自由度为无穷大时,其形状与正态分布相同,随着自由度的减小,t分布的中间变低,两端变高,与正态分布相比更加“平坦”。

    为什么t统计量服从t分布

    单样本t检验

    x1,x2,,xn来自正态分布总体 N(μ,σ2) ,则
    均值 x¯=1nni=1xi
    方差 S2=1n1ni=1(xix¯)2
    且有:
    1. x¯ S2 相互独立
    2. x¯N(μ,σ2μ)
    3. (n1)S2σ2χ2(n1)
    所以:
    x¯μσ/nN(0,1)
    (n1)S2σ2χ2(n1)
    所以:
    x¯μσ/n/(n1)S2σ2/(n1)=x¯μS/nt(n1)

    独立样本t检验

    x1,x2,,xn 来自正态分布总体 N(μ1,σ21)
    y1,y2,,yn 来自正态分布总体 N(μ2,σ22)
    且两样本是独立的
    σ1 σ2 已知: x¯y¯N(μ1μ2,σ21m+σ22n)

    μ=(x¯y¯)(μ1μ2)σ21m+σ22nN(0,1)

    σ1 σ2 未知时:
    σ21=σ22=σ2 时, x¯y¯N(μ1μ2,(1m+1n)σ2)
    因为:
    1σ2mi=1(xix¯)2χ2(m1)
    1σ2ni=1(yiy¯)2χ2(n1)
    所以:
    1σ2mi=1(xix¯)2+1σ2ni=1(yiy¯)2χ2(m+n2)
    因卡方分布 χ2 具有可加性
    S2w=1m+n2[mi=1(xix¯)2+ni=1(yiy¯)2]
    t=(x¯y¯)(μ1μ2)Sw1m+1n

    当假设两总体均值相等,即 μ1=μ2 时:
    t=x¯y¯Sw1m+1n

    其中:
    Sw=1m+n2[(m1)S21+(n1)S22]

    配对样本t检验

    可将两配对样本对应元素做差,得到新样本,这个新样本可视作单样本,与单样本t检验统计量证明方法相同。

    p值参照表

    p值碰巧的概率对原假设统计意义
    P>0.05碰巧出现的可能性不大于5%不能否定原假设两组差别无显著意义
    P<0.05碰巧出现的可能性小于5%可以否定原假设两组差别有显著意义
    p<0.01碰巧出现的可能性小于1%可以否定原假设两组差别有非常显著意义

    t分位数表

    单侧75%80%85%90%95%97.50%99%99.50%99.75%99.90%99.95%
    双侧50%60%70%80%90%95%98%99%99.50%99.80%99.90%
    111.3761.9633.0786.31412.7131.8263.66127.3318.3636.6
    20.8161.0611.3861.8862.924.3036.9659.92514.0922.3331.6
    30.7650.9781.251.6382.3533.1824.5415.8417.45310.2112.92
    40.7410.9411.191.5332.1322.7763.7474.6045.5987.1738.61
    50.7270.921.1561.4762.0152.5713.3654.0324.7735.8936.869
    60.7180.9061.1341.441.9432.4473.1433.7074.3175.2085.959
    70.7110.8961.1191.4151.8952.3652.9983.4994.0294.7855.408
    80.7060.8891.1081.3971.862.3062.8963.3553.8334.5015.041
    90.7030.8831.11.3831.8332.2622.8213.253.694.2974.781
    100.70.8791.0931.3721.8122.2282.7643.1693.5814.1444.587
    110.6970.8761.0881.3631.7962.2012.7183.1063.4974.0254.437
    120.6950.8731.0831.3561.7822.1792.6813.0553.4283.934.318
    130.6940.871.0791.351.7712.162.653.0123.3723.8524.221
    140.6920.8681.0761.3451.7612.1452.6242.9773.3263.7874.14
    150.6910.8661.0741.3411.7532.1312.6022.9473.2863.7334.073
    160.690.8651.0711.3371.7462.122.5832.9213.2523.6864.015
    170.6890.8631.0691.3331.742.112.5672.8983.2223.6463.965
    180.6880.8621.0671.331.7342.1012.5522.8783.1973.613.922
    190.6880.8611.0661.3281.7292.0932.5392.8613.1743.5793.883
    200.6870.861.0641.3251.7252.0862.5282.8453.1533.5523.85
    210.6860.8591.0631.3231.7212.082.5182.8313.1353.5273.819
    220.6860.8581.0611.3211.7172.0742.5082.8193.1193.5053.792
    230.6850.8581.061.3191.7142.0692.52.8073.1043.4853.767
    240.6850.8571.0591.3181.7112.0642.4922.7973.0913.4673.745
    250.6840.8561.0581.3161.7082.062.4852.7873.0783.453.725
    260.6840.8561.0581.3151.7062.0562.4792.7793.0673.4353.707
    270.6840.8551.0571.3141.7032.0522.4732.7713.0573.4213.69
    280.6830.8551.0561.3131.7012.0482.4672.7633.0473.4083.674
    290.6830.8541.0551.3111.6992.0452.4622.7563.0383.3963.659
    300.6830.8541.0551.311.6972.0422.4572.753.033.3853.646
    400.6810.8511.051.3031.6842.0212.4232.7042.9713.3073.551
    500.6790.8491.0471.2991.6762.0092.4032.6782.9373.2613.496
    600.6790.8481.0451.2961.67122.392.662.9153.2323.46
    800.6780.8461.0431.2921.6641.992.3742.6392.8873.1953.416
    1000.6770.8451.0421.291.661.9842.3642.6262.8713.1743.39
    1200.6770.8451.0411.2891.6581.982.3582.6172.863.163.373
    展开全文
  • t检验

    千次阅读 2019-06-10 20:25:21
    基于R实现统计中的检验方法—T检验 p值是指在原假设为真的条件下,样本数据拒绝原假设这样一个事件发生的概率。 t检验,有三种常用场景:a.单一样本t检验、b.配对样本t检验、c.独立样本t检验 单一样本t检验:比较...

    基于R实现统计中的检验方法—T检验

    p值是指在原假设为真的条件下,样本数据拒绝原假设这样一个事件发生的概率。
    t检验,有三种常用场景:a.单一样本t检验、b.配对样本t检验、c.独立样本t检验

    单一样本t检验:比较样本的情况和总体的情况有无差异

    例如,现在有广州市的平均身高,现在我在天河区随机抽取100个人,看看天河的100个人和广州的平均身高有无差异。
    配对样本t检验:比较样本某个状况前后的对比有无差异

    例如,现在有10个糖尿病的病人,给他们都用同种控制糖尿病的药物,看看这组病人在用药前和用药后有无差异

    注:每个病人用药前后各自配对成一对,所以叫配对样本
    独立样本t检验:比较两组样本有无差异

    例如,现在有10男一组,10女一组,看看这不同性别的身高有无差异
    ① 样本满足正态分布

    统计检验方法中,有一些是基于正态分布的统计检验方法,如本文要介绍的 T 检验,有些是不需要关注其分布情况的,如 KS,秩和检验。所以 t 检验的第一个条件是样本服从正态分布。

    (当样本数少于30时,需要检验满足正态分布,若数量较多,根据中心极限定律,样本会趋向正态分布)

    ② 样本方差齐次性

    做 t 检验之前,需要进行方差齐次性的验证,因 t 检验是基于正态总体之上的,正态总体的分布服从N(μ,σ^2),即标准差和均值定了,那分布也就确定了。

    标准差确定了离散程度,均值确定了集中趋势,离散程度定了,比较集中趋势是否一致,就能比较两个总体的差异程度。

    所以,在做 t 检验之前,需要做方差齐次性检验,一般用F检验,后面有机会会讲,如果方差非齐次性,则用Welch - t检验

    1. 该使用单侧t检验还是双侧t检验?

    单侧 t 检验:

    当我们想验证某一结果是否比另一结果是否更好或者更坏,我们使用单侧 t 检验

    例如,男生的身高是不是比女生的身高更高?

    这个时候就用单侧 t 检验去做假设检验。

    双侧 t 检验:

    当我们想验证某一结果,与某一结果对比是否有区别,我们使用双侧 t 检验

    例如,男生的身高是不是和女生的身高有所区别?
    4. 检验的步骤

    统计检验的步骤一般是三板斧:a.建立假设;b.验证检验;c.接受/拒绝假设

    建立假设

    一般先看看假设结果,设定原假设 H0,备择假设 H1,H0是和你要的假设反着来,H1是你要证明的假设。

    如,要证明男生比女生是否更高?

    H0:男生身高不必女生高;H1:男生身高比女生高;

    验证检验

    一般通过统计检验会得到对应的值,并换算成p值,也就是传说中的统计p值,一般取0.05为检验水准,即标杆。

    通过建立假设,我们此时要做的事情就是验证H0发生的概率,假设H0发生的可能性p值小于5%,则表明H0很难发生。

    根据上述不同的 t 检验,得到不同的 t 值,需要根据自由度查阅 t 值对应的 p 值。

    接受/拒绝假设

    根据p值,若p值小于0.05,拒绝原假设H0,反之,接受原假设H0。

    本章就介绍到这里,后续再分享如何实现,如何看结果。

    单侧检验:
    0.05

    双侧t检验:《只要一边的面积小于0.025,就是p的一半,t小于或者大于某个值就可以了。p一般还是计算按照0.05比较)

    。。。。。。。

    z检验用于检验正态样本均值是否等于某个假设值,不过需要事先知道总体方差,得到的统计量服从正态分布,有的教材上又叫u检验。

    t检验与z检验相似,t检验不需要知道总体方差,它用样本方差替代总体方差,得到的统计量服从t分布。实践应用中,t检验比z检验常用,因为不容易知道总体的方差。

    作者:徐涛,19年应届毕业生,专注于珊瑚礁研究,喜欢用R各种清洗数据。
    本部分内容分五块:主要描述T检验、F检验、卡方检验( χ^{2} 检验),μ检验(又称Z检验),方差分析。其中T检验主要应用于小样本资料,F检验主要对于方差齐性或方差同质性进行检验,卡方检验主要应用于适合性检验、独立性检验和方差同质性检验,μ检验主要应用于大样本资料或方差已知的资料,方差分析(均数差异的显著性检验)主要应用于两个及两个以上样本均数差别的显著性检验。

    前言

    T检验,亦称student t检验(Student’s t test),主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。T检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。
    1.适用条件
    已知一个总体均数;可得到一个样本均数及该样本标准差;样本来自正态或近似正态总体。

    备注:若是单独样本T检验,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t检验的前提条件是该组资料必须服从正态分布;若是配对样本T检验,每对数据的差值必须服从正态分布;若是独立样本T检验,个体之前相互独立,两组资料均取自正态分布的总体,并满足方差齐性。之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。后面的方差分析,其独立样本T检验的前提条件是相同的,即正态性额方差齐性。(参考:t检验和方差分析的前提条件及应用误区_百度文库(链接见文末)说的非常详细)

    2.分类
    单总T检验(单独样本T检验),双总T检验(一是独立样本T检验,另一是配对样本T检验)

    备注:单独样本T检核与独立样本T检验的区别。单独样本T检验(One-Samples T Test)用于进行样本所在总体均数与已知总体均数的比较,独立样本T检验(Independent-Samples T Test)用于进行两样本均数的比较。

    ③R实例

    —————————#单样本T检验#——————————————
    #某鱼塘水的含氧量多年平均值为4.5mg/L,现在该鱼塘设10点采集水样,测定水中含氧量(单位:mg/L)分别为:
    #4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26,问该次抽样的水中含氧量与多年平均值是否有显著差异?
    Sites<-c(4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26)

    Sites<-c(4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26)
    t.test(Sites,mu=4.5)

    One Sample t-test
    

    data: Sites
    t = -0.93574, df = 9, p-value = 0.3738
    alternative hypothesis: true mean is not equal to 4.5
    95 percent confidence interval:
    4.230016 4.611984
    sample estimates:
    mean of x
    4.421

    p=0.3738>0.05,认为所抽样水体的含氧量与多年平均值无显著差异

    —————————#独立样本T检验#——————————————
    #有两种情况,一种是两个总体方差齐性,另一种是两个总体方差不齐。
    #方差齐性时直接使用独立样本T检验,当两样本方差不齐时,使用t′检验,t′检验用于两组间方差不齐时,t′检验的计算公式实际上是方差不齐时t检验的校正公式。

    #################两样本方差齐性
    #用高蛋白和低蛋白两种饲料饲养1月龄的大白鼠,饲养3个月后,测定两组大白鼠的增重量(g),两组数据分别如下所示:
    #高蛋白组:134,146,106,119,124,161,107,83,113,129,97,123
    #低蛋白组:70,118,101,85,107,132,94
    #试问两种饲料养殖的大白鼠增重量是否有显著差异?

    High<-c(134,146,106,119,124,161,107,83,113,129,97,123)
    Low<-c(70,118,101,85,107,132,94)
    Group<-c(rep(1,12),rep(0,7))#1表示High,0表示Low
    x<-c(High,Low)
    DATA<-data.frame(x,Group)
    DATA G r o u p &lt; − a s . f a c t o r ( D A T A Group&lt;-as.factor(DATA Group<as.factor(DATAGroup)

    F检验(又称为方差齐性检验)主要对于方差齐性或方差同质性进行检验。

    二、F检验

    F检验又叫方差齐性检验,在第一篇T检验中说明T检验分为单样本T检验,双总T检验(一是独立样本T检验,另一个是配对样T检验),其中独立样本T检验前需要进行方差齐性检验,F检验的功能就是进行方差齐性检验。第一篇参考链接:parkson:基于R实现统计中的检验方法—T检验

    ①适用条件

    从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t’检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等,就可以用F检验。简单说,检验两个样本的方差是否具有显著性差异(F检验),这是选择何种独立样本T经验(方差齐时选择一种T检验方法,方差不齐时选择一种T检验方法)的前提条件。

    备注:F检验是方差齐性检验,R中有不同的算法去实验F检验。即bartlett.test方差齐性检验、var.test方差齐性检验、leveneTest方差齐性检验这三种都是实现F检验的方法。(比如你打算去北京,你可以选择飞机,动车, 汽车,自行车,步行,甚至爬行等这些都可以抵达北京,虽然不交通工具不一样,但是一个目的到达北京)。

    Reference:

    [1]顾志峰,叶乃好,石耀华.实用生物统计学[M].北京:科学出版社,2012年.

    #bartlett.test方差齐性检验
    bartlett.test(x~Group)

    Bartlett test of homogeneity of variances
    

    data: x by Group
    Bartlett’s K-squared = 0.0066764, df = 1, p-value = 0.9349

    #var.test方差齐性检验
    var.test(x~Group)

    F test to compare two variances
    

    data: x by Group
    F = 0.94107, num df = 6, denom df = 11, p-value = 0.9917
    alternative hypothesis: true ratio of variances is not equal to 1
    95 percent confidence interval:
    0.2425021 5.0909424
    sample estimates:
    ratio of variances
    0.941066

    High<-c(134,146,106,119,124,161,107,83,113,129,97,123)
    Low<-c(70,118,101,85,107,132,94)
    Group<-c(rep(1,12),rep(0,7))#1表示High,0表示Low
    x<-c(High,Low)
    DATA<-data.frame(x,Group)
    DATA G r o u p &lt; − a s . f a c t o r ( D A T A Group&lt;-as.factor(DATA Group<as.factor(DATAGroup)
    #leveneTest方差齐性检验(也是SPSS的默认方差齐性检验方法)

    install.packages(“car”)

    library(car)##主要作用是引入这个包的这个检验方法
    leveneTest(DATA x , D A T A x,DATA x,DATAGroup)
    Levene’s Test for Homogeneity of Variance (center = median)
    Df F value Pr(>F)
    group 1 0.0088 0.9264
    17
    #前两者是对原始数据的方差进行检验的,leveneTest是对方差模型的残差进行组间齐性检验.一般认为是要求残差的方差齐,所以一般的统计软件都做的是leveneTest
    #结果说明两独立样本数据方差齐性,可以进行独立样本T检验。

    t.test(High,Low,paired=FALSE)

    Welch Two Sample t-test
    

    data: High and Low
    t = 1.9319, df = 13.016, p-value = 0.07543
    alternative hypothesis: true difference in means is not equal to 0
    95 percent confidence interval:
    -2.263671 40.597005
    sample estimates:
    mean of x mean of y
    120.1667 101.0000

    结果表明两种饲料养殖的大白鼠增重量无显著差异。

    #################两样本方差不齐######

    t′检验用于两组间方差不齐时,t′检验的计算公式实际上是方差不齐时t检验的校正公式。

    #有人测定了甲乙两地区某种饲料的含铁量(mg/kg),结果如下:
    #甲地:5.9,3.8,6.5,18.3,18.2,16.1,7.6
    #乙地:7.5,0.5,1.1,3.2,6.5,4.1,4.7
    #试问这种饲料含铁量在两地间是否有显著差异?

    JIA<-c(5.9,3.8,6.5,18.3,18.2,16.1,7.6)
    YI<-c(7.5,0.5,1.1,3.2,6.5,4.1,4.7)
    Content<-c(JIA,YI)
    Group<-c(rep(1,7),rep(2,7))#1表示甲地,2表示乙地
    data<-data.frame(Content,Group)
    data G r o u p &lt; − a s . f a c t o r ( G r o u p ) d a t a C o n t e n t G r o u p 15.9123.8136.51418.31518.21616.1177.6187.5290.52101.12113.22126.52134.12144.72 d a t a Group&lt;-as.factor(Group) data Content Group 1 5.9 1 2 3.8 1 3 6.5 1 4 18.3 1 5 18.2 1 6 16.1 1 7 7.6 1 8 7.5 2 9 0.5 2 10 1.1 2 11 3.2 2 12 6.5 2 13 4.1 2 14 4.7 2 data Group<as.factor(Group)dataContentGroup15.9123.8136.51418.31518.21616.1177.6187.5290.52101.12113.22126.52134.12144.72dataGroup
    [1] 1 1 1 1 1 1 1 2 2 2 2 2 2 2
    Levels: 1 2

    #bartlett.test方差齐性检验
    bartlett.test(Content~Group)

    Bartlett test of homogeneity of variances
    

    data: Content by Group
    Bartlett’s K-squared = 3.9382, df = 1, p-value = 0.0472

    #var.test方差齐性检验
    var.test(Content~Group)

    F test to compare two variances
    

    data: Content by Group
    F = 5.9773, num df = 6, denom df = 6, p-value = 0.04695
    alternative hypothesis: true ratio of variances is not equal to 1
    95 percent confidence interval:
    1.02707 34.78643
    sample estimates:
    ratio of variances
    5.9773

    #leveneTest方差齐性检验(也是SPSS的默认方差齐性检验方法)
    library(car)
    leveneTest(data C o n t e n t , d a t a Content,data Content,dataGroup)
    Levene’s Test for Homogeneity of Variance (center = median)
    Df F value Pr(>F)
    group 1 3.073 0.1051
    12

    #结果说明两独立样本数据方差不齐,对齐进行方差不齐分析
    t.test(Content,Group,paired=FALSE,var.equal=FALSE)

    Welch Two Sample t-test
    

    data: Content and Group
    t = 3.7511, df = 13.202, p-value = 0.002362
    alternative hypothesis: true difference in means is not equal to 0
    95 percent confidence interval:
    2.519419 9.337724
    sample estimates:
    mean of x mean of y
    7.428571 1.500000

    #方差齐性检验表明,方差不等,因此设定var.equal=FALSE,此时p=0.0023<0.05,
    #表明该饲料在两地的含铁量有显著差异。

    —————————#配对样本T检验#——————————————
    #某人研究冲水对草鱼产卵率的影响, 获得冲水前后草鱼产卵率(%),如下:
    #冲水前:82.5,85.2,87.6,89.9,89.4,90.1,87.8,87.0,88.5,92.4
    #冲水后:91.7,94.2,93.3,97.0,96.4,91.5,97.2,96.2,98.5,95.8
    #问:冲水前后草鱼亲鱼产卵率有无差异?

    Before<-c(82.5,85.2,87.6,89.9,89.4,90.1,87.8,87.0,88.5,92.4)
    After<-c(91.7,94.2,93.3,97.0,96.4,91.5,97.2,96.2,98.5,95.8)
    t.test(Before,After,paired=T)

    Paired t-test
    

    data: Before and After
    t = -7.8601, df = 9, p-value = 2.548e-05
    alternative hypothesis: true difference in means is not equal to 0
    95 percent confidence interval:
    -9.1949 -5.0851
    sample estimates:
    mean of the differences
    -7.14

    结果表明,p=2.548e-05<0.01,表明冲水前后,草鱼亲鱼的产卵率有非常显著差异。

    1)会有很多同学疑惑(Professionals don’t laugh),为什么独立样本T检验有方差相等/不相等之分,而配对样本T检验/单样本T检验没有?
    2)t.test(x,y,alternative=c(“two.sided”,“less”,“greater”),mu=0,paired=FALSE,
    var.equal=FALSE,conf.level=0.95…)
    如果只提供x,则作单个正态总体的均值检验,如果提供x,y则作两个总体的均值检验),alternative表示被则假设,
    two.sided(缺省),双边检验,less表示单边检验,greater表示单边检验,mu表示原假设μ0,若 paired=T,为配对检验,
    则必须指定x和y,并且它们必须是相同的长度。默认删除缺失值(如果配对为TRUE,则成对配对),var.equal是逻辑变量,
    var.equal=TRUE表示两样品方差相同,var.equal=FALSE(缺省)表示两样本方差不同,conf.level置信水平,即1-α,通常是0.95,。

    备注:t′检验用于两组间方差不齐时,t′检验的计算公式实际上是方差不齐时t检验的校正公式。

    Reference:

    [1]顾志峰,叶乃好,石耀华.实用生物统计学[M].北京:科学出版社,2012年.

    [2]t检验和方差分析的前提条件及应用误区_百度文库

    双侧T检验
    零假设H0: μ=0,对立假设Ha: μ≠0(p value可以通俗的理解为同时满足tscore和对立假设的概率,所以越小越支持原假设)

    如果t score=1.96,此时p value就是两个白色面积的和,等于0.05

    如果t score=−1.96,此时p value也是两个白色面积的和,等于0.05

    单侧T检验
    零假设H0:μ=0,对立假设Ha:μ>0

    如果t score=1.96,此时p value就是右边白色小三角的面积,等于0.025

    如果t score=−1.96,此时p value是左边白色面积加上中间蓝色面积的和,等于0.975

    类似地,

    零假设H0:μ=0,对立假设Ha:μ<0

    如果tscore=1.96,此时p value就是右边白色面积加上中间蓝色面积的和,等于0.975

    如果tscore=−1.96,此时p value是左边白色面积,等于0.025

    为何叫“T“检验,不叫”A”检验,“B”或“检验呢?

    因为:T检验的对象是符合T分布特征的数据,T分布是三大分布(卡方分布,U分布)一种。

    特征:

    以0为中心,左右对称的单峰分布。

    T分布是一簇曲线,其形态变化与n(确切地说与自由度DF)大小有关。自由度DF越小,T分布曲线越低平;自由度DF越大,T分布曲线越接近标准正态分布(u分布)曲线。

    随着自由度逐渐增大,T分布逐渐接近标准正态分布.

    2.T检验用途及公式

    T检验是用于小样本(样本容量小于30)的两个平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。
    适用条件:

    (1) 已知一个总体均数;

    (2) 可得到一个样本均数及该样本标准差;

    (3) 样本来自正态或近似正态总体。

    T检验分为单样本检验和双样本检验。

    单样本T检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。

    当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计呈T分布(如果求出的平均数是由所研究对象全部数据求出的,就叫做总体平均数;如果是由样本求出的,就叫做样本平均数,可以用样本平均数去估算总体平均数)。

    双样本T检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。

    双样本T检验又分为两种情况,一是独立样本T检验,一是配对样本T检验。

    3.T检验步骤和举例

    以单样本T检验为例说明:

    工厂要求每包精细面粉其平均重量u0=20 (单位:kg) ,某日抽查了16包,测量结果得样本均值为20.0669Kg,样本标准差S =0.1026Kg,问在显著水平a=00.5下,工厂生产的面粉重量都是20Kg?

    解:

    1. 建立假设、确定检验水准α

    H0:μ = 20 (零假设,null hypothesis

    H1:μ ≠ 20(备择假设, alternative hypothesis)

    双侧检验,检验水准:α=0.05

    1. 计算检验统计量

    2. 查相应界值表,确定P值,下结论

    查附表, t 0.05 / 2.15 = 2.131,t = 2.61,t > t 0.05 / 2.15,P < 0.05,按α=0.05水准,拒绝H0,即认为面粉重量差别已有显著变化,生产不正常。

    展开全文
  • t 检验

    千次阅读 2017-01-03 11:07:48
    t检验T检验,亦称student t检验(student’s t test),主要用于变量为连续型的组间比较,样本含量较小(例如n),总体标准差σ未知且服从正态分布.T检验是用于小样本(样本容量小于30)的两个平均值差异程度的检验...

    t检验

    T检验,亦称student t检验(student’s t test),主要用于变量为连续型的组间比较,样本含量较小(例如n<30),总体标准差σ未知且服从正态分布.

    T检验是用于小样本(样本容量小于30)的两个平均值差异程度的检验方法。

    它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。

    为了阐明方法,我们将使用MASS包中的UScrime数据集。它包含1960年美国47个州的刑罚制度对犯罪率影响的信息。我们感兴趣的结果变量为 Prob(监禁的概率)、U1(14-24岁年龄段城市男性失业率)和U2(35-39岁年龄段城市男性失业率)。类别型变量 So(指示该州是否位于南方的指示变量)将作为分组变量使用。

    1. 独立样本的t检验

    我们比较的对象是南方和非南方各州,因变量为监禁的概率。一个针对两组的独立样本t检验可以用于检验两个总体的均值相等的假设。这里假设两组数据是独立的,并且是从正态总体中抽得。
    检验的调用格式为:

    t.test(y ~ x,data)其中 y 是一个数值型变量, x 是一个二分变量

    t.test(y1,y2)其中的 y1 和 y2 为数值型向量(即各组的结果变量)。

    在下列代码中,我们使用了一个假设方差不等的双侧检验,比较了南方(group1)和非南方(group0)各州的监禁概率:

    library(MASS)
    t.test(Prob ~ So, data = UScrime)

    可以拒绝南方各州和非南方各州拥有相同监禁概率的假设(p < .001)。

    library(MASS)
    t.test(UScrime$Prob,UScrime$So)

    默认地,t.test不会假设样本具有相同的方差,因此该函数默认地调用Welch t检验方法而不是student t检验。

    如果我们要调用student t检验方法,那么我们需要设置参数var.equal=TRUE。

    library(MASS)
    t.test(Prob ~ So, data = UScrime,var.equal=TRUE)

    2. 非独立样本的t检验

    较年轻(14-24岁)男性的失业率U1是否比年长(35-39岁)男性的失业率U2更高?在这种情况下,这两组数据并不独立。你不能说亚拉巴马州的年轻男性和年长男性的失业率之间没有关系。

    非独立样本的t检验假定组间的差异呈正态分布。检验的调用格式为:t.test(y1,y2,paired=TRUE)其中的y1和y2为两个非独立组的数值向量。

    library(MASS)
    sapply(UScrime[c("U1","U2")],function(x)(c(mean=mean(x),sd=sd(x))))
    with(UScrime,t.test(U1, U2,paired=TRUE))##with就是把所有操作都限制在数据框上。比如说你手上有两组数据,asian是亚洲人的身体参数:体重身高视力等等,european是欧洲人的,那么with(asian,height)就是调去asian数据中的height.with(european,height) 就是调用european数据中的height

    差异的均值(61.5)足够大,可以保证拒绝年长和年轻男性的平均失业率相同的假设。年轻男性的失业率更高。

    3. 多于两组的情况

    如果想在多于两个的组之间进行比较,应该怎么做?如果能够假设数据是从正态总体中独立抽样而得的,那么你可以使用方差分析(ANOVA)。ANOVA是一套覆盖了许多实验设计和准实验设计的综合方法。

    展开全文
  • T 检验 matlab

    2021-04-18 00:34:57
    T 检验 matlab
  • T检验与Z检验

    千次阅读 2020-07-22 14:59:48
    五.T检验和Z检验 文章目录五.T检验和Z检验0. 检验学习先知知识离散变量与连续变量为什么要做比较分析1.假设检验2.单样本t检验3. 配对设计资料均数的t检验4. 独立样本的t检验与t'检验独立样本的方差齐性检验独立样本t...

    五.T检验和Z检验


    参考文献:

    [1].t检验原理
    [2]:什么是原假设?什么是备择假设?
    [3]:T检验还是Z检验
    [4]:统计学离散型变量和连续型变量有什么区别?
    [5]:经典比较篇之一:为什么要做比较分析?
    [6]:假设检验之z-检验,t-检验,卡方检验

    0. 检验学习先知知识

    离散变量与连续变量

    变量按其数值表现是否连续

    	连续变量是一直叠加上去的,增长量可以划分为固定的单位,即:1,2,3......例如:一个人的身高,首先长到1.51,然后才能长到1.52153......。
    	而离散变量则是通过计数方式取得的,即是对所有要统计的对象进行技术,增长量非固定的,如:一个地区的企业数目可以是今年只有一家,而第二年开了十家;一个企业的职工人数今年只有10人,第二年一次招聘了20人等。
    

    变量值的变动幅度不同

    	对离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,称单项式分组。如居民家庭按儿童数或人口数分组,均可采用单项式分组。
       离散变量如果变量值的变动幅度很大,变量值的个数很多,则把整个变量值一次划分为几个区间,各个变量值则按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组。
    	也就是说,离散变量根据情况既可以用单项式分组,也可以用组距式分组。在组距式分组中,相邻组既可以有确定的上下限,也可将相邻组的祖限重叠。
    

    扩展资料

    1. 离散变量是指其数值只能用自然数或整数单位计算的则为离散变量。例如,企业个数、职工人数、设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得。
    2. 连续变量是在一定区间内可以任意取值的变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。例如,生产零件的规格尺寸、人体测量的身高、体重、胸围等为连续变量,其数值只能用测量或计量的方法取得。
    3. 离散变量的概率分布,常用的有二项分布、泊松(Poisson)分布。其余的还有两点分布、几何分布、超几何分布等概率分布。
    

    为什么要做比较分析

    什么是比较分析

    所谓比较分析,就是运用假设检验原理,通过抽样,对总体的某些参数(常用均值或方差)的大小进行比较,得出因子的不同状态对结果是否产生显著影响。比较对象可以是连续数据,也可以是离散数据。这种比较只给出“是”与“否”的结论,不试图给出具体的差异值。
    

    为什么要做比较分析

    这是一个最常见的问题,我在最初学习的时候也有此疑问。要想比较均值,直接把两个均值拿出来比较一下大小不就行了,干嘛还要做假设、定分布、算p值呢?这不是脱那啥放那啥吗。
    
    深入学习后,渐渐理解了其中的道理。
    
    对于我们要研究的对象,其真相可能永远未知,我们只是通过抽样来管中窥豹,但谁也无法肯定研究对象就是这样或者那样的。也就是说,我们抽样所反映出来的状态可能是对的,也可能是错的,所以我们给出了置信区间,意思就是说,我们也不知道具体是多少,但我们可以给出个范围,虽然没有十足的把握,但也有九成半的把握说总体的状态落在这个范围内。
    
    以双样本t-检验(这个说法不严谨,但已经约定俗成了,以至于有些书上和统计软件中也这么说)为例,如果两个范围离得很远,就像这样,
    

    image-20200722140744470

    t检验

    	t检验是以t分布为理论基础,对一个或两个样本的数值变量资料进行假设检验常用的方法,属于参数检验。
    

    1.假设检验

    假设建设的概念与分类

    	假设检验亦称显著性检验,是利用样本信息,根据一定的概率水准,推断指标(统计量)与总体指标(参数)、不同样本指标间的差别有无意义的统计方法。
    

    参数检验与非参数检验

    	参数检验是依赖总体分布的具体形式的统计方法,简称参数法。常用的参数法有X^2检验、t检验、F检验等。使用条件是抽样总体的分布已知。
    	优点:能充分利用样本信息;检验效率较高。
    	缺点:应用条件限制较多;手工计算繁琐。
    	
       非参数检验是一类不依赖总体分布的具体形式的统计方法。如Ridit分析、秩和检验、符号检验、中位数检验、序贯试验、等级相关分析等。
    	优点:对总体的分布形式不要求
           可用于不能精确测量的资料
           易于理解和掌握、计算简便
    	缺点:不能充分利用资料所提供的信息,使检验效率降低。
    

    单因素分析与多因素分析

    	单因素分析亦称一元分析,是在主要的非处理因素相同的条件下,不管影响结果的处理因素(如病人年龄、病情、辩证分型、病理类型、药物剂型、用药途径、疗程等)有多少,每次仅分析一个处理因素与效应之间关系的统计方法。
    	多因素分析亦称多变量分析或多元分析,是研究多因素和多指标之间的关系以及具有这些因素的个体之间关系的一种统计方法。
    

    无效假设与备择假设

    	无效假设:记为H0,即样本均数所代表的总体均数μ与已知的总体均数μ0相等。样本均数与μ0的差异是由抽样误差引起,无统计学意义。
       备择假设:记为H1,即样本均数所代表的总体均数μ与μ0不相等,样本均数与μ0的差异是本质性差异,有统计学意义。
    	假设检验的基本思想:概率性质的反证法。根据所考察问题的要求提出原假设和备择假设,为了检验原假设是否正确,先假定原假设是正确的情况下,构造一个小概率事件,然后根据抽取的样本去检验这个小概率事件是否发生。
    
    	如果在一次试验中小概率事件竟然发生了,我们就怀疑原假设原假设的正确性,从而拒绝原假设如果在一次试验中小概率事件没有发生,则没有理由怀疑原假设原假设的正确性,因此接受原假设。
    

    一图解释流
    image-20200722105154035

    确立原假设与备择假设时应遵循以下两个原则:

    1. 原假设是在一次试验中有绝对优势出现的事件,而备择假设在一次试验中不易发生(或几乎不可能发生)的事件。因此,在进行单侧检验时,最好把原假设取为预想结果的反面,即把希望证明的命题放在备择假设上。
    2. 将可能犯的严重错误看作第一类错误,因为犯第一类错误的概率可以通过a的大小来控制。犯第二类错误的概率夕是无法控制的。如医生对前来问诊的病人作诊断时,可能会犯“有病看成无病”或者“无病看成有病’的错误,相比较而言,“无病看成有病“的错误更严重,故应将“问诊人有病”作为原假设。而在某项疾病普查中,将“被检查人有病’作为原假设就不恰当了。

    假设检验基本概念
    假设检验:

    • 什么是假设:对总体参数(均值,比例等)的具体数值所作的陈述。比如我认为新的配方的药效要比原来的更好
    • 什么是假设检验:先对总体的参数提出某种假设,然后利用样本的信息判断假设是否成立的过程。比如,上面的假设我是要接受还是拒绝。

    假设检验的应用:

    • 推广新的教育方案后,教学效果是否有所提高
    • 醉驾判定为刑事犯罪后是否会使得交通事故减少
    • 男生和女生在选文理科时是否存在性别因素影响

    显著性水平:

    • 一个概率值,原假设为真时,拒绝原假设的概率,表示为alpha常用取值为0.01,0.05,0.10
    • 一个公司要来招聘了,本来实际有200个人准备荤一荤,但是公司希望有5%的人是浑水摸鱼进来的,所以可能会有4个人混进来,所谓显著性水平alpha,就是你允许最多有多大比例浑水摸鱼的通过你的测试。

    假设检验的步骤:

    • 提出假设
    • 确定适当的检验统计量
    • 规定显著性水平
    • 计算检验统计量的值
    • 做出统计决策

    原假设与备选假设:

    • 待检验的假设又叫原假设,也可以叫做零假设,表示为H0.(零假设其实就是表示原假设一般都是说没有差异,没有改变)
    • 与原假设对比的假设叫做备选假设,表示为H1
    • 一般在比较的时候,主要有等于,大于,小于

    检验统计量:

    • 计算检验的统计量
    • 根据给定的显著性水平,查表得出相应的临界值
    • 将检验统计量的值与显著性水平的临界值进行比较
    • 得出拒绝或不拒绝原假设的结论

    检验中常说的小概率:

    • 在一次试验中,一个几乎不可能发生的事件发生的概率
    • 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设
    • 小概率由我们事先确定

    P值:

    • 是一个概率值
    • 如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率
    • 左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积
    • 右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积

    左侧检验与右侧检验:

    • 当关键词有不得少于/低于的时候用左侧,比如灯泡的使用寿命不得少于/低于700小时时
    • 当关键词有不得多于/高于的时候用右侧,比如次品率不得多于/高于5%时

    双侧检验:

    image-20200722144723296

    检验结果:
    image-20200722144746299

    img

    img

    img

    2.单样本t检验

    适用范围

    	单样本t检验亦称样本均数与总体均数的比较的t检验。用于从正态总体中获得含量为n的样本,算得均数和标准差,判断其总体均数μ是否与某个已知总体均数μ0相同。
    	已知总体均数一般为标准值、理论值或经大量观察得到的较稳定的指标值。
    

    适用条件

    	1. 对正态分布的数值变量资料,需用t检验。
    	2. 对于非正态分布的资料,若经过变量变换成正态分布,可按t检验处理;否侧,用非参数检验的方法。
    

    正态性检验的方法

    image-20200722110829678

    计算公式
    image-20200722110916665

    检验步骤
    image-20200722110942260

    image-20200722110954276

    3. 配对设计资料均数的t检验

    配对设计

    	配对设计是将观察单位按照某些特征(如性别、年龄、病情等可疑混杂因素)配成条件相同或相似的对子,每对中的两个观察单位随机分配到两个组,给与不同的处理,观察指标的变换。
    	1. 同一观察单位实验(或治疗)前后的比较;
    	2. 同一样品用两种方法检验结果的比较;
    	3. 配对的两个观察单位分别接受处理后的数据比较。
    

    4. 独立样本的t检验与t’检验

    一图流看懂独立样本的t检验与t’检验的关系

    image-20200722115512659

    独立样本资料

    	独立样本资料是在两个总体里分别随机抽样,或将同一总体里抽取的观察对象随机分为两组,采取不同的处理得到的资料。
    

    独立样本的t检验与t’检验

    	独立样本t检验亦称两样本t检验或成组t检验。与t'检验均适用于完全随机化设计两独立样本的比较,目的是推断两独立样本均数所代表的未知总体均数μ1与μ2是否有差别
    

    独立样本的方差齐性检验

    	两个样本均数的假设检验,除了要求样本资料来自正态分布或近似正态分布,还要求两个样本的总体方差相等,称为方差齐性。
    

    应用条件

    两个样本均来自正态分布的总体。
    

    计算公式
    image-20200722112940232

    检验步骤
    image-20200722113031896

    image-20200722113038126

    image-20200722113046318

    image-20200722113054961

    image-20200722113103799

    独立样本t检验

    应用条件

    1. 样本个体测量值相互独立,即独立性。
    2. 两个样本所代表的总体均数服从正态分布,即正态性。
    3. 总体方差相等,即方差齐性。
    

    计算公式

    image-20200722113644869

    检验步骤
    image-20200722113700125

    image-20200722113836479

    image-20200722113847163

    image-20200722113855297

    t’检验

    • 成组样本均数的比较,若方差不齐,可以采取3种方式处理:
    1. 经过数据变换使方差齐,然后进行t检验;
    2. 采用近似t检验——t’检验;
    3. 基于秩次的非参数检验方法。

    image-20200722114134486

    image-20200722114145070

    image-20200722114150919

    image-20200722114157521

    image-20200722114206006

    image-20200722114212983

    image-20200722114220963

    image-20200722114226550

    5. t检验还是z检验

    • Z分布是T分布的特殊形式, 用不太严格的统计估计,故T检验可以包括Z检验。

    个人理解:

    ​ 两者虽然有微妙的联系,但个人认同的是,当样本容量较少且少于30的时候使用t检验,当样本容量较大且大于30的时候使用z检验。

    ​ 因为t检验事实上是对样本进行抽样计算的,在拥有较大数据的基础上即样本容量足够大,我们直接使用z检验就对了。

    展开全文
  • 根据研究设计和资料的性质有单个样本t检验、配对样本t检验、两个独立样本t检验以及在方差不齐时的t'检验 单样本t检验 单样本t检验(one-sample t-test)又称单样本均数t检验,适用于样本均数$\overline{X}$与已知...
  • Matlab进行t检验

    万次阅读 多人点赞 2018-07-13 20:08:23
    T检验 可以用于比较两组数据是否来自同一分布(可以用于比较两组数据的区分度)。用法:[h,p,ci]=ttest2(x,y,alpah);其中,x,y均为行向量(维度必须相同),各表示一组数据,alpha为可选参数,表示设置一个值作为t...
  • T检验入门.docx

    2020-09-02 10:01:56
    T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n),总体标准差σ未知的正态分布资料。  T检验是用于小样本(样本容量小于30)的两个平均值差异程度的检验方法。它是用T分布理论来...
  • T检验和p-value含义及计算公式

    万次阅读 多人点赞 2018-01-30 14:50:32
    T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n正态分布资料。 T检验是用于小样本(样本容量小于30)的两个平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率,从而...
  • 如您所知,Student t 检验只能用于比较两组。 当你有 k 个组时,你不能对每对夫妇使用 t 检验,因为如果你为每个 t 检验固定了 alpha=0.05,那么当它不是时,有 k*0.05 的概率找到差异(邦费罗尼不等式)。 Holm-...
  • 滑动t检验Fortran

    2016-02-29 11:22:29
    滑动T检验,检验时间序列突变,fortran程序
  • R语言差异检验:t检验

    千次阅读 2019-11-09 00:24:28
    文章目录@[toc]单样本t检验适用条件具体计算公式R语言示例独立样本t检验适用条件具体计算公式R语言示例配对样本t检验适用条件具体计算公式R语言示例 t检验(student t检验)是应用t分布的特征,将t作为检验的统计量来...
  • 卡方检验,U检验,t检验,F检验

    千次阅读 2019-08-17 16:08:27
    卡方检验:主要用于等级资料 。 t检验:适用于计量资料、正态分布、方差...U检验:检验应用条件与t检验基本一致,只是当大样本时用U检验,而小样本时则用t检验,t 检验可以代替U检验。t检验和就是统计量为t,u的假...
  • 单样本t检验:检验单个变量的均值与目标值之间是否存在差异,如果总体均值已知,样本均值与总体均值之间差异显著性检验属于单样本t检验。 金融应用: 原假设为沪深300收益率均值为0,而p值为0.27>0.05(t值为1.1...
  • 1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所得到的统计检定值,与统计学家建立了一些随机变量...
  • t分布与t检验详解

    万次阅读 多人点赞 2019-01-25 16:39:10
    最近又遇到了t分布及t检验方面的内容,发现有些地方自己当初没有很明白,就又查了些资料,加深了一下自己的理解,这里也将自己的一些理解记录下来。 1. 理论基础——大数定理与中心极限定理  在正式介绍t分布前,...
  • 双样本T检验-P-T和T-T检验

    千次阅读 2017-04-20 21:09:00
    双样本t检验2 Sample T-TEST和成对t检验Paired Test的意思和区别成对t检验Paired Test是对来自同一总体的样本,在不同条件影响下获取的2组样本进行分析,以评价不同条件是否对其有显著影响。不同条件可以是不同存放...
  • T检验 卡方检验 检验的要求

    千次阅读 2017-07-07 21:13:34
    单样本T检验:样本所在的总体均数与已知的总体均数比较。 独立样本T检验:两样本的均数比较。如ADHD组与正常组比较。 配对样本T检验:两样本的均数比较。如分析重测信度或者同一组人术前术后比较。 卡方检验与t...
  • R语言t检验

    万次阅读 多人点赞 2017-02-27 16:09:06
    单样本t检验例1. 有原始数据的t检验已知某水样中含碳酸钙的真值为20.7mg/L,现用某法重复测定该水样12次,碳酸钙的含量分别为..问该法测定碳酸钙含量所得的均值与诊治有无显著差异?x (20.99,20.41,20.10,20.00,20....
  • SPSS使用教学 t检验

    2018-12-12 18:58:20
    进行SPSS中t检验的具体步骤及相关操作指南,有需要的人可以看看。
  • matlab滑动t检验代码

    2018-03-23 13:40:26
    在做气候变化突变检验的时候,通常会用到petti,MK检验等,滑动t检验等,现将代码奉上
  • SAS t检验

    千次阅读 2017-02-28 18:21:59
    单样本t检验 -----------------*/ /*有原始数据的t检验*/ DATA TEMP; INPUT X@@; Y=X-20.7; CARDS; 20.99 20.41 20.10 20.00 20.91 22.60 20.99 20.42 20.90 22.99 23.12 20.89 ; TITLE 'T检
  • SPSS--独立样本t检验与配对样本t检验

    万次阅读 2017-08-20 07:54:04
    用软件分析之前,得很清楚什么是T检验?用来做什么?回顾T检验理论基础: 抽样分布:t分布; 均值差异性的检验方法:Z检验和T检验综述; 简单总结:要证明两列正态分布的高测度数据(定距数据和高...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 140,750
精华内容 56,300
关键字:

T检验