精华内容
下载资源
问答
  • 缘起已知两组数据的样本量,均数和标准差,如何求得合并组的均数和标准差;你问的这么迫切,应该比较急吧!如何计算合并数据的效应量合并后均数 Xc= (x1*n1+x2*n2)/(n1+n2),其中x,n分别为各自组的个数和均数;合并...
    缘起

    已知两组数据的样本量,均数和标准差,如何求得合并组的均数和标准差;

    你问的这么迫切,应该比较急吧!

    b27408c0341997e55cf5f79adf7c9452.png

    如何计算合并数据的效应量

    合并后均数 Xc= (x1*n1+x2*n2)/(n1+n2),其中x,n分别为各自组的个数和均数;

    合并后的方差 Sc^2 = ((n1-1)*S1^2+(n2-1)*S2^2)/(n1+n2-2),其中S为各自的标准差,S^2为各自的方差。

    合并后的样本量n=n1+n2。

    合并后的样本量等于两个样本量之和,这个没问题吧!

    合并后均数中,(x1*n1+x2*n2)为两组数据的求和,除以总的样本量即为合并后的均数,也应该没问题!

    合并后的方差,(n1-1)*S1^2即是样本1的离均差平方和SS;

                        (n2-1)*S2^2)即是样本2的离均差平方和SS;

                        (n1+n2-2)为两组合并数据的自由度;

    而SS/自由度df=方差,再开根号,即是合并后的标准差了!

    松哥统计说

    未来最大的竞争力,其实就是学习力,我们大学时期所学的基本就是某个专业领域里面的扫盲知识,绝大多数走上工作岗位需要的知识与能力需要重新学习,因此大学更应该学会如何学习。

     有人会说,这个公式到底有啥用途呢?合并呗!比如知道某班男生的人数、均数和标准差;该班女生人数、均数和标准差。那现在就可以算出来该班全部学生的人数、均数和标准差。

    统计思维与统计理论系列[1]

    ---统计思维与理论系列---

    【1049.】meta分析软件Revman5.3卡死解决方案

    【1048.】P>0.05,本身就是没意义还是样本量不够?

    【1047.】两因素方差分析,如何判断哪个因素对结果影响较大?

    【1046.】带基线数据数值变量如何进行统计分析辨析

    【1045.】统计学习之最大困惑!!

    【1044.】松哥为啥我318样本量统计分析出来确实400样本量?

    【1043.】这两个是啥图?区别和联系

    【1042.】变量之间到底是单项转化还是双向转化

    【1041.】统计水平自我评估表

    【1040.】基线分析的3个终极目的

    【1039.】统计小白的学习路径

    【1038.】SCI论文中Logistic回归模型“门当户对”原则,松哥心得推荐给您

    【1037.】被我们忽视的生存分析区间删失数据

    【1036.】Logistic回归文章的SCI审稿人意见解读

    【1035.】统计学上的2K效应,你发现了没?

    【1034.】正态分布的3个基因密码,聆听大自然心跳的代码!

    【1033.】生存分析K-M法与COX回归结论不一致怎么办?

    【1032.】异常值的处理只有删除?

    【1031.】没有比较就没有伤害,让咱们互相伤害吧,教你4大类统计伤害方法

    【1030.】SCI审稿人让我控制2个单因素无意义的变量?

    【1029.】量表评价是信度重要还是效度重要?

    【1028.】Meta分析要解决的首要任务

    【1027.】文章材料与方法中统计方法如何描述

    【1026.】这个到底是啥统计设计?一起来看看!

    【1025.】聚类分析稳定性判别的经验总结

    【1024.】“参数检验与非参数检验”哪个更好?

    【1023.】干预前后数据统计分析方法

    【1022.】听完四个小故事,你就明白主成分分析是啥意思了!

    【1021.】方差分析P>0.05,两两比较LSD法P<0.05,这可咋整?

    【1020.】等级与等比,可得分清楚!

    【1019.】频率与概率,如胶又似漆!

    【1018.】终于发现不用学习,顿悟统计的方法

    【1017.】倾向性评分后数据,应该采用配对设计还是成组设计?

    【1016.】统计必学的4个核心思想

    【1015.】加权最小二乘回归是什么鬼?

    【1014.】平行性检验到底应该啥时候做?

    【1013】统计的4维空间(一维一层天)

    【1012】到底做相关?还是方差分析呢?

    【1011】这篇文章凭啥这样分组呢?

    【1010】常用统计分析方法选择图解

    【1009】P<0.05也别理直气壮,统计也会犯错,还分犯I类和II类错误?

    【1008】文章鉴析:这篇文章或许有10处不适!

    【1007】R×C卡方的Fisher确切概率法为什么会有卡方值

    【1006】大小优指标如何同时制作ROC曲线[经验技巧]

    【1005】统计方法与统计思想谁重要?

    【1004】别说相关太简单,且听松哥说相关

    【1003】正态分布10种鉴别方法汇总【荐藏】

    【1002】连续变量变成等级变量后,原来有意义的变量变得没意义了?

    【1001】SCI论文中的P for trend是什么鬼?为什么高分文章经常采用呢

    ------------------------------

    精鼎原创,欢迎转发,未经允许,谢绝转载

    e18826ebc7714ee60039bfc45bec503b.png

    9d3c5c0090664d0b0fb1a35413f22119.gif

    展开全文
  • T检验是用T分布理论来推论差异发生的概率,从而比较两个平均的差异是否显著。它与F检验、卡方检验并列。T检验是戈斯特为了观测酿酒质量而发明的,并于1908年在Biometrika上公布。 上期,我们详细学习了参数类假设...

    单样本T检验小贴士

    T检验,亦称student T检验(Student's T test),主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。T检验是用T分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与F检验、卡方检验并列。T检验是戈斯特为了观测酿酒质量而发明的,并于1908年在Biometrika上公布。

    上期,我们详细学习了参数类假设检验:比较均值,同时也讲解了参数类分析对数据的要求就是要服从正态性分布。本期我们接着来学习参数类假设检验中的单样本T检验。

    单样本T检验的目的,就是检验单个变量样本的总体均值与我们既定的检验值之间是否存在显著差异。例如我国成年男性平均身高为170cm,我们在某城市抽样收集了100位成年男性的身高,想分析这些100例样本的身高平均值是否达到国内成年男性平均身高的水平,或者说与国内成年男性平均身高之间的差异是否显著,这时候就需要用到单样本t检验。

    我们搜集了31例患者的相关数据,要计算出全部样本的骨头高度均值与既定检验值40mm之间是否存在显著的差异(图1)

    4cde2fea363cccf122937f7c2e3dd3a6.png

    图1

    SPSS中的操作步骤

    单样本t检验操作步骤:

    ①点击“分析”--“比较平均值”--“单样本t检验”(图2)

    c8179f9f4a44e655d47f65e48729f86b.png

    图2

    ②将“骨头高度”选入右侧“检验变量”框内(图3)

    64373cacf6ef94096c6174b5982e6bec.png

    图3

    ③在下方“检验值”内填入我们的既定比较标准,也就是检验值“40mm”(图4),点击确定

    7a460286dc9af6e73a05a6b492ca8afc.png

    图4

    ④结果分析

    f8ecf2e5ddf415d022671f55d0bab8d1.png

    图5

    由上表(图5)看出:31个样本的骨头高度均值为46.49mm,标准差为6.18mm,这些均为一般描述性结果。

    dc18d0b71ff40228647b9fc891d41b25.png

    图6

    由上表(图6)可以看出:本次的31个样本的骨头密度的均值与检验值40mm之间的t检验值为5.851,显著性水平P<0.05,那么单样本t检验的原假设H0:“即本次检验的31个样本的骨头密度的均值与40mm之间不存在显著差异”发生的概率为0%,因此我们需要拒绝原假设H0,接受备选假设H1:“31个样本的骨头密度的均值与40mm之间存在显著差异”。

    值得注意的是:这里的骨头高度数据同样需要服从正态性分布,关于如何进行检验正态性,大家可以查阅前期的相关课程。

    以上就是本期全部内容哦,我们将持续推出更多实用的生物医药统计课程,涵盖SPSS、Meta、Stata、GraphPad、SAS、R、NoteExpress、EndNote、Revman等数据统计分析软件及统计学方法!敬请关注哦!

    cb1a645ef729c3c71e57d05218f21050.png

    版权说明:本文系杏花开生物医药统计原创文章。

    【杏花开生物医药统计】相关文章:

    ·SPSS差异分析(1)比较均值和T检验

    ·Amos分类调节变量多群组分析的操作与详解

    ·最小二乘回归模型在生物医药统计中的应用(2)

    ·最小二乘回归在生物医药统计分析中的应用(1)

    ·SPSS方差分析之协方差分析(2)协方差分析操作

    ·SPSS方差分析(1)协方差分析的前置条件

    ·SPSS判别分析的操作及应用(2)逐步判别分析

    ·SPSS判别分析的操作及应用(1)一般判别分析

    ·SPSS聚类分析(K-均值聚类)软件操作结果解读

    ·SPSS聚类分析(R型聚类)的软件操作与结果解读

    · SPSS聚类分析的软件操作与结果解读

    · SPSS曲线回归分析的应用与操作详解

    · 多因素方差分析(3)Graphpad简单效应折线图

    · SPSS方差分析之多因素方差分析(2)(简单效应)

    · SPSS方差分析之多因素方差分析(1)

    · SPSS虚拟线性回归分析在问卷量表数据统计分析中的应用

    · SPSS进行中介效应检验的实战操作与分析

    · AMOS结构方程教程,SPSS调节效应分析操作与结果的详细解读

    · SPSS混合线性模型在生物医药统计中的应用与操作

    · SPSS无序Logistic回归在生物医药统计分析中的应用

    · AMOS处理生物医药问卷中的中介效应分析

    · AMOS进行问卷分析效度分析之验证因子分析

    · SPSS调节回归分析在生物医药统计分析中应用

    · SPSS重复测量方差分析在生物医药中的应用

    · SPSS进行组间差异比较及其两两比较

    · SPSS独立样本T检验与SPSS单因素方差分析

    · GraphPad Prism绘制ROC曲线具体操作步骤

    · SPSS进行连续型数据的正态分布检验

    · SPSS有序Logistic回归的具体操作

    · SPSS生存分析在生物医药统计中的应用之COX风险比例回归

    · SPSS二元Logistic回归在生物医药统计分析中的应用

    · Medcalc软件精准比较多个指标诊断准确率

    · SPSS多元线性回归的应用操作及分析

    · SPSS和GraphPad如何比较组内和组间差异

    · AMOS结构方程进行医学问卷量表分析教程

    · SPSS生存分析在生物医药统计中的应用

    · GraphPad Prism统计绘图之柱状图、箱式图

    · SPSS中对问卷数据进行探索因子分析的详细操作与结果解读

    · SPSS问卷数据统计分析之项目分析

    · Excel进行线性回归模型分析的操作

    · SPSS中常用的参数和非参数检验方法

    · ROC曲线在SPSS中的操作及应用

    · 一文读懂R语言如何实现逐步回归分析

    · R语言中如何绘制散点图和箱线图?

    · SPSS中的Variable数据变量类型介绍

    · 相关性分析在SPSS中的操作,相关系数含义

    · 一文读懂SPSS单因素方差分析及方差分析

    · 线性回归决定系数R方的计算方法及具体意义

    · 医学和生物统计全过程

    · 生物和医学统计中的假设检验

    · GraphPad Prism绘制生存曲线详细教程

    展开全文
  • 一、问题与数据随机抽取20只小鼠分配到A、B两个不同饲料组。每组 10只,喂养一定时间后,测得...要知道不同饲料对鼠肝中铁的含量有无影响,则要比较2组间的总体均数差值是否有统计学差异。若数据满足独立性、样本均...

    一、问题与数据

    随机抽取20只小鼠分配到A、B两个不同饲料组。每组 10

    只,喂养一定时间后,测得鼠肝中铁的含量(μg/g),数据如下。试问不同饲料对鼠肝中铁的含量有无影响?

    二、对数据结构的分析

    整个数据资料涉及2组,每组随机抽取10个数据,测量指标为鼠肝中铁的含量,因此属于两组设计的定量资料。

    要知道不同饲料对鼠肝中铁的含量有无影响,则要比较2组间的总体均数差值是否有统计学差异。若数据满足独立性、样本均数服从正态分布、两个总体方差齐,可选用两个样本均数比较的t检验。

    三、SPSS分析方法

    1.数据录入SPSS

    2.选择Analyze→Compare

    Means→Independent-Sample T Test

    3.选项设置

    (1)主对话框设置:将分析变量送入Test Variable(s)

    框中→将分组变量送入Grouping Variable(s) 框中

    (2)Define

    Groups设置:定义两组的编号分别为A、B→Continue→OK

    四、结果解读

    Group

    Statistics表格给出了两组鼠肝中铁含量的部分统计信息,包括组别(Group)、数量(N)、均数(Mean)、标准差(Std.

    Deviation)和样本均数的标准误(Std. Error Mean)。

    Independent Samples Test

    表格给出了统计检验的结果。

    (1)首先看对两组数据方差齐性检验的结果(Levene’s

    Test for Equality of

    Variances):F值=8.246,P(Sig.)=0.010,说明两组数据方差不齐。

    (2)此时的t检验应当使用校正后的t’检验(即Equal variances

    not assumed一列):t’值=2.109,P=0.054。(若方差齐,则使用t检验,即Equal variances

    assumed一列的结果)

    五、撰写结论

    A饲料组鼠肝中铁含量为(2.40 ±

    1.09)μg/g,B饲料组鼠肝中铁含量为(1.58 ±

    0.56)μg/g。尚不能认为两组饲料对鼠肝中铁含量影响的差异有统计学意义(t’=2.109,P=0.054)。数据分析师培训

    展开全文
  • 统计小食系列数据的正态性始终是困扰我们的一个重要问题。到底偏态的数据怎么处理?...1.数据分析误区对于两组均数比较,一般情况下存在三种误区:第一种,无论偏态、正态分布,均数比较直接用t检...

    统计小食系列

    数据的正态性始终是困扰我们的一个重要问题。到底偏态的数据怎么处理?估计10个人有9个束手无策。对于定量资料而言,几乎所有方法的选择都跟正态性有关。很多人都很崩溃:我想直接用t检验行不行啊?可惜,正态性检验就像一个绕不过去的门槛,你恨或愤怒,它都在那里,不声不响,不悲不喜。

    1.数据分析误区

    对于两组均数比较,一般情况下存在三种误区: 

    第一种,无论偏态、正态分布,均数比较直接用t检验;

    第二种,严格按照数据SPSS正态性检验结果来看,如果至少一组正态分布不要用t检验了,应该用秩和;

    第三种,一般很多教材,特别是《卫生统计学》教材带来了很大的误解。一般卫生统计学教材说,大样本 (>30)的时候,根据中心极限理论,样本均数也近似正态分布,是可以做t检验的!

    你的思路符合哪一种呢?

    首先,第一种思路肯定是不对的!

    第二种思路呢?SPSS软件一般可通过统计学检验法进行正态性检验。常见的统计学检验有Kolmogorov-Smirnov检验(KS检验)和Shapiro-Wilk检验(SW检验),当检验结果的P值小于0.05,则认为数据不满足正态性;反之,则认为数据满足正态性。

    8cd49c4fe21ce7436af1fa140bb22dcc.png

    但需要注意的是,上述检验方法存在一定局限性。因为这两种方法都毕竟敏感。比如下图:

    016ab8b748af4f5e63320ba8050d0234.png

    你觉得这个是正态分布吗?非常接近,遗憾的是,正态性检验结果显示,不能认为是正态分布(P=0.015)。为什么会这样?一般情况下,样本量增加,P值就越来越小,即便是数据非常非常接近于正态分布。那么此时,t检验就不好用了?

    第三种思路,你说人卫出版社的《卫生统计学》教材错了吗? 它讲的没有错,但是却是比较误导人的。虽说样本量大于30,样本均数分布呈现正态分布。但是,这不代表总体也是呈现正态分布呀。比如两组大样本偏态分布数据,我们用均数来比较,来进行t检验。虽然,t检验方法用的是没有错,但本身样本均数没法代表其数据的集中度。均数没有代表性,还拿出去比较?这不是笑掉牙的事情吗?t检验结果,不能反映数据的实际情况。比如说,两个医院开展外科临床比赛,代表出赛都是内科的医生们。他们的胜负能反映两家医院的水平高低么! 你还别说,我们的《卫生统计学》教材也没有好好理清这里面的道道。

    二、什么时候用t检验

    那么怎么办,简直太混乱了!

    我的建议是返璞归真,不要过分依赖正态性检验结果,要凭着肉眼观察。

    我们常建议研究者通过绘制直方图、QQ图等来判断数据的正态性在直方图中数据呈现钟型分布,中间高,两端逐渐下降左右两侧呈现对称或近似对称,或者在QQ图中的数据点和理论直线基本重合,则可认为数据满足正态性。此外,这种方法还可以发现极端值,异常值。极端值和异常值情况下,也要舍弃t检验的方法。

    所以,如果数据正态分布或者近似正态分布者,无论单组偏态甚至双组偏态,均可采用t检验,严重偏态分布则则采用秩和检验。

    相信我没有错!我是郑老师,我为自己带盐!

    “如何分析真实世界临床研究数据”系列文章

    1.“如何分析真实世界临床研究数据”系列文章开启!敬请关注。

    2.真实世界数据分析(1): 为什么是回归方法

    3.困扰多年的问题:如何筛选自变量建立多因素回归模型

    245bcb2343af1ade514a2513b85ee54f.png

    展开全文
  • 包括配对资料间、样本与均数间、两样本均数比较三种,三者的计算公式不能混淆。(处理时不用判断分布类型就可以使用t检验) t'检验 应用条件与t检验大致相同,但t′检验用于两组间方差不齐时,t′检验的计算...
  • 多变量数据的统计描述与统计推断(三)轮廓分析轮廓分析是比较两组或多组多变量均数向量的轮廓是否相等。轮廓分析是两个或多个均数向量比较的一个特例。m个变量可以是同一个处理的m次重复测量结果,也可以是m次处理的...
  • 01 T检验的概念T检验是通过比较不同数据的均值,...在应用T检验进行两样本均数比较时,要求数据满足以下3个条件:(1)独立性,各观察值之间是相互独立的,不能相互影响;(2)正态性,各个样本均来自于正态分布的...
  • 如果有超过两个以上的数据,就选择一个分割点将数据分成两个部分,小于分割点的数据放在一组,其余的放在另一组,然后分别对两组数据排序。通常分割点的数据是随机选取的。这样无论你的数据是否已被排列过,你所分割...
  • 独立样本t检验用于比较独立设计(也叫完全随机设计)的两组总体均数是否相同。一般而言此法根据分组设计而决定,但有时候也可以按某个定量变量的截断值(cut point)分成两组比较两组某个变量的均数。例如,一家...
  • Java实现快速排序

    2021-04-05 22:01:06
    快速排序的基本思想是:通过一轮比较将基数定位(一般按从小到大),并将数据一分为二,基数前面的数均比基数小,基数后面的数均比基数大,之后再对这两组数据分别继续进行比较。这就回到了刚才的问题:冒泡排序每一轮...
  • t检验其实仅仅是对两组之间的均值进行了比较,但是为啥呢,正态分布不是有俩参数嘛——均值、标准差,为啥比一个均数就能说两样本代表的总体之间是否存在差异呢?我们发现t检验的前提条件除了要求数据来自正态分布...
  • 这个时候,t检验就不再适用了,我们需要使用方差分析来处理当前的问题,方差分析是检验两个或两个以上样本均数间差别有无统计学意义的方法。方差分析对于样本数据依然有着严苛的要求,要求数据满足以下的条件:(1)...
  • 插入排序

    2018-03-19 10:58:43
    方法:将数组分为两组数据,分别为有序组和无序组,每次从待插入组中取出一个元素,与有序组的元素进行比较,并找到合适的位置,将该元素插到有序组当中。就这样,每次插入一个元素,有序组增加,待插入组减少。直到待...
  • t检验多用于两组连续性变量样本均数比较。例如,研究两地正常成年男性血液红细胞均数的差别,两个班级期末考试成绩之间的差别。配对样本是比较特殊的,配对样本是指两个样本中的观察值由于存在某种联系而一一对应...
  • 在进行数据分析时,有时候我们会遇到数据基线不平的情况,比如两样本的t检验的示例,比较Labe和Meto用药13周的降压效果,但一开始用药的时候两组舒张压的差别便有统计学意义。除了文中使用的差值比较,协方差分析是...
  • 独立样本t检验

    2020-11-21 16:11:13
    对于数值变量,首先进行正态性检验,如果各组均满足正态性,采用均数(标准差)进行统计描述,采用t检验进行组间比较;否则采用中位数(四分位数间距)进行统计描述,采用非参数检验进行组间比较。 今天,我们一...
  • 1. 数据类型卡方检验要求X、Y项为定类数据,即数字大小代表分类。如果X是定类数据,Y是定量数据,且X组别多于2组,则应该使用方差分析。如果X是定类数据,Y是定量数据,且X组别仅为两组,则应该使用T检验。2. 研究...
  • 1. 数据类型卡方检验要求X、Y项为定类数据,即数字大小代表分类。如果X是定类数据,Y是定量数据,且X组别多于2组,则应该使用方差分析。如果X是定类数据,Y是定量数据,且X组别仅为两组,则应该使用T检验。2. 研究...
  • 插入排序法

    2018-05-21 20:59:59
    插入排序原理很简单,讲一组数据分成两组,我分别将其称为有序组与待插入组。每次从待插入组中取出一个元素,与有序组的元素进行比较,并找到合适的位置,将该元素插到有序组当中。就这样,每次插入一个元素,有序组...
  • python插入排序算法

    2019-08-01 20:42:12
    插入排序原理:将一组数据分为两组,分别将其称为有序数组和待插入数组。每次从待插入数组中取出一个元素,同有序数组的元素进行比较,找到合适的位置后,将该元素插入有序数组中。每插入一个元素,有序数组增加,待...
  • 插入排序原理很简单,讲一组数据分成两组,我分别将其称为有序组与待插入组。每次从待插入组中取出一个元素,与有序组的元素进行比较,并找到合适的位置,将该元素插到有序组当中。就这样,每次插入一个元素,有序...
  • 插入排序原理很简单,讲一组数据分成两组,我分别将其称为有序组与待插入组。每次从待插入组中取出一个元素,与有序组的元素进行比较,并找到合适的位置,将该元素插到有序组当中。就这样,每次插入一个元素,有序组...
  • 插入排序算法

    2018-04-10 14:54:00
    插入排序原理很简单,讲一组数据分成两组,我分别将其称为有序组与待插入组。每次从待插入组中取出一个元素,与有序组的元素进行比较,并找到合适的位置,将该元素插到有序组当中。就这样,每次插入一个元素,有序组...
  • 插入排序原理很简单,将一组数据分成两组,我分别将其称为有序组与待插入组。每次从待插入组中取出一个元素,与有序组的元素进行比较,并找到合适的位置,将该元素插到有序组当中。就这样,每次插入一个元素,有序组...
  • 插入排序原理很简单,讲一组数据分成两组,我分别将其称为有序组与待插入组。每次从待插入组中取出一个元素,与有序组的元素进行比较,并找到合适的位置,将该元素插到有序组当中。就这样,每次插入一个元素,有序组...
  • 常见排序

    2018-03-15 21:08:05
    插入排序:将一组数据分成两组,将其称为有序组与待插入组。每次从待插入组中取出一个元素,与有序组的元素进行比较,并找到合适的位置,将该元素插到有序组当中。就这样,每次插入一个元素,有序组增加,待插入组...
  • 插入排序详解

    2021-01-07 23:30:44
    插入排序的原理很简单,讲一组数据分为两组,分别称为有序组与待插入组,每次从待插入组中取一个元素,然后与有序的元素进行比较,并找到合适的位置,然后将该元素插到有序组当中。这样的话,每次插入一个元素,有序...
  • 由各 谱的数据表(见表4.1,表4.2,表4.3)及对比图,得出如下结论:利用NNLS算法进行多指数反演时,最佳的布点方式是2的幂指数均匀布点,次之是线性均匀布点方式,而且随着布点增多,二者反演曲线与原曲线的拟...

空空如也

空空如也

1 2
收藏数 35
精华内容 14
关键字:

两组数据均数比较