精华内容
下载资源
问答
  • 标准误差
    千次阅读
    2019-05-03 15:32:26

    标准差与标准误差区别

    • 概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;
    • 用途不同;标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。
    • 它们与样本含量的关系不同:当样本含量n足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。

    转载自https://zhidao.baidu.com/question/561511345148197404.html

     

    更多相关内容
  • 在进行科学研究、数据统计分析时,经常需要计算一组数据的标准差、方差、标准误差等。今天,我们来介绍如何用excel或wps计算一组数据的标准差、方差、标准误差。一、标准差的计算标准偏差,又名标准差、均方差、...

    在进行科学研究、数据统计分析时,经常需要计算一组数据的标准差、方差、标准误差等。

    今天,我们来介绍如何用excel或wps计算一组数据的标准差、方差、标准误差。

    一、标准差的计算

    标准偏差,又名标准差、均方差、standard deviation,可以用希腊字母  σ表示。

    标准偏差反映一个数据集的离散程度,标准偏差越小,这些值偏离平均值就越少,反之亦然。

    在统计学中,我们经常通过从总体中随机抽取样品来观察,对应的就会有样本标准偏差(sample standard deviation )和总体标准偏差(population standard deviation)。

    样本标准偏差和总体标准偏差的计算公式如下:

    177af290be3f7fbeb50e521499210c55.png

    总体标准偏差:针对总体数据的偏差,所以要平均 1/N。

    样本标准偏差,也称实验标准偏差:针对从总体抽样,利用样本来计算总体偏差,为了使算出的值与总体水平更接近,就必须将算出的标准偏差的值适度放大,即1/(N-1)。

    在Excel中,要计算样本标准偏差可以使用函数STDEV.S、STDEV、STDEVA,要计算总体标准偏差可以使用函数STDEV.P、STDEVPA、STDEVP。

    如下图所示,分别演示了如何直接用STDEV.S、STDEV.P  函数以及间接用上述公式计算一组数据的样本标准偏差和总体标准偏差:

    195dbf055d0d68b275a01c2d594218a5.png

    公式如下:

    Visual Basic

    '样本标准偏差

    =STDEV.S(A2:A6)

    '样本标准偏差

    =(SUMPRODUCT((A2:A6-AVERAGE(A2:A6))^2)/(COUNT(A2:A6)-1))^(1/2)

    '总体标准偏差

    =STDEV.P(A2:A6)

    '总体标准偏差

    =(SUMPRODUCT((A2:A6-AVERAGE(A2:A6))^2)/COUNT(A2:A6))^(1/2)

    1

    2

    3

    4

    5

    6

    7

    8

    '样本标准偏差

    =STDEV.S(A2:A6)

    '样本标准偏差

    =(SUMPRODUCT((A2:A6-AVERAGE(A2:A6))^2)/(COUNT(A2:A6)-1))^(1/2)

    '总体标准偏差

    =STDEV.P(A2:A6)

    '总体标准偏差

    =(SUMPRODUCT((A2:A6-AVERAGE(A2:A6))^2)/COUNT(A2:A6))^(1/2)

    二、方差的计算

    方差,又名Variance,用希腊字母  σ2表示,它对应的是标准偏差的平方。

    在Excel中,要计算样本方差可以使用函数VAR.S,要计算总体标准偏差可以使用函数VAR.P。

    三、标准误差的计算

    标准误差一般用来判定一组测量数据的可靠性,在数学上它的公式等于样本的标准偏差除以样本的数量的平方根。

    ‘标准误差

    =STDEV.S(A2:A6)/SQRT(COUNT(A2:A6))

    展开全文
  • 标准差(Standard Deviation) 和 标准误差(Standard Error) 顺带一下,不要直接使用此公式计算SD,会产生非常多舍入误差(rounding error)。统计学书通常会提供另外一个等同的公式,能获得更加精确的值。   ...

    本文转自:https://www.cnblogs.com/jhcelue/p/7388773.html

    以下是转载内容:

    本文摘自

    Streiner DL.Maintaining standards: differences between the standard deviation and standarderror, and when to use each. Can J Psychiatry 1996; 41: 498–502.

    http://www.07net01.com/program/306401.html

    标准差(Standard Deviation)

    标准差,缩写为S.D., SD, 或者 s (就是为了把人给弄晕?),是描写叙述数据点在均值(mean)周围聚集程度的指标。

     

    假设把单个数据点称为“Xi,” 因此 “X1” 是第一个值。“X2” 是第二个值,以此类推。

    均值称为“M”。

    初看上去Σ(Xi-M)就能够作为描写叙述数据点散布情况的指标。也就是把每一个Xi与M的偏差求和。换句话讲。是(单个数据点—数据点的平均)的总和。

    看上去挺有逻辑性的。可是它有两个缺点。

     

    第一个困难是:上述定义的结果永远是0。依据定义,高出均值的和永远等于低于均值的和。因此它们相互抵消。能够取差值的绝对值来解决(也就是说,忽略负值的符号),可是由于各种神奇兮兮的原因,统计学家不喜欢绝对值。另外一个剔除负号的方法是取平方,由于不论什么数的平方肯定是正的。所以,我们就有Σ(Xi-M)2。

     

    另外一个问题是当我们添加数据点后此等式的结果会随之增大。

    比方我们手头有25个值的样本。依据前面公式计算出SD是10。假设再加25个一模一样的样本,直觉上50个大样本的数据点分布情况应该不变。可是我们的公式会产生更大的SD值。

    好在我们能够通过除以数据点数量N来弥补这个漏洞。所以等式就变成Σ(Xi-M)2/N.

    依据墨菲定律,我们攻克了两个问题,就会随之产生两个新问题。

    第一个问题(或者我们应该称为第三个问题,这样能与前面的相衔接)是用平方表达偏差。假设我们測量自闭症儿童的IQ。或许会发现IQ均值是75, 散布程度是100 个IQ点平方。这IQ点平方又是什么东西?只是这easy处理:用结果的平方根替代,这样结果就与原来的測量单位一致。

    所以上面的样例中的散布程度就是10个IQ点,变得更加easy理解。

    最后一个问题是眼下的公式是一个有偏预计,也就是说。结果总是高于或者低于真实的值。

    解释略微有点复杂。先要绕个弯。在多数情况下,我们做研究的时候。更感兴趣样本来自的整体(population)。比方,我们探查有年轻男性精神分裂症患者的家庭中的外现情绪(expressed emotion。EE)水平时,我们的兴趣点是全部满足此条件的家庭(整体)。而不单单是哪些受研究的家庭。

    我们的工作便是从样本中预计出整体的均值(mean)和SD。由于研究使用的仅仅是样本,所以这些预计会与整体的值未知程度的偏差。理想情况下。计算SD的时候我们应当知道每一个家庭的分值(score)偏离整体均值的程度。可是我们手头仅仅有样本的均值。

    依据定义,分值样本偏离样本均值的程度要小于偏离其它值,因此使用样本均值减去分值得到的结果总是比用整体均值(还不知道)减去分值要小。公式产生的结果也就偏小(当然N非常大的时候,这个偏差就能够忽略)。为了纠正这个问题,我们会用N-1除,而不是N。总之,最后我们得到了修正的标准差的(预计)公式(称为样本标准差):

    标准差(Standard Deviation) 和 标准误差(Standard Error)

    顺带一下,不要直接使用此公式计算SD,会产生非常多舍入误差(rounding error)。统计学书通常会提供另外一个等同的公式,能获得更加精确的值。

     

    如今我们完毕了全部推导工作,这意味着什么呢?

    假设数据是正态分布的。一旦知道了均值和SD,我们便知道了分值分布的全部情况。对于任一个正态分布,大概2/3(精确的是68.2%)的分值会落在均值-1 SD和均值+1 SD之间。95.4%的在均值-2 SD 和均值+2 SD之间。

    比方,大部分研究生或者职业院校的入学考试(GRE,MCAT,LSAT和其它折磨人的手段)的分数分布(正态)就设计成均值500,SD 100。这意味68%的人得分在400到600之间。略超过95%的人在300到700之间。使用正态曲线的概率表,我们就能准确指出低于或者高于某个分数的比例是多少。相反的。假设我们想让5%的人淘汰掉。假设知道当年測试的均值和SD,依靠概率表。我们就能准确划出最低分数线。

     

    总结一下,SD告诉我们分值环绕均值的分布情况。如今我们转向标准误差(standard error)。

     

    标准误差(Standard Error)

    前面我提到过大部分研究的目的是预计某个整体(population)的參数。比方均值和SD(标准方差)。一旦有了预计值,另外一个问题随之而来:这个预计的精确程度怎样?这问题看上去无解。我们实际上不知道确切的整体參数值。所以怎么能评价预计值的接近程度呢?挺符合逻辑的推理。可是曾经的统计学家们没有被吓倒。我们也不会。

    我们能够求助于概率:(问题转化成)真实整体均值处于某个范围内的概率有多大?(格言:统计意味着你不须要把话给说绝了。

    回答这个疑问的一种方法反复研究(实验)几百次,获得非常多均值预计。然后取这些均值预计的均值,同一时候也得出它的标准方差(预计)。然后用前面提到的概率表,我们可预计出一个范围,包含90%或者95%的这些均值预计。

    假设每一个样本是随机的,我们就能够安心地说真实的(整体)均值90%或者95%会落在这个范围内。

    我们给这些均值预计的标准差取一个新名字:均值的标准误差(the standard error of the mean),缩写是SEM,或者。假设不存在混淆。直接用SE代表。

    可是首先得处理一个小纰漏:反复研究(实验)几百次。

    现今做一次研究已经非常困难了,不要说几百次了(即使你能花费整个余生来做这些实验)。好在一向给力的统计学家们已经想出了基于单项研究(实验)确定SE的方法。

    让我们先从直观的角度来讲:是哪些因素影响了我们对预计精确性的推断?一个明显的因素是研究的规模。样本规模N越大。反常数据对结果的影响就越小,我们的预计就越接近整体的均值。所以,N应该出如今计算SE公式的分母中:由于N越大,SE越小。

    相似的。第二因素是:数据的波动越小,我们越相信均值预计能精确反映它们。所以,SD应该出如今计算公式的分子上:SD越大。SE越大。因此我们得出以下公式:

    标准差(Standard Deviation) 和 标准误差(Standard Error)

    (为什么不是N?

    由于实际是我们是在用N除方差SD2,我们实际不想再用平方值。所以就又採用平方根了。)

    所以,SD实际上反映的是数据点的波动情况。而SE则是均值的波动情况。

     

    置信区间(Confidence Interval) 
    前面一节。针对SE,我们提到了某个值范围。我们有95%或者99%的信心觉得真实值就处在其中。我们称这个值范围为“置信区间”,缩写是CI。让我们看看它是怎样计算的。

    看正态分布表,你会发现95%的区域处在-1.96SD 和+1.96 SD 之间。

    回想到前面的GRE和MCAT的样例。分数均值是500。SD是100,这样95%的分数处在304和696之间。

    怎样得到这两个值呢?首先,我们把SD乘上1.96,然后从均值中减去这部分,便得到下限304。假设加到均值上我们便得到上限696。CI也是这样计算的,不同的地方是我们用SE替代SD。

    所以计算95%的CI的公式是:95%CI= 均值± ( 1.96 xSE)。

    选择SD, SE和CI 
    好了。如今我们有SD, SE和CI。问题也随之而来:什么时候用?选择哪个指标呢?非常明显。当我们描写叙述研究结果时。SD是必须报告的。依据SD和样本大小,读者非常快就能获知SE和随意的CI。假设我们再加入上SE和CI,是不是有反复之嫌?回答是:“YES”和“NO”兼有。

     

    本质上,我们是想告之读者通常数据在不相同本上是存在波动的。

    某一次研究上获得的数据不会与另外一次反复研究的结果一模一样。我们想告之的是期望的差异究竟有多大:可能波动存在。可是没有大到会改动结论,或者波动足够大。下次反复研究可能会得出相反的结论。

    某种程度上来讲。这就是检验的显著程度。P level 越低。结果的偶然性就越低。下次能反复出相似结果的可能性越高。

    可是显著性检验。一般是黑白分明的:结果要么是显著的,要么不是。

    假设两个实验组的均值区别仅仅是勉强通过了P < 0.05的红线,也常常被当成一个非常稳定的结果。假设我们在图表中加上CI,读者就非常easy确定样本和样本间的数据波动会有多大。可是我们选择哪个CI呢?

    我们会在图表上加上error bar(误差条,非常难听),通常等同于1个SE。优点是不用选择SE或者CI了(它们指向的是一样的东西),也无过多的计算。不幸的这样的方法传递了非常少实用信息。一个error bar (-1 SE,+1 SE )等同于68%的CI;代表我们有68%的信心真的均值(或者2个实验组的均值的区别)会落在这个范围内。糟糕的是,我们习惯用95%,99% 而不是68%。所以让忘记加上SE吧。传递的信息量太少了,它的主要用途是计算CI。

    那么把error bar加长吧,用2个SE怎样?这好像有点意思。2是1.96的不错预计。

    有双方面的优点。首先这种方法能显示95%的CI。比68%更有意义。其次能让我们用眼睛检验区别的显著性(至少在2个实验组的情况下是如此)。假设以下bar的顶部和上面bar的底部没有重叠。两个实验组的差异必然是显著的(5%的显著水平)。

    因此我们会说。这2个组间存在显著区别。假设我们做t-test,结果会验证这个发现。

    这样的方法对超过2个组的情况就不那么精确了。由于须要多次比較(比方。组1和组2。组2和组3,组1和组3),可是至少能给出区别的粗略指示。在表格中展示CI的时候,你应该给出确切的数值(乘以1.96而不是2)。

    总结 
    SD反映的是数据点环绕均值的分布状况,是数据报告中必须有的指标。SE则反映了均值波动的情况。是研究反复多次后,期望得到的差异程度。SE自身不传递非常多实用的信息。主要功能是计算95%和99%的CI。

    CI是显著性检验的补充,反映的是真实的均值或者均值区别的范围。

    一些期刊已把显著性检验抛弃了,CI取而代之。这可能走过头了。

    由于这两种方法各有优点。也均会被误用。

    比方,一项小样本研究可能发现控制组和实验组间的区别显著(0.05的显著水平)。假设在结果展示加上CI。读者会非常easy看到CI十分宽。说明对区别的预计是非常粗糙的。

    与之相反,大量鼓吹的被二手烟影响的人数,实际上不是一个均值预计。

    最好的预计是0,它有非常宽的CI。报道的却仅仅是CI的上限。

     

    总之,SD、显著性检验,95%或者99% 的CI,均应该加在报告中,有利于读者理解研究结果。它们均有信息量。能相互补充,而不是替代。

    相反,“裸”的SE的并不能告诉我们什么信息,多占领了一些篇幅和空间而已。

    http://bbs.pinggu.org/thread-1189387-1-1.html 
    最后总结:标准差还是标准误。注意看其英文原意,就能够把握个八九不离十了。本质上二者是同一个东西(都是标准差),但前者反映的是一种偏离程度,后者反映的是一种“差错”,即用样本统计量去预计整体參数的时候,对其“差错”大小(也即预计精度)的衡量。

    展开全文
  • 标准差(Standard Deviation) 和 标准误差(Standard Error)

    万次阅读 多人点赞 2019-02-19 11:14:08
    我们给这些均值估计的标准差取一个新名字:均值的标准误差(the standard error of the mean),缩写是SEM,或者,如果不存在混淆,直接用SE代表。 但是首先得处理一个小纰漏:重复研究(实验)几百次。现今做一次...

    转载自:https://blog.csdn.net/tanzuozhev/article/details/50830928

    本文摘自

    Streiner DL.Maintaining standards: differences between the standard deviation and standarderror, and when to use each. Can J Psychiatry 1996; 41: 498–502.

    http://www.07net01.com/program/306401.html

    标准差(Standard Deviation)

    标准差,缩写为S.D., SD, 或者 s (就是为了把人给弄晕?),是描述数据点在均值(mean)周围聚集程度的指标。

    如果把单个数据点称为“Xi,” 因此 “X1” 是第一个值,“X2” 是第二个值,以此类推。均值称为“M”。初看上去Σ(Xi-M)就可以作为描述数据点散布情况的指标,也就是把每个Xi与M的偏差求和。换句话讲,是(单个数据点—数据点的平均)的总和。

    看上去挺有逻辑性的,但是它有两个缺点。

    第一个困难是:上述定义的结果永远是0。根据定义,高出均值的和永远等于低于均值的和,因此它们相互抵消。可以取差值的绝对值来解决(也就是说,忽略负值的符号),但是由于各种神秘兮兮的原因,统计学家不喜欢绝对值。另外一个剔除负号的方法是取平方,因为任何数的平方肯定是正的。所以,我们就有Σ(Xi-M)2。

    另外一个问题是当我们增加数据点后此等式的结果会随之增大。比如我们手头有25个值的样本,根据前面公式计算出SD是10。如果再加25个一模一样的样本,直觉上50个大样本的数据点分布情况应该不变。但是我们的公式会产生更大的SD值。好在我们可以通过除以数据点数量N来弥补这个漏洞。所以等式就变成Σ(Xi-M)2/N.

    根据墨菲定律,我们解决了两个问题,就会随之产生两个新问题。

    第一个问题(或者我们应该称为第三个问题,这样能与前面的相衔接)是用平方表达偏差。假设我们测量自闭症儿童的IQ。也许会发现IQ均值是75, 散布程度是100 个IQ点平方。这IQ点平方又是什么东西?不过这容易处理:用结果的平方根替代,这样结果就与原来的测量单位一致。所以上面的例子中的散布程度就是10个IQ点,变得更加容易理解。

    最后一个问题是目前的公式是一个有偏估计,也就是说,结果总是高于或者低于真实的值。解释稍微有点复杂,先要绕个弯。在多数情况下,我们做研究的时候,更感兴趣样本来自的总体(population)。比如,我们探查有年轻男性精神分裂症患者的家庭中的外现情绪(expressed emotion,EE)水平时,我们的兴趣点是所有满足此条件的家庭(总体),而不单单是哪些受研究的家庭。我们的工作便是从样本中估计出总体的均值(mean)和SD。因为研究使用的只是样本,所以这些估计会与总体的值未知程度的偏差。理想情况下,计算SD的时候我们应当知道每个家庭的分值(score)偏离总体均值的程度,但是我们手头只有样本的均值。

    根据定义,分值样本偏离样本均值的程度要小于偏离其他值,因此使用样本均值减去分值得到的结果总是比用总体均值(还不知道)减去分值要小,公式产生的结果也就偏小(当然N很大的时候,这个偏差就可以忽略)。为了纠正这个问题,我们会用N-1除,而不是N。总之,最后我们得到了修正的标准差的(估计)公式(称为样本标准差):

    标准差(Standard Deviation) 和 标准误差(Standard Error)

    顺带一下,不要直接使用此公式计算SD,会产生很多舍入误差(rounding error)。统计学书一般会提供另外一个等同的公式,能获得更加精确的值。

    现在我们完成了所有推导工作,这意味着什么呢?

    假设数据是正态分布的,一旦知道了均值和SD,我们便知道了分值分布的所有情况。对于任一个正态分布,大概2/3(精确的是68.2%)的分值会落在均值-1 SD和均值+1 SD之间,95.4%的在均值-2 SD 和均值+2 SD之间。比如,大部分研究生或者职业院校的入学考试(GRE,MCAT,LSAT和其他折磨人的手段)的分数分布(正态)就设计成均值500,SD 100。这意味68%的人得分在400到600之间,略超过95%的人在300到700之间。使用正态曲线的概率表,我们就能准确指出低于或者高于某个分数的比例是多少。相反的,如果我们想让5%的人淘汰掉,如果知道当年测试的均值和SD,依靠概率表,我们就能准确划出最低分数线。

    总结一下,SD告诉我们分值围绕均值的分布情况。现在我们转向标准误差(standard error)。

    标准误差(Standard Error)

    前面我提到过大部分研究的目的是估计某个总体(population)的参数,比如均值和SD(标准方差)。一旦有了估计值,另外一个问题随之而来:这个估计的精确程度如何?这问题看上去无解。我们实际上不知道确切的总体参数值,所以怎么能评价估计值的接近程度呢?挺符合逻辑的推理。但是以前的统计学家们没有被吓倒,我们也不会。我们可以求助于概率:(问题转化成)真实总体均值处于某个范围内的概率有多大?(格言:统计意味着你不需要把话给说绝了。)

    回答这个疑问的一种方法重复研究(实验)几百次,获得很多均值估计。然后取这些均值估计的均值,同时也得出它的标准方差(估计)。然后用前面提到的概率表,我们可估计出一个范围,包括90%或者95%的这些均值估计。如果每个样本是随机的,我们就可以安心地说真实的(总体)均值90%或者95%会落在这个范围内。我们给这些均值估计的标准差取一个新名字:均值的标准误差(the standard error of the mean),缩写是SEM,或者,如果不存在混淆,直接用SE代表。

    但是首先得处理一个小纰漏:重复研究(实验)几百次。现今做一次研究已经很困难了,不要说几百次了(即使你能花费整个余生来做这些实验)。好在一向给力的统计学家们已经想出了基于单项研究(实验)确定SE的方法。让我们先从直观的角度来讲:是哪些因素影响了我们对估计精确性的判断?一个明显的因素是研究的规模。样本规模N越大,反常数据对结果的影响就越小,我们的估计就越接近总体的均值。所以,N应该出现在计算SE公式的分母中:因为N越大,SE越小。类似的,第二因素是:数据的波动越小,我们越相信均值估计能精确反映它们。所以,SD应该出现在计算公式的分子上:SD越大,SE越大。因此我们得出以下公式:

    标准差(Standard Deviation) 和 标准误差(Standard Error)

    (为什么不是N? 因为实际是我们是在用N除方差SD2,我们实际不想再用平方值,所以就又采用平方根了。)

    所以,SD实际上反映的是数据点的波动情况,而SE则是均值的波动情况。

    置信区间(Confidence Interval) 
    前面一节,针对SE,我们提到了某个值范围。我们有95%或者99%的信心认为真实值就处在当中。我们称这个值范围为“置信区间”,缩写是CI。让我们看看它是如何计算的。看正态分布表,你会发现95%的区域处在-1.96SD 和+1.96 SD 之间。回顾到前面的GRE和MCAT的例子,分数均值是500,SD是100,这样95%的分数处在304和696之间。如何得到这两个值呢?首先,我们把SD乘上1.96,然后从均值中减去这部分,便得到下限304。如果加到均值上我们便得到上限696。CI也是这样计算的,不同的地方是我们用SE替代SD。所以计算95%的CI的公式是:95%CI= 均值± ( 1.96 xSE)。

    选择SD, SE和CI 
    好了,现在我们有SD, SE和CI。问题也随之而来:什么时候用?选择哪个指标呢?很明显,当我们描述研究结果时,SD是必须报告的。根据SD和样本大小,读者很快就能获知SE和任意的CI。如果我们再添加上SE和CI,是不是有重复之嫌?回答是:“YES”和“NO”兼有。

    本质上,我们是想告之读者通常数据在不同样本上是存在波动的。某一次研究上获得的数据不会与另外一次重复研究的结果一模一样。我们想告之的是期望的差异到底有多大:可能波动存在,但是没有大到会修改结论,或者波动足够大,下次重复研究可能会得出相反的结论。

    某种程度上来讲,这就是检验的显著程度,P level 越低,结果的偶然性就越低,下次能重复出类似结果的可能性越高。但是显著性检验,通常是黑白分明的:结果要么是显著的,要么不是。如果两个实验组的均值差别只是勉强通过了P < 0.05的红线,也经常被当成一个很稳定的结果。如果我们在图表中加上CI,读者就很容易确定样本和样本间的数据波动会有多大,但是我们选择哪个CI呢?

    我们会在图表上加上error bar(误差条,很难听),通常等同于1个SE。好处是不用选择SE或者CI了(它们指向的是一样的东西),也无过多的计算。不幸的这种方法传递了很少有用信息。一个error bar (-1 SE,+1 SE )等同于68%的CI;代表我们有68%的信心真的均值(或者2个实验组的均值的差别)会落在这个范围内。糟糕的是,我们习惯用95%,99% 而不是68%。所以让忘记加上SE吧,传递的信息量太少了,它的主要用途是计算CI。

    那么把error bar加长吧,用2个SE如何?这好像有点意思,2是1.96的不错估计。有两方面的好处。首先这个方法能显示95%的CI,比68%更有意义。其次能让我们用眼睛检验差别的显著性(至少在2个实验组的情况下是如此)。如果下面bar的顶部和上面bar的底部没有重叠,两个实验组的差异必定是显著的(5%的显著水平)。因此我们会说,这2个组间存在显著差别。如果我们做t-test,结果会验证这个发现。这种方法对超过2个组的情况就不那么精确了。因为需要多次比较(比如,组1和组2,组2和组3,组1和组3),但是至少能给出差别的粗略指示。在表格中展示CI的时候,你应该给出确切的数值(乘以1.96而不是2)。

    总结 
    SD反映的是数据点围绕均值的分布状况,是数据报告中必须有的指标。SE则反映了均值波动的情况,是研究重复多次后,期望得到的差异程度。SE自身不传递很多有用的信息,主要功能是计算95%和99%的CI。 CI是显著性检验的补充,反映的是真实的均值或者均值差别的范围。

    一些期刊已把显著性检验抛弃了,CI取而代之。这可能走过头了。因为这两种方法各有优点,也均会被误用。比如,一项小样本研究可能发现控制组和实验组间的差别显著(0.05的显著水平)。如果在结果展示加上CI,读者会很容易看到CI十分宽,说明对差别的估计是很粗糙的。与之相反,大量鼓吹的被二手烟影响的人数,实际上不是一个均值估计。最好的估计是0,它有很宽的CI,报道的却只是CI的上限。

    总之,SD、显著性检验,95%或者99% 的CI,均应该加在报告中,有利于读者理解研究结果。它们均有信息量,能相互补充,而不是替代。相反,“裸”的SE的并不能告诉我们什么信息,多占据了一些篇幅和空间而已。

    http://bbs.pinggu.org/thread-1189387-1-1.html 
    最后总结:标准差还是标准误,注意看其英文原意,就可以把握个八九不离十了。本质上二者是同一个东西(都是标准差),但前者反映的是一种偏离程度,后者反映的是一种“差错”,即用样本统计量去估计总体参数的时候,对其“差错”大小(也即估计精度)的衡量。

    展开全文
  • 如何计算均值、标准差标准误差

    万次阅读 2019-12-12 11:51:32
    这通常都免不了要计算均值、标准差标准误差。本文将向你展示如何计算。 方法1 数据 1 获得一组你想要分析的数据。这些信息也称为样本。 例如,一个由5个学生组成的班级接受了一次测试,测试结果...
  • 用R语言快速求数据各组别的均值,频数,标准差标准误差。 使用R语言中的'plyr'包的ddply()函数,和常见的summarise()函数。 导入'plyr'包和你的数据。 library(plyr) library(readxl) NP <- read_excel("C:...
  • 随着样本数(或测量次数)n的增大,标准差趋向某个稳定值,即样本标准差s越接近总体标准差σ,而标准误差则随着样本数(或测量次数)n的增大逐渐减小,即样本平均数越接近总体平均数μ;故在实验中也经常采用适当增加...
  • 1、标准差是对一次抽样的原始数据进行计算的,而标准误则是对多次抽样的样本统计量进行计算的(这个统计量可以是均值); 2、标准差只是一个描述性指标,只是描述原始数据的波动情况,而标准误是跟统计推断有关的...
  • 标准差 3.标准差 4. 抽 样 方 差 \color{lime}4.抽样方差 4.抽样方差 5. 标 准 误 差 \color{lime}5.标准误差 5.标准误差 6. 均 方 差 \color{lime}6.均方差 6.均方差 7. 均 方 误 差 \color{lime}7.均方误差 7.均方...
  • 之前已经推送了关于标准差(SD)、平均值的标准误差(SEM)的介绍文章,今天将重点介绍一下标准差(SD)和平均值的标准误差(SEM)之间的区别、什么场景下需要绘制SD或SEM图形? 开始之前,我们先复习一下之前的...
  • 标准差标准误差、平均值

    万次阅读 2018-12-24 22:34:15
    SS用于表示离均差的平方和 对于总体,方差为:SS/N ...标准误差:sqrt(SS/n/(n-1)),也就是说,对于样本,excel需要用STDEV.S计算无偏估计作为方差,或者直接用SPSS描述,标准误差再次基础上需要除以:sqrt(n)...
  • 标准差标准误差计算以及置信 统计学中该计算有详细推理,需要对于统计有深刻理解。 标准差(Standard Deviation) 标准差,缩写为S.D., SD, 或者 s (就是为了把人给弄晕?),是描写叙述数据点在均值(mean)周围...
  • 1、均方误差:MSE(Mean Squared Error) 其中,为测试集上真实值-预测值。 def rms(y_test, y): return sp.mean((y_test - y) ** 2) 2、均方根误差:RMSE(Root Mean Squard Error) 可以看出,RMSE=sqrt...
  • ",即约 68% 数值分布在距离平均值有 1 个标准差之内的范围,约 95% 数值分布在距离平均值有 2 个标准差之内的范围,以及约 99.7% 数值分布在距离平均值有 3 个标准差之内的范围。如下图: SE SE是什么呢,一般来说...
  • - 标准差SD,有**样本**标准差和**总体**标准差,二者不同,可以通过公式换算,总的来说标准差SD是反映个体间的变异程度的指标,是反映个体距离平均数的离散程度的指标; - 标准误差SE是一种关于可靠性的估计指标;
  • 标准差 对于前面例子的数据 [1,2,5,8,9],求出来的方差是10,但是这个方差值是否说明这一组数据非常离散呢?由于方差的单位和原始数据的单位不一样,如果原始数据的单位是m,那么方差的单位就是m^2,这样比较没多大...
  • 点击打开:标准差(Standard Deviation)和标准误差(Standard Error)
  • end %sample的标准差和标准误 SD_sample = std(sample) SE_sample = SD_sample/sqrt(1000) %sample平均值的标准差 SD_sample_mean = std(sample_mean) 结论 1、标准差(SD)更能反应离散程度。 paper里需要Mean±SD...
  • % 必要的输入: % x轴% 输入% 标准误差:每个 x 轴点的误差向量, % 线条颜色:例如 [1 0 0] % 线宽:例如 [1] % 填充颜色:例如 [.5 .5 .5] % 边缘颜色:例如 [.5 .5 .5]
  • 标准差标准误差的区别

    千次阅读 2015-06-20 13:06:53
    对于标准差与标准误的区别,很多书上这样表达:标准差表示数据的离散程度,标准误表示抽样误差的大小。这样的解释可能对于许多人来说等于没有解释。 其实这两者的区别可以采用数据分布表达方式描述如下:如果样本...
  • boxplot3 绘制均值(红色)、标准误差(蓝色、 分位数0.25和0.75)和标准偏差(黑色) 语法:boxplot3(X,Y) 例子: X=1:2; 是{1}=1:100; Y {2} = 101:200; boxplot3(X,Y)
  • 标准差标准误差

    2019-03-08 09:34:42
    转载 https://blog.csdn.net/haipengdai/article/details/53715463
  • 统计学中的标准差(SD)和 平均值的标准误差(SEM)的区别 先来看一个解释: The standard deviation (SD) represents variation in the values of a variable, whereas the standard error of the mean (SEM) ...
  • Java代码标准差计算

    2017-03-26 22:43:50
    该代码是计算标准差使用,代码也是我在网上找的,然后发现计算一组数的标准差并不正确,改动了一点。
  • 一文《关于excel计算标准差SD和标准误SE的方法》是最先害的文章,而后有百度百科,有人认为标准差即是标准误。在百度百科就有这种说法。= Standard error of the mean= standard deviation“【计算方法】Exce...
  • 方差(Variance) 概率论 离散型随机变量的数学期望:,其中,是变量发生的概率。 连续型随机变量的数学期望:,其中,f(x)是概率密度。...,其中,为总体的均值,为总体的标准差,为总体的样本数。 样本方...
  • 对于从事数据工作的人来说,经常需要用到方差、标准差、均方差等概念,但即使是一个数学专业的毕业生(比如我自己),经常也会被这几个概念弄得头晕脑胀,使用的时候也是清楚的少,碰运气的多。 这里,我通俗易懂的...
  • 单纯介绍概念不易理解,所以应从实际应用出发介绍其区别。 四者的研究对象和研究目的不同。...定义:标准差是观测值与其平均数偏差的平方和的平方根,即方差的算术平方根。 公式: 公式意义:所有数减去其...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 665,361
精华内容 266,144
关键字:

标准误差

友情链接: skhasp (3).zip