精华内容
下载资源
问答
  • 对于任意参数θ在可能的取值范围内,P{θ12}≥1-α,则称随机区间(θ1,θ2)是参数θ的置信水平为1-α的置信区间,θ1θ2分别称为置信水平为1-α的双侧置信区间的置信下限置信上限,1-α称为置信水平。...

    置信区间

    估计参数真值所在的范围通常以区间的形式给出,同时还给出此区间包含参数真值的可信程度,这种形式的估计称为区间估计,这样的区间称为置信区间。

    对于任意参数θ在可能的取值范围内,P{θ1<θ<θ2}≥1-α,则称随机区间(θ1,θ2)是参数θ的置信水平为1-α的置信区间,θ1和θ2分别称为置信水平为1-α的双侧置信区间的置信下限和置信上限,1-α称为置信水平。

    对于特殊问题,我们关心的是重点在于参数θ的上限或下限,比如对于设备的使用寿命,关心平均寿命的“下限”;对于药品中杂质含量,关心平均含量的“上限”。对于任意参数θ在可能的取值范围内,P{θ<θ2}≥1-α或P{θ>θ1}≥1-α,则称随机区间(-∞,θ2)或(θ1,∞)是参数θ的置信水平为1-α的单侧置信区间,θ1和θ2分别称为置信水平为1-α的单侧置信下限和单侧置信上限。

     

    显著性检验

    统计推断(statistical inference),是根据带随机性的观测数据(样本)以及问题的条件和假定(模型),而对未知事物,作出的以概率形式表述的推断。主要包括参数估计和假设检验。

    参数估计包括点估计和区间估计。点估计包括矩估计法和最大似然估计法。

    假设检验:在总体的分布函数完全未知或只知其形式、但不知其参数的情况,为了推断总体的某些未知特性,提出某些关于总体的假设。再根据样本,对所提出的假设作出是接受,还是拒绝的决策。假设检验是作出这一决策的过程。

    对两者有无显著性差异的判断是在显著性水平α之下作出的。显著性水平α为满足原假设时,发生不可能事件的概率的上限。如果样本发生的概率小于显著性水平α,证明小概率事件(不可能事件)发生了,样本与假设的差异是显著的,故拒绝原假设;否则,接受原假设。显著性水平α即为拒绝原假设的标准。P值和sig值表示在原假设的条件下,样本发生的概率,也是拒绝原假设的依据。

    由于检验法则是根据样本作出的,总有可能作出错误的决策。在原假设为真时,可能犯拒绝原假设的错误,称这类“弃真”的错误为第一类错误;在原假设为不真时,有可能接受原假设,称这类“取伪”的错误为第二类错误。

    一般来说,我们总是控制第一类错误的概率,使它不大于显著性水平α。α的大小视具体情况而定,通常取0.1,0.05,0.01,0.005 等值。只对第一类错误的概率加以控制,而不考虑第二类错误的概率的检验,称为显著性检验。区分双边假设检验和单边假设检验。

    无论是显著性相关,还是显著性差异,显著性表示的意义为出现该情况的概率大于1-α。

    Z检验:单个总体,方差已知,关于均值的检验。

    T检验:单个总体,方差未知,关于均值的检验;两个总体,方差相同,关于均值差的检验;两个总体,方差未知,配对出现,关于均值差的检验(配对t检验:配对求差值,构成单个总体)。

    卡方检验:单个总体,均值未知,关于方差的检验。

    F检验:两个总体,均值未知,关于方差的检验。

     

    T检验、F检验和统计学意义(P值或sig值)

    1.    T检验和F检验的由来

    一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。

    通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的机率很高,并不罕见;那我们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。

    F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。统计显著性(sig)就是出现目前样本这结果的机率。

    2.    统计学意义(P值或sig值)

    结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,0.05的p值通常被认为是可接受错误的边界水平。

    通常,原假设为无差别,若P值小于边界水平(比如0.05),小概率事件发生了,推翻原假设,认为差别是显著的。


    所有的检验统计都是正态分布的吗 

    并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如t检验、f检验或卡方检验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。这种条件下有两种方法:一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提下的检验。后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的作用。即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。

     

    
    展开全文
  • 置信区间-显著性-P-值

    2019-10-02 14:43:51
    我们用中括号[a,b]表示样本估计总体平均值的误差范围的区间,由于ab的确切数值取决于你希望自己对于“该区间包含总体均值”这一结果具有可信程度,所以[a,b]被称为置信区间。 2.置信水平:我们选择这个置信区间...
    1.置信区间:误差范围(区间)在统计概率中就叫做置信区间;简单来说置信区间就是误差范围
        我们用中括号[a,b]表示样本估计总体平均值的误差范围的区间,由于a和b的确切数值取决于你希望自己对于“该区间包含总体均值”这一结果具有可信程度,所以[a,b]被称为置信区间。
    2.置信水平:我们选择这个置信区间,目的是为了让“a和b之间包含总体平均值”这一结果具有特定的概率,这个概率就称为置信水平。
    

    蒙特卡罗模拟

    1.蒙特卡罗模拟用于求事件的近似概率,它多次执行同一模拟,然后将结果进行平均。
    2.用查表法替代计算的这种思想用途十分广泛,性能出现问题时,经常会采用这种方法,查表法是以空间换时间这种通用思想的一个典型列子。
    3.模拟模型是描述性而非规定性的,它可以描叔出系统如何在给定的条件下运行,但不能告诉我们如何安排条件才能使系统运行的最好,模拟模型只会进行描述,不会进行优化,但这并不是说模拟不能作为优化过程的一部分,例如,寻找参数设定的最优集合时,经常使用模拟作为搜索过程的一部分。
        模拟模型可以按照三个维度进行分类:
    确定性与随机性
        确定性模拟的行为完全由模型定义,重新运行模拟不会改变结果,随机性模拟在模型中引入了随机性,多次运行同一个模型会得到不同的结果
    静态与动态
        在静态模型中,时间的作用不大,在动态模型中,时间是个基本要素
    离散与连续
        在离散模型中,相关变量的值是可数的,例如所有值都是整数,在连续模型中,相关变量的值位于一个不可数集合中,例如实数集合。
    

    补充

    PyLab中提供了一个内置函数polyfit,它可以找出最小二乘拟合的近似解。
    调用以下函数:
        pylab.polyfit (observedXVals, observedYVals, n)
    可以找出一组n阶多项式的系数,这个多项式就是定义在observedXVals和observedYVals这两个数组中的数据点的最优最小二乘拟合。
    举例来说,调用以下函数:
        pylab.polyfit(observedXVals,observedYVals, 1)
    可以找出一条由多项式y = ax + b定义的直线,这里的a是直线的斜率,b是Y轴上的截距。在本例中,函数会返回一个带有两个浮点数的数组。同样,二次方程y = ax2+ bx + c可以定义一条抛物线。因此,调用以下函数:pylab.polyfit(observedXVals, observedYVals, 2)可以返回一个带有3个浮点数的数组
    

    显著性

    1.费希尔的检验显著性的方法总结如下:
        (1)定义一个原假设和一个备择假设。原假设就是“布里斯托·洛奇博士根本品尝不出不同奶茶之间的区别”,备择假设仅当原假设是错误的时候才成立,例如,“布里斯托·洛奇博士可以品尝出奶茶之间的区别”;
        (2)理解待评价样本的统计学假设。对于“奶茶测试”,费希尔假设布里斯托·洛奇博士对每一杯奶茶都可以做出独立判断;
        (3)计算相关的检验统计量。在本例中,检验统计量就是布里斯托·洛奇博士给出正确答案的可能性;
        (4)在原假设成立的情况下,推导出检验统计量的概率。在本例中,就是仅凭运气正确找出所有奶茶的概率,也就是0.014;
        (5)确定这个概率是否足够小到可以使你放心地认为原假设是错的,即拒绝假设。这个能使你拒绝原假设的概率要事先决定好,一般为0.05或0.01
    

    P-值

    P-值的含义很容易被误解,它经常被认为是原假设为真的概率,但实际上不是。如果P-只很小,就意味着原假设为真的情况下,得到特定样本的可能性很小。
    

    条件概率

    1.构成贝叶斯推理的核心思想就是条件概率。
    2.P(A|B)表示当B为真时,A为真的概率,它经常读作“给定B时,A的概率”
        如果P(A)和P(B)是独立的,那么P(A|B) = P(A)
        一般的,如果P(B)!= 0,则:P(A|B)=P(A+B)/P(B)
        条件概率也在0到1之间
    3.公式P(A|B,C)表示当B和C同时成立时,A成立的概率,假设B和C互不相关,那么通过条件概率的定义和独立概率的乘法法则可知:
                P(A|B,C) = P(A,B,C)/P(B,C)
    这里的P(A,B,C)表示A,B和C同时为真的概率。
        同理,P(A,B|C)表示当C为真时,A和B同时为真的概率。假设A和B是互不相关的,那么:P(A,B|C) = P(A|C)*P(B|C)
    

    贝叶斯定理

    P(A|B) = P(A)*P(B|A) / P(B)
    在贝叶斯统计中,概率测量的是可信度,贝叶斯定理表明了不考虑证据的可信度和考虑了证据的可信度之间的关系。公式等号左边的部分P(A|B)是后验概率,即考虑了B之后的A的可信度。后验概率定义为先验概率P(A)与证据B对A的支持度的乘积。支持度是A成立的情况下B成立的概率与不考虑A时B成立的概率的比值,即:P(B|A)/P(B)

    转载于:https://www.cnblogs.com/monkeyT/p/9496253.html

    展开全文
  • 我将解释置信区间和置信水平,以及它们与P值和显著性水平的密切关系。 一、如何解释置信区间和置信水平置信区间是可能包含未知总体参数的值范围。如果您多次绘制随机样本,则一定百分比的置信区间将包含总体均值,这...

    文章来自微信公众号:发现Minitab

    概述

    在本篇文章中,我将继续通过关注概念和图形而不是方程式和数字来说明假设检验和置信区间是如何工作的。我将解释置信区间和置信水平,以及它们与P值和显著性水平的密切关系。

    一、如何解释置信区间和置信水平
    置信区间是可能包含未知总体参数的值范围。如果您多次绘制随机样本,则一定百分比的置信区间将包含总体均值,这个百分比是置信水平。
    最常见的是,您将使用置信区间来约束均值或标准差,但您也可以获得它们的回归系数,比例,发生率(泊松)以及种群之间的差异。

    a6a404af9042be3564c4e6b236bcd953.png


    正如对如何解释P值存在一种常见的误解一样,对于如何解释置信区间也存在一些常见的误解。在这种情况下,置信水平不是特定置信区间包含总体参数的概率。
    置信水平表示的是通过分析获得评估总体参数精确区间的理论能力。通过研究分析得到一个特定的置信区间,区间包含或者不包含均值—除了概率为0或1没有其他情况。你不能确定事实是这两种可能性的哪一个,因为你不知道总体参数的值。该参数是一个未知的常数,并且没有关于其值的概率陈述。在我们讨论下面的图表之后,这将更容易理解。
    考虑到这一点,如何解释置信区间?
    置信区间作为良好的总体参数估计方法,在这个过程中往往产生包含参数的区间。置信区间由点估计(最可能的值)和围绕这一点的误差估计组成。误差表示的是针对总体参数周围样本不确定性的估计。
    在这种背景下,您可以使用置信区间评估样本估计的精度。作为一个具体的变量,一个窄点的置信区间【90,110】 比一个宽点的置信区间【50,150】对总体参数的估计更加精确。
    二、置信区间和误差估计
    接下来,我们看一看置信区间是如何来确定误差幅度的。要做到这一点,我们将使用在解释假设检验时相同的工具。我通过概率图,t分布以及数据的变量研究抽样的分布,我们基于能源成本的数据集确定置信区间。
    当我们图形反映的重要信息:样本分布集中在假设范围内,范围以外5%的分布显示阴影。对于置信区间,我们需要对样本数据的分布进行转换,这样样本会集中在均值附近95%的阴影范围内:

    3e258ecaa64b87f368376205bb5471a4.png


    阴影区域表示样本均值范围意味着在95%的情况下可以使用我们的样本均值的点估计值作为总体的均值,这个范围【267, 394】就是我们95%的置信区间。
    使用图形更加容易理解一个特定的置信区间表示的误差大小或者数量的不确定性、在点附近的估计傎。样本均值是我们得到的关于总体均值最有可能的值。然而,图形显示来自总体的其他随机样本在阴影区域获得不同的样本均值不是不寻常的。这些其他类似样本均值表明总体存在不同的均值。因此,区间表示使用示例数据时固有的不确定性。
    您可以使用这些图形来计算特定值的概率。然而,请注意您不能在图上确定总体的均值,因为这个值是未知的。因此, 正如前面所说,你不能计算总体均值的概率!三、为什么P值和置信区间总是在统计学上呈现一致性
    您可以使用P值或置信区间来确定你的结果是否具有统计学意义。如果一个假设检验产生这两个值,它们反馈的结果将是一致的。
    置信水平相当于1 –α对应的水平。所以,如果你的显著性水平为0.05,相应的置信水平为95%。

    1. 如果P值小于你的显著性水平α,假设检验的结果是存在统计上的显著性。
    2. 如果置信区间不包含原假设的值,那么分析结果是具有统计上的显著性的。
    3. 如果P值小于α,置信区间将不包含原假设值。

    18f665b5eeaff8e969650a4f4d7eb6f1.png


    在我们的例子中,P值(0.031)小于显著性水平(0.05),这表明我们的结果具有统计上的显著性。同样,我们的95%置信区间(267 394)不包括均值为260年的原假设,我们得出了相同的结论。
    为了理解为什么结果会表现出一致性,让我们思考一下显著性水平和置信水平是如何进行检验的。

    • 显著性水平定义了样本均值必须距离原假设多远才被认为是具有统计上的显著性。
    • 置信水平定义了样本均值与置信区间的接近程度。


    显著性水平和置信水平都定义了均值与置信限的距离。你猜会是怎么的情形?在这两种情况下,这个距离是一样的!
    关键的t值*均值标准误有相等的距离。对我们的能源成本示例数据来说,这个距离是63.57美元。
    想一下这是在讨论总体均值的原假设和样本均值之间的关系。
    假设检验的典型均值原假设:嘿,哥们!我发现你具有统计上的显著性,因为你距离我超过了63.57美元!
    置信区间的典型样本均值:其实,我是显著的,因为你距离我超过了63.57美元!
    它们非常一致不是吗? 只要你正确的匹配P值和置信区间,它们总会表现出一致性。如果你不能正确的进行匹配,你会得到相互矛盾的结果。四、小结

    在统计分析中,人们往往更多注重P值来简单地排除显著性影响或不同。然而,统计上的显著性影响在现实世界中不一定是有意义的。例如,影响效果可能会太小以至于没有实用价值。
    注意估计效果的大小和精度非常重要,这就是我为什么很喜欢置信区间。它们可以让你评估这些重要特性以及统计学意义。你可以看到一个狭窄的置信区间,整个区间范围代表的是真实世界中有意义的影响。

    f5d78c71d9e599c57deaa16e73870441.png
    展开全文
  • 写在前边:本文会根据置信区间和假设检验的知识来展开项目实战。所以文章分为两大部分:基础知识篇,介绍置信区间、置信水平、假设检验;实战篇,根据假设检验的三种类型展开项目实战。你可以选择感兴趣的部分进行...

    d2a1954068e0c926ae527cb23d7a442d.png

    写在前边:

    本文会根据置信区间假设检验的知识来展开项目实战。所以文章分为两大部分:基础知识篇,介绍置信区间、置信水平、假设检验;实战篇,根据假设检验的三种类型展开项目实战。你可以选择感兴趣的部分进行阅读哟~

    目录

    【Part1】基础篇

    • 置信区间
    • 假设检验

    【Part2】实战篇

    • 单样本检验
    • 相关配对检验
    • 独立双样本检验(A/B测试)

    【Part1】基础篇

    置信区间

    我们在浅析统计概率中,提出了为什么样本可以来估计整体?是因为“中心极限定理”说“样本的平均值,约等于总体的平均值;不管总体是什么分布,任意一个总体的样本平均值都会围绕在总体的平均值周围,并且呈正态分布”。

    样本又能在多大程度上代表整体呢?翻译大白话,就是说用样本来估计总体,它的误差范围是多少?比如,我们估计了公司里同事们的平均体重是60kg,可是当你换个时间点或者换一部分样本,估计平均体重是62.5kg,那你能说我测量的平均体重是错的么?

    因为我们没有办法知道整体平均值的真实数值,所以需要给出一个误差范围来估计这个样本的准确程度。点估计和区间估计就是解释这个问题的。

    点估计是在抽样推断中不考虑抽样误差,直接以抽样指标代替全体指标的一种推断方法。因为个别样本的抽样指标不等于全体指标,所以,用抽样指标直接代替全体指标,不可避免的会有误差。区间估计是抽样推断中根据抽样指标和抽样误差去估计全体指标的可能范围的一种推断方法。在从抽样指标推断全体指标时,用一定概率保证误差不超出某一给定范围。

    简单来说。我们多次抽样,每个样本的平均值,可以视为点估计;因为我们无法判断,哪个点估计对总体平均值的估计的误差范围最小,于是就使用区间估计。比如我们说,公司员工的平均体重是60-63kg,那[60,63]这个区间就是置信区间

    那我们的置信区间包含总体员工的平均体重(总体平均值)的概率是p,我们用Y%来表示,这个概率值呢就是置信水平

    比如说,我们有100个样本,每一个样本都有一个置信区间,那么我们就有100个置信区间。置信水平95%就表示,这100个置信区间中,有95个区间是包含了这个平均值。所以,如果我们只做一次抽样,那这个样本置信区间包含平均值的概率就是95%。

    常见的置信水平,有90%,95%和99%。

    我们知道了置信区间和置信水平是什么后,接下来我们看,如何求不同样本大小的置信区间呢?

    我们按照样本大小,是否超过30,把他们分为“大样本”和“小样本”;顾名思义,“大样本”就是样本大小超过30的样本;“小样本”就是样本小于30的样本。为啥要以30为界呢?不是40、不是50呢?这是因为我们区分大、小样本,也是为了判断属于那种抽样分布类型,是正态分布还是t分布?一般而言n=30的时候,已经很接近正态分布了。所以一般认为30就是大样本。

    那也就是需要解决正态分布的置信区间和t分布的置信区间如何求~

    我们可以按照以下思路:

    ba2a2fa54ec42bbb728e484e0f206321.png

    ① 确定要求的问题是什么

    ② 求样本的平均值和标准误差

    ③ 确定置信水平:

    如果是大样本的正态分布:根据置信水平,比如说置信水平是95%,α = 0.25(也就是(1-0.95)/2得出)查找Z表格,求z值;

    如果是小样本的t分布:根据自由度和置信水平来查找t表格,求t值;我们可以看一下t表格:

    35976dddb9bba9f0be08fd4e0641695e.png

    ④ 得出置信区间

    置信区间是一个有着上限和下限的区间[a , b],那么:

    • a = 样本平均值 - z*标准误差 或者 样本平均值 - t*标准误差
    • b = 样本平均值 + z*标准误差 或者 样本平均值 + t*标准误差

    假设检验

    “当你排除了所有可能性,还剩下一个时,不管有多么的不可能,那就是真相”

    ——阿瑟·柯南·道尔 《福尔摩斯全集》

    假设检验,就是这个道理,当我们排出了一个假设,那剩下的一个就是true。

    假设检验的基本思想是“小概率事件”原理,其统计推断方法是带有某种概率性质的反证法。小概率思想是指小概率事件在一次试验中基本上不会发生。反证法思想是先提出检验假设,再用适当的统计方法,利用小概率原理,确定假设是否成立。即为了检验一个假设H0是否正确,首先假定该假设H0正确,然后根据样本对假设H0做出接受或拒绝的决策。如果样本观察值导致了“小概率事件”发生,就应拒绝假设H0,否则应接受假设H0。

    根据这个定义,我们就知道,当我们在提出问题的时候,需要定义一个“零假设”,和一个反命题作为“备选假设”;就比如我们把“A九是胖妞”作为零假设,呃,换一个吧,“A九是美妞”作为零假设,那么“A九不是美妞”就是备选假设(-_- 什么举例),不管怎样还是比较好理解是吧~

    接下来,我们需要根据我们的问题和抽样情况,来判断属于什么检验类型。这里需要介绍一下假设检验的检验类型:

    ① 单样本检验:就是单个样本的检验,检验单个样本的平均值是否等于目标值,比如公司员工的平均体重是不是等于60kg;

    ② 相关配对检验:检验相关或配对观测之差的平均值是否等于目标值;比如检验减肥药是否起作用,对每个人服药前后进行体重测量;

    ③ 独立双样本检验:检验两个独立样本的平均值之差是否等于目标值;比如常见的A/B测试,两个版本的产品对不同的用户进行测试,记录两个版本用户的使用数据,比较各个版本对于改进目标的效果;

    接下来按照我们的抽样的样本大小,就可以判断是什么抽样分布类型;如果样本大于30就是大样本的正态分布;如果小于30就是小样本的t分布;

    当然还有注意的是,根据我们的问题,判断是什么检验方向?左尾检验?右尾检验?还是双尾检验?

    以上,我们就完整的提出了问题

    • 定义零假设、备选假设
    • 什么检验类型
    • 什么抽样类型
    • 什么检验方向

    接下来,我们想知道,在假定零假设成立的前提下,得到样本平均值的概率是多少?这个概率就是p值;在求p值之前,我们需要确定用于做决策的拒绝域,也就是决定显著性水平α;最后我们需要比较p和α的大小来做决策。(常用的显著性水平α = 5%)

    我们来说一下p值是如何计算的(以t分布为例),之前也有介绍:

    s为样本标准差,表示样本偏离样本均值的程度,用来衡量数组的离散程度;标准误差是所有样本平均值

    的标准差;计算对象是所有的样本的平均值

    标准误差

    ;t = (样本平均值 - 总体平均值)/标准误差;

    下一步,就是根据p值大小和α的大小,来做决策:

    • 当p<=α时,拒绝零假设,接受备选假设;
    • 当p>α时,接受零假设。

    思路见下图:

    70fcfc3224c43e1927213386c6b43eb5.png

    做完了假设检验,我们还需要计算效应量。

    效应量是指由于因素引起的差别,是衡量处理效应大小的指标。与显著性检验不同,这些指标不受样本容量影响。它表示不同处理下的总体均值之间差异的大小,可以在不同研究之间进行比较。

    很懵,对不对?简单说,效应量是指处理效应的大小,例如药物A比药物B效果显著。在判断某个研究的结果,是否有意义或者重要时,要考虑的另一项指标就是效应量。效应量太小,意味着处理即使达到了显著水平,也缺乏实用价值。

    度量效应量有很多种,但大多数都属于两大主要类别:

    ① 差异度量:例如在对比平均值时,衡量效应大小的常见标准之一是Cohen's d

    Cohen's d = (样本平均值1-样本平均值2) / 标准差

    Cohen's d 除以的是标准差,也就是以标准差为单位,样本平均值和总体平均值之间相差多少;

    ② 相关度度量:例如R平方,表示某个变量的变化比例与另一变量的关系。可以用t检验的信息推出R平方的公式,这里的t值从t检验中获得的值,df是自由度;

    如果r² 等于20%,表示我们可以说通过知道另一个变量能够接受相关变量20%的变化情况。

    以上,就完成了我们基础部分内容。

    【Part2】实战篇

    接下来,我们根据假设检验的三种类型:单样本检验、相关匹配样本检验、独立双样本检验展开实战:

    1.单样本检验 —— 矿泉水的净含量是否达到550ml

    工商局在检验某厂商生成的矿泉水时,需要验证矿泉水的净含量是否如厂商所说的550ml?

    于是,抽取16瓶矿泉水进行检测;发现抽样后得到的实际净含量数据(饮料净含量的总体均值为550ml)为558,551,542,557,552,547,551,549,548,551,553,557,548,550,546,552;

    怎么知道,工程生产的矿泉书净产量是否达到550ml呢?

    1)描述统计分析

    我们先导入包:

    import numpy as np
    import pandas as pd
    import scipy.stats as ss
    import matplotlib.pyplot as plt
    import seaborn as sns

    根据样本数据集,建立样本数据框:

    # 样本数据集
    data_df = pd.DataFrame()
    data_df['净含量'] = [558,551,542,557,552,547,551,549,548,551,553,557,548,550,546,552]

    我们使用describe看一下描述统计信息:

    data_df.describe()

    28534fc2c485fdeac93f7a04ee7518af.png

    我们得出:样本矿泉水净含量平均值为550.75ml,标准差为4.25ml;

    2)推论统计分析

    推论统计分析报告中包括:假设检验,置信区间,效应量;

    ① 问题是什么?

    定义零假设和备选假设:

    • 零假设H0为“矿泉水的净含量未达到(<)550ml”;
    • 备选假设H1为“矿泉水的净含量达到(≥)550ml”;

    什么检验类型?

    这里只有1个样本,所以选择单样本检验;

    什么抽样分布?

    我们里利用Python可视化看一下:

    # 查看数据集分布
    sns.distplot(data_df)

    e2e3a0ee8e249a938670443ef8834a29.png

    通过观察上面数据集分布图,数据集近似正态分布,满足t分布的使用条件,所以抽样分布是t分布,自由度df = 16 - 1 = 15;

    什么检验方向?

    我们 备选假设为“矿泉水净含量≥550ml”,也就是平均值≥550;我们使用右尾检验

    综合以上分析,本次假设检验是单样本t检验,单尾检验中的右尾

    ② 确定用于做决策的拒绝域,也就是决定显著性水平α:

    显著性水平α = 5%。

    ③ 证据是什么?

    我们需要求出,在零假设成立的条件下得到样本平均值的概率p;

    因为是单样本t检验,我们使用scipy包中ttest_1samp来计算p值:

    # 总体平均值 = 550
    pop_mean = 550
    '''
    ttest_1samp:单独样本t检验
    返回的第1个值t是假设检验计算出的(t值),
    第2个值p是双尾检验的p值
    '''
    t , p_two = ss.ttest_1samp(data_df , pop_mean)
    print('t值=',t,'双尾检验的p值=',p_two)

    7bb3e95b748cfa92b76b33c8647b937e.png

    t = 0.706 >0 ; p = 0.49

    这里,我们得到的p值是双尾检验的p值,我们需要得到单尾检验的p值:

    #单尾检验的p值
    p_one=p_two/2
    
    print('单尾检验的p值=',p_one)

    ebbd5dd85a04b4d0c44b2860673a2d7e.png

    ④ 做出决策:

    • 左尾判断条件:t < 0 and p_one < 判断标准(显著水平)alpha
    • 右尾判断条件:t > 0 and p_one < 判断标准(显著水平)alpha
    #做出结论
    if(t > 0 and p_one< alpha): 
        #左尾判断条件
        print('拒绝零假设,有统计显著,矿泉水净含量符合标准')
    else: 
        print('接受零假设,没有统计显著,也就是矿泉水净含量不符合标准')

    2e811319e656a60d5f711f9ed37e1938.png

    如此看来,我们的零假设成立了。

    ⑤ 置信区间

    根据上述分析,我们查找t表格,95%的置信水平,自由度是15,t = 2.131;

    1e5c98a01fd4a36b860611093ab37b93.png

    根据t值,我们可得出置信区间:

    # 计算置信区间 
    t = 2.131
    # 计算标准误差
    se=ss.sem(data_df)
    #置信区间上限
    a=data_df['净含量'].mean() - t * se
    #置信区间下限
    b=data_df['净含量'].mean() + t * se
    print('单个平均值的置信区间,95置信水平 CI=(%f,%f)' % (a,b))

    ff584a080c2b50b643abae016857ab8d.png

    ⑥ 效应量

    # 效应量
    '''
    效应量:差异指标Cohen's d
    '''
    d = (data_df['净含量'].mean() - pop_mean)/data_df['净含量'].std()
    print('d=',d)
    '''
    效应量:相关度指标R2
    '''
    #样本大小
    n=16
    #自由度
    df=n-1
    R2=(t*t)/(t*t+df)
    print('R2=',R2)

    9ab12b062e0e855de63aee459e5f80b5.png

    综上,我们的推论统计报告见下:

    1.描述统计分析
    样本矿泉水净含量平均值为550.75ml,标准差为4.25ml;2.推论统计分析1)假设检验
    独立样本(15)=0.706,p = 0.2456,单尾检验(右尾);
    矿泉水净含量不符合标准;2)置信区间
    平均值的置信区间,95%,CI = [548.49,553.01]3)效应量
    d = 0.18

    相关配对检验

    我们以学生月考成绩来作为案例研究:

    某班级20个学生,第一次月考英语成绩和第二次月考的英语成绩如下:判断两次月考成绩是否有显著性差异?

    7f36023cbe73b05c5f09d8b220405801.png

    1)描述统计分析

    我们先导入包:

    import numpy as np
    import pandas as pd
    import scipy.stats as ss
    import matplotlib.pyplot as plt
    import seaborn as sns

    根据样本数据集,建立样本数据框:

    # 样本数据集
    score_df = pd.DataFrame()
    score_df['No_1'] = [60,78,28,83,60,87,90,73,70,82,69,86,68,68,76,84,83,87,60,78]
    score_df['No_2'] = [67,79,60,85,66,87,86,74,74,81,79,80,82,70,82,86,85,84,62,77]

    我们使用describe看一下描述统计信息:

    f9bf1a371d05bbf91e85690b67044057.png

    我们使用柱状图对两个样本数据进行比较:

    # 使用柱状图对两个样本数据进行比较
    #两个样本数据集对比
    #画板
    fg = plt.figure(figsize = (20,10))
    #画纸
    ax = fg.add_subplot(1,1,1)
    #绘制柱状图
    score_df.plot(kind = 'bar',ax = ax)
    sns.set_palette('summer')

    5aa31388534190d87a36852d4b831ab5.png

    描述统计分析结果

    • 第一次月考,学生成绩的平均值是73.50分,标准差是14.35分;
    • 第二次月考,学生成绩的平均值是77.30分,标准差是8.34分;
    • 第二次月考成绩大部分的学生成绩高于第一次月考成绩;

    2)推论统计分析

    ① 问题是什么?

    定义零假设和备选假设:

    • 零假设H0为“学生的第二次月考成绩不受第一次考试成绩影响”;
    • 备选假设H1为“学生的第二次月考成绩受第一次考试成绩影响”;

    什么检验类型?

    因为该使用两组数据是相关样本,所以选择相关配对检验

    相关配对检验只关注每对相关数据的差值,避免得到的结论受到参加考试的学生独立性的影响。在只关注差值集的情况下,样本集处理后只有一组(差值集)。下面我们先对样本数据进行处理,得到差值集:

    # 获取差值集 
    score_df['No_sub'] = score_df['No_2'] - score_df['No_1']

    看下结果:

    f064d917e93fcb38be6f24d918631368.png

    什么抽样分布?

    案例中,样本大小是20,属于小样本,小样本的抽样分布是否满足t分布呢?因为t分布还要求数据集近似正态分布,所以下面我们里利用Python可视化看一下差值数据集的分布什么样:

    #查看数据集分布
    #画板
    fg = plt.figure(figsize = (20,10))
    #画纸
    ax = fg.add_subplot(1,1,1)
    sns.distplot(score_df['No_sub'])
    sns.set_palette('summer')

    ed78321ce9fa1092b3cdf7e6be5a8ec3.png

    通过观察上面差值数据集分布图,数据集近似正态分布,所以满足t分布的使用条件,我们可以使用相关样本t检验

    什么检验方向?

    因为备选假设是:"学生的第二次月考成绩受第一次考试成绩影响",就是第二次月考均值s2>第一次月考均值s1(s1<s2);所以使用单尾检验中的左尾检验,显著水平为5%,t检验的自由度df=n-1=20-1=19;

    综合以上分析,本次假设检验是相关样本t检验,单尾检验中的左尾

    ② 确定用于做决策的拒绝域,也就是决定显著性水平α:

    显著性水平α = 5%。

    ③ 证据是什么?

    我们需要求出,在零假设成立的条件下得到样本平均值的概率p;

    '''
    ttest_rel:相关配对检验
    返回的第1个值t是假设检验计算出的(t值),
    第2个值p是双尾检验的p值
    '''
    t,p_two = ss.ttest_rel(score_df['No_1'] , score_df['No_2'])
    
    print('t值=',t,'双尾检验的p值=',p_two) 
    #单尾检验的p值
    p_one=p_two/2
    
    print('单尾检验的p值=',p_one)

    239314941adad7a0869aa12ae5ff3c9a.png

    ④ 做出决策:

    • 左尾判断条件:t < 0 and p_one < 判断标准(显著水平)alpha
    • 右尾判断条件:t > 0 and p_one < 判断标准(显著水平)alpha
    #显著水平使用alpha=5%
    alpha=0.05
    '''
    左尾判断条件:t < 0 and  p_one < 判断标准(显著水平)alpha
    右尾判断条件:t > 0 and  p_one < 判断标准(显著水平)alpha
    '''
    #做出结论
    if(t<0 and p_one< alpha):
        print('拒绝零假设,有统计显著')
        print('也就是接受备选假设:学生的第二次月考成绩受第一次考试成绩影响')
    else:
        print('接受备选假设,没有统计显著,也就是学生的第二次月考成绩不受第一次考试成绩影响')

    7960fd04c74b5991abca6d05d6594263.png

    如此看来,我们的备选假设成立了,学生的第二次月考成绩受第一次考试成绩影响。

    ⑤ 置信区间

    根据上述分析,我们查找t表格,95%的置信水平,自由度是19,t = 2.093;

    1a4a310a265f85e889ea964576da0bcf.png

    根据t值,我们可得出置信区间:

    # 计算置信区间 
    t = 2.093
    # 计算标准误差
    se=ss.sem(score_df['No_sub'])
    #置信区间上限
    a=score_df['No_sub'].mean() - t * se
    #置信区间下限
    b=score_df['No_sub'].mean() + t * se
    print('两个平均值差值的置信区间,95置信水平 CI=[%f,%f]' % (a,b))

    e9106822f0fec465dab91375498aaba3.png

    ⑥ 效应量

    '''
    效应量:差异指标Cohen's d
    '''
    #差值数据集对应的总体平均值是0
    pop_mean= 0
    #差值数据集的标准差
    d=(score_df['No_sub'].mean() - pop_mean) / score_df['No_sub'].std()
    
    print('d=',d)

    9dc6d62f6c028341da290ae885c8df9e.png

    综上,我们的推论统计报告见下:

    1.描述统计分析
    第一次月考,学生成绩的平均值是73.50分,标准差是14.35分;
    第二次月考,学生成绩的平均值是77.30分,标准差是8.34分;
    第二次月考成绩大部分的学生成绩高于第一次月考成绩;2.推论统计分析 1)假设检验
    独立样本(19)=-2.09,p = 0.025,相关匹配t检验(左尾);
    学生第二次月考成绩受第一次月考成绩影响; 2)置信区间
    平均值的置信区间,95%,CI = [-0.00,7.60] 3)效应量
    d = 0.47

    独立双样本检验

    案例:在体育课上记录14名学生乒乓球得分数据,男女生各7名,数据如下:

    男生:82,80,85,85,78,87,82;

    女生:75,76,80,77,80,77,73;

    假设,男女得分相互独立,且均服从正态分布。比较在置信水平95%情况下男女生得分是否有显著差异。

    1)描述统计分析

    我们先导入包:

    import numpy as np
    import pandas as pd
    import scipy.stats as ss
    import matplotlib.pyplot as plt
    import seaborn as sns

    根据样本数据集,建立样本数据框:

    # 建立样本数据集
    pp_df = pd.DataFrame()
    pp_df['Boy'] = [82,80,85,85,78,87,82]
    pp_df['Girl'] = [75,76,80,77,80,77,73]

    我们使用describe看一下描述统计信息:

    374dcb54d5d69ced908508bbc69ee10d.png

    我们得出:男生的得分平均值82.71分,标准差3.15分;女生得分平均值76.86分,标准差2.54分。

    2)推论统计分析

    ① 问题是什么?

    定义零假设和备选假设:

    • 零假设H0:男生女生得分没有显著差异;也就是男生平均得分= 女生平均得分;
    • 备选假设H1:男生女生得分有显著差异;也就是男生平均得分≠ 女生平均得分;

    什么检验类型?

    这里有两组样本,是不同的人,所以选择双独立样本检验。

    什么抽样分布?

    这个AB测试中,样本大小是14属于小样本。那小样本的抽样分布是否满足t分布呢?因为t分布还要求总体分布近似正态分布,我们通过样本数据集的分布来推断总体分布。

    # 查看数据分布
    f = plt.figure(figsize=(20,10))
    f.add_subplot(2,1,1)
    sns.distplot(pp_df['Boy'])
    plt.title('Boys Score')
    f.add_subplot(2,1,2)
    sns.distplot(pp_df['Girl'])
    plt.title('Girls Score')
    sns.set_palette('summer')

    e51bf6cecfed95bed0f7ea3b08208af1.png

    通过观察上面数据集分布图,两个样本数据集都近似正态分布,满足t分布的使用条件,所以抽样分布是t分布。

    什么检验方向?

    我们备选假设为男生女生得分有显著差异;也就是男生平均得分≠ 女生平均得分;所以我们使用双尾检验。

    综合以上分析,本次假设检验是双独立样本t检验,双尾检验。

    ② 确定用于做决策的拒绝域,也就是决定显著性水平α:

    显著性水平α = 5%。

    ③ 证据是什么?

    我们需要求出,在零假设成立的条件下得到样本平均值的概率p;

    Scipy的双独立样本t检验不能返回自由度,对于后面计算置信区间不方便。所以我们使用另一个统计包(statsmodels)。

    import statsmodels.stats.weightstats as ssw
    '''
    ttest_ind:独立双样本t检验,
    usevar='unequal'两个总体方差不一样
    返回的第1个值t是假设检验计算出的(t值),
    第2个p_two是双尾检验的p值
    第3个df是独立双样本的自由度
    '''
    t,p_two,df=ssw.ttest_ind(pp_df['Boy'] ,pp_df['Girl'] , usevar='unequal')
    
    #自由度一般只保留整数部分
    print('t=',t,'p_two=',p_two,',df=',int(df))

    002c3f4eb71d0498112cd35c1e8ac184.png

    t = 3.8388 ; p = 0.0026 ; df = 11。

    ④ 做出决策:

    • 双尾检验判断条件:p_two(双尾检验的p值) < 判断标准(显著水平)α 时,拒绝零假设,有统计显著,也就是有显著差异。
    #显著水平使用alpha=5%
    alpha=0.05
    
    #做出结论
    if (p_two < alpha) : 
        print('拒绝零假设,有统计显著,也就是接受备选假设:男生女生得分有显著差异')
    else: 
        print('接受零假设,没有统计显著,也就是男生女生得分没有显著差异')

    32eeab13387a1315e0ec6989db828beb.png

    ⑤ 置信区间

    根据上述分析,我们查找t表格,95%的置信水平,自由度是11,t =2.201;

    57fdf4db3f4f71b76cf328f8c4ed5f3f.png

    根据t值,我们可得出置信区间:

    t=2.201
    
    #样本大小n
    Boy_n = 7
    Girl_n = 7
    
    se=np.sqrt( np.square(pp_df['Boy'].std())/Boy_n + np.square(pp_df['Girl'].std())/Girl_n )
    '''
    对于双独立样本检验
    置信区间的样本平均值=男生得分平均值 - 女生得分平均值
    '''
    sample_mean=pp_df['Boy'].mean() - pp_df['Girl'].mean()
    
    #置信区间上限
    a = sample_mean - t * se
    #置信区间下限
    b = sample_mean + t * se
    
    print('两个平均值差值的置信区间,95置信水平 CI=[%f,%f]' % (a,b))

    53d1b11b59e252a432e2a77173ff8e49.png

    ⑥ 效应量

    '''
    效应量:差异指标Cohen's d
    这里的标准差,因为是双独立样本,需要用合并标准差(pooled standard deviations)代替
    '''
    #合并标准差
    sp=np.sqrt(((pp_df['Boy'].size-1)*np.square(pp_df['Boy'].std()) + (pp_df['Girl'].size-1)* np.square(pp_df['Girl'].std()) ) / (pp_df.size-2))
    #效应量Cohen's d
    d=(pp_df['Boy'].mean() - pp_df['Girl'].mean()) / sp
    
    print('d=',d)

    f32f6d6daa0ae778fca19ef34b489ed4.png

    综上,我们的推论统计报告见下:

    1.描述统计分析
    男生的得分平均值82.71分,标准差3.15分;女生得分平均值76.86分,标准差2.54分;2.推论统计分析1)假设检验
    独立样本(11)=3.8388,p = 0.0026,双尾检验;
    男生女生得分有显著差异;2)置信区间
    平均值的置信区间,95%,CI = [2.49,9.22]3)效应量
    d = 2.05

    以上内容,就是对置信区间和假设检验的全部介绍啦~

    感谢阅读!

    展开全文
  • 假设分为原假设H0备选假设H1 H0一般是我们想要拒绝的假设 一般是=、>=、<= H1是我们想要接受的假设 一般是<> 、 >、< (2)选择假设检验方法,计算检验统计量; (3)判断临界值,得出结论;...
  • 置信区间计算

    千次阅读 2019-06-14 13:18:58
    而区间估计又称为置信区间估计,要得到一个置信区间需要样本统计量(比如均值)从数据中计算出方差,中心极限定理告诉我们均值会接近一个高斯分布,我们可以用标准差计算出真实期望落在选定区间的概率,例如,以...
  • 喜欢文章?不如来点赞关注吧分步计划比较以下两种期望。一,你期望超过半数的持证美国潜水者有超过 35 小时的潜水经验。二,所有持证美国潜水者的平均...因此,当实施显著性检验时,你需要特别注意你的方法。这一...
  • 置信区间、P值那点事

    千次阅读 2019-04-30 15:33:23
    置信区间和P值是怎么得来的,我想大多数盆友都不会有什么直观的概念,只会注意P值是否小于0.05或者0.01(根据显著性水平确定)。  为了给大伙说清楚置信区间和P值的梗,小编以比较常见的两独立样本t检验为例进行...
  •  t检验回归系数的置信区间  当上述F检验结论是推翻H0时,并不见得每个解释变量都对yt有显著的解释作用(即不见得每一个都是重要解释变量),所以还应对每个解释变量的系数进行显著性检验。零假设
  • 全文共1785字,预计学习时长3分钟我们有95%的信心认为总体...频率统计贝叶斯统计的区别十分显著。在教科书中,以抛硬币为例来阐述这两个概念。抛硬币一百万次,如果其中有50万次都是正面朝上,频率学派的统计学...
  • 频率统计贝叶斯统计的区别十分显著。在教科书中,以抛硬币为例来阐述这两个概念。抛硬币一百万次,如果其中有50万次都是正面朝上,频率学派的统计学家就会断定抛硬币一方是公平的。但是,贝叶斯学派的...
  • 1 假设检验 2 正态总体均值的假设检验 3 正态总体方差的假设检验 4 置信区间与假设检验之间的关系 5 样本容量的选取6 分布拟合检验 7 秩检验 8 假设检验问题的户值检验法
  • 怎样理解置信区间 影响区间宽度的因素 解释95%的置信区间 什么是假设检验中的显著性水平?统计显著是什么意思? 显著性水平α的局限性 什么是假设检验的两类错误及其数理关系怎样 P值较小时为什么要拒绝原假设 显著...
  • 1. 置信系数(1-α)表达了置信区间 A准确性 B显著性 C可靠性 D精确性 2. 估计量的无偏性是指 A数学期望等于被估计的参数 B方差大于其它估计量 C方差小于其它估计小 D样本量越大,该估计量越接近被估计的总体...
  • Question 大量检测已知正常人血浆载脂蛋白E总体平均水平为4.15mmol/L,总体分布近似于正态分布。某医师经抽样测得16例...并给出置信区间(显著性水平) 为研究某铁剂治疗饮食治疗对营养性缺铁性贫血的效果,将...
  • 研究建立了如下统计检验算法:样带多样性测度的显著性、样带多样性测度的置信区间、样带间多样性的差异显著性检验。基于这些算法,设计实现了相应的多样性检验系统。该系统采用网络分布计算体系结构,可运行于多种...
  • 数据可视化——R语言绘制散点相关图并自动添加相关系数和拟合方程加载所需的包并设置主题样式示例数据基本的散点相关图添加相关系数和显著性水平(P值)存在多个组别的散点相关图自动添加回归曲线的拟合方程拟合多项式...
  • EDA的出现主要是在对数据进行初步分析时,往往还无法进行常规的统计分析。这时候,如果分析者先...在此基础上再采用以显著性检验和置信区间估计为主的统计分析技术,就可以科学地评估所观察到的模式或效应的具体情况。
  • 采取浮选精煤尾煤各20个样品分别用煤炭快速灰化法缓慢灰化法进行单次测...分析结果表明,精煤尾矿灰分结果的t检验无显著性差异,差值的置信区间范围较小,即煤炭灰分快速灰化法可满足技术比武考核快速检查的需要。
  • 选用不同热值的煤标准物质对测量...试验结果表明:煤标准物质的发热量测定值(Qgr,d)与标准值间无显著性差异,误差的95%置信区间均小于标准物质的不确定度,所采用的测量方法设备的准确度良好,能满足检测实验室的要求。
  • 文中引用某矿井下7″级基本控制导线量...采用置信区间检验进行粗差估计,并确定相应置信度下的置信区间范围;采用显著性检验评价数据差异性大小。最后获得结论:在剔除粗差之后"前视高"比"后视高"量测数据更为稳定可靠。
  • 统计推断-经典统计推断

    千次阅读 2019-03-24 01:28:21
    经典统计推断基本问题统计学与概率论贝叶斯统计与经典统计推断模型与推断变量术语解释经典参数估计术语最大似然估计均值方差的估计置信区间求近似的置信区间基于方差近似估计量的置信区间线性回归最小二乘法合理...
  • 知道期望E,显著性水平为0.05下的z的统计量为1.96,标准差为1000,求得样本容量为385.计算方式为: 置信度精确度 什么是置信度呢?如果在一次大选中某人的支持率为55%,而置信水平0.95上的置信区间是(50%,...
  • 文章目录探索数据分析概念结构化数据的组成矩形数据位置估计变异估计自由度探索数据分布二元数据分类数据的分布相关性两个及以上变量数据抽样分布概念随机抽样样本偏差偏差选择偏差自助法置信区间抽样分布...
  • value如何使用解释的文章:Scientists rise up against statistical significance,800多名科学家联合声明拒绝使用基于p-value或置信区间或贝叶斯因子等的二分法将研究结果分为统计显著和统计不显著两个部分,...
  • 关于这个主题,涉及到以下问题: 1、大数定理 描述样本均值真实均值的关系:样本足够大,样本...给出一个假设,从而基于这个假设推出一个检验值,给出一个p-value(显著性水平),看检验值是否在区间内,如果是...
  • 多元病态线性回归

    2021-02-04 22:44:28
    检验是否为病态回归问题****若为病态回归问题,则降维处理****建立回归模型,计算回归参数、回归结果****平方分解****显著性检验****回归直线方程****求解置信区间**例题求解相关程序 一、病态线性回归问题中,...
  • 首先将SAR图像不确定轮廓模糊化得到相似度定义,进而通过分析模糊模型分布函数,在给定显著性水平下得到相似度置信区间,并给出可信度定义。实验结果表明,该方法对轮廓定位有一定容错性,对一定程度的断裂轮廓及多边缘...

空空如也

空空如也

1 2 3
收藏数 53
精华内容 21
关键字:

置信区间和显著性