精华内容
下载资源
问答
  • 一类错误:原假设是正确的,却拒绝了原假设。 第二类错误:原假设是错误的,却没有拒绝原假设。 第一类错误即 I 型错误是指拒绝了实际上成立的H0,为“弃真”的错误,其概率通常用α表示,这称为显著性水平。α...

     

    简介

    我们不妨先看下定义:

    第一类错误:原假设是正确的,却拒绝了原假设。
    第二类错误:原假设是错误的,却没有拒绝原假设。

    第一类错误即 I 型错误是指拒绝了实际上成立的H0,为“弃真”的错误,其概率通常用α表示,这称为显著性水平。α可取单侧也可取双侧,可以根据需要确定α的大小,一般规定α=0.05或α=0.01。
    第二类错误即 II 型错误是指不拒绝实际上不成立的H0,为“存伪”的错误,其概率通常用β表示。β只能取单尾,假设检验时一般不知道β的值,在一定条件下(如已知两总体的差值δ、样本含量n和检验水准α)可以测算出来。

    来自:传送门

    我们知道,一型错误往往利用 α分位数进行假设推断,而二型错误我们则用 β 值进行衡量

    一,二型错误之间的联系

    对于实际情况来说,我们可以看到预测情况与真实情况之间的数量关系,即混淆矩阵:

     

     

    我们假设有原假设H0和备择假设H1,那么利用自己的data构造统计量,即构造某种满足H0的统计量分布;同样的我们也可以构造某种满足H1的统计量分布:

     


    其中虚线表示分位数 α , 黑色曲线表示H0统计量分布,红色曲线表示H1统计量分布
    这样一来,H0极端情况(小概率事件)为虚线右侧与黑色分布曲线相围成的面积,并且定义为FP(α);对于H1极端情况(小概率事件)为虚线左侧与红色分布曲线相围成的面积,并且定义为FN(β)

    那么倘若我们想降低一型错误发生率,即将虚线往右移动,那么势必会增大二型错误发生率;同样,我们想降低二型错误发生率,即将虚线往右移动,那么势必会增大一型错误发生率
    唯一降低两型错误发生率的办法是提高样本量,使得二者分母都变大

    拓展

    我们往往在做统计推断的时候只考虑一型错误发生情况(即 α 分位数),那是因为我们往往围绕H0构造统计量(比较好构造);而H1的统计量分布往往不太好求,并且二型错误发生情况必须知道H1的统计量分布才能求出,所以我们一般做简单的统计推断时不考虑二型错误

    展开全文
  • 统计学中I和II类错误

    千次阅读 2019-03-13 10:28:51
    但由于抽样误差的存在,在进行假设检验根据P值做出推断时具有一定的概率性,因此所得的结论就不一定完全正确,这就是我们常见的假设检验的陷阱:I类错误和II类错误。 I类错误,也称为假阳性错...

    转自:原文转
    转自:原文转
    假设检验是基于抽样样本来进行结果推断的,而抽样样本只是总体的一小部分,从总体中抽取不同的样本,可能会得出不同的结果,因此我们通常希望抽样样本是一个能够很好地反映总体特征的具有代表性的样本。但由于抽样误差的存在,在进行假设检验根据P值做出推断时具有一定的概率性,因此所得的结论就不一定完全正确,这就是我们常见的假设检验的陷阱:I类错误和II类错误。
    I类错误,也称为假阳性错误,就是说实际上总体并无差异,原假设H0是成立的,但是通过假设检验P≤α,在设定α的检验水准下,拒绝了H0,认为有差异,出现了假阳性的现象。前面提到的检验水准α,就是预先设定允许犯I类错误概率的最大值,此时犯I类错误的概率即为α。
    II类错误,也称为假阴性错误,就是说实际上原假设H0不成立,但是通过假设检验P>α,在设定α的检验水准下,不拒绝H0,得出了阴性的结论,此时犯II类错误的概率为β。
    1、第一类错误又称Ⅰ型错误、拒真错误,是指拒绝了实际上成立的、正确的假设,为“弃真”的错误,其概率通常用α表示。假设检验是反证法的思想,依据样本统计量作出的统计推断,其推断结论并非绝对正确,结论有时也可能有错误,错误分为两类。

    2、第二类错误,Ⅱ型错误,接受了实际上不成立的H0 ,也就是错误地判为无差别,这类取伪的错误称为第二类错误,其概率用β表示。简单说就是:你的假设是错误,但你接受该假设。

    “第一类错误”和“第二类错误”之间的关系:

    1、当样本例数固定时,α愈小,β愈大;反之,α愈大,β愈小。因而可通过选定α控制β大小。要同时减小α和β,唯有增加样本例数。统计上将1-β称为检验效能或把握度(power of a test),即两个总体确有差别存在,而以α为检验水准,假设检验能发现它们有差别的能力。实际工作中应权衡两类错误中哪一个重要以选择检验水准的大小。

    2、做假设检验的时候会犯两种错误:第一,原假设是正确的,而你判断它为错误的;第二,原假设是错误的,而你判断它为正确的。我们分别称这两种错误为第一类错误(Type I error)和第二类错误(Type II error)。

    第一类错误:原假设是正确的,却拒绝了原假设。

    第二类错误:原假设是错误的,却没有拒绝原假设。

    我们常把假设检验比作法庭判案,我们想知道被告是好人还是坏人。原假设是“被告是好人”,备择假设是“被告是坏人”。法庭判案会犯两种错误:如果被告真是好人,而你判他有罪,这是第一类错误(错杀好人);如果被告真是坏人,而你判他无罪,这是第二类错误(放走坏人)。

    记忆方法:我们可以把第一类错误记为“以真为假”,把第二类错误记为“以假为真”。当然我们也可以将第一类错误记为“错杀好人”,把第二类错误记为“放走坏人”。

    在其他条件不变的情况下,如果要求犯第一类错误概率越小,那么犯第二类错误的概率就会越大。这个结论比较容易理解,当我们要求“错杀好人”的概率降低时,那么往往就会“放走坏人”。

    同样的,在其他条件不变的情况下,如果要求犯第二类错误概率越小,那么犯第一类错误的概率就会越大。当我们要求“放走坏人”的概率降低时,那么往往就会“错杀好人”。同样的,在其他条件不变的情况下,如果要求犯第二类错误概率越小,那么犯第一类错误的概率就会越大。当我们要求“放走坏人”的概率降低时,那么往往就会“错杀好人”。

    总结而言:I类错误和II类错误只是一个统计学上的概念,在进行假设检验时无法确定其发生的实际概率。由于两类错误主要受样本量的影响,因此可以通过增大样本量的方法,使得我们的抽样样本尽可能的接近总体,具有更好的代表性,以达到降低两类错误发生概率的目的

    展开全文
  • 通俗易懂解释一类和类错误(Type I Error Type II Error) 作者 KULDEEP PATEL 翻译自False Positive (Type I Error) and False Negative (Type II Error) 本文涵盖以下与“误报False Positive漏报False Negative...

    通俗易懂解释一类和二类错误(Type I Error Type II Error)

    作者 KULDEEP PATEL

    翻译自False Positive (Type I Error) and False Negative (Type II Error)


    本文涵盖以下与“误报False Positive和漏报False Negative”及其在机器学习领域中的意义有关的主题:

    • 解释
    • 3个案例
    • Python代码(Scikit-Learn)
    • 我们如何衡量分类问题中的错误?
    • 还想获得更多相关内容?:有关医学检验假阳性和假阴性的新闻

    解释

    I型错误(误报)和II型错误(漏报)

    ▲I型错误(误报 False Positive)和II型错误(漏报 False Negative)

    通过查看该图,您对I型和II型错误有了解了吗?让我们探索一下它。

    这张图表示年龄(在X轴上,自变量)与已婚(在Y轴上,因变量)之间的关系。Y取决于X的值,即某人已婚(Y = 1或Yes)或未婚(Y = NO 获0)的决定取决于人的年龄。

    误报 (False Postive),也称Type I Error

    蓝色十字标记→红色十字标记(实际→预测)

    就是那个25到30之间的一蓝一红的2个点

    注意图中的十字标记符号,其中蓝色十字标记表示实际值,红色十字标记表示预测值。在25至30岁左右的年龄,一个名叫A先生的人实际上并未结婚。但是,预测说A先生已结婚,这是一个错误的预测(即False),并且预测值是Yes或1(即Positive)。因此,它被称为“误报False Postive”或“ I类错误”。

    漏报(False Negative),也称Type II Error

    蓝色圆圈标记→红色圆圈标记(实际→预测) 即20-25之间的两个点

    在此方案中,蓝色圆圈标记和红色圆圈标记分别表示实际值和预测值。实际上,一个名为B先生的人已婚,年龄约为20-25岁。但是,预测值表明B先生尚未结婚。因此,在这种情况下,预测也是错误的(即False),并且预测值为No或0(即Negative)。这被称为“漏报False Negative”或II型错误。

    解释说明 Interpretation

    误报-当预测错误且预测值是真时

    漏报-当预测错误且预测值为假时

    False Positive- when a prediction is wrong & predicted value is positive

    False Negative- when a prediction is wrong & predicted value is Negative

    混淆矩阵中的I型和II型错误表示:

    混淆矩阵

    ▲混淆矩阵 Confusion Matrix

    案例

    第一个案例:火灾报警

    一类错误

    类型I错误(误报):当没有火警时,火警会响起[Sources:Gifer(火警)]

    二型错误

    类型II错误(漏报) :发生火灾时,火警警报无法响起 [Sources:Gifer(FireAlarm),tenor(Fire)]

    第二个案例:男人怀孕

    1_5pZNWXDxY4M9SUJ56QV7yA

    I型错误(误报):医生说男人怀孕了…

    II型错误(漏报):医生说孕妇没有怀孕…

    [来源:pinterest(医生),fotosearch(男人)和deviantart(女士)]

    Python Code解释(用Sklearn)

    # Assume we have a dataset which contains the information on pregnancy tests
    # 0- Represents Lady is not pregnant 女士没怀孕
    # 1- Represents Lady is pregnant 女士怀孕了
    # y- Output/Target/Dependent Variable 因变量
    # y_actual - In reality 真实值
    # y_predicted - Predicted by Machine Learning algorithm  机器学习预测值
    y_actual = [1,0,0,0,0,0,1,1,1,0]
    y_predicted = [1,1,1,0,0,0,1,1,0,0]
    
    from sklearn. metrics import confusion_ matrix
    print( confusion_matrix(y_actual, y_predicted))
    
    # 输出
    # [[4 2]
    #  [1 3]]
    

    ▲混淆矩阵Confusion Matrix

    # False Positive and False Negative
    FP=confusion_ matrix(y. actual,y_predicted)[0][1]
    FN=confusion_ matrix(y_ actual,y_predicted)[1][0]
    print("False Positive (Type I Error) :",FP)
    print("False Negative (Type II Error):",FN)
    # Accuracy 准确度 = 1-(漏报的个数+误报的个数)/总数据个数
    accuracy=100-((FP+FN)*100/len(y_predicted))
    print( ." Accuracy : " , accuracy,' %')
    
    # 输出
    # False Positive (Type I Error) : 2
    # False Negative (Type II Error): 1
    # Accuracy : 70.0 %
    

    ▲误报和漏报 False Positive and False Negative

    Relate the results with a confusion matrix

    ▲与混淆矩阵相关的结果

    3 Errors (2 False Positive + 1 False Negative)

    ▲3个错误(2个误报 蓝色箭头+ 1个漏报 红色箭头)

    如何衡量分类问题中的错误

    I型错误(误报)和II型错误(漏报)可帮助我们确定模型的准确性,可以借助混淆矩阵来确定模型的准确性。

    如果我们将类型I和类型II错误的值相加,则总错误=误报+漏报,精准程度=1-总错误数/总个数。

    如果错误较小,则准确度会更高,反之亦然。更好的准确性,更好的性能,这正是我们想要的。。

    我们来解释下在Python代码中获得的结果

    误报数= 2,表示2位女士实际上并未怀孕,但模型预测表明他们已怀孕。

    漏报数= 1,表示1位女士实际情况下怀孕,但根据预测她没有怀孕。

    因此,由于孕妇怀孕且模型预测说她没有怀孕,这种情况更加危险。

    因此,这里的Type II Error比Type I Error更危险。

    我们可以得出结论,在10个预测中,我们的模型做出了3个错误预测(1个假阴性+ 2个假阳性)和7个正确预测(4个真阳性+3个真阴性)。

    因此我们可以说模型的准确性为70%,误差为30%。

    还想获得更多相关内容?:有关医学检验假阳性和假阴性的新闻

    请点击查看 医学测试当中的预测价值

    非常感谢您的阅读!

    展开全文
  • 维基百科中对 Type Ⅰ Type Ⅱ error的解释是: type I error is the rejection of a true null hypothesis (also known as ‘False Positive’) type II error is failing to reject a false null...

    第一类错误和第二类错误

    假设检验(hypothesis testing)是数理统计中根据一定的假设条件,由样本来推测总体的一种方法。假设检验实际上是一种反证法的思想,常见的做法是先构建统计量,然后在假设 H 0 H_{0} H0下,统计量往往有一个分布,当我们计算出统计量处于分布的小概率区域中时,我们就可以说 H 0 H_{0} H0假设是小概率事件,可以拒绝零假设。常见的假设检验的方法有u-检验法、t检验法、卡方检验、F-检验、秩和检验等。

    维基百科中对 Type Ⅰ和 Type Ⅱ error的解释是:

    type I error is the rejection of a true null hypothesis (also known as ‘False Positive’)
    type II error is failing to reject a false null hypothesis (also known as ‘False Negative’)

    从字面上来进行理解,第一类错误就是原假设 H 0 H_{0} H0是正确的,但是拒绝了它;第二类错误就是原假设 H 0 H_{0} H0是错误的,但是接受了它。

    再加上知乎上对于第一类和第二类错误的几种形象解释来加深一下印象:

    例子一:

    出自作者:马志阳
    链接:https://www.zhihu.com/question/20993864/answer/81244176

    按照平时的习惯,对于原假设我们一般都是拒绝的,所以对原答案进行了一点修改:
    假设检验就好比谈恋爱,你需要推测这个男生是否是真心爱你的,所以需要作出下面的假设:

    H 0 H_{0} H0:他不是一个真心爱你的男生
    H 1 H_{1} H1:他是一个真心爱你的男生

    如果 H 0 H_{0} H0实际上成立,而你凭借经验拒绝了这假设,也就是你和这个不爱你的男生在一起了,这样就是犯了第Ⅰ类错误。

    如果 H 0 H_{0} H0实际上不成立,而你接受了这个假设,也就是你失去了和一个真正爱你的男生在一起的机会,这样就是犯了第Ⅱ类错误。

    如果要同时减少犯第一类错误和第二类错误的概率,那就只能通过增加恋爱的次数 n n n,比如一个经历过 n = 100 n=100 n=100次恋爱的女生,第101次恋爱犯第一类错误和第二类错误的概率就会小很多了。

    例子二

    出自作者:DDTemp
    链接:https://www.zhihu.com/question/20993864/answer/93762491

    先提出假设:

    H 0 H_{0} H0: He/She are not pregnant
    H 1 H_{1} H1: He/She are pregnant

    对应图中的描述,左图中,错误的拒绝了 H 0 H_{0} H0假设,所以说犯了第一类错误;右图中,错误的接受了 H 0 H_{0} H0假设。

    补充

    1、第一类错误的概率就是错误地拒绝了原假设的概率,也就是p-value。
    2、第一类错误和第二类错误是负相关的,即第一类错误概率大,第二类错误概率就小,但是两者的概率之和不是1,否则的话犯错的概率就是1了。

    REF

    https://blog.csdn.net/weixin_34226182/article/details/86400139
    https://www.zhihu.com/question/20993864/answer/93762491
    https://www.zhihu.com/question/20993864/answer/81244176

    展开全文
  • 统计学中存在两类错误 这两类错误主要是在统计学假设检验中所出现的,因此,先要了解假设检验的基本概念。 假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的种方法。具体作法是:根据...
  • Type I and type II errors - wiki type I error is the rejection of a true nullhypothesis (also known as a "false positive" finding),  type II error is failing to reject a ...
  • 进行假设检验时,由于数据的随机性,所作出的决策...第 II 类错误(受伪):H0H_0H0​为假时错误地没有拒绝零假设。第 IIIIII 类错误的最大概率记为 β\betaβ。 H0H_0H0​ Do not reject H0H_0H0​ Reject H0H_...
  • 在假设检验中,可能存在两种错误,即I型和II错误。 I类型错误:当零假设实际为真时,却认为备择假设是真的。 II类型错误:当备择假设实际为真时,却判断认为零假设为真。 在个法庭的例子中,如果零假设是个人...
  • 统计学假设检验的两类错误

    万次阅读 多人点赞 2018-08-07 17:15:01
    1、两类错误的解释 我们之前探讨了假设检验的基本思想...II类错误——取伪错误,发生的概率为β   为了更形象点说明这两类错误,我们看下下面这个图片: 对于正常情况下对于上面实例的假设检验应该为: H...
  • 假设检验中的两类错误

    千次阅读 2019-05-12 21:37:13
    在进行假设检验时提出原假设备择假设,原假设实际上是正确的,但我们做出的决定是拒绝原假设,此类错误称为第一类错误。原假设实际上是不正确的,但是我们却做出了接受原假设的决定,此类错误称为第二类错误。 ...
  • quatus ii 常见错误及其改正方法

    千次阅读 2018-11-11 15:25:48
    在QuartusII下进行编译仿真的时候,会出现堆warning,有的可以忽略,有的却需要注意,虽然按F1可以了解关于该警告的帮助,但有时候帮助解释的仍然不清楚,大家群策群力,把自己知道了解的一些关于警告的问题都说出来...
  • 假设检验的两类错误

    千次阅读 2020-08-04 20:57:36
    弃真错误也叫第I类错误或α错误:它是指 原假设实际上是真的,但通过样本估计总体后,拒绝了原假设。明显这是错误的,我们拒绝了真实的原假设,...我们把第一类错误出现的概率用α表示。这个α,就是Significance Level
  • sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频教程) ...amp;utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share       二型错误和检验功...
  • AB测试 - 假设检验的两类错误

    千次阅读 2020-04-04 20:10:09
    假设检验两类错误
  • 个试验相当于个样本,由个样本平均数可以对总体平均数做出估计,但样本平均数是因不同样本而变化的,即样本平均数有抽样误差。用存在误差的样本平均数来推断总体,其结论并不是绝对正确的。把试验的表面效应与...
  • 统计学中的两类错误

    千次阅读 2018-02-01 15:34:17
    在进行假设检验时提出原假设备择假设,原假设实际上是正确的,但我们做出的决定是拒绝原假设,此类错误称为第一类错误。原假设实际上是不正确的,但是我们却做出了接受原假设的决定,此类错误称为第二类错误。 ...
  • 假设检验的两类错误及功效

    千次阅读 2018-07-17 17:26:43
    、为什么会有假设检验的两类错误? 由于假设检验是根据有限的样本信息对总体作推断,不论做出哪种推断结论(拒绝原假设H0不拒绝原假设H0),都由可能因为抽样等原因发生错误。 二、假设检验的两类错误 1. 第I...
  • 测试开发笔记

    万次阅读 多人点赞 2019-11-14 17:11:58
    章 测试基础 7 什么是软件测试: 7 ★软件测试的目的、意义:(怎么做好软件测试) 7 3.软件生命周期: 7 第二章 测试过程 8 1.测试模型 8 H模型: 8 V模型 9 2.内部测试 10 3外部测试: 10 验收测试:(在系统...
  • matlab人脸识别论文

    万次阅读 多人点赞 2019-10-11 17:41:51
    本文设计了种基于BP神经网络的人脸识别系统,并对其进行了性能分析。该系统首先利用离散小波变换获取包含人脸图像大部分原始信息的低频分量,对图像数据进行降维;再由PCA算法对人脸图像进行主成分特征提取,进--步...
  • 【数据库学习】数据库总结

    万次阅读 多人点赞 2018-07-26 13:26:41
    ②外模式(子模式,用户模式) 是数据库用户能够看见使用的局部数据的逻辑结构特征的描述,是数据库用户的数据视图,是与某应用有关的数据的逻辑表示。 外模式通常是模式的子集,个数据库可以有多个外模式...
  • 假设检验中错误的类型

    千次阅读 2020-12-23 14:19:56
    I类错误是指在无效假设是真的时候,结果是显著的,第一类错误的可能性经常用a表示,并且该值的数据分析前就确定,在质量控制中,第一类错误被叫作生产者风险,因为你在一个产品符合规范要求的情况拒绝了它 ...
  • FPGA数字信号处理()数字混频(NCO与DDS的使用)

    万次阅读 多人点赞 2018-05-30 16:27:36
    这是数字信号处理系列的第篇,以简单的数字混频为例,介绍在FPGA程序设计中很重要的二进制原码、补码;有符号数、无符号数的问题。本文不是像课本那样介绍这些基础概念,而是介绍很实际的设计方法。 借助于数字...
  • 目录: (1)错误率(Error ...错误率、精度 错误率(Error Rate):是分类错误的样本数占样本总数的比例。对样例集D,分类错误率计算公式如1所示。 (1) 对公式(1)解释:统计分类器预测出来的结...
  • Verilog 常见错误汇总 1.Found clock-sensitive change during active clock edge at time <time> on register "<name>" 原因:vector source file中时钟敏感信号(如:数据,允许端,清零,同步加载等)在...
  • Type I 错误和 Type II错误

    千次阅读 2007-11-08 13:14:00
    最近看人脸检测的论文,遇到两个词不知其意:false-positive rate false-negative rate。最后查wikipedia才知道...对于正例,分类器可能正确的将其分类为正例,也可能错误的拒绝了这个样例,对于反例也是一样。false
  • 分类中解决类别不平衡问题

    万次阅读 多人点赞 2018-05-11 22:19:31
    起来学习,起来交流,起来进步吧!本文同步更新在我的微信公众号里面,公众号文章地址:https://mp.weixin.qq.com/s?__biz=MzI5NDMzMjY1MA==&amp;mid=2247484313&amp;idx=1&amp;sn=568015a62bf99...
  • quartus_ii_常见的19个错误、28个警告

    万次阅读 多人点赞 2013-08-15 18:27:56
    ()Quartus警告解析    1.Found clock-sensitive change during activeclock edge at time on register "" 原因:vectorsource file中时钟敏感信号(如:数据,允许端,清零,同步加载等)在时钟的边缘同时变化。...
  • c++类和类的封装,对象线程封装

    千次阅读 2018-09-05 17:50:42
    1. C++面向对象编程介绍 面向对象编程(Object Oriented Programming),简称OOP。 在传统的面向过程编程中...OOP提供了设计对象的功能,对象包括特性行为,两者都囊括在一起,共同构成对象实体(即实体); 对...
  • 本文是我在阅读西瓜书的时候的一些学习笔记少许理解,更多的我个人觉得算是抛砖引玉吧,如果有误,请麻烦纠正。 顺带说句,自从看了《西瓜书》,再也不愁出去买到烂瓜了。 本文内容是机器学习算法的性能度量,...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 47,442
精华内容 18,976
关键字:

一类错误和ii类错误