精华内容
下载资源
问答
  • Type I and type II errors - wiki type I error is the rejection of a true nullhypothesis (also known as a "false positive" finding),  type II error is failing to reject a ...

    偶尔能看懂,但是死活记不住,归根结底是没有彻底理解!

    Type I and type II errors - wiki

    type I error is the rejection of a true nullhypothesis (also known as a "false positive" finding), 

    type II error is failing to reject a false null hypothesis (also known as a "false negative" finding). 1-power。

    大部分举例都没有讲清楚,必须要结合下面的图才能有直观的理解。

     

    power就是当统计量服从备择假设时,我们得到备择假设的概率。

    我们要构建零假设,这就是我们要攻击的目标,我们需要使用我们的数据来拒绝它。

    常见的做法是我们需要构建统计量,在H0的假设下,统计量往往有一个分布,当我们计算出统计量处于分布的小概率区域中时,我们就可以说零假设是小概率事件,可以拒绝零假设。

    如下图的单侧假设检验,当统计量大于2时,我们就可以拒绝H0,此时我们犯第一类错误地概率就是α,就是零假设是真的,我们却拒绝了它。

    当设定了显著性水平后,α就定了,一般为0.05,所以统计量水平也就定了,下图为2. 第二类错误就是,即使没有达到拒绝H0的标准(统计量小于2),但是其实H1是真的,我们却拒绝了它。定义为β。也可以叫做我们接受了错误地H0。

     

    结论:

    第一类错误:错误地拒绝了H0

    第二类错误:错误地拒绝了H1,换句话说,错误地接受了H0,接受了假的H0,真的很绕口,但是确实一个东西。

    与wiki定义完美吻合!!!

     

    这之后,Sensitivity, Specificity, and ROC Curves就很好理解了。

     

    展开全文
  • 统计学中I和II类错误

    千次阅读 2019-03-13 10:28:51
    但由于抽样误差的存在,在进行假设检验根据P值做出推断时具有一定的概率性,因此所得的结论就不一定完全正确,这就是我们常见的假设检验的陷阱:I类错误和II类错误。 I类错误,也称为假阳性错...

    转自:原文转
    转自:原文转
    假设检验是基于抽样样本来进行结果推断的,而抽样样本只是总体的一小部分,从总体中抽取不同的样本,可能会得出不同的结果,因此我们通常希望抽样样本是一个能够很好地反映总体特征的具有代表性的样本。但由于抽样误差的存在,在进行假设检验根据P值做出推断时具有一定的概率性,因此所得的结论就不一定完全正确,这就是我们常见的假设检验的陷阱:I类错误和II类错误。
    I类错误,也称为假阳性错误,就是说实际上总体并无差异,原假设H0是成立的,但是通过假设检验P≤α,在设定α的检验水准下,拒绝了H0,认为有差异,出现了假阳性的现象。前面提到的检验水准α,就是预先设定允许犯I类错误概率的最大值,此时犯I类错误的概率即为α。
    II类错误,也称为假阴性错误,就是说实际上原假设H0不成立,但是通过假设检验P>α,在设定α的检验水准下,不拒绝H0,得出了阴性的结论,此时犯II类错误的概率为β。
    1、第一类错误又称Ⅰ型错误、拒真错误,是指拒绝了实际上成立的、正确的假设,为“弃真”的错误,其概率通常用α表示。假设检验是反证法的思想,依据样本统计量作出的统计推断,其推断结论并非绝对正确,结论有时也可能有错误,错误分为两类。

    2、第二类错误,Ⅱ型错误,接受了实际上不成立的H0 ,也就是错误地判为无差别,这类取伪的错误称为第二类错误,其概率用β表示。简单说就是:你的假设是错误,但你接受该假设。

    “第一类错误”和“第二类错误”之间的关系:

    1、当样本例数固定时,α愈小,β愈大;反之,α愈大,β愈小。因而可通过选定α控制β大小。要同时减小α和β,唯有增加样本例数。统计上将1-β称为检验效能或把握度(power of a test),即两个总体确有差别存在,而以α为检验水准,假设检验能发现它们有差别的能力。实际工作中应权衡两类错误中哪一个重要以选择检验水准的大小。

    2、做假设检验的时候会犯两种错误:第一,原假设是正确的,而你判断它为错误的;第二,原假设是错误的,而你判断它为正确的。我们分别称这两种错误为第一类错误(Type I error)和第二类错误(Type II error)。

    第一类错误:原假设是正确的,却拒绝了原假设。

    第二类错误:原假设是错误的,却没有拒绝原假设。

    我们常把假设检验比作法庭判案,我们想知道被告是好人还是坏人。原假设是“被告是好人”,备择假设是“被告是坏人”。法庭判案会犯两种错误:如果被告真是好人,而你判他有罪,这是第一类错误(错杀好人);如果被告真是坏人,而你判他无罪,这是第二类错误(放走坏人)。

    记忆方法:我们可以把第一类错误记为“以真为假”,把第二类错误记为“以假为真”。当然我们也可以将第一类错误记为“错杀好人”,把第二类错误记为“放走坏人”。

    在其他条件不变的情况下,如果要求犯第一类错误概率越小,那么犯第二类错误的概率就会越大。这个结论比较容易理解,当我们要求“错杀好人”的概率降低时,那么往往就会“放走坏人”。

    同样的,在其他条件不变的情况下,如果要求犯第二类错误概率越小,那么犯第一类错误的概率就会越大。当我们要求“放走坏人”的概率降低时,那么往往就会“错杀好人”。同样的,在其他条件不变的情况下,如果要求犯第二类错误概率越小,那么犯第一类错误的概率就会越大。当我们要求“放走坏人”的概率降低时,那么往往就会“错杀好人”。

    总结而言:I类错误和II类错误只是一个统计学上的概念,在进行假设检验时无法确定其发生的实际概率。由于两类错误主要受样本量的影响,因此可以通过增大样本量的方法,使得我们的抽样样本尽可能的接近总体,具有更好的代表性,以达到降低两类错误发生概率的目的

    展开全文
  • 通俗易懂解释一类和类错误(Type I Error Type II Error) 作者 KULDEEP PATEL 翻译自False Positive (Type I Error) and False Negative (Type II Error) 本文涵盖以下与“误报False Positive漏报False Negative...

    通俗易懂解释一类和二类错误(Type I Error Type II Error)

    作者 KULDEEP PATEL

    翻译自False Positive (Type I Error) and False Negative (Type II Error)


    本文涵盖以下与“误报False Positive和漏报False Negative”及其在机器学习领域中的意义有关的主题:

    • 解释
    • 3个案例
    • Python代码(Scikit-Learn)
    • 我们如何衡量分类问题中的错误?
    • 还想获得更多相关内容?:有关医学检验假阳性和假阴性的新闻

    解释

    I型错误(误报)和II型错误(漏报)

    ▲I型错误(误报 False Positive)和II型错误(漏报 False Negative)

    通过查看该图,您对I型和II型错误有了解了吗?让我们探索一下它。

    这张图表示年龄(在X轴上,自变量)与已婚(在Y轴上,因变量)之间的关系。Y取决于X的值,即某人已婚(Y = 1或Yes)或未婚(Y = NO 获0)的决定取决于人的年龄。

    误报 (False Postive),也称Type I Error

    蓝色十字标记→红色十字标记(实际→预测)

    就是那个25到30之间的一蓝一红的2个点

    注意图中的十字标记符号,其中蓝色十字标记表示实际值,红色十字标记表示预测值。在25至30岁左右的年龄,一个名叫A先生的人实际上并未结婚。但是,预测说A先生已结婚,这是一个错误的预测(即False),并且预测值是Yes或1(即Positive)。因此,它被称为“误报False Postive”或“ I类错误”。

    漏报(False Negative),也称Type II Error

    蓝色圆圈标记→红色圆圈标记(实际→预测) 即20-25之间的两个点

    在此方案中,蓝色圆圈标记和红色圆圈标记分别表示实际值和预测值。实际上,一个名为B先生的人已婚,年龄约为20-25岁。但是,预测值表明B先生尚未结婚。因此,在这种情况下,预测也是错误的(即False),并且预测值为No或0(即Negative)。这被称为“漏报False Negative”或II型错误。

    解释说明 Interpretation

    误报-当预测错误且预测值是真时

    漏报-当预测错误且预测值为假时

    False Positive- when a prediction is wrong & predicted value is positive

    False Negative- when a prediction is wrong & predicted value is Negative

    混淆矩阵中的I型和II型错误表示:

    混淆矩阵

    ▲混淆矩阵 Confusion Matrix

    案例

    第一个案例:火灾报警

    一类错误

    类型I错误(误报):当没有火警时,火警会响起[Sources:Gifer(火警)]

    二型错误

    类型II错误(漏报) :发生火灾时,火警警报无法响起 [Sources:Gifer(FireAlarm),tenor(Fire)]

    第二个案例:男人怀孕

    1_5pZNWXDxY4M9SUJ56QV7yA

    I型错误(误报):医生说男人怀孕了…

    II型错误(漏报):医生说孕妇没有怀孕…

    [来源:pinterest(医生),fotosearch(男人)和deviantart(女士)]

    Python Code解释(用Sklearn)

    # Assume we have a dataset which contains the information on pregnancy tests
    # 0- Represents Lady is not pregnant 女士没怀孕
    # 1- Represents Lady is pregnant 女士怀孕了
    # y- Output/Target/Dependent Variable 因变量
    # y_actual - In reality 真实值
    # y_predicted - Predicted by Machine Learning algorithm  机器学习预测值
    y_actual = [1,0,0,0,0,0,1,1,1,0]
    y_predicted = [1,1,1,0,0,0,1,1,0,0]
    
    from sklearn. metrics import confusion_ matrix
    print( confusion_matrix(y_actual, y_predicted))
    
    # 输出
    # [[4 2]
    #  [1 3]]
    

    ▲混淆矩阵Confusion Matrix

    # False Positive and False Negative
    FP=confusion_ matrix(y. actual,y_predicted)[0][1]
    FN=confusion_ matrix(y_ actual,y_predicted)[1][0]
    print("False Positive (Type I Error) :",FP)
    print("False Negative (Type II Error):",FN)
    # Accuracy 准确度 = 1-(漏报的个数+误报的个数)/总数据个数
    accuracy=100-((FP+FN)*100/len(y_predicted))
    print( ." Accuracy : " , accuracy,' %')
    
    # 输出
    # False Positive (Type I Error) : 2
    # False Negative (Type II Error): 1
    # Accuracy : 70.0 %
    

    ▲误报和漏报 False Positive and False Negative

    Relate the results with a confusion matrix

    ▲与混淆矩阵相关的结果

    3 Errors (2 False Positive + 1 False Negative)

    ▲3个错误(2个误报 蓝色箭头+ 1个漏报 红色箭头)

    如何衡量分类问题中的错误

    I型错误(误报)和II型错误(漏报)可帮助我们确定模型的准确性,可以借助混淆矩阵来确定模型的准确性。

    如果我们将类型I和类型II错误的值相加,则总错误=误报+漏报,精准程度=1-总错误数/总个数。

    如果错误较小,则准确度会更高,反之亦然。更好的准确性,更好的性能,这正是我们想要的。。

    我们来解释下在Python代码中获得的结果

    误报数= 2,表示2位女士实际上并未怀孕,但模型预测表明他们已怀孕。

    漏报数= 1,表示1位女士实际情况下怀孕,但根据预测她没有怀孕。

    因此,由于孕妇怀孕且模型预测说她没有怀孕,这种情况更加危险。

    因此,这里的Type II Error比Type I Error更危险。

    我们可以得出结论,在10个预测中,我们的模型做出了3个错误预测(1个假阴性+ 2个假阳性)和7个正确预测(4个真阳性+3个真阴性)。

    因此我们可以说模型的准确性为70%,误差为30%。

    还想获得更多相关内容?:有关医学检验假阳性和假阴性的新闻

    请点击查看 医学测试当中的预测价值

    非常感谢您的阅读!

    展开全文
  • 维基百科中对 Type Ⅰ Type Ⅱ error的解释是: type I error is the rejection of a true null hypothesis (also known as ‘False Positive’) type II error is failing to reject a false null...

    第一类错误和第二类错误

    假设检验(hypothesis testing)是数理统计中根据一定的假设条件,由样本来推测总体的一种方法。假设检验实际上是一种反证法的思想,常见的做法是先构建统计量,然后在假设H0H_{0}下,统计量往往有一个分布,当我们计算出统计量处于分布的小概率区域中时,我们就可以说H0H_{0}假设是小概率事件,可以拒绝零假设。常见的假设检验的方法有u-检验法、t检验法、卡方检验、F-检验、秩和检验等。

    维基百科中对 Type Ⅰ和 Type Ⅱ error的解释是:

    type I error is the rejection of a true null hypothesis (also known as ‘False Positive’)
    type II error is failing to reject a false null hypothesis (also known as ‘False Negative’)

    从字面上来进行理解,第一类错误就是原假设H0H_{0}是正确的,但是拒绝了它;第二类错误就是原假设H0H_{0}是错误的,但是接受了它。

    再加上知乎上对于第一类和第二类错误的几种形象解释来加深一下印象:

    例子一:

    出自作者:马志阳
    链接:https://www.zhihu.com/question/20993864/answer/81244176

    按照平时的习惯,对于原假设我们一般都是拒绝的,所以对原答案进行了一点修改:
    假设检验就好比谈恋爱,你需要推测这个男生是否是真心爱你的,所以需要作出下面的假设:

    H0H_{0}:他不是一个真心爱你的男生
    H1H_{1}:他是一个真心爱你的男生

    如果H0H_{0}实际上成立,而你凭借经验拒绝了这假设,也就是你和这个不爱你的男生在一起了,这样就是犯了第Ⅰ类错误。

    如果H0H_{0}实际上不成立,而你接受了这个假设,也就是你失去了和一个真正爱你的男生在一起的机会,这样就是犯了第Ⅱ类错误。

    如果要同时减少犯第一类错误和第二类错误的概率,那就只能通过增加恋爱的次数nn,比如一个经历过n=100n=100次恋爱的女生,第101次恋爱犯第一类错误和第二类错误的概率就会小很多了。

    例子二

    出自作者:DDTemp
    链接:https://www.zhihu.com/question/20993864/answer/93762491

    先提出假设:

    H0H_{0}: He/She are not pregnant
    H1H_{1}: He/She are pregnant

    对应图中的描述,左图中,错误的拒绝了H0H_{0}假设,所以说犯了第一类错误;右图中,错误的接受了H0H_{0}假设。

    补充

    1、第一类错误的概率就是错误地拒绝了原假设的概率,也就是p-value。
    2、第一类错误和第二类错误是负相关的,即第一类错误概率大,第二类错误概率就小,但是两者的概率之和不是1,否则的话犯错的概率就是1了。

    REF

    https://blog.csdn.net/weixin_34226182/article/details/86400139
    https://www.zhihu.com/question/20993864/answer/93762491
    https://www.zhihu.com/question/20993864/answer/81244176

    展开全文
  • Type I 错误和 Type II错误

    千次阅读 2007-11-08 13:14:00
    最近看人脸检测的论文,遇到两个词不知其意:false-positive rate false-negative rate。最后查wikipedia才知道...对于正例,分类器可能正确的将其分类为正例,也可能错误的拒绝了这个样例,对于反例也是一样。false
  • 最近看人脸检测的论文,遇到两个词不知其意:false-positive rate false-negative rate。最后查wikipedia才知道...对于正例,分类器可能正确的将其分类为正例,也可能错误的拒绝了这个样例,对于反例也是一样。false
  • 因此,必须在 .C .H 文件中定义。这种重复的定义很容易导致错误。以下讨论的方法只需用在头文件中定义次。虽然有点不易懂,但用户一旦掌握,使用起来却很灵活。表1.2中的 定义出现在定义所有全局变量的.H头文件...
  • II类错误和检验效能 如果我们想回答这样个问题:“当备择假设实际上是正确的时候,我们有多大可能拒绝原假设”,换句话说,我们检测出真实效果的可能性是多少?我们面临着个不同的问题。要回答这些问题我们需要...
  • 安装时发生严重错误”之的,捣鼓了老半天,在网上找了一下,好像跟个叫“Windows Process Activator Service(Windows进程激活服务)”有关。于是,在功能里面把“Windows进程激活服务”“.NET”的那个都删掉...
  • 、伪阳性伪阴性1. 伪阳性----I型错误,伪阴性---II错误。2. II错误要比I型错误严重的多二、混淆矩阵In [ ]:### y 预测 0 1 In [ ]:### y实际 0 35 5 In [ ]:### 1 10 50 5位I型错误(伪阳),10为II型...
  • 代码语法错误分析工具pclint8.0

    热门讨论 2010-06-29 07:00:09
    该类选项是用于禁止生成某类错误信息的选项,最常用的是-e+e,-e是禁止生成某类错 误信息,+e是恢复生成某类错误信息。运行lint目录下的msg.exe可以得到msg.txt文件, 这个长达5000行的文件包含了所有的错误...
  • Quartus_II使用教程

    热门讨论 2012-11-26 23:20:43
    生成设计图名字一样的bsf文件,即为打包的芯片。 在memory设计图中,双击空白处,输入cdu16(名称为刚才自行设计模块的文件名) 就可以调出自己打包的芯片,也可以双击后在project中点选,如图10. 图...
  • 管家婆辉煌版II top+10.3 内含单机版网络版的pojie补丁注册机,本人已经测试很稳定。比之前的版本添加了一些功能,也更人性化。注:本软件来自网络,我只是软件的搬运工。下载仅做测试。 立即下载 1积分/C币时间...
  • 种数据结构,可以包括:数据成员(常量字段),函数成员(方法、属性、事件、索引,操作符、实例构造函数、析构函数静态构造函数),以及嵌套。 抽象:abstract修饰符可以用来指明是不完整的,...
  • 为期末考试,冲鸭—— 1、在计算机运行时,把程序数据一样存放在内存中,这是1946年由_____领导...5、下列叙述中,错误的是___。 A .Apple II是个人计算机 B.IBM PC是个人计算机 C.个人计算机词由IBM PC而来 D.计算机
  • 参考课程辅导书《构建之法》可以知道...使用goto,错误处理,设计等),制定代码规范是合作编程中不可缺少的环,对于增强结对编程效率,提高代码可读性有着重要的意义。 在此基础上对以下观点作出回应 ...
  • 深入理解JAVA异常异常处理机制

    千次阅读 多人点赞 2020-06-15 21:45:42
    目录()什么是异常异常处理(二)异常的分类(三)异常处理机制(3.1)try-catah语句(3.2)调试代码(四)自定义异常(4.1)自定义异常概述(4.2)调试代码 ()什么是异常异常处理 异常:程序不正常...
  • 线性模型分析原理》第版第次印刷 刊误表 页 码 (行) 错误 更正 ii 倒6行 许海明 徐海明 P2 倒7行 随机变量有二 通常研究的随机变量有二 P2 第4行 如果事件A事件B为独立事件 下移2行 P2 第5行 事件A发生...
  • 笔试刷题必备------ 排序搜索笔试刷题必备------ 排序搜索合并两个有序数组前 K 个高频元素数组中的第K个最大元素颜色分类第错误的版本寻找峰值在排序数组中查找元素的第最后个位置合并区间搜索二维...
  • 假设检验原假设 H0H_0 对立假设H1H_1 简单假设:假设为个值 复合假设:没有确定值,假设变量在个范围内... 犯II类错误的概率定义为置信系数 1−β1-\beta (β\beta 为α\alpha呈正相关的个系数,原来错了 感
  • 在进行假设检验时,分别提出原假设(Null Hypothesis)备择假设(Alternative Hypothesis),检验结果可能出现的两类错误: 原假设实际上是正确的,而检验结果却拒绝原假设,称为第一类/第一型错误(Type I ...
  • c# 加密解密相关代码

    热门讨论 2011-09-06 11:04:59
    在第个GroupBox 中放入3 个TextBox 控件和一个Button 按钮,分别用于输入数字、输入加密数字、显示加 密后的数字计算加密信息;在第二个GroupBox 中放入个TextBox 控件和一个Button 按钮,分别用于显示 解密后...
  • Precision & Recall

    2016-03-03 19:58:27
    模式识别 & 信息检索领域中的二分类问题中:Precision:识别样本中,相关的样本比例; Recall:相关样本中,识别的样本比例;...Recall = 4/9precision & recall 分别于第I类II类错误;上例中包含了3个第I类错误
  • jstat-示例 使用示例 实例图 机器学习 ... :II错误和样本量 :模拟中心极限定理 :采样分布 蒙特卡洛 :Monty Hall问题的蒙特卡洛模拟 :使用蒙特卡洛积分计算圆的面积 :马尔可夫链蒙特卡
  • springboot参考指南

    2016-07-21 12:00:22
    ii. 2. 获取帮助 iii. 3. 第步 iv. 4. 使用Spring Boot v. 5. 了解Spring Boot特性 vi. 6. 迁移到生存环境 vii. 7. 高级主题 3. II. 开始 i. 8. Spring Boot介绍 ii. 9. 系统要求 i. 9.1. Servlet容器 iii. 10. ...
  • 在基于相机的成像中,拍摄错误曝光的照片仍然是个主要的错误来源。曝光问题可分为以下两: •(i)曝光过度,相机曝光时间过长,导致图像区域变亮褪色; •(ii)曝光不足,曝光时间太短,导致图像区域变暗。 ...
  • R-S(Reed-Solomon)码是一类纠错能力很强的特殊的非二进制BCH码,能应对随机性突发性错误,广泛应用于各种通信系统中和保密系统中。R-S(255,223)码能够检测32字节长度纠错16字节长度的连续数据错误信息。

空空如也

空空如也

1 2 3 4 5 6
收藏数 103
精华内容 41
热门标签
关键字:

一类错误和ii类错误