精华内容
下载资源
问答
  • 误检:f_r = fp/(fp+tn) 精确(precision):p_r= tp/(tp+fp) 召回:r_rate= tp/(tp+fn) 漏检率:fn/(fn+tp)

    误检率:f_r = fp/(fp+tn)
    精确率(precision):p_r= tp/(tp+fp)
    召回率:r_rate= tp/(tp+fn)
    漏检率:fn/(fn+tp)

    展开全文
  • Recall(检出率)和 Precision(准确率)

    千次阅读 2014-07-23 21:15:38
    浅显易懂的理解,用下面的图片和公式最好不过。 那么 - 召回R:用检索到相关文档数作为分子,所有相关文档总数作为分母,即R = A / ( A + C ) - 准确P:用检索到相关文档数作为分子,所有检索...

    这两个名词是模式识别和信息检索中用到的度量值。


    浅显易懂的理解,用下面的图片和公式最好不过。



    那么

    - 召回率R:用检索到相关文档数作为分子,所有相关文档总数作为分母,即R = A / ( A + C )
    准确率P:用检索到相关文档数作为分子,所有检索到的文档总数作为分母.即P = A / ( A + B ).

    展开全文
  • 浅显易懂的理解,用以下的图片和公式最好只是。 那么 - 召回R:用检索到相关文档数作为分子。全部相关文档总数作为分母。即R = A / ( A + C ) - 准确P:用检索到相关文档数作为分子。全部检索...

    这两个方面是模式识别和信息检索使用措施值。


    浅显易懂的理解,用以下的图片和公式最好只是。



    那么

    - 召回率R:用检索到相关文档数作为分子。全部相关文档总数作为分母。即R = A / ( A + C )
    准确率P:用检索到相关文档数作为分子。全部检索到的文档总数作为分母.即P = A / ( A + B ).

    版权声明:本文博客原创文章,博客,未经同意,不得转载。

    展开全文
  • 一些标准指标的计算true positive rate (tp rate)【真阳性】, or hit rate 【命中】, or recall 【召回】:false positive rate (fp rate) 【假阳性】, or false alarm rate:sensitivity【灵敏度】:...

    误报率、故障检测率、漏报率、虚警率、误警率等指标异同及计算公式

    1. 一些标准指标的计算

    参考论文:Fawcett T. An introduction to ROC analysis[J]. Pattern Recognition Letters, 2006, 27(8): 861–874.

    谷歌学术显示这篇文章引用量有一万四千多,应该是比较权威经典的。

    下面这部分相关指标的定义是从该论文中摘抄出来的

    中括号【】内的【中文】,是自己根据相应英文含义加的

    True class 【真实类别】 True class 【真实类别】
    p 【阳性】 n 【阴性】
    Hypothesized class 【预测类别】 Y 【阳性】 TP(True Positives) 【真阳性】 FP(False Positives) 【假阳性】
    Hypothesized class 【预测类别】 N 【阴性】 FN(False Negatives) 【假阴性】 TN(True Negatives) 【真阴性】

    注:Hypothesized class直接翻译好像是“被假定的类别”,不太清楚是什么意思,个人认为应该是指“预测类别”。

    true positive rate (tp rate)【真阳性率】, or hit rate 【命中率】, or recall 【召回率】:

    tp rate=TPTP+FNPositives correctly classified 【被正确分类的阳性数目】 Total positives 【总阳性数目】  \textrm{tp rate}=\frac{TP}{TP+FN}\approx\frac{\textrm{Positives correctly classified 【被正确分类的阳性数目】 }}{\textrm{Total positives 【总阳性数目】 }}

    注:关于上面是约等号的问题,首先,原文说的是用后面这部分的公式去估计tp rate,个人想法是,前面的计算公式是理论公式,后面公式是用实验的结果来估计的意思吧。

    false positive rate (fp rate) 【假阳性率】, or false alarm rate:

    fp rate=FPFP+TNNegatives incorrectly classified【被错误分类的阴性数目】Total negatives【总阴性数目】 \textrm{fp rate}=\frac{FP}{FP+TN}\approx\frac{\textrm{Negatives incorrectly classified【被错误分类的阴性数目】}}{\textrm{Total negatives【总阴性数目】}}

    sensitivity【灵敏度】:

    sensitivity=recall \textrm{sensitivity=recall}

    specificity【特异度】:

    specificity=True negatives【真阴性】 False positives【假阳性】+True negatives【真阴性】=1fp rate \textrm{specificity}=\frac{\textrm{True negatives【真阴性】 }}{\textrm{False positives【假阳性】+True negatives【真阴性】}}=1-\textrm{fp rate}

    precision【精确度】:

    precision=TPTP+FP \textrm{precision}=\frac{TP}{TP+FP}

    accuracy【准确度】:

     accuracy=TP+TNTP+FN+TN+FP \textrm{ accuracy}=\frac{TP+TN}{TP+FN+TN+FP}

    F measure【F值】:

     F measure=21precision+1recall \textrm{ F measure}=\frac{2}{\frac{1}{\textrm{precision}}+\frac{1}{\textrm{recall}}}

    2. 在化工等领域的故障检测中相关指标计算

    以下是个人的理解,没有特意参照某篇论文,如有不同意见或错误,欢迎指出。

    在故障检测里,因为只是故障检测,并不会区分故障1或者故障2,而是统统当成故障这一类别。

    所以,将故障定义为阳性P,正常定义为阴性N,例如,故障1是阳性P,故障2也是阳性P。

    那么故障检测中,常用的相关指标定义如下:

    故障检测率(fault detection rate,FDR):

    FDR=被正确检测的故障(即故障被成功预测成故障)数目 故障总数目=TPTP+FN=tp rate \textrm{FDR}=\frac{\textrm{被正确检测的故障(即故障被成功预测成故障)数目 }}{\textrm{故障总数目}}=\frac{TP}{TP+FN}=\textrm{tp rate}

    因此,故障检测率与召回率、真阳性率是同一个计算公式,同一个含义。

    故障L的故障检测率

    故障L故障检测率 =被正确检测的故障L(即故障L被成功预测成故障)总数 故障L总数目 \textrm{故障L故障检测率 }=\frac{\textrm{被正确检测的故障L(即故障L被成功预测成故障)总数 }}{\textrm{故障L总数目}}

    其中,L是具体某类故障的标签。因此论文中,谈到“不同故障检测率”,用的是故障L的故障检测率公式。而“平均故障检测率”就是在不区分故障几的情况下计算的结果,即用的FDR或tp rate计算。

    所以,如果在“fault detection rate”的讨论环境中,存在着不同故障,那用的是故障L的故障检测率公式。如果没有区分故障,那么指的就是原来的含义,不过,为了说明的更清楚,一般采用“average fault detection rate”,即平均故障检测率,所以,这样也算是作了相应的区分了。

    论文示例 1:

    来源:Lv F, Wen C, Bao Z, et al. Fault diagnosis based on deep learning[C]. 2016 American Control Conference (ACC). Boston, MA, USA: IEEE, 2016: 6851–6856.

    这个讨论的是平均故障检测率:
    在这里插入图片描述

    论文示例 2:

    来源:Zhang X, Kano M, Li Y. Principal Polynomial Analysis for Fault Detection and Diagnosis of Industrial Processes[J]. IEEE Access, 2018, 6: 52298–52307.

    这个讨论的是各故障的检测率,用的是故障L的故障检测率公式,左边第一列是21种故障:
    在这里插入图片描述

    误报率(false alarm rate,FAR)、虚警率、误检率:

    FAR=误报成故障的正常样本数目正常总数目=FPFP+TN=fp rate \textrm{FAR}=\frac{\textrm{误报成故障的正常样本数目}}{\textrm{正常总数目}}=\frac{FP}{FP+TN}=\textrm{fp rate}

    误报的含义肯定是指正常被误报成故障(真实类别为正常,预测类别为故障),显然不会有故障误报成正常这一说法,只有故障漏报成正常的说法。

    因此,误报率是与假阳性率同一个计算公式,同一个含义

    关于虚警率这个指标的问题,个人认为,完全是翻译的问题。

    毕竟,false alarm rate 这个词,字面意思,假的警报比率,翻译成“误报率”、“虚警率”都是合理的翻译,甚至翻译成“误警率”,“虚报率”字面意思好像也完全说的通的,只是可能没有人这么说。

    在百度翻译中,“虚警率”甚至被翻译成了“false positive rate”,即“假阳性率”了(而上面公式表明误报率和假阳性率确实是一样的)。

    而在谷歌翻译中,“虚警率”被翻译成“false alarm rate”,而“false alarm rate”再翻译回中文时又成“误报率”了。

    个人猜测,会不会是不同领域的故障检测的研究人员,由于侧重点不同或者什么原因,在翻译“false alarm rate”时,分别翻译成了“误报率”、“虚警率”、“误检率”之类的名称了,所以导致存在不同的翻译名称,但计算公式和含义是完全一样的。

    漏报率(missing alarm rate,MAR)、漏检率、漏警率:

    MAR=漏报为正常的故障数目故障总数目=FNTP+FN \textrm{MAR}=\frac{\textrm{漏报为正常的故障数目}}{\textrm{故障总数目}}=\frac{FN}{TP+FN}

    个人认为,漏报率、漏检率、漏警率等也是不同领域的翻译问题,它们其实是一样的。

    故障L的漏报率:

    故障L漏报率=漏报为正常的故障L数目故障L总数目 \textrm{故障L漏报率}=\frac{\textrm{漏报为正常的故障L数目}}{\textrm{故障L总数目}}

    因此漏报率也可以分成“平均故障漏报率”和“故障L漏报率”。不过好像没见过用“平均故障漏报率”这一说法的。

    漏报率这一指标,在使用时,存在和检测率一样的使用规则。

    论文示例 3:

    来源:Shi L, Tong C, Lan T, 等. Statistical process monitoring based on ensemble structure analysis[J]. IEEE/CAA Journal of Automatica Sinica, 2018: 1–8.

    这个漏报率实际是各故障的漏报率,用的故障L的漏报率计算公式
    在这里插入图片描述

    显然,这个漏报率+故障检测率=1,或者说平均漏报率+平均故障检测率=1,再或者说故障L漏报率+故障L故障检测率=1

    因为和为1,所以,用故障检测率,一般就不用漏报率,反之亦然。

    而“精确度”、“准确率”、“错误率”这类指标,在故障检测上一般没见使用,可能是这类指标会受到不同类别数目的影响,所以,在该领域讨论意义不大。

    3. 在化工等领域的故障检测中哪个指标说法更专业?

    误报率、故障检测率、false alarm rate、fault detection rate

    阅读了一些该领域中的中英文论文,包括国内的硕博论文。

    中文论文中,大家基本都是用的误报率、故障检测率这两个指标。用漏报率的比较少。用“虚警率”这类说法的几乎没有看到过。

    个别人用了故障准确率等类似的说法,但是个人认为这一说法并不好,不知道什么意思,容易有歧义,也没看到它的计算公式,通过文章上下文,个人猜测,大概是故障检测率的意思吧。

    英文论文中,一般都是用false alarm rate、fault detection rate,用missing alarm rate也有,但比较少见。

    所以,个人认为,在化工过程的故障检测中,用误报率、故障检测率比用“虚警率、漏警率”更专业些。如有需要,不用故障检测率,用漏报率也是可以的。

    4. 上述论述得到的结论

    在 故障定义为阳性,正常定义为阴性 的前提下。

    结论① 故障检测率=真阳性率=召回率

    结论② 误报率=假阳性率

    结论③ false alarm rate=误报率=虚警率=误检率等名称(纯粹是翻译不同)

    结论④ missing alarm rate=漏报率=漏警率=漏检率等名称

    结论⑤ 漏报率+故障检测率=1

    结论⑥ 在化工等领域的故障检测中,用“误报率(false alarm rate)、故障检测率(fault detection rate)”是比较通用、比较专业的说法。

    展开全文
  • 两组数据,其中一组叫上部,另一组叫下部。上部249个数据,下部499个数据。...注释:其实这三个名词儿就已经体现它这个东西了,准确那肯定就是都是对的,就是检测出来都是对的那些数量总数比;精确就是在它
  • 目录 1.二分类评价标准介绍 2. Tensorflow实现代码 ...正确(Accuracy)表示政府样本被正确分类的比例,计算公式如下: 其中NTP表示正类样本被正确分类的数目,NTN表示负类样本被正确分类的数目,NFP表示负...
  • 在设计控制图时,需要了解-控制限的计算公式-合理子组原则我们本篇继续探讨子组样本量大小和抽样频率。在前几篇内容得知,考虑控制限的计算(比如均值极差图),为了用样本极差对标准差进行有效的估计,子组样本量可以...
  • 召回:(Recall Ratio,简称R)是衡量信息检索系统在实施某一检索作业时检出相关文献能力的一种测度指标,其计算方法为:Recall=检出的相关文献量/检索系统中的相关文献总量. 准确:(Precision Ratio,简称P)是...
  • 计算机组成原理重点总结(学习笔记)含计算公式

    千次阅读 多人点赞 2020-07-24 17:55:05
    ②海明(汉明)检验码:可检出错位位置 ③循环冗余校验(CRC)码:可检出错误位置(通过除法运算) 原码、反码、补码、移码 1、原码、补码、反码三种机器数的最高位均是符号位。 2、当真值为正时,原码、补码、反码...
  • 由图中可以看出,当信号淹没在噪声中时,通过脉冲压缩及相关检测可以到10 km 处的目标,经MATLAB仿真解算的距离符合实际情况,说明该方案可以实现目标的距离测量。 图4 脉冲压缩测距仿真结果 5 结论 本文在分析...
  • 而B_sweep的计算公式为: delta_r为距离分辨率 Doppler Estimation Doppler effect 雷达的速度估计是基于一种古老的现象, 叫做多普勒效应. 多普勒效应是波源和观察者有相对运动时, 观察者接受到波的频率与波源发出...
  • 片式电感的应用场合主要有: 射频(RF)和无线通讯,信息技术设备,雷达波器,汽车电子,蜂窝电话,寻呼机,音频设备,PDAs(个人数字助理),无线遥控系统以及低压供电模块等。片式磁珠的应用场合主要有: 时钟发生...
  • 2、并发用户数的计算公式 系统用户数:系统额定的用户数量,如一个OA系统,可能使用该系统的用户总数是5000个,那么这个数量,就是系统用户数。 同时在线用户数:在一定的时间范围内,最大的同时在线用户数量。 同时...
  • 无线电波在介质中的传播速度计算公式  首先介绍介质天线, 介质天线是为了使接收天线小型化而设计的。所以有必要了解一下电磁波在不同介质中的传播速度的计算方法,以便于确定不同介质材料中天线振子的长度。...
  • 通过贝叶斯公式计算阳性概率

    千次阅读 2020-01-07 16:16:08
    已知某病发病5%,假阴5%,假阳5%,如果一个人检出了阳性结果,那么他患该病的可能性有多大? 首先需要说明,假阳就是把没病的检成有病的,假阴就是把有病的检成没病的。 然后搬出贝叶斯公式: p(x∣y)=p(x)∗...
  • 查全率(R)是测量检索系统检出相关文献能力的一种尺度,指系统检出的相关文献数(w)与系统信息库中存储 相关文献数(x)之比,用公式可表示为 查全率计算方法 R=w/x 查准率概念: 查准率(P)是检测检索系统...
  • 我们可以很自然的想到准确,准确的定义是预测正确的结果占总样本的百分比,其公式如下: 准确=(TP+TN)/(TP+TN+FP+FN),错误则是,1-准确 虽然准确可以判断总的正确,但是在样本不平衡的情况下...
  • 目录1、常见的几种预测情况2、精确和召回(Precision And Recall)3、F1-分数(F1-Score)4、其他常见性能评价指标 1、常见的几种预测情况 TP ,True Positive,表示把正类预测为正类 TN,True Negative,表示把负类...
  • 贝叶斯公式

    千次阅读 2018-08-03 09:54:34
    即使被医院检测为阳性,实际患病的概率其实还不到10%,有很大可能是假阳性,往往需要复检来确定是否真的患病,让我们再来计算和复检结果都为阳性时,患病的可能性。假设两次检查的准确相同,都是99%,这里令 B...
  •    ... anchor boxes用来预测bounding box,faster rcnn中用128*128,256*256,512*512,分三个尺度变换1:1,1:2,2:1,共计9个anchor来预测框,每个anchor预测2000个框左右,使得检出率提高很...
  • 方法1:使用病死率计算查明率 (Approach 1: Using the Case Fatality Ratio to Calculate Ascertainment) The first approach applies the novel methodology used by researchers at the Centre for the ...
  • 在概率论与数理统计中,有两个相当重要的公式——全概率公式与贝叶斯公式。然而很多人对这两个公式感到非常迷茫。一来不知道公式背后的意义所在,二来不知道这些冰冷的公式能有什么现实应用。 1. 全概
  • 右下角为 recall 召回 查全,顾名思义,就是实际的正样本中,有多大比例被检出了 在图中有标记,阴阳,真假。 真/假 阴/阳性中,阴阳性是指的分类器的判断结果是阴性还是阳性,而真假指代的是是否和真是...
  • 软件性能测试的基本概念和计算公式 一、软件性能的关注点 二、软件性能的几个主要术语 1、响应时间:对请求作出响应所需要的时间 2、并发用户数的计算公式 3、吞吐量的计算公式 4、性能计数器 5、思考时间的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 2,971
精华内容 1,188
关键字:

检出率计算公式