精华内容
下载资源
问答
  • 置信度

    2021-04-15 14:53:38
    https://blog.csdn.net/weixin_43384257/article/details/100974776

    https://blog.csdn.net/weixin_43384257/article/details/100974776
    在这里插入图片描述

    展开全文
  • 题目: 基于置信度校正可信图神经网络会议: NeurIPS 2021论文地址:https://arxiv.org/abs/2109.14285自信点,我的GNN们图神经网络 (GNN) 卓...

    7f444fb397d9895535caf2c78eb44dfa.png

    题目: 基于置信度校正可信图神经网络

    会议: NeurIPS 2021

    论文地址:https://arxiv.org/abs/2109.14285

    自信点,我的GNN们

    图神经网络 (GNN) 卓越的性能已经广受关注,但其预测结果是否值得信赖却有待探索。之前的研究结果表明,许多现代神经网络对其预测具有过度自信的现象。然而与之不同的是,我们发现 GNN对其预测结果却呈现出欠自信的现象。因此,要想获得一个可信的GNN,亟需对其置信度进行校正。在本文中,我们设计了一种拓扑感知的后处理校正函数,并由此提出了一种新颖的可信赖 GNN 模型。具体来说,我们首先验证了图中的置信度分布具有同质性的特点,由此启发我们再次利用GNN模型来为分类GNN模型学习校正函数(CaGCN)的想法。CaGCN 能够为每个节点学习到一种从分类 GNN 的输出到校正后的置信度的唯一转换,同时这种转换还能够保留类间的序关系,从而满足保存精度的属性。此外,我们还将CaGCN应用于自训练框架,结果表明可以通过对置信度进行校正获得更可信的伪标签,从而并进一步提高性能。我们通过大量实验证明了我们提出的模型在置信度校正方面和在提高分类准确率方面的有效性。

    总结(2-1-1):

    • 2种现象:GNN的预测结果具有欠自信现象;好的置信度分布具有同质性现象;

    • 1个模型:CaGCN

    • 1类应用:置信度调整后的GNN可以有效应用于自训练框架

    1 引言

    图数据在现实世界中是无处不在的,而图神经网络(GNNs)已经在多种图(graph)数据相关的任务中拥有了卓越的性能。然而在许多现实世界的应用中,高预测准确率并不是我们唯一的追求。例如在许多安全相关的应用中,更渴望获得一个可信的模型。这里的可信指得是模型对预测的置信度可以真实地反映出模型预测的准确率。如果这两者相等,我们称其是校正的,这代表模型是可信的。事实上,深度学习中模型的校正能力早已经在如计算机视觉、自然语言处理等多个领域内被探索过,其结论是现代神经网络大多数是没有被校正的,并且对其预测是过于自信的。然而,还并没有人探究过图领域中模型的校正能力。所以,现有的图神经网络模型的校正能力到底如何呢,模型是否也对其预测过于自信呢?

    带着这个问题,我们对节点分类任务中模型的校正能力进行了实验探究。实验结果如图1所示,其中横坐标代表模型(GCN或者GAT)预测的置信度,取值范围为[0,1],我们将其划分为20等份,纵坐标代表相应置信度区间的平均分类准确率。一般来说,如果模型已经被完美的校正,其置信度应该近似等于该区间的平均分类准确率,换句话说,图1中的蓝色柱(实际输出)应与红色柱(期望输出)对齐。但是我们发现,实际上在大部分情况下,蓝色柱高于红色柱,这说明模型的分类准确率高于其置信度,模型对其预测是不自信的。这与其他领域中的结论正好相反。

    19229ec34c0c00cbb05f81fc2ecd89e7.png

    图1 GCN和GAT在Cora、Citeseer、Pubmed、CoraFull数据集上的可靠性直方图。

    此外,我们可视化了节点的置信度分布,如图2所示,其中横坐标代表置信度,纵坐标代表对该置信度下节点数量的密度估计。从图2中我们可以明显观察到,许多预测正确(蓝色)节点的置信度分布在低置信度区间中。这可以部分解释我们上面结论,即图模型是不自信的。

    5a6199259f324fbe73a0d5bbe71f58c8.png

    图2 GCN和GAT在Cora、Citeseer、Pubmed、CoraFull数据集上的置信度分布

    接下来,我们将提出图领域中置信度的校正方法——CaGCN。

    2 方法

    给定一个graph 的邻接矩阵 和其特征矩阵 ,对于一个层GCN来说,其输出可以通过如下方法得到:

    其中 代表GCN的第层的权重,代表激活函数。接下来我们设计的置信度校正函数应该满足如下三个属性:(1)考虑网络拓扑 (2)是一个非线性函数 (3)能保存分类GCN的分类精度。

    基于GCN设计的校正函数

    我们假设在一个graph中,节点置信度的ground-truth分布应该满足同配(homophily)属性。我们首先设计实验验证了这一点,即利用一个经典的校正函数 tenperature scaling (TS) 对分类模型GCN的每个节点的置信度进行校正,然后计算这些节点置信度的总变差,结果如图3所示。显然,相比于没有校正(Uncal.)的情况,校正后的置信度的总变差有了明显的下降,这证明了我们假设的正确性。考虑到GCN天然可应用于高同配性图,具有平滑邻居节点信号的能力,我们利用另一个GCN作为我们的校正函数,我们称其为CaGCN。

    4b27da71a082e247c7134cf98c847c96.png

    图3 graph中置信度的同配性验证实验

    具体来说,CaGCN以分类GCN的输出作为输入,输出校正后的每一个节点的置信度,如下所示:

    其中是softmax算子。可以看到,CaGCN能够学习到一种非线性变换,并且将网络拓扑考虑在内。但是,我们也可以注意到,由于CaGCN是一种非线性变换,对任意节点,它并不能保证和的类间序关系是一致的。换句话说,它并不能保持分类GCN的分类精度。针对这一点,接下来我们将对CaGCN进行改进。

    精度保存的属性

    首先,我们对一般的精度保存的校正函数进行了研究,提出了如下理论:

    理论一:对于一个校正函数,一维函数以及节点的输出,如果是一个严格保序函数并满足

    则是可以保存分类模型的精度。

    Temperature scaling(TS)就是一个最简单的精度保存的校正函数,它用一个标量对所有节点的输出的所有维度做相同的变换:,这里的就是一个严格保序函数。因此我们可以借助TS的思想,对前面提出的CaGCN进行改进。具体来说,给定分类模型的输出,我们首先用CaGCN为每个节点学到一个,然后再进行TS变换。用公式可形式化的表示为:

    相比于公式(2)中未改进的CaGCN,公式(4)的CaGCN可以保存分类模型GCN的精度;相比于TS方法,其为每个节点学习到了一种非线性变换,同时在校正过程中将网络拓扑考虑在内。需要注意的是,相比于公式(2)中的模型,公式(4)施加了很强的约束,它迫使中所有的维度只能进行相同的变换,但是接下来我们将证明他们在置信度校正方面的相等性。事实上,我们只要证明公式(4)可以输出中的任意一个置信度值即可,如下:

    理论二:给定分类模型对任意节点的输出,假定对于的所有元素均不趋于无穷,则通过公式(4)得到的校正后的置信度可以取遍区间。

    到此,我们提出的CaGCN已经可以满足需要的全部属性,即(1)考虑网络拓扑 (2)是一个非线性函数 (3)能保存分类GCN的分类精度。接下来我们将讲述CaGCN的目标函数。

    优化目标

    前人已经证明了优化NLL loss(交叉熵loss)便可以对置信度校正进行优化,因此我们也将NLL loss作为损失函数:

    此外,由于NLL loss并不能直接减小错误预测的置信度,我们提出了一个正则化项:

    其中,和分别指正确和错误预测的数量,和指预测概率向量的最大值和次大值。最终,目标函数为:

    其中,为超参数。

    CaGCN整体的框架如图4所示,其中实线代表可以进行反向梯度传播的运算。我们首先利用训练集训练好一个分类GCN从而得到所有节点的输出,接下来以作为CaGCN的输入,利用验证集训练CaGCN。具体来说,首先将输入到CaGCN中得到每个节点的,然后对进行temperature scaling变换得到,即对于节点,,最后对做softmax变换并根据公式(5,6,7)得到目标函数,优化该目标函数从而更新CaGCN。

    a0475c096affc61b883758659974c20c.png

    图4 CaGCN的整体框架

    3 基于置信度校正的自训练方法

    这里我们额外提出一个置信度校正的实际应用,即将其用于改进GCNs中自训练方法。自训练指的是为无标签节点预测伪标签,然后选择部分高置信度节点连同伪标签加入到训练集,从而扩充训练集,改进模型性能的方法。由于GCNs普遍是不自信的,因此我们首先对GCN输出的置信度进行校正,然后再利用校正后的置信度选择无标签节点,从而更好利用正确的低置信的预测。我们将该方法称之为CaGCN-st。

    4 实验

    实验分为两部分,分别评估CaGCN在置信度校正方面的性能和CaGCN-st在提高模型分类准确率方面的性能,其中前者的评估指标是ECE,后者是Accuracy。两个实验均选择了Cora、Citeseer、Pubmed、CoraFull四个数据集,每个数据集选取了不同的标签率。实验结果如下:

    f0da0f7bd9fd659216e4adeed95d3960.png

    图5 CaGCN与其他置信度校正方法的结果对比(值越小代表性能越好)

    ffefd80656a59ba8bb41b7a262c4f360.png

    图6 CaGCN-st与其他自训练方法的结果对比(值越大代表性能越好)

    另外,我们还进行了CaGCN-st的消融实验,验证增加的置信度校正方法的有效性,结果如图7所示,其中GCN-st指没有置信度校正的普通自训练方法。

    28a0521966dba0b84f1f8c7860f1f8b8.png

    图7 自训练消融实验

    更多细节以及实验结果请参见:https://arxiv.org/abs/2109.14285

    本期责任编辑:王啸

    本期编辑:刘佳玮


    
     

    2de663fe3b10f3958181bd0db3ff6a03.png

    
     
    
     
    
     
    往期精彩回顾
    
    
    
    
    适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
    AI基础下载机器学习的数学基础专辑黄海广老师《机器学习课程》视频课

    本站qq群851320808,加入微信群请扫码:

    0f345c1056def529c6ff50bf911eb4ba.png

    展开全文
  • 置信度为95%的置信区间什么意思

    千次阅读 2021-02-06 11:19:09
    同时因为茄子本身有热毒,浸泡可以 2019-10-09阅读(87) 置信度也称为可靠度,或置信水平、置信系数,即在抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。因此,采用一种概率的陈述方法,也就是...

    2019-10-09阅读(72)

    前事不忘,后世之师。欲灭其国,必去其史!以人为鉴可以知得失,以史为鉴可以知兴替。灭人之国,必先去其史;灭人之枋,败人之纲纪,必先去其史;绝人之材,湮塞人之教,必先去其史;夷人之祖宗,必先去其史。龚自珍历史睡了,时间醒着;世界睡了,你们醒着~洛夫历史就在

    2019-10-09阅读(85)

    1、首先打开手机设置,找到更多设置,点击进入。2、然后在新的界面里,找到应用程序,点击进入。3、然后在新的界面里点击选择“出厂应用程序管理”选项。4、然后在新的界面里,找到LOCKScreen.apk,点击安装。5、然后在新的界面里选择安装,安装完成

    2019-10-09阅读(71)

    1,没有一个清洁的环境,再优裕的生活条件也无意义。------曲格平2,只有服从大自然,才能战胜大自然.——达尔文3、提高环境意识,保护美好家园。4,人们常常将自己周围的环境当作一种免费的商品,任意地糟蹋而不知加以珍惜.——甘哈曼5,大地给予所

    2019-10-09阅读(79)

    由于总结起来比较多,所以给你找了网址,希望根据你自己的需要进行筛选、、、、、、参考资料:http://www.fhzhangliang.com/Article_Show.asp?ArticleID=157

    2019-10-09阅读(87)

    置信度也称为可靠度,或置信水平、置信系数,即在抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。因此,采用一种概率的陈述方法,也就是数理统计中的区间估计法,即估计值与总体参数在一定允许的误差范围以内,其相应的概率有多大,这

    2019-10-09阅读(189)

    1、历史应是人类的教师。——赫尔巴特2、历史就在每一个人的生活中。——莎士比亚3、前事不忘,后世之师。——《战国策·赵策一》4、史乃"述往以为来者师也,经世之大略"。——王夫之5、究天人之际,通古今之变,成一家之言。——司马迁6、史

    2019-10-09阅读(67)

    置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidenceinterval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给

    2019-10-09阅读(91)

    ●端庄即至美,严肃乃极乐(威·沃森)●如果不保持一定程度的陌生感,就不会有出类拔萃的美----(培根)●不能说凡是合理的都是美的,但凡是美的确实都是合理的----(德国)●扬帆的航船,全副武装的男人和腹部隆起的孕妇,是世上最美的三种景象(詹·豪厄尔)●

    2019-10-09阅读(56)

    1人生的旅途,前途很远,也很暗。然而不要怕,不怕的人的面前才有路。——鲁迅2人生像攀登一座山,而找寻出路,却是一种学习的过程,我们应当在这过程中,学习稳定、冷静,学习如何从慌乱中找到生机。——席慕蓉3做人也要像蜡烛一样,在有限的一生中有一

    2019-10-09阅读(60)

    EMUI3.1:请点击桌面>实用工具>一键锁屏EMUI4.0:升级到B398版本后开始支持,请在桌面上双指捏合,点击窗口小工具,找到一键锁屏并将其拖动到桌面上。EMUI5.0:长按屏幕空白处,点击“窗口小工具”,然后拖动“一键锁屏”窗口到主屏幕中。打开“设置”,

    2019-10-09阅读(56)

    利于国者爱之,害与国者恶之。——晏婴乐以天下,忧以天下。——孟子生于忧患,死于安乐.——孟子身既死兮神以灵,魂魄毅兮为鬼雄!——屈原岂余身之惮殃兮,恐皇舆之败绩。——屈原长太息以掩涕兮,哀民生之多艰。——屈原苟利国家,不求富贵。——《

    2019-10-09阅读(88)

    1、八百里秦川物华天宝,五千年历史人杰地灵。2、秋风吹渭水,落叶满长安。3、修竹挼蓝,梅山耸翠,小小佳处西安。4、忆长安,九月时(范灯《忆长安;九月》)5、一为迁客去长沙,西望长安不见家(李白《与史郎中饮听黄鹤楼上吹笛》)6、长相思,在长安(李白《

    2019-10-09阅读(64)

    手机自带一键锁屏功能。长按屏幕空白处,点击“窗口小工具”,然后拖动“一键锁屏”窗口到主屏幕中。悬浮按钮也有一键锁屏选项,请打开“设置”,点击“智能辅助>悬浮按钮”,然后打开“悬浮按钮”开关,点击“”锁定屏幕。

    2019-10-09阅读(75)

    茄子切好后水泡一下的好处:在茄子切好块后,只要稍微泡水就可以减少用油量。也都知道,茄子在切块后比较容易变黑,所以应该将切块后的茄子放在冷水或者低浓度的盐水中稍微浸泡一下,能够有效避免茄子块氧化变黑。同时因为茄子本身有热毒,浸泡可以

    2019-10-09阅读(87)

    置信度也称为可靠度,或置信水平、置信系数,即在抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。因此,采用一种概率的陈述方法,也就是数理统计中的区间估计法,即估计值与总体参数在一定允许的误差范围以内,其相应的概率有多大,这2019-10-09阅读(67)

    置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidenceinterval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给2019-10-09阅读(218)

    置信度也称为可靠度,或置信水平、置信系数,即在抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。因此,采用一种概率的陈述方法,也就是数理统计中的区间估计法,即估计值与总体参数在一定允许的误差范围以内,其相应的概率有多大,这2019-10-09阅读(151)

    信度主要是指测量结果的可靠性或一致性。置信度,也叫置信水平。它是指特定个体对待特定命题真实性相信的程度.也就是概率是对个人信念合理性的量度.概率的置信度解释表明,事件本身并没有什么概率,事件之所以指派有概率只是指派概率的人2019-10-09阅读(55)

    置信水平是指总体参数值落在样本统计值某一区内的概率,置信区间越大,置信水平不就越高吗?通俗点讲的话,置信水平即是指可靠度,也就是表征一个结论的正确程度,置信水平越高,结论越可靠。放在置信区间上来讲,置信水平表征实际值落在置信区间的概率2019-10-09阅读(70)

    所谓置信度,也叫置信水平。它是指特定个体对待特定命题真实性相信的程度.也就是概率是对个人信念合理性的量度.概率的置信度解释表明,事件本身并没有什么概率,事件之所以指派有概率只是指派概率的人头脑中所具有的信念证据。置信水平是2019-10-09阅读(127)

    置信水平是指特定个体对待特定命题真实性相信的程度,也就是概率是对个人信念合理性的量度。概率的置信度解释表明,事件本身并没有什么概率,事件之所以指派有概率只是指派概率的人头脑中所具有的信念证据。置信水平是指总体参数值落在样本统2019-10-09阅读(113)

    读音:zhìxìnqūjiān释义:置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidenceinterval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结

    展开全文
  • 题目: 基于置信度校正的可信图神经网络会议: NeurIPS 2021论文地址:https://arxiv.org/abs/2109.14285图神经网络 (GNN) 卓越的性能已经广受关...

    e5be111938499be7daeb85de746e8b6c.gif

    84035529c96f8c160b8d3414e9761d45.png

    题目: 基于置信度校正的可信图神经网络

    会议: NeurIPS 2021

    论文地址:https://arxiv.org/abs/2109.14285

    图神经网络 (GNN) 卓越的性能已经广受关注,但其预测结果是否值得信赖却有待探索。之前的研究结果表明,许多现代神经网络对其预测具有过度自信的现象。然而与之不同的是,我们发现GNN对其预测结果却呈现出欠自信的现象。因此,要想获得一个可信的GNN,亟需对其置信度进行校正。

    在本文中,我们设计了一种拓扑感知的后处理校正函数,并由此提出了一种新颖的可信赖 GNN 模型。具体来说,我们首先验证了图中的置信度分布具有同质性的特点,由此启发我们再次利用GNN模型来为分类GNN模型学习校正函数(CaGCN)的想法。CaGCN 能够为每个节点学习到一种从分类 GNN 的输出到校正后的置信度的唯一转换,同时这种转换还能够保留类间的序关系,从而满足保存精度的属性。

    此外,我们还将CaGCN应用于自训练框架,结果表明可以通过对置信度进行校正获得更可信的伪标签,从而并进一步提高性能。我们通过大量实验证明了我们提出的模型在置信度校正方面和在提高分类准确率方面的有效性。

    总结(2-1-1):

    • 2种现象:GNN的预测结果具有欠自信现象;好的置信度分布具有同质性现象;

    • 1个模型:CaGCN

    • 1类应用:置信度调整后的GNN可以有效应用于自训练框架

    9b526bf1d5abb7bbe09365fdf4e63e1b.png

    引言

    图数据在现实世界中是无处不在的,而图神经网络(GNNs)已经在多种图(graph)数据相关的任务中拥有了卓越的性能。然而在许多现实世界的应用中,高预测准确率并不是我们唯一的追求。例如在许多安全相关的应用中,更渴望获得一个可信的模型。这里的可信指得是模型对预测的置信度可以真实地反映出模型预测的准确率。如果这两者相等,我们称其是校正的,这代表模型是可信的。

    事实上,深度学习中模型的校正能力早已经在如计算机视觉、自然语言处理等多个领域内被探索过,其结论是现代神经网络大多数是没有被校正的,并且对其预测是过于自信的。然而,还并没有人探究过图领域中模型的校正能力。所以,现有的图神经网络模型的校正能力到底如何呢,模型是否也对其预测过于自信呢?

    带着这个问题,我们对节点分类任务中模型的校正能力进行了实验探究。实验结果如图1所示,其中横坐标代表模型(GCN或者GAT)预测的置信度,取值范围为[0,1],我们将其划分为20等份,纵坐标代表相应置信度区间的平均分类准确率。

    一般来说,如果模型已经被完美的校正,其置信度应该近似等于该区间的平均分类准确率,换句话说,图1中的蓝色柱(实际输出)应与红色柱(期望输出)对齐。但是我们发现,实际上在大部分情况下,蓝色柱高于红色柱,这说明模型的分类准确率高于其置信度,模型对其预测是不自信的。这与其他领域中的结论正好相反。

    0b75e76d5d88a207246cce4cdd9e5ffe.png

    图1. GCN和GAT在Cora、Citeseer、Pubmed、CoraFull数据集上的可靠性直方图

    此外,我们可视化了节点的置信度分布,如图2所示,其中横坐标代表置信度,纵坐标代表对该置信度下节点数量的密度估计。从图2中我们可以明显观察到,许多预测正确(蓝色)节点的置信度分布在低置信度区间中。这可以部分解释我们上面结论,即图模型是不自信的。

    6a176f0c57b8647c1e0caf25c94803ac.png

    图2 GCN和GAT在Cora、Citeseer、Pubmed、CoraFull数据集上的置信度分布

    接下来,我们将提出图领域中置信度的校正方法——CaGCN。

    75e9fe61d9bf1182440162093ea50623.png

    方法

    给定一个graph 的邻接矩阵 和其特征矩阵 ,对于一个层GCN来说,其输出可以通过如下方法得到:

    其中 代表GCN的第层的权重,代表激活函数。接下来我们设计的置信度校正函数应该满足如下三个属性:1)考虑网络拓扑;2)是一个非线性函数;3)能保存分类GCN的分类精度。


    基于GCN设计的校正函数

    我们假设在一个graph中,节点置信度的ground-truth分布应该满足同配(homophily)属性。我们首先设计实验验证了这一点,即利用一个经典的校正函数 tenperature scaling (TS) 对分类模型GCN的每个节点的置信度进行校正,然后计算这些节点置信度的总变差,结果如图3所示。显然,相比于没有校正(Uncal.)的情况,校正后的置信度的总变差有了明显的下降,这证明了我们假设的正确性。考虑到GCN天然可应用于高同配性图,具有平滑邻居节点信号的能力,我们利用另一个GCN作为我们的校正函数,我们称其为CaGCN。

    6ce24f0efa0bc541cba7ce6e678330ec.png

    图3. graph中置信度的同配性验证实验

    具体来说,CaGCN以分类GCN的输出作为输入,输出校正后的每一个节点的置信度,如下所示:

    其中是softmax算子。可以看到,CaGCN能够学习到一种非线性变换,并且将网络拓扑考虑在内。但是,我们也可以注意到,由于CaGCN是一种非线性变换,对任意节点,它并不能保证和的类间序关系是一致的。换句话说,它并不能保持分类GCN的分类精度。针对这一点,接下来我们将对CaGCN进行改进。

    精度保存的属性

    首先,我们对一般的精度保存的校正函数进行了研究,提出了如下理论:

    理论一:对于一个校正函数,一维函数以及节点的输出,如果是一个严格保序函数并满足

    则是可以保存分类模型的精度。

    Temperature scaling(TS)就是一个最简单的精度保存的校正函数,它用一个标量对所有节点的输出的所有维度做相同的变换:,这里的就是一个严格保序函数。因此我们可以借助TS的思想,对前面提出的CaGCN进行改进。具体来说,给定分类模型的输出,我们首先用CaGCN为每个节点学到一个,然后再进行TS变换。用公式可形式化的表示为:

    相比于公式(2)中未改进的CaGCN,公式(4)的CaGCN可以保存分类模型GCN的精度;相比于TS方法,其为每个节点学习到了一种非线性变换,同时在校正过程中将网络拓扑考虑在内。需要注意的是,相比于公式(2)中的模型,公式(4)施加了很强的约束,它迫使中所有的维度只能进行相同的变换,但是接下来我们将证明他们在置信度校正方面的相等性。事实上,我们只要证明公式(4)可以输出中的任意一个置信度值即可,如下:

    理论二:给定分类模型对任意节点的输出,假定对于的所有元素均不趋于无穷,则通过公式(4)得到的校正后的置信度可以取遍区间。

    到此,我们提出的CaGCN已经可以满足需要的全部属性,即(1)考虑网络拓扑 (2)是一个非线性函数 (3)能保存分类GCN的分类精度。接下来我们将讲述CaGCN的目标函数。

    优化目标

    前人已经证明了优化NLL loss(交叉熵loss)便可以对置信度校正进行优化,因此我们也将NLL loss作为损失函数:

    此外,由于NLL loss并不能直接减小错误预测的置信度,我们提出了一个正则化项:

    其中,和分别指正确和错误预测的数量,和指预测概率向量的最大值和次大值。最终,目标函数为:

    其中,为超参数。

    CaGCN整体的框架如图4所示,其中实线代表可以进行反向梯度传播的运算。我们首先利用训练集训练好一个分类GCN从而得到所有节点的输出,接下来以作为CaGCN的输入,利用验证集训练CaGCN。具体来说,首先将输入到CaGCN中得到每个节点的,然后对进行temperature scaling变换得到,即对于节点,,最后对做softmax变换并根据公式(5,6,7)得到目标函数,优化该目标函数从而更新CaGCN。

    6c1d260d92394657bf20f68bb6afd641.png

    图4. CaGCN的整体框架

    4ee23ff345df58df1d6fd4c92c33e4a1.png

    基于置信度校正的自训练方法

    这里我们额外提出一个置信度校正的实际应用,即将其用于改进GCNs中自训练方法。自训练指的是为无标签节点预测伪标签,然后选择部分高置信度节点连同伪标签加入到训练集,从而扩充训练集,改进模型性能的方法。由于GCNs普遍是不自信的,因此我们首先对GCN输出的置信度进行校正,然后再利用校正后的置信度选择无标签节点,从而更好利用正确的低置信的预测。我们将该方法称之为CaGCN-st。

    3c18c387526013ad5e9e5f9d8692dbf0.png

    实验

    实验分为两部分,分别评估CaGCN在置信度校正方面的性能和CaGCN-st在提高模型分类准确率方面的性能,其中前者的评估指标是ECE,后者是Accuracy。两个实验均选择了Cora、Citeseer、Pubmed、CoraFull四个数据集,每个数据集选取了不同的标签率。实验结果如下:

    d300fd7f1767e48776bcc627bc67bc42.png

    图5. CaGCN与其他置信度校正方法的结果对比(值越小代表性能越好)

    2e841fc43b3fbd2af71d041823597269.png

    图6. CaGCN-st与其他自训练方法的结果对比(值越大代表性能越好)

    另外,我们还进行了CaGCN-st的消融实验,验证增加的置信度校正方法的有效性,结果如图7所示,其中GCN-st指没有置信度校正的普通自训练方法。

    2bdc09aef504b7f7b8e643d703cafd99.png

    图7. 自训练消融实验

    更多细节以及实验结果请参见原论文。

    特别鸣谢

    感谢 TCCI 天桥脑科学研究院对于 PaperWeekly 的支持。TCCI 关注大脑探知、大脑功能和大脑健康。

    更多阅读

    52c5fe5a05944274f9a1ab2042938791.png

    de57a4dc0317c6491c6adb50c639f654.png

    2510b5e928e82f21f7f8c01b0990412b.png

    161d3a4e577e805fa12463ca10730f7f.gif

    #投 稿 通 道#

     让你的文字被更多人看到 

    如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

    总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

    PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

    📝 稿件基本要求:

    • 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

    • 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

    • PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

    📬 投稿通道:

    • 投稿邮箱:hr@paperweekly.site 

    • 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

    • 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

    8fa6cf4404ebf09f42ac8a871b7b2f80.png

    △长按添加PaperWeekly小编

    🔍

    现在,在「知乎」也能找到我们了

    进入知乎首页搜索「PaperWeekly」

    点击「关注」订阅我们的专栏吧

    ·

    8f1b9ec923f1763e29f6a250c48a2f11.png

    展开全文
  • Apriori算法python实现(可调节支持度与置信度前言完整代码 前言 看到网上的Apriori算法代码大多都没有添加置信度进行筛选,因此我自己写了一个 完整代码 import itertools def item(dataset): #求第一次扫描...
  • 来源:俊红的数据分析之路今天这篇聊聊统计学里面的置信度和置信区间。1.点估计在讲置信度和置信区间之前先讲讲点估计,那什么是点估计呢?给你举两个例子你就知道了。现在你想要知道一个学校学生的身...
  • 显著性检验:P值和置信度

    千次阅读 2021-05-26 16:21:17
    由于置信度= 1-α(%),因此如果α值为0.05,那么达到此门槛的测试统计结果置信度就为95%。 P值指的是比较的两者的差别是由机遇所致的可能性大小。P值越小,越有理由认为对比事物间存在差异。例如,P,就是说结果...
  • 支持度和置信度

    2021-03-11 10:36:52
    置信度 表示规则准确率, 对于特定规则, 在所有相同(与这个特定规则的前提相同)前提假设下的所占比例. 说得比较抽象, 直接看代码理解. from collections import defaultdict # 上面"买了苹果又买香蕉"是一种情况,...
  • 购物篮分析: ...一般我们使用三个指标来度量一个关联规则,这三个指标分别是:支持度、置信度和提升度。 Support(支持度):表示同时包含 A 和 B 的事务占所有事务的比例。如果用 P(A) 表示包含 A 的
  • 【统计分析】关联规则之置信度,支持度,提升度_红芒果-CSDN博客_关联规则提升度一般使用三个指标来度量一个关联规则,根据这三个指标可以筛选出满足条件的关联规则。 这三个指标是:Support(支持度)、Confidence...
  • 下面这个表格是代表一个事务数据库D,其中最小支持度为50%,最小置信度为70%,求事务数据库中的频繁关联规则。 Tid 项目集 1 面包,牛奶,啤酒,尿布 2 面包,牛奶,啤酒 3 啤酒,尿布 4 面包,牛奶,...
  • 在测试模型时想在每张图片上显示出置信度,网上一些帖子用的版本和我用的版本不一致,改的内容也不一样,记录下来做个参考。 要修改的文件是 darknet/src/ 下的 image.c 要修改的是draw_detections函数,添加4行代码...
  • ▐导读本文主要介绍阿里妈妈外投广告团队在点击率预估领域提出的一种新模型训练方法 —— 深度置信度感知学习(Deep Uncertainty-Aware Learning),以下简称:D...
  • Apriori算法的简介...在这里,所有支持大于最小支持的项集称为频繁项集,简称频集。Apriori原理:如果某个项集是频繁的,那么它的所有子集也是频繁的。该定理的逆反定理为:如果某一个项集是非频繁的,那么...
  • 对于单类别检测模型(如检测一个工件中一个圆孔,单个工件中只有1个孔),那么业务逻辑中就需要对检测框按置信度排序。 二、实现: #usr/bin/env python #-*- coding: utf-8 -*- det_results = [] det_1 = ...
  • 为什么计算置信度?在推荐场景下,我们会研发一些策略,来提升业务指标,在做AB实验的时候,实验组跟base组的指标对标,并非稳定的胜利或者稳定的失败,观察7天或者14天的指标数据,会有正有负,那么怎么衡量胜利的...
  • 关于支持度、置信度、提升度以及apriori算法的理解(简单版) 理解支持度 所谓支持度,就是比如说10个用户购买商品,有8个用户购买商品A,那么商品A的支持度就是80%。支持度越大,关联规则越重要,因为支持度大代表...
  • 许栩原创专栏《从入门到高手:线性回归分析详解》第9章:总体回归、置信度、置信区间及其计算方法。多元回归方程求解后,我们分别确认了回归方程的精度和进行了回归方程的显著性验证,接下来,我们需要计算置信区间...
  • 利用变分推断进行分割置信度的预测。 在过去的十年里,深度学习在一系列的应用中取得了巨大的成功。然而,为了验证和可解释性,我们不仅需要模型做出的预测,还需要知道它在做出预测时的置信度。这对于让医学影像学...
  • I'm using regression SVMs in python and I am wondering if there is any way to get a "confidence-measure" value for its predictions.Previously, when using SVMs for binary classification, I was able to ...
  • 一、 目标:本节主要讲解置信度(95.0%)的计算过程。二、定义:在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在...
  • 已知多元回归方程,求一个点在置信度为97.5%的预测区间,Matlab代码如何实现?为了说明问题,特举例如下:已知x1,x2,y试验数据,求其数学模型。x1=[94 65 95 15 47 23 65 52];x2=[45 66 22 54 87 16 65 54];y=[1 2 3...
  • 相比于排名第2的fDSST算法, 在尺度变化属性方面, 所提算法在减少尺度更新次数的情况下取得了更好的效果, 说明所提算法通过高置信度更新策略去除冗余尺度更新操作的做法是切实有效的; 在遮挡、形变、运动出视野、低...
  • 一、 支持度 置信度、 二、 频繁项集、 三、 非频繁项集、 四、 Apriori 算法过程、 五、模式挖掘示例、
  • 置信区间分作数学期望μ的置信区间,标准差 σ的...若样本的平均值X▔是 35,设定的置信度是 95%,计算出来的置信区间是 33 ~ 37,那么含义就是,总体的95%的数值会在这个区间内。或者说,总体的任意一个数值,在区...
  • 购物篮分析购物篮数据的二元0/1表示利用关联分析的方法可以发现二元...事务的宽度:事务中出现的项的个数一般我们使用三个指标来度量一个关联规则,这三个指标分别是:支持度、置信度和提升度。Support(支持度):...
  • 支持度和置信度:关联规则从一个侧面揭示了事务之间的某种联系。支持度和置信度总是伴随着关联规则存在的,它们是对关联规则的必要的补充。对某条关联规则而言,如 A -> B (support=30%, confidence=60%)其中的...
  • 我最近在使用detectron2深度学习库进行实验,在跑检测框的可视化的时候,发现框很多很乱,而且很多置信度很低的检测框也画了出来,这看起来很难受,于是我就想着设定一个置信度阈值(score_threshold)来进行检测框...
  • 如题 原始的non_max_suppression def non_max_suppression(prediction, conf_thres=0.25, iou_thres=0.45, classes=None, agnostic=False, multi_label=False, labels=()): """Runs Non-Maximum Suppression (NMS)...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 48,558
精华内容 19,423
关键字:

置信度

友情链接: MultiDesktop.rar