精华内容
下载资源
问答
  • 不确定度与协方差矩阵的关系

    千次阅读 2019-06-20 17:43:12
    一些地方看到“使用协方差矩阵表示某个状态的不确定度”,不太理解协方差矩阵和不确定度有什么关系,一直认为协方差矩阵是描述一个样本的不同维度的关联关系不确定度是描述一个状态的值的不确定程度,为什么...

    常在一些地方看到“使用协方差矩阵表示某个状态的不确定度”,不太理解协方差矩阵和不确定度有什么关系,一直认为协方差矩阵是描述一个样本的不同维度的关联关系,不确定度是描述一个状态的值的不确定程度,为什么协方差矩阵可以用来表示不确定度呢?

    不确定度的定义如下:

    不确定度的含义是指由于测量误差的存在,对被测量值的不能肯定的程度。

    表征合理地赋予被测量之值的分散性,与测量结果相联系的参数。

    此参数可以是诸如称为标准测量不确定度的标准偏差(或其特定倍数),或是说明了包含概率的区间半宽度。

    当测量结果是由若干个其他量的值求得时, 按其他各量的方差和协方差算得的标准不确定度, 称为合成标准不确定度。

    合成标准不确定度仍然是标准偏差, 它表征了测量结果的分散性。

    由上可知,标准偏差是描述随机变量围绕均值的分散程度的,是可以用来表示不确定度的,而标准偏差的平方就是方差,那方差也是可以反映不确定度的。注意,不确定度不是误差,误差是测量值减去真实值。


    协方差的定义如下:

    在概率论和统计学中,协方差用于衡量两个变量的总体误差。

    协方差表示的是两个变量总体误差的期望。

    单个随机变量的方差表示分布的分散程度,2个随机变量的协方差可以理解为它们一致的分散程度,其中,“一致”体现在2个随机变量分别对应于各自的均值同时正向/负向变化的程度,对应名字中的“协”,“分散”体现在相对于各自均值的偏离,对应名字中的“方差”。因此,协方差包含了误差和相关性2重特性,协方差是相关性导致的方差,也就和不确定度产生了微妙的联系。


    不确定度 <------> 标准偏差 <------> 方差 <-----> 协方差

    当有随机变量x,y,u=ax+by,即u是x与y的线性组合。则有

    记u=P*S,其中,P=[a b], S=transpose([x y]), 则有Var(u) = P*C*transpose(P)。这里强调一下,计算的结果就是变量u的方差!!这个式子就可以和卡尔曼滤波器中的预测误差协方差矩阵的计算联系起来了,而这个预测误差协方差矩阵,就反映了预测结果的不确定性。

    如果u与xy不是线性关系,就把u=f(x,y)泰勒一阶展开,上式中的P就换为f对x,y求偏导,即雅各比矩阵,就演化为了扩展卡尔曼滤波器


    总结下来,我的理解就是协方差矩阵是可以反映测量结果的不确定度的,正如方差发挥的作用一样。同时,因为其附加体现的相关性,这个不确定度就是一个椭圆,相关性体现在沿椭圆的长轴不确定性更大,沿短轴不确定性较小。并且,在推导误差或不确定度沿模型(就是f(x,y))传递时,协方差矩阵发挥了基础且重要的作用。

    展开全文
  • 不确定性Uncertainty

    千次阅读 2018-10-14 15:21:38
    不确定不确定性(Uncertainty)一词有多个含义。一般来说,任何没有完全和彻底了解的事物对我们来说都存在不确定性。不确定性这个词有怀疑(比如“他能否按计划完成工作是不确定的”)或者缺乏知识(比如“我...

    不确定或不确定性(Uncertainty)一词有多个含义。一般来说,任何没有完全和彻底了解的事物对我们来说都存在不确定性。不确定性这个词有怀疑(比如“他能否按计划完成工作是不确定的”)或者缺乏知识(比如“我不确定溶液是否有毒”)的意思,本文中,作者倾向于把风险和不确定性看成两个不同的词。研究对象的风险可以用风险分析的结果“风险图”来表示,并且“风险图”一般会成为决策制定的依据,当然,决策制定的依据还有很多,比如生产评估、成本利润评估等。为了能够进行好的决策,决策者必须要相信他所使用的决策依据是尽可能正确的。这样,决策者也就会有兴趣了解,他对于风险分析的结果可以有多大信心,即要了解风险分析结果的不确定性有多大。

    作者将“不确定性”定义为“对风险评估结果信心的‘量度’”,此处给“量度”加上引号是为了表示不确定性并不一定需要量化。2009年美国国家研究委员会(NRC)对“不确定性”给出的精确定义是“不确定性:信息缺乏或不完整,定量不确定性分析试图分析和描述计算值与真实值之间的差异程度,描述的方法有时候是概率分布。不确定性取决于数据的质量、数量和相关度,以及模型和假设的可靠性和相关度(NRC,2009)。

    2.不确定性的类型:

    根据需要常常将不确定性分为两大类(Armen Der Kiureghian,2007)。

    随机不确定性:随机(Aleatory)这个单词来自拉丁语alea,意思是掷骰子。

    认知不确定性:认知(Epistemic)来自希腊语episteme,意思是知识。

    2.1 随机不确定性

    随机不确定性:此种不确定性主要由自然变异和随机性引起。随机不确定性的例子包括风速、风向、降雨量、产品质量的变化、污染物在食品中的浓度等。

    随机不确定性也被称为变异(NRC,2009)、内在不确定性、偶然不确定性和不可降低不确定性。如果在相同的条件下重复一个实验若干次,而每次的结果都不尽相同,比如,抛掷一枚两面均衡的硬币1000次,我们就可以观察到随机不确定性。增加实验的数量并不能减少这些变异的出现,但是却可以让我们更加准确的描绘出结果变异的概率分布。

    例子1:考虑一个化工厂毒气泄露的事故场景,有毒气体泄露后形成毒气云其最终影响取决于实时的风向。通过对相关地点风向的长期观察,我们可以拟合出不同方向d的概率分布。在事故场景发生的时候,我们无法确定毒气云一定会吹向居民区,但是我们可以使用分布F(d)寻找事件的概率。

    2.2 认知不确定性

    认知不确定性:此种不确定性主要是由于缺乏知识引起。常见的例子包括转基因食品的健康风险以及二氧化碳排放导致全球变暖的担忧。从原理上讲,如果我们获得了有关研究对象足够的知识,就可以消除这种不确定性。鉴于随着知识增加,认知不确定性可以因此降低,所以它也可以被称为可降低的不确定性。与随机不确定性相反,认知不确定性依赖于评估者的知识水平,因此它还被称为主观不确定性。

    认知不确定性也被称为无知(ignorance)(Salvatore Modica,1997)和表象不确定性。

    无知可以分为两种:认识到的无知和没有认识到的无知。认识到的无知是指,我们知道自己不知道,并希望在进行风险分析的时候采取相应措施。而没有认识到的无知则更加危险,因为我们根本不知道自己不知道,说的更严重点,就是我们对于风险评估结果的信心可能就是一种错觉。

    例子2:现在,有很多基于纳米技术的新产品不断问世。然而许多人都在担心纳米颗粒会对他们的健康以及地球环境造成伤害。但是至少到现在(2014年),纳米技术的影响还无从所知,因此与使用这项技术相关的认知不确定性还非常高。随着人们关于纳米技术的经验越来越多,认知不确定性也就会随之降低。

    从基本的词义上看,不确定性就是简单地缺少确定性,没有必要将其分成不同的类型。然而,绝大部分分析人员都发现使用上面介绍的分类很有帮助(Winkler,1996;Anderson and Hattis,1999;Der Kiureghian and ditlevsen,2009)。现在风险分析界比较一致的看法是,在随机不确定性和认知不确定性之间并没有固定的界限。如果有新的知识出现,我们可以更加深入地解释某一情况或现象,那么与之相应的随机不确定性就降低了。归根结底,可能所有的不确定性都是认知方面的。有时候,信心(confidence)和准确性(Accuracy)这两个词被当作不确定性的反义次,也就是说,在不确定性很高的时候,我们的信心很低。David Cox在1981年给出的不确定性和变量关系的阐述是“变量是物质世界中需要被度量、分析并做出合理解释的现象,而不确定性是知识的一个方面”(David Cox,1981)。

    展开全文
  • 不确定

    千次阅读 2019-11-23 17:13:54
    一、测量不确定度来源 任何测量值都不是绝对准确的,最初使用误差来衡量 测量值与真值之间的差异。 误差=随机误差+系统误差, 由于各种因素的存在,每次测量时 测量值与真值之间的差异应该有所同,但会介于...

      

    一、测量不确定度来源

           任何测量值都不是绝对准确的,最初使用误差来衡量 测量值与真值之间的差异。

               误差=随机误差+系统误差,

          由于各种因素的存在,每次测量时 测量值与真值之间的差异应该有所同,但会介于一定范围内。误差值是个点值不能准确的表达测量值与真值之间的差异,基于逻辑和准确性考虑,使用测量不确定度。

    二、测量不确定度

    2.1 测量不确定度

    表征合理地赋予被测量之值的分散性,与测量结果相联系的参数。

     
                          1)测量不确定度是个范围;2)有多少个来源就有多少个不确定度。
     

    2.2 方差合成定理是测量不确定度的基础:

      1) 若一个随机变量是两个或多个独立随机变量之和,则该随机变量的方差等于各分量的方差之和

        V(y)= V(x1)+ V(x2)+…+V(xn)

    根据标准不确定度的定义,方差即是标准不确定度的平方

        u2(y)= u2(x1)+ u2(x2)+…+u2(xn)

    2)  若y=c1x1+c2x2+…+cnxn

    根据方差的性质:随机变量与常数之乘积的方差,等于随机变量的方差与该常数的平方之乘积

     

    三、不确定度评定步骤

    3.1  不确定度评定步骤

    1. )寻找不确定度来源
    2. )建立满足测量不确定度评定所需的数学模型
    3. )确定对应于各输入量的标准不确定度分量ui(y)
    4. )确定对应于各输入量的标准不确定度分量ui(y)
    5. )列出不确定度分量汇总表
    6. )将各标准不确定度分量ui(y)合成得到合成标准不确定度uc(y)
    7. )确定被测量Y可能值分布的包含因子
    8. )确定扩展不确定度
    9. )给出测量不确定度报告

    3.2 建立数学模型

    •         3.2.1  步骤二中建立数学模型的方法有 

            1)透明箱模型:对测量原理了解比较透彻时,即每个输入量对被测量的影响方式一清二楚,且其影响的大小可以根据数学表达式定量地进行计算,数学模型可以从测量的基本原理直接得到

             2)黑箱模型:在很多情况下,有许多输入量对测量结果的影响是无法用解析形式的数学表达式表示的,只能根据经验估计输入量对测量结果的影响,这时,就可以采用增加一个修正项的方式将其补充到数学模型中,即采用黑箱模型的方式。

    •      3.2.2 数学模型通式:

    测量结果=真值+误差=真值+系统误差+随机误差

    真值=测量结果+系统误差的修正值+随机误差的修正值

    则数学模型的通式为:

    被测量等于测量结果的计算公式加上由于系统误差所引入的修正值(即数学期望不等于零的修正值),再加上由于随机误差所引入的修正值(即数学期望等于零的修正值)。

    3.3 各输入量估计值xi的标准不确定度u(xi)评定

          评定方法分为A类和B类:

    • 3.3.1 A类(A类评定的标准不确定度仅来源于对具体测量结果的统计评定)

    (1)基本方法:贝塞尔法

    •a)若在重复性条件下对被测量Xn次独立重复测量,测量的结果为x{k}

    用标准偏差表示的不确定度称为标准不确定度,则单次测量结果的标准不确定度u\left ({x_{k}} \right )

    b) 若采用该n次测量结果的平均值作为测量结果的最佳估计值

    平均值

    ,

    则平均值的实验标准差为

    注意:当测量次数n较小时,计算得到的实验室标准差可能会有较大的误差 ,所以,使用贝塞尔法时要求n应较大,一般要求≥10

     

    c) 若所给测量结果是m次(m可以比较小)重复测量的平均值

    (2)合并样本标准差:

    a)  若在重复性条件下对被测量Xn次独立观测,并且有m组这样的测量结果,各组间的测量条件可能会稍有不同

    就不能直接采用贝塞尔公式,可以考虑采用合并样本标准差。

    b)  若已计算出m组测量结果的实验标准差sj(xk),且每组包含的测量次数相同,则合并样本标准差

    则可以看出:合并样本标准差s_{p}\left ( x_{k} \right )并不是各组的实验标准差s_{j}\left ( x_{k} \right )的平均值,而是采用方差的平均。

    各组包含的测量次数不完全相同,则合并样本标准差为:

    •c)  若最后给出的测量结果是若干次N)测量结果的平均值

    (3) 极差法(适用于测量次数少)

      可以估计被测量X接近正态分布的前提下,单次测量结果xk的实验标准差s_{p}\left ( x_{k} \right )近似评定:

    (4)最小二乘法

    估计xy之间有线性关系y=a+bx;同时假定x的测量不确定度远小于y的测量不确定度,则可采用最小二乘法得到参数ab及它们的标准不确定度u(a)u(b)

    写出y=a+bx的误差方程,分别对ab求偏导,同时使偏导数为0,可得联立方程,求得ab。

    x测量,得值x0,通过计算的ab,y0,可以计算出的标准不确定度u(y0)

    y重复测量p次,得y的平均值y0,通过计算的ab,x0,可以计算出的标准不确定度u(x0)

    最小二乘法常用于测量仪器作校准曲线

    3.3.2  B类(来源于为各种标准和规程等技术性文件、生产部门提供的技术文件、测量人员对仪器特征的了解经验等。)

    信息来源于检定证书或校准证书: 

             (1)给出被测量x的扩展不确定度U(x)和包含因子k:

            (2)给出被测量x的扩展不确定度Up(x)和其对应的置信区间 p:

                 大部分情况下会选择正态分布,在不同分布中正态分布的包含因子k最大,得到的标准不确定度就最小。

     

    信息来源于其他各种资料或手册

    a:输入量x的可能值分布区间的半宽,可以看作它所对应的置信区间的置信概率p100%,则实际上它就是该输入量的扩展不确定度。

    3.4 合成标准不确定度

                  下标c表示合成之意,即uc(y)表示被测量Y的合成标准不确定度。

     

                    注:此时各输入量相互独立的或各输入量间相关性可以忽略

          注:此时各输入量相互独立的或各输入量间相关性可以忽略

    3.5 扩展不确定度

    扩展不确定度U等于合成标准不确定度uc与包含因子k的乘积。

    4.测量不确定度对合格或不合格判定的影响

    只有当测量结果处于被扩展不确定度U扩大了的规范区之外时,即测量结果的完整表述全部处于规范区外时,才能判定产品不合格;同样只有当测量结果处于被扩展不确定度U缩小了的规范区之内时,即测量结果的完整表述全部处于规范区内时,才能判定产品合格。

    5.检测实验室的能力验证试验

    v在检测实验室的比对中,一般用中位值代替平均值作为参考值。
    v各实验室之间测量结果标准偏差会受到离群值的影响,这种情况通常用四分位数间距IQR来代替标准偏差,通过对标准化正态分布进行计算得到正态分布的四分位数间距与标准偏差的比值为1.3490
    v标准IQRIQR/1.3490=0.7341×IQR

     

    v由于中位值相当于平均值,在比对中就作为参考值,而标准IQR相当于标准偏差,则Z比分数的最大允许值相当于包含因子k,因此对各参加实验室所得到的Z比分数的要求为:

    v当∣Z∣≤2,由于该结果在95%置信区间内,该结果为满意。

    v2<∣Z∣<3,由于测量结果出现在该区间的概率较小,仅为5%左右,因此该结果为可疑结果,或称有问题结果。

    v当∣Z∣≥3,该结果出现的概率不到1%,为小概率事件,故认为该结果为不满意结果,或成为离群结果。

    vZ比分数的符号表明测量结果偏离的方向,Z>0表示测量结果大于中位值,Z<0表示测量结果小于中位值。

     

     

     

    展开全文
  • 人工智能 4.不确定性推理方法

    万次阅读 2018-12-20 19:57:11
    不确定性推理的含义 基本问题 不确定性推理的类型 可信度推理模型 知识不确定性的表示: 可信度的定义: 可信度的性质 证据不确定性的表示 不确定性的更新 结论不确定性的合成 主观Bayes方法的概率论基础 ...

    目录

     

    概述

    不确定性推理的含义

    基本问题

    不确定性推理的类型

    可信度推理模型

    知识不确定性的表示:

    可信度的定义:

    可信度的性质

    证据不确定性的表示

    不确定性的更新

    结论不确定性的合成

    主观Bayes方法的概率论基础

    全概率公式

    Bayes公式

    推导

    知识不确定性的表示

    证据不确定性的表示

    不确定性的更新


    概述

    不确定性推理的含义

    泛指除精确推理以外的其它各种推理问题。包括不完备、不精确知识的推理,模糊知识的推理,非单调性推理等。

    采用不确定性推理因:

        所需知识不完备、不精确

        所需知识描述模糊

        多种原因导致同一结论

    解题方案不唯一

    基本问题

    不确定性的表示:

    (1) 知识的不确定性的表示

        含义:知识的确定性程度,或动态强度

        表示:用概率,在[0,1]区间取值,越接近于0越假,越接近于1越真

              用可信度,在[-1,1]区间取值,大于0接近于真,小于0接近于假

              用隶属度,在[0,1]区间取值,越接近于0隶属度越低,反之越高

    (2) 证据不确定性的表示

        证据的类型:按组织:基本证据,组合证据

                    按来源:初始证据,中间结论

        表示方法:概率,可信度,隶属度等

        基本证据:常与知识表示方法一致,如概率,可信度,隶属度等

        组合证据:组合方式:析取的关系,合取的关系。

                  计算方法:基于基本证据,最大最小方法,概率方法,有界方法 等。

    不确定性的匹配:

    含义

        不确定的前提条件与不确定的事实匹配

    问题

        前提是不确定的,事实也是不确定的

    方法

        设计一个计算相似程度的算法,给出相似的限度

    标志

    相似度落在规定限度内为匹配,否则为不匹配

    不确定性的更新,不确定性结论的合成:

    4. 不确定性的更新

        主要问题

        ① 如何用证据的不确定性去更新结论的不确定性

        ② 如何在推理中把初始证据的不确定性传递给最终结论

        解决方法

        对①,不同推理方法的解决方法不同

        对②,不同推理方法的解决方法基本相同,即把当前结论及其不确定性作为新的结论放入综合数据库,依次传递,直到得出最终结论

    5. 不确定性结论的合成

        含义:多个不同知识推出同一结论,且不确定性程度不同

    方法:视不同推理方法而定

    不确定性推理的类型

     

    可信度推理模型

    知识不确定性的表示:

    表示形式:

        在C-F模型中,知识是用产生式规则表示的,其一般形式为:

                IF   E   THEN   H  (CF(H, E)) 

    其中,E是知识的前提条件;H是知识的结论;CF(H, E)是知识的可信度。

        说明:

         ①  E可以是单一条件,也可以是复合条件。

         ②  H可以是单一结论,也可以是多个结论

         ③  CF是知识的静态强度,CF(H, E)的取值为[-1, 1],表示当E为真时,证据对H的支持程度,其值越大,支持程度越大。

         例子:

               IF   发烧    AND  流鼻涕   THEN   感冒   (0.8)

    表示当某人确实有“发烧”及“流鼻涕”症状时,则有80%的把握是患了感冒。

    可信度的定义:

    在CF模型中,把CF(H, E)定义为

               CF(H, E)=MB(H, E)-MD(H, E)

    式中MB称为信任增长度,MB(H, E)的定义为

    MD称为不信任增长度,MD(H, E)的定义为

        MB和MD的关系

        当MB(H, E)>0时,有P(H|E)>P(H),即E的出现增加了H的概率

        当MD(H, E)>0时,有P(H|E)<P(H) ,即E的出现降低了H的概率

        根据前面对CF(H, E)可信度 、MB(H, E)信任增长度、MD(H, E)不信增长度的定义,可得到CF(H, E)的计算公式:

    分别解释CF(H,E)>0,CF(H,E)=0,CF(H,E)<0

    可信度的性质

        (1)  互斥性

     对同一证据,它不可能既增加对H的信任程度,又同时增加对H的不信任程度,这说明MB与MD是互斥的。即:

             当MB(H, E)>0时,MD(H, E)=0

             当MD(H, E)>0时,MB(H, E)=0

    (2) 值域

        (3) 典型值

     当CF(H,E)=1时,有P(H/E)=1,它说明由于E所对应证据的出现使H为真。此时,MB(H, E)=1,MD(H, E)=0。

        当CF(H,E)= -1时,有P(H/E)=0,说明由于E所对应证据的出现使H为假。此时,MB(H, E)=0,MD(H,E)=1。

        当CF(H,E)= 0时,有MB(H, E)=0、MD(H, E)=0。E所对应证据的出现不证实、不否认H;

    4.

            (1)对H的信任增长度等于对非H的不信任增长度

            (2)对H的可信度与非H的可信度之和等于0

            (3)可信度不是概率,不满足

                  P(H)+P(﹁H)=1 和 0≤P(H),P(﹁H)≤ 1

     

     (5)对同一前提E,若支持若干个不同的结论Hi(i=1,2,…,n),则

    因此,如果发现专家给出的知识有如下情况

            CF(H1, E)=0.7,  CF(H2, E)=0.4

    则因0.7+0.4=1.1>1为非法,应进行调整或规范化。

    证据不确定性的表示

    基本证据

     表示方法,用可信度,其取值范围也为[-1,1]。例如,CF(E) ,其含义:

        CF(E)= 1,证据E肯定它为真

        CF(E)= 0,对证据E一无所知

        0<CF(E)<1,证据E以CF(E)程度为真

    否定证据

              CF(¬E)= - CF(E)

    组合证据

        合取:E=E1 AND E2 AND … En时,若已知CF(E1),CF(E2),…,则

               CF(E)=min{CF(E1), CF(E2), … ,CF(En)}

        析取:E=E1 OR  E2  OR … En时,若已知CF(E1),CF(E2),…,则

              CF(E)=max{CF(E1), CF(E2), … ,CF(En)}

    不确定性的更新

        CF模型中的不确定性推理实际上是从不确定的初始证据出发,不断运用相关的不确性知识,逐步推出最终结论和该结论可信度的过程。而每一次运用不确定性知识,都需要由证据的不确定性和知识的不确定性去计算结论的不确定性

        不确定性的更新公式

               CF(H)=CF(H, E)×max{0, CF(E)}

        若CF(E)<0,则

               CF(H)=0

    即该模型没考虑E为假对H的影响。(只考虑为真条件的影响)

        若CF(E)=1,则

               CF(H)=CF(H,E)

    规则强度CF(H,E)实际上是在E为真时,H的可信度

    结论不确定性的合成

        当有多条知识支持同一个结论,且这些知识的前提相互独立,结论的可信度又不相同时,可利用不确定性的合成算法求出结论的综合可信度。

        设有知识:IF  E1   THEN   H  (CF(H, E1))

             IF  E2   THEN   H  (CF(H, E2))

    则结论H 的综合可信度可分以下两步计算:

        (1) 分别对每条知识求出其CF(H)。即

             CF1(H)=CF(H, E1) ×max{0, CF(E1)}

             CF2(H)=CF(H, E2) ×max{0, CF(E2)}

    (2) 用如下公式求E1与E2对H的综合可信度

    例题P20

    主观Bayes方法的概率论基础

    全概率公式

    定理3.1 设事件A1,A2,…,An满足:

        (1)任意两个事件都互不相容,即当i≠j时,有Ai∩Aj=Φ  (i=1,2,…,n;j=1,2,…,n);

        (2) P(Ai)>0 (i=1, 2, … ,n);

        (3) D=


    则对任何事件B由下式成立:

       该公式称为全概率公式,它提供了一种计算P(B)的方法。

    Bayes公式

    https://blog.csdn.net/jiangjiang_jian/article/details/81346797

      定理3.2 设事件A1,A2,…,An满足定理3.1规定的条件,则对任何事件B有下式成立:

    该定理称为Bayes定理,上式称为Bayes公式。

        其中,P(Ai)是事件Ai的先验概率,P(B|Ai)是在事件Ai发生条件下事件B的条件概率;P(Ai|B)是在事件B发生条件下事件Ai的条件概率。

        如果把全概率公式代入Bayes公式,则有:

    这是Bayes公式的另一种形式。

        Bayes定理给处了用逆概率P(B|Ai)求原概率P(Ai|B)的方法。

    贝叶斯公式

    在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”,如“假设袋子里面有 N 个白球,M 个黑球,你伸手进去摸一把,摸出黑球的概率是多大”。而一个自然而然的问题是反过来:“如果我们事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一个(或好几个)球,观察这些取出来的球的颜色之后,那么我们可以就此对袋子里面的黑白球的比例作出什么样的推测”。这个问题,就是所谓的逆向概率问题。

    P(A) A 的先验概率,之所以称为“先验”是因为它不考虑任何 B 方面的因素

    P(A|B)是已知 B 发生后 A 的条件概率,也由于得自 B 的取值而被称作 A 的后验概率。

    P(B|A)是已知 A 发生后 B 的条件概率,也由于得自 A 的取值而被称作 B 的后验概率。

    P(B) B 的先验概率,也作标淮化常量(normalizing constant)。

    贝叶斯定理可表述为:

    后验概率 = (相似度 * 先验概率)/标淮化常量

    也就是说,后验概率与先验概率和相似度的乘积成正比。

    另外,比例P(B|A)/P(B)也有时被称作标淮相似度(standardised likelihood),Bayes定理可表述为:

    后验概率 = 标淮相似度 * 先验概率

    联合概率表示两个事件共同发生(数学概念上的交集)的概率。A B 的联合概率表示为

    推导

    我们可以从条件概率的定义推导出贝叶斯定理。

    根据条件概率的定义,在事件 B 发生的条件下事件 A 发生的概率为:

    同样地,在事件 A 发生的条件下事件 B 发生的概率为:

    结合这两个方程式,我们可以得到:

    这个引理有时称作概率乘法规则。上式两边同除以 P(A),若P(A)是非零的,我们可以得到贝叶斯定理:

    根据新情况更新先验概率-修正概率

    知识不确定性的表示

    表示形式:在主观Bayes方法中,知识是用产生式表示的,其形式为:

               IF  E  THEN  (LS, LN)   H

    其中,(LS, LN)用来表示该知识的知识强度,LS(充分性度量)和LN(必要性度量)的表示形式分别为:

    LS充分性:结论成立/不成立时 条件为真概率

    LN必要性:结论成立/不成立时 条件为假概率

    根据贝叶斯:

    两式相除得(几率函数):

    为讨论方便,下面引入几率函数

    可见,X的几率等于X出现的概率与X不出现的概率之比,P(X)与O(X)的变化一致,且有:

               P(X)=0  时有  O(X)=0

               P(X)=1  时有  O(X)=+∞

    即把取值为[0,1]的P(X)放大为取值为[0,+∞]的O(X)

    以上两式联立

    再把LS代入此式,可得:

    同理可得到关于LN的公式:

    以上两式就是修改的Bayes公式

    LS的性质:

        当LS>1时,O(H|E)>O(H),说明E支持H,LS越大,E对H的支持越充分。当LS→∝时,O(H|E)→∝,即P(H/E)→1,表示由于E的存在将导致H为真。

        当LS=1时,O(H|E)=O(H),说明E对H没有影响。

     当LS<1时,O(H|E)<O(H),说明E不支持H。

     当LS=0时,O(H|E)=0,说明E的存在使H为假。

    LN的性质:

     当LN>1时,O(H|﹁E)>O(H),说明E支持H,即由于E的不出现,增大了H为真的概率。并且,LN得越大,﹁E对H为真的支持就越强。当LN→∝时,O(H|﹁E)→∝,即P(H|﹁E)→1,表示由于﹁E的存在将导致H为真。

        当LN=1时,O(H|﹁E)=O(H),说明﹁E对H没有影响。

        当LN<1时,O(H|﹁E)<O(H),说明﹁E不支持H,即由于﹁E的存在,使H为真的可能性下降,或者说由于E不存在,将反对H为真。当LN→0时O(H|﹁E) →0,即LN越小,E的不出现就越反对H为真,这说明H越需要E的出现。

        当LN=0时,O(H|﹁E)=0,说明﹁E的存在(即E不存在)将导致H为假。

     

    LS与LN的关系

     由于E和﹁E不会同时支持或同时排斥H,因此只有下述三种情况存在:

        ① LS>1且LN<1                       

        ② LS<1且LN>1                      

        ③ LS=LN=1

    证据不确定性的表示

    基本证据的表示:

       在主观Bayes方法中,基本证据E的不精确性是用其概率或几率来表示的。

    概率与几率之间的关系为:

    以概率情况为例,对初始证据E,用户可以根据当前观察S将其先验概率P(E)更改为后验概率P(E|S),即相当于给出证据E的动态强度

    组合证据不确定性的计算:

       证据的基本组合方式只有合取和析取两种。(合取min,析取max)

     当组合证据是多个单一证据的合取时,例

              E=E1  AND   E2  AND  …  AND  En

     如果已知在当前观察S下,每个单一证据Ei有概率P(E1|S), P(E2|S), … ,P(En|S),则

          P(E|S)=min{ P(E1|S), P(E2|S), … ,P(En|S)}

     当组合证据是多个单一证据的析取时,例

                 E=E1  OR   E2  OR  …  OR  En

        如果已知在当前观察S下,每个单一证据Ei有概率P(E1|S), P(E2|S), … ,P(En|S),则

      P(E|S)=max{ P(E1|S), P(E2|S), … ,P(En|S)}

    不确定性的更新

    根据E的概率P(E)及LS和LN的值,把H的先验概率P(H)或先验几率O(H)更新为后验概率或后验几率。

        分以下3种情况讨论:

        1. 证据肯定为真

        2. 证据肯定为假

    3. 证据既非为真有非为假

    证据肯定为真时

     当证据E肯定为真时,P(E)=P(E|S)=1。将H的先验几率更新为后验几率的公式:

              O(H|E)=LS×O(H)

     把H的先验概率P(H)更新为后验概率P(H|E)的公式

     

    证据既非真假:需要使用杜达等人给出的公式:

    P(H|S)=P(H|E)×P(E|S)+P(H|﹁E)×P(﹁E|S)                              (3.7)

     

     

        下面分四种情况讨论:

        (1)P(E|S)=1

        当P(E|S)=1时,P(﹁E|S)=0。

    这实际是证据肯定存在的情况

        (2)P(E|S)=0

        当P(E|S)=0时,P(﹁E|S)=1。

        (3)P(E|S)=P(E)

        当P(E|S)=P(E)时,表示E与S无关。由(3.7)式和全概率公式可得

        (4) P(E/S)为其它值

    上面已经得到了P(E|S)的3个特殊值:0,P(E),1;它们分别对应的3个值为P(H|﹁E),P(H),P(H|E)。由此构造的分段线性插值函数为:

     

    展开全文
  • 如果class D 以public形式继承class B,你的意图就是告诉编译器:每一个类型为D的对象同时也是一个类型为B的对象,反之成立。例如,每个学生都是人,但并非每个人都是学生,因此可以实现is-a:class Person{}; ...
  • 信息与不确定

    千次阅读 2019-07-20 14:43:45
    “信息是可以量化的,用事件的不确定性表示”, “增加相关信息,会减小其不确定性”。 咱们先搞清楚以下五个概念,他们是层层递进的。 信息量 信息熵 交叉熵 相对熵 互信息 一、信息量 咱们一起来玩一玩Yes...
  • 软件项目管理中,任务之间的关系有那几种,如何确定活动之间的关系? 任务之间共有四种关系,下面分别举例说明如下:1.FS(完成-开始)关系 a.必须先完成任务1,然后任务2才能开始。 b.如任务1"录入",任务...
  • 处理不确定数据的方法研究

    千次阅读 2016-01-25 11:41:35
    成果简介: ...本研究针对不确定性的数学理论、算法及应用开展了多层次研究:随机性数据处理方面,应用已有的成熟算法对实际生活中常见的不确定性现象开展分析,包括了多维标度法亲属关系中的分析应
  • 信息熵---信息不确定

    千次阅读 2016-12-06 11:35:41
    不确定性越大,则信息量越大,熵越大 若不确定性越小,则信息量越小,熵越小 比如A班对B班,胜率一个为x,另一个为1-x 则信息熵为 -(xlogx + (1-x)log(1-x)) 求导后容易证明x=1/2时取得最大,最大值为2 也...
  • 精度与不确定

    千次阅读 2012-12-11 21:59:57
    本文属 MATLAB与SOLIDWORK集成机电系统仿真与实现... 设计产品中,如果这个精度与不确定度的概念不足够重视或者不清楚,那么产品的档次也最多是九流、十流的,设计源头上有一堆问题,然后再加上生产管理上再来一堆问
  • 利用协方差,皮尔逊相关系数和斯皮尔曼相关系数确定变量间的关系 https://www.toutiao.com/i6550915552490029576/ 数据集中的变量之间可能存在复杂且未知的关系。重要的是发现和量化数据集的变量相关的程度。这些...
  • 难点在于,培训没有新增成立之前,不确定组织者需要报名页面上收集参加报名人员的哪些信息,就是说每次培训需要报名者填写的信息不确定,具体要填写哪些,姓名、年龄、国籍、星座等完全视组织者的需求而定。...
  • nginx 中location和root,你确定真的明白他们关系

    万次阅读 多人点赞 2016-01-17 14:48:34
    当时卡location和root中,但是网上却比较少聊这方面的关系,一般都是聊location匹配命令(这里可以看看http://www.nginx.cn/115.html),花了一下午,彻底搞清楚了location和root到底怎样找到文件的。
  • 不确定性世界中的行为预测

    千次阅读 2021-01-08 17:07:26
    桔妹导读:自动驾驶系统中的行为预测模块主要负责预判其他交通参与者未来一段时间的行为,其困难主要源自现实世界和人类行为的高度不确定性。本文列举了现实环境中的不同场景,讨论了两种不同预测方法...
  • 确定asm磁盘与物理磁盘的对应关系

    千次阅读 2012-08-02 15:36:40
    磁盘与操作系统磁盘设备的对应关系 . [root@ocmdb1 disks]# cd /dev/oracleasm/disks [root@ocmdb1 disks]# ls -lt total 0 brw-rw---- 1 oracle dba 8, 17 Jan 14 19:06 VOL1 [root@ocmdb1 disks]...
  • 例如有n个数组 var arr1=[1,2,3] var arr2=[4,5,6] var arr3=[7,8,9] var arr.... 怎么遍历获取: 1,4,7.... 2,4,7.... 3,4,7.... 1,5,7.... 算法咋写,数组个数不确定
  • 最近做项目遇到一个挺操蛋的问题,由于业务的关系,DB的数据表无法确定使用过程中字段可能会增加,这样insert时给我造成了很大的困扰。先来看一下最终我是怎么实现的: <![CDATA[ INSERT INTO tg_fcst_...
  • 领导者要面对显然(Obvious),繁杂(Complicated),复杂(Complex),混沌(Chaos),无序(Disorder)五种场景,并需要不同场景下使用不同的管理策略。目前,创新过程中最大问题就在于领导者将适用于显然和繁杂...
  • 不确定推理:  推理:从已知事实(证据)出发,通过运用相关知识逐步推出结论或证明某个假设成立或不成立的思维过程  不确定推理:从不确定的初始证据出发,通过运用不确定的性的知识,最终推出一个具有一定程度...
  • 不确定性,进化与经济理论

    千次阅读 2019-02-15 10:24:13
    大家都知道这样的说法,经济学假设人是理性的,那么一个理性的人抉择时都会选择最优化方案。曾经有两个大经济学为此也发生过争论,还把争论写到经济学的期刊里面去了。其中一位经济学家叫理查德·莱斯特( Richard...
  • 这种方法某些情况下可能适用,比如列表中有重复值的情况下: >>> D = [1,2,3,4,4,4,5,5,5] >>> print set(D) #列表转换成集合时会去重,某些场景下需要考虑这个问题。 set([1, 2, 3, 4, 5]) 除此之外,...
  • 前言 传播同一则信息,信息的量好像弹性空间很大,我们应该如何测一测这个信息的量呢...信息熵代表了一个黑盒子中的不确定性,或者说,要搞清楚这个黑盒子的秘密所需要的信息。(例子:怎么用鼓点准确传达消息呢?方...
  • 信息熵(不确定性)的理解与解释

    千次阅读 2019-10-16 21:43:30
    熵越高,说明事件的不确定性越大。而信息不确定性越大时,该信息的价值越高。 总结: 1、某随机事件结果的种类越多,该事件的熵越大 2、某随机事件的各种可能发生的结果概率越均匀,该事件的熵越大 ...
  • 独立正交相关定义关系

    千次阅读 2018-06-01 16:00:40
    一、“独立”、“相关”和“正交”的定义假设X为一个随机过程,则t1和t2时刻的随机变量的...正交仅仅描述确定函数之间的关系,也用以描述随机过程。两个随机过程X(t) Y(t)正交,即E[X(t)Y(t)]=0, 若E[X(t)Y(t)...
  • 关于二叉树先序遍历和后序遍历为什么能唯一确定一个二叉树分析 PAT 1119题目参考解释
  • 随机变量不算是统计中的概念,是概率论中的,作为定义某个概率空间上的可测函数,概率空间固定的情况下,不确定性指的是事件属于概率空间的真子集(如果确定,就是概率空间本身),随机性指的是某个子集发生,因为...
  • SCRUM是一种敏捷开发模式,源于橄榄球术语,有一些...Sprint计划会议确定本次冲刺任务列表(Sprint backlog),原则上一次冲刺内,拒绝需求变动,scrum master有责任保护team受需求变更的影响。关于Sprint执行期间
  • 1、条件技术使用到的表ER图2、sd的定价过程配置的说明(注意我这个图原来是用于分析科目确定的数据关系图,对于定价有些表名称可能不对) 1、各个表后面的序号的是定制的操作顺序;2、第一步是根据需要表的允许...
  • 相关关系和因果关系之间的区别 两个变量之间存在相关关系,不一定说明两者之间存在着因果关系。...比如天气冷和下雪通常一起发生,说明两者有很强的相关性,但不能肯定是谁导致了谁,所以不确定两者是够有因果关系
  • 确定和非确定性算法

    千次阅读 2016-11-27 17:05:28
    本文摘自http://wenda.so.com/q/1465703473723556?src=140所谓非确定性是指理论计算机...且非确定性是相对于确定性来说,对于非确定性的机器,性能各方面要高于确定性机器。任意一种自动机,按其动作的确定程度,大

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,035,011
精华内容 414,004
关键字:

在不确定的关系里