-
2020-05-25 05:42:40
先验与后验
先验的主张是那些您可以独立于经验而知道的主张。例如,三角形的内角将始终相加180度。您不必测量所有三角形就可以知道这一点。这是先验要求。您可以独立于经验(或之前)来了解它。这是先验要求的其他一些示例:
小明比小张高,小张比小王高。因此,小明比小王高。
先验的主张似乎是基于纯粹的思想或理性而来的,而后验的主张是根据经验来证明的。经过经验,我们只能知道后验要求。以下是一些后验例子:
三角形是蓝色的。
鲍勃高六英尺。
船正在下沉。
60%的美国人在临床上超重。总的来说,
先验的是“所有乌鸦都是鸟”。
“所有乌鸦都是黑色的”是后验的。
“绿色是一种颜色”是先验的。
“草是绿色的”是后验的。
先验是“房屋是生活的住所”。
“被破坏的房屋将倒塌”是一个后世。
“ 2 + 2 = 4”是先验的。
第二部分:Analytic vs. Synthetic
康德清楚地解释说,Analytic命题是谓词包含在主题中的命题。例如,“所有单身汉都是单身的”,因为谓语(单个)包含在主题(单身汉)中。因此,您可以将分析语句认为是定义正确的分析语句。以下是一些其他示例:
所有德克萨斯人都是北美人。
所有的狗都是动物。
三角形有三个边。
北美是德克萨斯州的定义,动物是狗的定义,三边是三角形的定义。注意,Analytic性陈述不是关于世界的真理,而是关于单词的真理。因为单身汉的意思,未婚单身是真的。您不必出门看看世界就能知道单身汉未婚。
Synthetic经验是正确的。谓词不包含在主题中。
来自德克萨斯州的人通常比来自科罗拉多州的人更肥胖。
我的狗生病了。
三角形是红色的。更多相关内容 -
贝叶斯公式的理解(先验后验的区别)和极大似然估计
2020-09-13 01:06:22目录一、贝叶斯公式的理解1、条件概率2、全概率公式3、贝叶斯公式4、先验概率和后验二、极大似然估计例子参考文章: 一、贝叶斯公式的理解 一直容易把最基础的贝叶斯公式里的概念搞混(主要是先验后验)。先上核心...一、贝叶斯公式的理解
一直容易把最基础的贝叶斯公式里的概念搞混(主要是先验后验)。先上核心知识,贝叶斯公式是
P(B|A)=P(A|B)P(B)/P(A)
贝叶斯公式就是当已知结果,问导致这个结果的第i原因的可能性是多少?执果索因!先验概率是指根据以往经验和分析得到的概率,如全概率公式,它往往作为"由因求果"问题中的"因"出现.(一般在计算中已知的原因和结果就是先验)
后验概率是指依据得到"结果"信息所计算出的最有可能是那种事件发生,如贝叶斯公式中的,是"执果寻因"问题中的"因".(一般未知需根据结果和原因求的是后验)
【重要】:
不是根据"模样"来判断是先验还是后验,而是根据该数据能否"直接得到"且不经过"贝叶斯理论"计算才认为是先验的,也就是说,一个东西是不是先验,光看P(A|B)这种形式是定不下来的,需要看上下文。
下面从介绍几个概念开始:1、条件概率
这个很简单,学过概率理论的人都知道条件概率的公式:
P(AB)=P(A)P(B|A)=P(B)P(A|B);
即事件A和事件B同时发生的概率等于在发生A的条件下B发生的概率乘以A的概率。
举个例子,比如让你背对着一个人,让你猜猜背后这个人是女孩的概率是多少?直接猜测,肯定是只有50%的概率,假如现在告诉你背后这个人是个长头发,那么女的概率就变为90%。所以条件概率的意义就是,当给定条件发生变化后,会导致事件发生的可能性发生变化。
条件概率由文氏图出发,比较容易理解:
P(A|B) 表示B发生后A发生的概率,由上图可以看出B发生后,A再发生的概率就是
,
因此:由:
得:
这就是条件概率公式。
假如事件A与B相互独立,那么:
注:
相互独立:表示两个事件发生互不影响。而互斥:表示两个事件不能同时发生,(两个事件肯定没有交集)。互斥事件一定不独立(因为一件事的发生导致了另一件事不能发生);独立事件一定不互斥,(如果独立事件互斥, 那么根据互斥事件一定不独立,那么就矛盾了)
2、全概率公式
假设B是由相互独立的事件组成的概率空间{B1,b2,…bn}。则P(A)可以用全概率公式展开:
P(A)=P (A|B1)P(B1)+P(A|B2)P(B2)+…P(A|Bn)P(Bn)。
举个例子,小张从家到公司上班总共有三条路可以直达(如下图),但是每条路每天拥堵的可能性不太一样,由于路的远近不同,选择每条路的概率如下:
每天上述三条路不拥堵的概率分别为:
假设遇到拥堵会迟到,那么小张从Home到Company不迟到的概率是多少?
其实不迟到就是对应着不拥堵,设事件C为到公司不迟到,事件
为选择第i条路,则:
全概率就是表示达到某个目的,有多种方式(或者造成某种结果,有多种原因),问达到目的的概率是多少(造成这种结果的概率是多少)?
全概率公式:
设事件
是一个完备事件组,则对于任意一个事件C,若有如下公式成立:
那么就称这个公式为全概率公式。
3、贝叶斯公式
仍旧借用上述的例子,但是问题发生了改变,问题修改为:到达公司未迟到选择第1条路的概率是多少?
可不是 p(L1)=0.5 因为0.5这个概率表示的是,选择第一条路的时候并没有靠考虑是不是迟到,只是因为距离公司近才知道选择它的概率,而现在我们是知道未迟到这个结果,是在这个基础上问你选择第一条路的概率,所以并不是直接就可以得出的。
故有:
所以选择第一条路的概率为0.28.
贝叶斯公式就是当已知结果,问导致这个结果的第i原因的可能性是多少?执果索因!
贝叶斯公式:
在已知条件概率和全概率的基础上,贝叶斯公式是很容易计算的:
4、先验概率和后验
在贝叶斯法则中,每个名词都有约定俗成的名称:
P(A)是A的先验概率或边缘概率。之所以称为"先验"是因为它不考虑任何B方面的因素。
P(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。
P(B|A)是已知A发生后B的条件概率,也由于得自A的取值而被称作B的后验概率。
P(B)是B的先验概率或边缘概率,也作标准化常量(normalized constant)。按这些术语,Bayes法则可表述为:
后验概率 = (似然度 * 先验概率)/标准化常量 也就是说,后验概率与先验概率和似然度的乘积成正比。另外,比例P(B|A)/P(B)也有时被称作标准似然度(standardised likelihood),Bayes法则可表述为:
后验概率 = 标准似然度 * 先验概率
(这也是把极大似然估计放到一篇文章的缘故,详细可参考https://blog.csdn.net/u011508640/article/details/72815981)总结:
贝叶斯公式在在机器学习中重要的原因可能是:很多问题是需要计算机在已知条件下做出最佳决策的决策,而贝叶斯公式就是对人脑在已知条件下做出直觉判断的一种数学表示.。
贝叶斯定理或者说统计,更多的是给了我们一种认识世界的世界观和方法论。关于概率论和统计学我比较喜欢的两句话:“概率论只不过是把常识用数学公式表达了出来”—拉普拉斯
统计的方法论就是能够帮助我们透视 不确定性 (probability)以及 数据背后的原理 (inference),从而找到最好的应对方式。
二、极大似然估计
极大似然估计,通俗理解来说,就是利用已知的样本结果信息,反推最具有可能(最大概率)导致这些样本结果出现的模型参数值!
换句话说,极大似然估计提供了一种给定观察数据来评估模型参数的方法,即:“模型已定,参数未知”。EM算法的M步就是将似然函数最大化以获得新的参数值。
当模型满足某个分布,它的参数值我通过极大似然估计法求出来的话。最常见的比如正态分布中公式如下:
如果我通过极大似然估计,得到模型中参数 μ \mu μ和 σ \sigma σ的值,那么这个模型的均值和方差以及其它所有的信息我们就知道了。极大似然估计中采样需满足一个重要的假设,就是所有的采样都是独立同分布的。
举例说明前先说一下似然函数,取自上面的博客文章
例子
假如有一个罐子,里面有黑白两种颜色的球,数目多少不知,两种颜色的比例也不知。我 们想知道罐中白球和黑球的比例,但我们不能把罐中的球全部拿出来数。现在我们可以每次任意从已经摇匀的罐中拿一个球出来,记录球的颜色,然后把拿出来的球 再放回罐中。这个过程可以重复,我们可以用记录的球的颜色来估计罐中黑白球的比例。假如在前面的一百次重复记录中,有七十次是白球,请问罐中白球所占的比例最有可能是多少?
很多人马上就有答案了:70%。而其后的理论支撑是什么呢?
我们假设罐中白球的比例是p,那么黑球的比例就是1-p。因为每抽一个球出来,在记录颜色之后,我们把抽出的球放回了罐中并摇匀,所以每次抽出来的球的颜 色服从同一独立分布。
这里我们把一次抽出来球的颜色称为一次抽样。题目中在一百次抽样中,七十次是白球的,三十次为黑球事件的概率是P(样本结果|Model)。
如果第一次抽象的结果记为x1,第二次抽样的结果记为x2…那么样本结果为(x1,x2…,x100)。这样,我们可以得到如下表达式:
P(样本结果|Model)
= P(x1,x2,…,x100|Model)
= P(x1|Mel)P(x2|M)…P(x100|M)
= p70(1-p)30.
好的,我们已经有了观察样本结果出现的概率表达式了。那么我们要求的模型的参数,也就是求的式中的p。
那么我们怎么来求这个p呢?
不同的p,直接导致P(样本结果|Model)的不同。
好的,我们的p实际上是有无数多种分布的。如下:
那么求出 p70(1-p)30为 7.8 * 10^(-31)p的分布也可以是如下:
那么也可以求出p70(1-p)30为2.95* 10^(-27)
那么问题来了,既然有无数种分布可以选择,极大似然估计应该按照什么原则去选取这个分布呢?
答:采取的方法是让这个样本结果出现的可能性最大,也就是使得p70(1-p)30值最大,那么我们就可以看成是p的方程,求导即可!
那么既然事情已经发生了,为什么不让这个出现的结果的可能性最大呢?这也就是最大似然估计的核心。
我们想办法让观察样本出现的概率最大,转换为数学问题就是使得:
p70(1-p)30最大,这太简单了,未知数只有一个p,我们令其导数为0,即可求出p为70%,与我们一开始认为的70%是一致的。其中蕴含着我们的数学思想在里面。
参考文章:
1、https://blog.csdn.net/u010164190/article/details/81043856
2、https://zhuanlan.zhihu.com/p/26614750
3、https://blog.csdn.net/u011508640/article/details/72815981
4、https://blog.csdn.net/zouxy09/article/details/8537620(从最大似然到EM算法浅解) -
先验 后验 似然估计
2020-07-14 11:25:13对未知参数x的先验信息 用一个分布形式来表示,此分布称为未知参数的先验分布。...结果 是由 某个原因 导致的 概率 就是 后验概率。 似然估计是根据 原因 推测 该原因 导致 结果 发生 的概率。 ...对未知参数x的先验信息 用一个分布形式
来表示,此分布
称为未知参数
的先验分布。
结果 是由 某个原因 导致的 概率 就是 后验概率。
似然估计是根据 原因 推测 该原因 导致 结果 发生 的概率。
: 表示观察得到的数据(结果)
: 决定数据分布的参数(原因)
: prior 先验
:posterior 后验概率
: likelihood 似然估计
: evidence 关于x的概率统计信息。
MLE最大似然估计:
最大后验估计:
最大后验和最大似然在优化的时候,就在于最大后验的时候存在先验项
.
-
贝叶斯法则与先验后验概率以及似然度的关系
2021-03-20 20:50:04条件概率公式:P(A|B)=P(AB)/P(B) P(B)≠0 可推得乘法法则:P(AB)=P(A|B)*P(B) P(AB)=P(A|B)*P(B)=P(B|A)*P(A) 可得贝叶斯公式,也称贝叶斯定理、贝叶斯法则: ...P(A)是A的先验概率或边缘概率。之所以称为条件概率公式:P(A|B)=P(AB)/P(B) P(B)≠0
可推得乘法法则:P(AB)=P(A|B)*P(B)
P(AB)=P(A|B)*P(B)=P(B|A)*P(A)
可得贝叶斯公式,也称贝叶斯定理、贝叶斯法则:
P(A|B)=P(B|A)P(A)/P(B)
通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的;然而,这两者是有确定的关系,贝叶斯法则就是这种关系的陈述。
在贝叶斯法则中,每个名词都有约定俗成的名称:
P(A)是A的先验概率或边缘概率。之所以称为"先验"是因为它不考虑任何B方面的因素。
P(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。
P(B|A)是已知A发生后B的条件概率,也由于得自A的取值而被称作B的后验概率。
P(B)是B的先验概率或边缘概率,也作标准化常量(normalized constant)。Bayes法则可表述为:
后验概率 = (似然度 * 先验概率)/标准化常量,也就是说,后验概率与先验概率和似然度的乘积成正比。
另外,比例Pr(B|A)/Pr(B)也有时被称作标准似然度(standardised likelihood),
Bayes法则可表述为:后验概率 = 标准似然度 * 先验概率。例如:
一座别墅在过去的 20 年里一共发生过 2 次被盗,别墅的主人有一条狗,狗平均每周晚上叫 3 次,在盗贼入侵时狗叫的概率被估计为 0.9,问题是:在狗叫的时候发生入侵的概率是多少?
我们假设 A 事件为狗在晚上叫,B 为盗贼入侵,则以天为单位统计,P(A) = 3/7,P(B) = 2/(20365) = 2/7300,P(A|B) = 0.9,按照公式很容易得出结果:P(B|A) = 0.9(2/7300) / (3/7) = 0.00058另一个例子,
现分别有 A、B 两个容器,在容器 A 里分别有 7 个红球和 3 个白球,在容器 B 里有 1 个红球和 9 个白球,现已知从这两个容器里任意抽出了一个红球,问这个球来自容器 A 的概率是多少?
假设已经抽出红球为事件 B,选中容器 A 为事件 A,则有:P(B) = 8/20,P(A) = 1/2,P(B|A) = 7/10,按照公式,则有:P(A|B) = (7/10)*(1/2) / (8/20) = 0.875 -
先验 后验 似然 最大似然估计和最大后验估计
2019-05-08 21:40:00分别解释了先验概率,后验概率,似然函数,还讲了最大似然估计和最大后验估计。 2.https://blog.csdn.net/qq_40213457/article/details/82502105 最大似然和最大后验讲的挺好的,MAP就是在MLE上加一个先验概率,或... -
笔记:先验后验
2019-06-12 09:48:52先验: 原因 ----> 结果 的概率,由原因得到结果的概率。...后验: 一般先验对于我们来讲,是可以通过统计得出的,方便计算,因为它是知道了原因去统计结果。 但是一般我们会想要通过 结果(现象)... -
已知先验分布概率和条件概率,使用贝叶斯公式,求后验分布的概率
2021-07-05 13:03:15已知先验分布概率和条件概率,使用贝叶斯公式,求后验分布的概率 -
概率论:先验与后验与似然
2018-10-23 16:43:091.我自己的理解 1.1 从时间角度理解: a.先验:根据以往的经验或者常识,总结当前事情发生某种结果的概率,又或者说是...后验:根据当前的事情的观察(证据、原因),推断分析当前事情发生某种结果的概率... -
如何理解贝叶斯概率公式的先验、后验以及似然
2022-01-27 15:29:46关于如何理解/ 记住贝叶斯公式里的先验、后验以及似然。有一个关于编译器的巧妙的例子: 假设今天Alice结束了漫长的期末复习周,准备打开电脑准备半个月前的代码工作,结果发现程序出现了重大错误,那么Alice遇到的... -
先验与后验
2017-10-26 15:42:22先验与后验 从原因到结果的论证称为“先验的”,而从结果到原因的论证称为“后验的”。 先验概率是指根据以往经验和分析得到的概率,如全概率公式 中的,它往往作为“由因求果”问题中的“因”出现。后验概率... -
先验概率、后验概率、似然函数的理解
2021-04-08 16:43:31注释:最近一直看到先验后验的说法,一直不懂,这次查了资料记录一下。 1.先验和后验的区别: A.简单的了解两个概率的含义 先验概率可理解为统计概率,后验概率可理解为条件概率。 --------------------------... -
先验、后验、似然、置信的理解
2019-11-11 19:26:17先验、后验、似然、置信的理解 -
如何理解先验概率和后验概率
2021-05-27 20:15:37如何理解先验概率和后验概率前言先验概率的分类先验概率与后验概率的区别理解 前言 近代西方传统中,认为先验指无需经验或先于经验获得的知识,它通常与后验知识相比较,后验意思是指“在经验之后,需要经验”。这一... -
什么是先验、超验、后验?
2021-01-17 13:21:04经验的方式又包括阅读与现实体验,但对于所经验的状态又分为三种:超验、先验、后验。后验就是必须体验后才知道的,例如这杯水热不热。超验就是超出体验之外的,一般人无法共同体验到以形成普遍共通经验,如神、鬼的... -
机器学习与先验 后验概率
2019-07-28 18:27:07后验概率:进行多次抛硬币的实验, 然后计算出的概率可能是0.4998 在机器学习中 没有样本直接根据经验去预测标签概率就是先验概率 基于已经发生的事实(样本)去预测就是后验概率 所以求ML模型就是求后验概率P(Y|X) ... -
先验,后验和似然
2017-06-24 20:00:04本文主要介绍的就是这样让我总是分辨不清的三兄弟:先验、后验和似然。首先从概率上去认识,那么他们对应的分布啊,函数啊,以及衍生的其他就能更清楚地区分了。 在介绍各自区别之前,现在脑海中有这么两个概念:... -
贝叶斯先验概率和后验概率
2020-03-01 19:08:54贝叶斯公式究竟是什么意思,在现实中的含义是什么,什么是先验概率,什么是后验概率? 问题: 如下图所示:在一个群体中,有20个人。感冒5人,流感6人,脑膜炎4人,脑瘫3人,正常2人。 以B为例,解释一下。B... -
一个例子搞清楚(先验分布/后验分布/似然估计)
2017-10-17 19:22:36一个例子搞清楚(先验分布/后验分布/似然估计)preface: 无论是《通信原理》还是《概率与统计理论》,或者在现在流行的《模式识别》和《Machine Learning》中总会遇到这么几个概念:先验分布/后验分布/似然估计... -
先验 后验概率 与 极大 最大似然估计 的异同
2019-04-09 17:56:28先验概率 先验概率(prior probability)是指根据以往经验和分析得到的概率。例如投硬币事件,我们在执行这个事件之前就已经了解其符合二项分布,然后直接根据二项分布分析出的概率被称作是先验概率。它往往作为... -
【表格】从多角度对比先验知识 后验知识
2021-01-20 12:07:52后验知识 英文 prior knowledge aposterior knowledge 含义 先于经验的知识。 后于经验的知识。 作用 它使人联想到下述思想 哲学起源 在康德时期以来的西方哲学中,指与一切... -
贝叶斯概率公式和先验后验和极大似然估计
2021-03-01 21:47:59后验概率是根据当前的条件和先验概率得出的概率,与当前的情况密切相关(现在进行时,情况繁多,)执果求因21 贝叶斯概率公式: 贝叶斯公式就是根据先验来计算后验概率的公式 极大似然估计:知果求最可能的原因 先验... -
对先验后验概率的一点理解
2018-09-28 09:27:29先验概率是由某些起因推导出结果发生的概率,如用在全概率公式中。 利用过去历史资料计算得到的先验概率,称为客观先验概率; 当历史资料无从取得或资料不完全时,凭人们的主观经验来判断而得到的先验概率,称为主观... -
先验信息,先验概率,先验分布,后验概率,后验分布,共轭分布,共轭先验分布
2020-08-27 22:41:41先验与后验的区别主要在于有没有利用样本信息。没用样本信息是先验。用了样本信息是后验。 观测样本前的经验是先验,观测样本后的经验是后验。 “先”与“后”主要体现在对样本信息的利用上。 先验概率可理解为先... -
先验概率和后验概率
2018-03-22 21:48:12后验概率是指在得到“结果”的信息后重新修正的概率,是“执果寻因”问题中的"果"。上述的百科可以知道两者的特点为:先验概率是已有的知识和经历(先验知识),估计一件事发生的概率:比如提前知道硬币的... -
贝叶斯(一)先验分布与后验分布
2021-11-28 12:13:00一、先验分布与后验分布 先验分布:将一个未知量θ\thetaθ(这个θ\thetaθ并不是样本x)看做随机变量,应用一个概率分布在抽样前描述关于θ\thetaθ的先验信息的概率陈述,即先验分布 总体信息:样本x所属的... -
贝叶斯公式中的先验、后验以及似然
2020-09-03 17:42:14p(θ∣x)p(\theta|x)p(θ∣x) 后验分布 posterior:θ\thetaθ 基于 xxx 的分布 p(θ)p(\theta)p(θ) 先验分布 prior:θ\thetaθ 自身的分布 p(x∣θ)p(x|\theta)p(x∣θ) 似然 likelihood:xxx 基于 θ\thetaθ -
【算法知识】先验分布、后验分布、似然估计
2019-04-17 12:16:52预先已知结果(路上花的时间),然后根据结果估计(猜)原因(交通方式)的概率分布即 后验概率。 似然估计 先定下来原因,根据原因来估计结果的概率分布即 似然估计。根据原因来统计各种可能结果的概率即似然函数。... -
透彻理解贝叶斯定理:先验概率、后验概率
2019-05-20 16:02:24这一区分来自于中世纪逻辑所区分的两种论证,从原因到结果的论证称为“先验的”,而从结果到原因的论证称为“后验的”。1 以皇帝作为目标,先验针对的是秦始皇这种皇帝;后验针对的是刘邦、朱元璋这种皇... -
概率统计16——均匀分布、先验与后验
2021-02-14 15:21:08相关阅读: 最大似然估计(概率10) ...均匀分布也包括连续形态,比如一份外卖的配送时间是10~20分钟,如果我点了一份外卖,那么配送员会在接单后的10~20分钟内的任意时间送到,每个时间点送到的概率都是等可能的。 ...