• 条件概率分布_条件概率
千次阅读
2020-09-19 01:22:09

条件概率分布

If you’re currently in the job market or looking to switch careers, you’ve probably noticed an increase in popularity of Data Science jobs. In 2019, LinkedIn ranked “data scientist” the №1 most promising job in the U.S. based on job openings, salary, and career advancement opportunities and reported a 56% rise in job openings for data scientists over the previous year. Despite its popularity, however, data science can me a difficult field to enter, let alone to learn. I know from my personal experience, the amount of statistics involved made it very challenging. Probability, in particular, can be quite complicated but is fundamental to many machine learning models such as decision tree learning. So the purpose of this article is to provide a rudimentary undertanding of conditional probability.

如果您目前正处于就业市场或正在寻求转行，您可能已经注意到Data Science职位的受欢迎程度有所提高。 根据职位空缺，薪水和职业晋升机会，LinkedIn在2019年将“数据科学家”排在美国最有前途的工作之一，并报告说数据科学家的职位空缺比上一年增长了56％。 尽管它非常流行，但是数据科学还是一个很难进入的领域，更不用说学习了。 从我的亲身经历，我知道所涉及的统计数据非常具有挑战性。 概率尤其可能非常复杂，但是对于许多机器学习模型(例如决策树学习)而言，这是基础。 因此，本文的目的是提供对条件概率的基本理解。

How To Calculate Probability

如何计算概率

Simply put, the probability of an event happening is equal to the number of times an event could happen divided by the total number of outcomes. For example, imagine you have a deck of cards and you want to calculate the probability that you’ll randomly pull a king from the deck. How would you calculate that? Well, since there are 4 kings in a deck of cards, there are 4 possible ways you can draw a king from the deck; and since there are 52 cards in the deck, there’s 52 possible outcomes. So 4 divided by 52 is .076 or 7.6% chance your card will be a king. Now say you want to figure out the probability of drawing another king — the answer will depend on how you handle replacement. Sampling with replacement means that you place the first card back into the deck making the two events independant (the probability of drawing each king doesn’t change). Sampling without replacement means you’re not placing the first card back, which affects the probability of drawing the second king (total number of outcomes is now 51). If event A is drawing the first king card and event B os drawing the second king card, then we’d say the probability of B given A is equal to the probability of event A multiplied by the probability of event B given that A occurs.

简而言之，事件发生的概率等于事件可能发生的次数除以结果总数。 例如，假设您有一副扑克牌，并且想要计算随机从该副牌中拉出国王的概率。 您将如何计算？ 好吧，由于在一副纸牌中有4个国王，因此有四种方法可以从纸牌中抽出一张国王； 而且由于套牌中有52张牌，因此有52种可能的结果。 因此，将4除以52得出的结果是.076，即7.6％的机会是您的卡成为王牌。 现在，您要确定吸引另一位国王的可能性-答案将取决于您如何进行替换 进行替换采样意味着您将第一张卡放回卡组中，从而使两个事件无关(抽出每位国王的概率不变)。 无需更换就可以进行采样，这意味着您不会放回第一张纸牌，这会影响抽出第二张王牌的可能性(现在总结果为51)。 如果事件A吸引第一张王牌而事件B os吸引第二张王牌，那么我们说给定A的B概率等于事件A的概率乘以给定A发生的事件B的概率。

Mathematical NotationP(A and B) = P(A) x P(B|A) = 4/52 x 3/51 = .45%

Tree Diagram

树状图

Mathematics isn’t intuitive to everyone; it certainly wasn’t for me as I was just starting out in this field. Visualizations, however, can be a great tool when it comes to reenforcing complex topics. A tree diagram is one example that can help you break down a general problem into smaller components — perfect for probability problems that involves multiple events that lead to a variety of outcomes. For example, take a look at the diagram I’ve created that helps answer the following question: If you have a bag of 23 marbles (5 green, 8 blue, and 10 red), what’s the probability that you’ll randomly pull out a blue marble and a green marble? Let’s break it down.

数学不是每个人都直观的。 因为我刚开始涉足这一领域，所以对我当然不是。 但是，在强化复杂主题时，可视化可能是一个很好的工具。 树形图是一个示例，可以帮助您将一般问题分解为较小的部分-非常适合涉及多个事件并导致各种结果的概率问题。 例如，看一下我创建的有助于回答以下问题的图表：如果您有一袋23颗大理石(5颗绿色，8颗蓝色和10颗红色)，那么您随机抽出的概率是多少？蓝色大理石和绿色大理石？ 让我们分解一下。

1. The probability of grabbing a blue marble is 35%, because there are 8 way you can get a blue marble and 23 total potential outcomes.

抓住蓝色大理石的可能性为35％，因为有8种方法可以获取蓝色大理石，并且有23种潜在结果。
2. Now given that you pulled out a blue marble, the probability of grabbing a green marble from the bag is 23% — 5 green marbles divided by 22 potential outcomes (notice how the total number of outcomes changes the second time, hence the change in probability).

现在，假设您拔出一块蓝色大理石，则从袋子中抓取绿色大理石的概率为23％-5个绿色大理石除以22个潜在结果(请注意结果总数如何第二次更改，因此概率发生变化)

3. Finally, calculating the probability of both these events happening involves multiplying the probability of both events (.35 x .23 = 8%).

最后，计算这两个事件发生的概率涉及将两个事件的概率相乘(.35 x .23 = 8％)。

Conclusion

结论

Hopefully this demsonstration has given you a clearer mental picture of statistical probability. Even though conditional probability may seem elementary compared to the more advanced concepts in machine learning, having a solid understanding of the foundation of which data science is built on is extremely important. So whenever you begin to learn something new, remember that no topic is too small and relearning is reenforcement.

希望这种演示能使您对统计概率有更清晰的认识。 尽管与机器学习中更高级的概念相比，条件概率似乎是基本的，但对数据科学所基于的基础有扎实的了解仍然非常重要。 因此，每当您开始学习新知识时，请记住，没有一个主题太小，重新学习就是强化。

条件概率分布

更多相关内容
• 已知先验分布概率和条件概率，使用贝叶斯公式，求后验分布的概率
• 21.03_21_已知联合概率求边缘以及条件概率.pdf
• ## 条件概率

千次阅读 2019-03-13 09:45:00
条件概率是概率计算中的一类比较容易出错的题目。 一、条件概率 一般的，设$$A$$，$$B$$为两个事件，且$$P(A)>0$$，则称$$P(B|A)=\cfrac{P(AB)}{P(A)}$$为在事件$$A$$发生的条件下，事件$$B$$发生的条件概率。 ...

## 前言

条件概率是概率计算中的一类比较容易出错的题目。

## 一、条件概率

一般的，设$$A$$$$B$$为两个事件，且$$P(A)>0$$，则称$$P(B|A)=\cfrac{P(AB)}{P(A)}$$为在事件$$A$$发生的条件下，事件$$B$$发生的条件概率。

• 条件概率的性质：

$$0\leq P(B|A)\leq 1$$

②若$$B$$$$C$$为两个互斥事件，则$$P(B\cup C|A)=P(B|A)+P(C|A)$$

## 二、注意事项

• $$P(B|A)$$$$P(A|B)$$是两个不同的条件概率。

• 一般情况下，条件概率的计算只能按照条件概率的定义套用公式进行，在计算时要注意搞清楚问题的事件含义，特别注意在事件$$A$$包含事件$$B$$时，$$AB=B$$

• 对于古典概型的条件概率，计算方法有两种：其一可采用缩减基本事件空间的办法计算$$P(B|A)=\cfrac{n(AB)}{n(A)}$$；其二可直接利用定义计算$$P(B|A)=\cfrac{P(AB)}{P(A)}$$

## 三、典例剖析

例1【2017长沙二模】一个不透明的袋子装又4个完全相同的小球，球上分别标有数字0、1、2、2，现甲从中摸出1个球记下球上的数字后放回，乙再从中摸出1个球，若谁摸出的球上的数字大则获胜(若数字相同则为平局)，则在甲获胜的条件下，乙摸出的球上的数字为1的概率为【】

$A.\cfrac{5}{16}$ $B.\cfrac{9}{16}$ $C.\cfrac{1}{5}$ $D.\cfrac{2}{5}$

法1分析：使用古典概型求解，由于甲获胜的所有情形为$$(2，1)$$$$(2，1)$$$$(2，0)$$$$(2，0)$$$$(1，0)$$，共有5种，

其中在甲获胜的条件下，乙摸出的球上的数字为1的情形为$$(2，1)$$$$(2，1)$$，有2种，

令“在甲获胜的条件下，乙摸出的球上的数字为1”为事件$$A$$，则$$P(A)=\cfrac{2}{5}$$，故选$$D$$

法2分析：使用条件概率求解，令“甲获胜”为事件$$A$$，“乙摸出的球上的数字为1”为事件$$B$$，则所求为$$P(B|A)$$

由于甲、乙都从4个球中分别取出1个球，故所有情形有$$4\times 4=16$$种，则甲获胜的情形有$$(2，1)$$$$(2，1)$$$$(2，0)$$$$(2，0)$$$$(1，0)$$，共有5种，故$$P(A)=\cfrac{5}{16}$$

而事件$$AB$$即“甲获胜且乙摸出的球上的数字为1”的情形有$$(2，1)$$$$(2，1)$$，有2种，即$$P(AB)=\cfrac{2}{16}$$

由条件概率的计算公式可得，$$P(B|A)=\cfrac{P(AB)}{P(A)}=\cfrac{\frac{2}{16}}{\frac{5}{16}}=\cfrac{2}{5}$$

解后反思：①古典概型求解改题目，其实就是压缩了样本空间；

例2一个箱子中有9张标有1，2，3，4，5，6，7，8，9的卡片，从中依次取两次，则在第一张是奇数的条件下第二张也是奇数的概率是___________。

法一：设第一张是奇数记为事件$$A$$，第二张是奇数记为事件$$B$$

$$P(A)=\cfrac{A_5^1A_8^1}{A_9^2}=\cfrac{5}{9}$$$$P(AB)=\cfrac{A_5^2}{A_9^2}=\cfrac{5}{18}$$

所以$$P(B|A)=\cfrac{P(AB)}{P(A)}=\cfrac{\frac{5}{18}}{\frac{5}{9}}=\cfrac{1}{2}$$

法二：设第一张是奇数记为事件$$A$$，第二张是奇数记为事件$$B$$

$$n(A)=5\times 8=40$$$$n(AB)=5\times 4=20$$，所以$$P(B|A)=\cfrac{n(AB)}{n(A)}=\cfrac{20}{40}=\cfrac{1}{2}$$

例3某种家用电器能使用三年的概率为0.8，能使用四年的概率为0.4，已知这种家用电器已经使用了三年，则它能够使用到四年的概率是__________。

分析：记事件$$A$$为这个家用电器已经使用了三年，事件$$B$$为这个家用电器使用到四年，显然$$B\subseteq A$$，即事件$$AB=B$$

由题目可知$$P(A)=0.8$$$$P(AB)=0.4$$，故$$P(B|A)=\cfrac{P(AB)}{P(A)}=\cfrac{0.4}{0.8}=\cfrac{1}{2}$$

例4【2018济南针对性训练】某射击选手射击一次命中的概率是0.7，两次均射中的概率是0.4，已知某次射中则随后一次射中的概率是【】

$A.\cfrac{7}{10}$ $B.\cfrac{6}{7}$ $C.\cfrac{4}{7}$ $D.\cfrac{2}{5}$

分析：设某一次射中为事件$$A$$，随后一次射中为事件$$B$$，则$$P(A)=0.7$$$$P(AB)=0.4$$

$$P(B|A)=\cfrac{P(AB)}{P(A)}=\cfrac{0.4}{0.7}=\cfrac{4}{7}$$

例5设100件产品中有70件一等品，25件二等品，规定一、二等品为合格品，从中任取1件，已知取得的是合格品，则它是一等品的概率是__________。

分析：设$$B$$表示取得一等品，$$A$$表示取到合格品，则

法一：由于95件合格品中有70件一等品，又由于一等品也是合格品，所以$$AB=B$$

$$P(B|A)=\cfrac{70}{95}=\cfrac{14}{19}$$

法二：$$P(B|A)=\cfrac{P(AB)}{P(A)}=\cfrac{\cfrac{70}{100}}{\cfrac{90}{100}}=\cfrac{14}{19}$$

例6【2019届高三理科数学三轮模拟试题】从$$1$$$$2$$$$3$$$$4$$$$5$$$$6$$$$7$$$$8$$$$9$$中不放回地依次取$$2$$个数，事件$$A$$=“第一次取到的是奇数”，事件$$B$$=“第二次取到的是奇数”，则$$P(B|A)$$=【】

$A.\cfrac{1}{5}$ $B.\cfrac{3}{10}$ $C.\cfrac{2}{5}$ $D.\cfrac{1}{2}$

法1：条件概率法，由题可知，$$P(AB)=\cfrac{A_5^2}{A_9^2}=\cfrac{5}{18}$$$$P(A)=\cfrac{A_5^1}{A_9^1}=\cfrac{5}{9}$$

$$P(B|A)=\cfrac{P(AB)}{P(A)}=\cfrac{1}{2}$$，故选$$D$$.

法2：古典概型法，由题可知，$$n(A)=5\times 8=40$$$$n(AB)=5\times 4=20$$，故$$P(B|A)=\cfrac{n(AB)}{n(A)}=\cfrac{20}{40}=\cfrac{1}{2}$$;

转载于:https://www.cnblogs.com/wanghai0666/p/10521095.html

展开全文
• 准确了解条件概率的概念很重要。准确了解条件概率的概念很重要。
• 1、边缘概率 当P(x,y)P(x, y)P(x,y)的每个值被写在由每行表示不同的xxx值，每列表示...2、条件概率 在很多情况下，我们感兴趣的是某个事件，在给定其他事件发生时出现的概率。这种概率叫做条件概率。 我们将给定x=x\

# 1、边缘概率

P ( x , y ) P(x, y) 的每个值被写在由每行表示不同的 x x 值，每列表示不同的 y y 值形成的网格中时，对网格中的每行求和是很自然的事情，然后将求和的结果 P ( x ) P(x) 写在每行右边的纸的边缘处。

对于连续型变量，我们需要用积分替代求和：

p ( x ) = ∫ p ( x , y ) d y . p(x) = \int p(x, y)dy.

# 2、条件概率

在很多情况下，我们感兴趣的是某个事件，在给定其他事件发生时出现的概率。这种概率叫做条件概率。
我们将给定 x = x \rm x = \it x 时， y = y \rm y = \it y 发生的条件概率记为 P ( y = y ∣ x = x ) P(\rm y= \it y | \rm x=\it x)
这个条件概率可以通过下面的公式计算：
P ( y = y ∣ x = x ) = P ( y = y , x = x ) P ( x = x ) P(\rm y= \it y | \rm x=\it x) = \frac {P(\rm y= \it y , \rm x=\it x)}{P(\rm x = \it x)}
条件概率只在 P ( x = x ) > 0 P(\rm x \it = x)>0 时有定义。
我们不能计算给定在永远不会发生的事件上的条件概率。

## 2.1 条件概率的链式法则

任何多维随机变量的联合概率分布，都可以分解成只有一个变量的条件概率相乘的形式：
P ( x ( 1 ) , … , x ( n ) ) = P ( x ( 1 ) ) Π i = 2 n P ( x ( i ) ∣ x ( 1 ) , … , x ( i − 1 ) ) P(x^{(1)}, \ldots, x^{(n)}) = P(x^{(1)}) \Pi_{i=2}^n P(x^{(i)} \mid x^{(1)}, \ldots, x^{(i-1)})

这个规则被称为概率的链式法则或者乘法法则。例如，使用两次定义可以得到

$$P(a, b, c) = P(a \mid b, c) P(b, c) P(b, c) = P(b \mid c) P© P(a, b, c) = P(a \mid b, c) P(b \mid c) P©$$

# 3、条件的独立性

两个 x x y y ，如果它们的概率分布可以表示成两个因子的乘积形式，并且一个因子只包含 x x 另一个因子只包含 y y ，我们就称这两个随机变量是相互独立的：

∀ x ∈ x , y ∈ y , p ( x = x , y = y ) = p ( x = x ) p ( y = y ) . \forall x \in x, y \in y, p(x = x, y = y) = p(x = x)p(y = y).

如果关于 x x y y 的条件概率分布对于 z z 的每一个值都可以写成乘积的形式，那么这两个随机变量 x x y y 在给定随机变量 z z 时是条件独立的：

∀ x ∈ x , y ∈ y , z ∈ z , p ( x = x , y = y ∣ z = z ) = p ( x = x ∣ z = z ) p ( y = y ∣ z = z ) \forall x \in x, y \in y, z \in z, p( x=x, y=y \mid z=z) = p(x = x \mid z = z) p(y = y \mid z = z)

我们可以采用一种简化形式来表示独立性和条件独立性： x ⊥ y x \bot y 表示 x x y y 相互独立， x ⊥ y ∣ z x \bot y \mid z 表示 x x y y 在给定 z z 时条件独立。

展开全文
• 条件概率、全概率公式与贝叶斯公式一、背景一个随机事件的概率,确切地说,是指在某些给定的条件下,事件发生的可能性大小的度量.但如果给定的条件发生变化之后,该事件的概率一般也随之变化.于是,人们自然提出:如果增加...

条件概率、全概率公式与贝叶斯公式

一、背景

一个随机事件的概率,确切地说,是指在某些给定的条件下,事件发生的可能性大小的度量.但如果给定的条件发生变化之后,该事件的概率一般也随之变化.于是,人们自然提出:如果增加某个条件之后,事件的概率会怎样变化的?它与原来的概率之间有什么关系?显然这类现象是常有的.

[例1]设有一群共人,其中个女性,

个是色盲患者.

个色盲患者中女性占个.如果={从中任选一个是色盲},

={从中任选一个是女性},此时,

.如果对选取规则附加条件:只在女性中任选一位,换一句话说,

发生之后,

发生的概率(暂且记为)自然是.

[例2]将一枚硬币抛掷,观察其出现正反面的情况.设事件为“两次掷出同一面”,事件为“至少有一次为正面H”.现在来求已知事件已经发生的条件下事件发生的概率.

这里,样本空间.易知此属于古典概型问题.已知事件已发生,有了这一信息,知道不可能发生,即知试验所有可能结果所成的集合就是.

中共有3个元素,其中只有属于.于是,在发生的条件下,

发生的概率为

对于例1,已知

容易验证在发生的条件下,

发生的概率

对于例2,已知

容易验证发生的条件下,

发生的概率

对一般古典概型,容易验证:只要,则在发生的条件下,

发生的概率,

总是成立的.

在几何概率场合,如果向平面上单位正方形内等可能任投一点,则当发生的条件下,这时发生的概率为

由此可知对上述的两个等可能性的概率模型,总有成立.

其实,还可以验证,这个关系式对频率也是成立的.于是,从这些共性中得到启发,引入下面的一般定义.

二、条件概率

是一个概率空间,

,若,则对于任意的,称

为已知事件发生的条件下,事件发生的条件概率.

[例3]一盒子中装有4只产品,其中有3只是一等品,1只是二等品.从中取产品两次,每次任取一只,作不放回抽样,设事件为“第二次取到的是一等品”,事件为“第一次取到的是一等品”,试求条件概率

解:易知此属古典概型问题.将产品编号：1,2,3号为一等品,4号为二等品.以表示第一次、第二次分别取到第号、第号产品.试验E (取产品两次,记录其号码)的样本空间为

={(1,2),(1,3),(1,4), (2,1),(2,3),(2,4), (3,1),(3,2),(3,4), (4,1),(4,2),(4,3)}

={(1,2),(1,3),(1,4), (2,1),(2,3),(2,4), (3,1),(3,2),(3,4)}

={(1,2),(1,3), (2,1),(2,3), (3,1),(3,2)}

由条件概率公式得,

[例4]一个家庭中有两个小孩,已知其中有一个是女孩,问这时另一个小孩也是女孩的概率?(假定一个小孩是女孩还是男孩是等可能的)

解:据题意样本空间为

={(男,女),(男,男),(女,女),(女,男)}

={已知有一个是女孩}={(男,女),(女,女),(女,男)}

={另一个小孩也是女孩}={(女,女)}

于是,所求概率为

三、条件概率的性质

(1)非负性:对任意的

(2)规范性:

(3)可列可加性:若为一列两两不相交的事件,有

证明:(1)因为所以

(2)由于,所以

(3)由于两两不相交,所以也必然两两不相交,所以

四、乘法公式

由条件概率的定义知:设,则.于是,

这就是概率的乘法公式.

如果,同样有

证明因为,依条件概率的定义,上式的右边

五、乘法公式的应用例子

[例5] 设某光学仪器厂制造的透镜,第一次落下时打破的概率为1/2,若第一次落下时未打破,第二次落下时打破的概率为7/10,若前两次时未打破,第三次落下时打破的概率为9/10,试求透镜落下三次而未打破的概率.

解:以表示事件“透镜第次落下时打破”,以表示事件“透镜三次落下而未打破”.因为,故有

[例6] 设袋中装有

只红球,

只白球.每次自袋中任取一只球,观察其颜色后放回,并再放入

只与所取出的那个球同色的球.若在袋中连续取球四次,试求第一、二次取到红球且第三、四次取到白球的概率.

解:以表示事件“第次取到红球”,

分别表示事件第三、四次取到白球.所求概率为

[例7] (卜里耶模型)罐中有只黑球,

只红球,随机地取一只之后,把原球放回,并加进与抽出的球同色之球只,再摸第二次,这样下去共摸次.问前次出现黑球,后面次出现红球概率是多少?

解:以表示事件“第k次取到黑球”,

表示事件“第次取到红球”,则

由一般乘法公式,

1.在例7中,最后答案与黑球和红球出现的次数有关,而与出现的顺序无关.

2.卜里耶模型被卜里耶用来描述传染病的数学模型.

时,它是有放回的摸球模型.

时,它是不放回的摸球模型.

思考题:在卜里耶模型中,取次,问正好出现次红球概率是多少?

[例8]一批产品共100件,对其进行抽样调查,整批产品看作不合格的规定是:在被检查的5件产品中至少有一件是废品.如果在该批产品中有5%是废品,试问该批产品被拒绝接收的概率是多少?

解:设表示被检查的第件产品是正品.

表示该批产品被接收.则

因此,该批产品被拒绝接收的概率是0.23。

作业:

P55 EX 29,30,31

六、全概率公式

是两个事件,那么可以表示为

显然,

,如果

[例1] 1号箱中有2个白球和4个红球,2号箱中有5个白球和3个红球,现随机地从1号箱中取出一球放入2号箱,然后从2号箱随机取出一球,问从2号箱取出的红球的概率是多少?

解:令:最后从2号箱中取出的是红球;

:从1号箱中取出的是红球.

由上面的公式,

上例采用的方法是概率论中颇为常用的方法,为了求复杂事件的概率,往往可以把它分解成若干个互不相容的简单事件之并,然后利用条件概率和乘法公式,求出这些简单事件的概率,最后利用概率可加性,得到最终结果,这一方法的一般化就是所谓的全概率公式.

为试验的样本空间,

的事件,

的一组事件.若

(1)

(2)

则称为样本空间的一个分割.

为样本空间的一个分割,那么,对每一次试验,事件必有一个且仅有一个发生.

[例2]设试验为“掷一颗骰子观察其点数”.它的样本空间.的一组事件是样本空间的一个分割.而事件组不是样本空间的一个分割,因为

[例3]甲、乙、丙三人向同一飞机射击.设样本空间={无人命中飞机,一人命中飞机,二人命中飞机,全命中}.

的一组事件={三人以下命中飞机},

={全命中飞机}是样本空间的一个分割.

设试验E的样本空间,

的事件,

的一个分割,且 ,则

上式被称为全概率公式.

证明:,所以

由假设,且所以

由条件概率公式,得

代入上式,即得

[例4]甲、乙、丙三人向同一飞机射击.设甲、乙、丙射中的概率分别为0.4,0.5,0.7.又设若只有一人射中,飞机坠落的概率为0.2,若有二人射中,飞机坠落的概率为0.6,若有三人射中,飞机必坠落.求飞机坠落的概率.

解:记={飞机坠落},

={

个人射中飞机},

=(甲射中,乙丙未射中)+(乙射中,甲丙未射中)+(丙射中,甲乙未射中)

再由题设,

利用全概率公式,

[例5]播种用的小麦种子混有2%的二等种子,1.5%的三等种子,1%的四等种子,用一等、二等、三等、四等种子长出的麦穗含有50颗麦粒以上的概率为0.5,0.15,0.1,0.05,求这批所结出的麦穗含有50颗麦粒以上的概率.

解:设={从这批种子任选一颗种子是等种子},

.

={从这批种子任选一颗,所结出的麦穗含有50颗麦粒以上}

由全概率公式

在例题5中,

,这对于农业技术人员来说,这个数据是重要的,但对育种专家来说,仅有这个数据是不够的.因为他们更感兴趣的是下面的问题.

[例6]在例题5中,问由这批所结出的含有50颗麦粒以上麦穗中是一等、二等种子长出的概率.

解:

在上面的计算中,事实上建立了一个著名的公式——Bayes公式.

七、贝叶斯公式

设试验的样本空间,

的事件,

的一个分割,且 ,则

上式称为贝叶斯公式.

证明:由条件概率,知

和全概率公式

[例7]某电子设备厂所用的元件是由三家元件厂提供的,根据以往的记录,这三个厂家的次品率分别为0.02,0.01,0.03,提供元件的份额分别为0.15,0.8,0.05,设这三个厂家的产品在仓库是均匀混合的,且无区别的标志.

(1)在仓库中随机地取一个元件,求它是次品的概率.

(2)在仓库中随机地取一个元件,若已知它是次品,为分析此次品出自何厂,需求出此品由三个厂家生产的概率是多少?

解:设取到的元件是次品,

表示取到的元件是由第个厂家生产的.

(1)由全概率公式,

(2)由贝叶斯公式,

以上结果表明,这只产品来自第2家工厂的可能性最大.

八、贝叶斯方法

从这道题中我们看出，“取一个元件”是进行一个试验,那么是在试验以前就已经知道的,所以习惯地称它们为先验概率.实际上它是过去已经掌握的生产情况的反映,对试验要出现的结果提供了一定的信息.

在这个例子中,试验结果出现次品,这时条件概率反映了在试验以后,对A发生的来源的各种可能性的大小,通常称为后验概率.

如果是病人可能患的n种疾病,在诊断以前先检验与这些疾病有关的某些指标(如体温,血压,白血球等),若病人的某些指标偏离正常值,要问病人患的是哪一种疾病,从概率论的角度考虑,若较大,而为了计算 ,就可以利用上述的贝叶斯公式,并把由过去的病例中得到的先验概率值代入,也就是医学上所说的发病率,人们常常喜欢找有经验的医生给自己治病,因为过去的经验能帮助医生作出比较准确的诊断,能够更好地做到对症下药,而贝叶斯公式正是利用了经验的知识,由此,读者可以直觉地认识到这个公式的意义.也正因如此,这类方法在过去和现在,都受到人们的普遍重视,并称为贝叶斯方法.

[例8]用甲胎蛋白法普查肝癌,令

={被检验者患肝癌}

={甲胎蛋白检验呈阳性}

{被检验者未患肝癌}

{甲胎蛋白检验呈阴性}

由资料已知,

,又已知某地居民的肝癌发病率,在普查中查出一批甲胎蛋白检验呈阳性的人,求这批人中真的患肝癌的概率.

解:由贝叶斯公式可得,

由此可见,经甲胎蛋白检验呈阳性的人群中,其中真正患肝癌的人还是很少的,只占0.0038,把对比一下是很有意思的.当已知病人患肝癌或未患肝癌时,甲胎蛋白检验的准确性应该说是比较高的,这从可以肯定这一点.但如果病人患肝癌或未患肝癌时,而要从甲胎蛋白检验结果是否为阳性这一事件出发,来判断病人是否患肝癌,那么它的准确性还是很低的,因为 .这个问题看来似乎有点矛盾.一种检验方法准确性很高,但实际使用时准确性很低,到底是怎么一回事?

从上述计算中用到的贝叶斯公式,可以得到解释.已知是不大的,但是患肝癌的人数毕竟很少,

,这就使得相对很大,从而很小.那么,上述结果是不是说明甲胎蛋白检验法不能用了呢?完全不是!通常医生总是先采取一些其它简单易行的辅助方法进行检查,当他怀疑某个对象有可能患肝癌时,才建议用甲胎蛋白检验法.这时,肝癌的发病率已经显著地增加了.比方说,在被怀疑的对象中,这时,这就有相当的准确性了.

展开全文
• 条件概率 在原因B发生的条件下，结果A发生的概率: 全概率 假如结果A发生的原因有B1，B2…等多种原因，则全概率公式如下： 先验概率   事情还没有发生，根据以往经验和分析得到的概率，在事情发生之前，得到的...
• 条件概率 定义： 设A,B为两个事件，，且P(B)>0，则称P(A|B)=P(AB)P(B)\frac {P(AB)}{P(B)}P(B)P(AB)​为事件B已经发生的条件下，事件A发生的概率，即P(A∣B)=P(AB)P(B)P(A|B)=\frac {P(AB)}{P(B)}P(A∣B)=P(B)P...
• 为什么从定义上看，觉得联合概率和条件概率是一个意思？ P(A|B) 和 P(AB) 这俩真的不是一个东西吗？？ =碎碎念开始，正文请跳往第2分割线=== 虽然我产生了这种疑问，但我的直觉告诉我：大概是个傻逼。于是我秉承着...
• 导读：本文将从条件概率入手，介绍事件之间独立性的相关概念，然后引出全概率公式和贝叶斯公式的基本内容，带领读者通过概率的视角初步认知现实世界。作者：张雨萌来源：大数据DT（ID：hzdas...
• 这种概率叫做条件概率。我们将给定x=xix=x_ix=xi​，y=yiy=y_iy=yi​，发生的条件概率记为P(y=yi∣x=xi)P(y=y_i|x=x_i)P(y=yi​∣x=xi​)。这个条件概率可以通过下面的公式计算： P(y=yi∣x=xi)=P(x=xi,y=yi)P(x=xi)...
• 1、条件概率公式 设A,B是两个事件，且P(B)>0,则在事件B发生的条件下，事件A发生的条件概率（conditional probability)为： P(A|B)=P(AB)/P(B) 分析：一般说到条件概率这一概念的时候，事件A和事件B都是同一...
• 文章目录前方边缘概率联合概率定义分析条件概率定义问条件概率能举个例子吗问$P(A|B)$在图中表示的是哪一块呢？条件概率习题：全概率定义推导全概率习题贝叶斯公式定义推导贝叶斯定理习题结束语 前方 条件概率，边缘...
•   条件概率，全概率，先验概率，后验概率这么多的定义，以前是几乎遇见一次都要百度一次，一看就会，然而没有做好总结下一次还是会忘掉，好记性终究敌不过烂笔头，这次做个总结，一劳永逸，个人愚见，请大家...
• 条件概率公式 要理解贝叶斯推断，必须先理解贝叶斯定理。后者实际上就是计算"条件概率"的公式。 所谓条件概率，就是指在事件B发生的情况下，事件A发生的概率，用P(A|B)来表示 根据韦恩图，可以很容易理解 在...
• 文章目录一、条件概率二、使用步骤1.引入库2.读入数据总结 一、条件概率 按字面意思理解，即事件A在事件B已经发生的情况下发生的概率。记作 P(A∣B)P(A|B)P(A∣B), 二、使用步骤 1.引入库 代码如下（示例）： ...
• ## 条件概率/全概率/贝叶斯公式

万次阅读 多人点赞 2018-07-17 11:39:05
1、条件概率公式 设A,B是两个事件，且P(B)>0,则在事件B发生的条件下，事件A发生的条件概率（conditional probability)为： P(A|B)=P(AB)/P(B) 分析：一般说到条件概率这一概念的时候，事...
• 2. 条件概率(conditional probability)，全概率（total probability），和贝叶斯概率(Bayes probability) 2.1联合概率==>条件概率： 2.2 联合概率==>全概率公式： 2.3 条件概率+联合概率==>贝叶斯概率...
• 边缘概率是这样得到的：在联合概率中，把最终结果中那些不需要的事件通过合并成它们的全概率，而消去它们（对离散随机变量用求和得全概率，对连续随机变量用积分得全概率），这称为边缘化（marginalization）。...
• 一、概率概率的本质是寻找随机性背后的规律，通常用公式： P（A）=随机事件A所包含的单位事件的数量/随机变量空间所包含所有单位事件的数量 任何一个随机时间，随机事件A都是随机事件总集合里的一个子集。 如...
• 学过概率理论的人都知道条件概率的公式：P(AB)=P(A)P(B|A)=P(B)P(A|B)；即事件A和事件B同时发生的概率等于在发生A的条件下B发生的概率乘以A的概率。由条件概率公式推导出贝叶斯公式：P(B|A)=P(A|B)P(B)/P(A)；即,...
• 前言 有挺长一段时间没有更新博客了，一方面是学校期末考试，后来又看了一些很...这次主要介绍的是多个随机变量之间的关系，主要涉及联合概率，边缘概率，条件概率这三种关系，还有一个利用他们之间关系导出的非常重要
• 条件概率，贝叶斯，全概率理解 条件概率条件概率的定义： 设A,B为随机试验的E的两个事件，且P（A）>0，则称，P(B|A)=P(AB)/P(A)为在事件A发生的条件下事件B发生的条件概率，或称为B关于A的条件概率。由...
• 可以用它来理解条件概率、先后验概率、全概率公式和贝叶斯公式，非常划算。 大概是一个这样的问题：有一个信号的发射端和接收端。发射端只发射A、B两种信号，其中发射信号A的概率为0.6，发射信号B的概率为0.4。当...

...