精华内容
下载资源
问答
  • 泊松分布–计算概率分布的公式

    千次阅读 2020-08-17 17:18:36
    泊松分布概率公式Probability Distributions play an important role in our daily lives. We commonly use them when trying to summarise and gain insights from different forms of data. 概率分布在我们的日常...

    Probability Distributions play an important role in our daily lives. We commonly use them when trying to summarise and gain insights from different forms of data.

    概率分布在我们的日常生活中起着重要作用。 在尝试总结不同形式的数据并从中获取见解时,我们通常使用它们。

    Because of this, they're quite an important topic in fields such as Mathematics, Computer Science, Statistics, and Data Science.

    因此,它们是数学,计算机科学,统计和数据科学等领域的重要主题。

    There are two main types of data: Numerical (for example integers and floats), and Categorical (for example strings of text).

    数据有两种主要类型: 数值 (例如整数和浮点数)和分类 (例如文本字符串)。

    Numerical data can also be in either of two forms:

    数值数据也可以采用以下两种形式之一:

    • Discrete: this form of data can just take a limited number of values (like the number of clothes we have). We can infer probability mass functions from discrete data.

      离散的:这种形式的数据只能接受有限数量的值(例如我们拥有的衣服数量)。 我们可以从离散数据推断概率质量函数。

    • Continuous: on the other hand, continuous data is used to describe more abstract concepts such as weight/distance which can take any fractional or real value. From continuous data we can instead infer probability density functions.

      连续的:另一方面,连续的数据用于描述更抽象的概念,例如权重/距离,它可以取任何分数或实数值。 我们可以从连续数据中推断出概率密度函数。

    Probability mass functions can give us the probability that a variable is equal to a certain value. On the other hand, the values of probability density functions do not represent probabilities on their own, but instead first need to be integrated (within the considered range).

    概率质量函数可以为我们提供变量等于某个值的概率。 另一方面,概率密度函数的值本身并不表示概率,而是首先需要积分(在所考虑的范围内)。

    什么是泊松分布? (What is a Poisson Distribution?)

    Poisson Distributions are commonly used for two main purposes:

    泊松分布通常用于两个主要目的:

    • Predicting how many times an event will take place within a chosen time period. This technique can be used for different risk analysis applications such as house insurance price estimation.

      预测事件在选定时间段内将发生多少次。 该技术可用于不同的风险分析应用,例如房屋保险价格估计。
    • Estimating a probability that an event might occur given how often it happened in the past (for example how likely it is that there will be a power-cut in the next two months).

      考虑到事件过去发生的频率,估计事件发生的可能性(例如,未来两个月停电的可能性有多大)。

    Poisson Distributions let us be confident of the average time between the occurrence of different events. They can't, however, tell us the precise moment an event might take place (since processes usually have stochastic behaviour).

    泊松分布使我们对不同事件发生之间的平均时间充满信心。 但是,他们无法告诉我们事件可能发生的确切时间(因为流程通常具有随机行为)。

    线性与非线性系统 (Linear vs non-linear systems)

    Natural systems can, in fact, be divided into two main categories: linear and non-linear (stochastic).

    实际上,自然系统可以分为两大类: 线性非线性(随机)

    In linear systems, causes always precede their effect which creates a strong time precedence effect.

    在线性系统中,原因总是先于其结果,从而产生很强的时间优先效应。

    But this doesn't instead hold true when talking about non-linear systems, as small changes in the system's initial conditions can lead to unpredictable outcomes.

    但这在谈论非线性系统时并不能成立,因为系统初始条件的微小变化会导致不可预测的结果。

    Considering how complex and chaotic our real world is, most processes are better described using non-linear systems, although linear approximations are sometimes possible.

    考虑到我们现实世界的复杂性和混乱性,使用非线性系统可以更好地描述大多数过程,尽管有时可以进行线性近似。

    Poisson Distributions can be modeled using the expression in the figure below, where λ is used to represent the expected number of events which can take place in the considered time-span.

    可以使用下图中的表达式对泊松分布建模,其中λ用于 表示在考虑的时间跨度内可能发生的预期事件数。

    The main characteristics which describe Poisson Processes are:

    描述泊松过程的主要特征是:

    1. Two events can't take place simultaneously.

      两个事件不能同时发生。
    2. The average rate between event occurrence is overall constant.

      事件发生之间的平均速率总体恒定。
    3. Events are independent of each other (if one happens, this does not have any influence on the probability that another event might take place).

      事件彼此独立(如果一个事件发生,则不会对另一事件发生的可能性产生任何影响)。
    4. Events can take place any number of times (within the considered time-span).

      事件可以发生任意次(在所考虑的时间跨度内)。

    泊松分布的一个例子 (An example of a Poisson Distribution)

    In the figure below, you can see how varying the expected number of events (λ) which can take place in a period can change a Poisson Distribution. The image below has been simulated, making use of this Python code:

    在下图中,您可以看到改变一个时期内可能发生的事件数(λ)如何改变泊松分布。 下面的图像已使用此Python代码进行了模拟:

    import numpy as np
    import matplotlib.pyplot as plt
    import scipy.stats as stats
    
    # n = number of events, lambd = expected number of events 
    # which can take place in a period
    for lambd in range(2, 12, 2):
        n = np.arange(0, 9)
        poisson = stats.poisson.pmf(n, lambd)
        plt.plot(n, poisson, '-o', label="λ = {:f}".format(lambd))
        plt.xlabel('Number of Events', fontsize=12)
        plt.ylabel('Probability', fontsize=12)
        plt.title("Poisson Distribution varying λ")
        plt.legend()
        plt.savefig('name.png')

    Taking a closer look to this simulation, we can discover the following patterns:

    仔细研究此模拟,我们可以发现以下模式:

    • In each of the different cases, the number assigned to λ corresponds to the peak of the distribution, which then trails off moving further away from the peak.

      在每种不同情况下,分配给λ的数字对应于分布的峰值,然后逐渐远离峰值。
    • The more events that are expected to take place during the simulation, the greater the expected area under the distribution curve will be.

      在模拟过程中预期发生的事件越多,分布曲线下的预期面积将越大。

    This type of simulation could, for example, be used to try to reduce the queuing time when going shopping to a supermarket.

    例如,可以使用这种类型的模拟来尝试减少去超市购物时的排队时间。

    The owner could create a record of how many customers visit the store at different times and on different days of the week in order to then fit this data to a Poisson Distribution.

    所有者可以创建一个记录,记录有多少顾客在一周的不同时间和一周中的不同日期访问该商店,然后将该数据拟合到泊松分布中。

    In this way, it would be much easier to determine how many cashiers should be working at different times of the day/week in order to enhance the customer experience.

    这样,确定一天/一周的不同时间应有多少个收银员工作以提高客户体验会容易得多。

    结语 (Wrapping up)

    In case you are interested in learning more about the applications of distributions in stochastic settings, more information is available here.

    如果您有兴趣了解更多有关随机环境中分布的应用的信息,请在此处获取更多信息。

    I hope you enjoyed this article, thank you for reading!

    希望您喜欢这篇文章,感谢您的阅读!

    联络我 (Contact me)

    If you want to keep updated with my latest articles and projects follow me on Medium and subscribe to my mailing list. These are some of my contacts details:

    如果您想随时了解我的最新文章和项目,请在Medium上关注我,并订阅我的邮件列表 。 这些是我的一些联系方式:

    翻译自: https://www.freecodecamp.org/news/poisson-distribution-a-formula-to-calculate-probability-distribution/

    展开全文
  • 概率论---泊松分布

    万次阅读 2018-11-09 16:17:54
    (一)泊松分布是什么 泊松分布是用于近似二项分布的情况的。二项分布有两个参数,一个是...(二)泊松分布公式以及通俗地推导过程 泊松分布公式:   通俗推导: 假设某一零件厂每天生成的次品数如下: ...

    (一)泊松分布是什么

    泊松分布是用于近似二项分布的情况的。二项分布有两个参数,一个是事件发生的概率p,一个是试验的总数n。当p非常小且n也有一定大的时候(n大于等于20,p小于等于0.05),就可以用泊松分布来近似二项分布,用泊松分布来近似二项分布的好处是计算方便。

     

    (二)泊松分布公式以及通俗地推导过程

    泊松分布公式:

    P(X=k)=\frac{\lambda ^{k}e^{-\lambda }}{k!}

     

    通俗推导:

    假设某一零件厂每天生成的次品数如下:

    周一周二周三周四周五
    37465

    均值为:

    假设我们把每天工厂生产时间设为T:

    再把T分为n=4份,并把周一生产出的三个次品放进去:

    此时工厂在每个时间段生成次品的概率就如同抛硬币,要么出现,要么不出现,这样子工厂生产次品的概率符合二项分布:

    \binom{4}{3}p^{^{3}}(1-p)^{^{1}}

    但当把数据换成周二的7个次品呢?

    则出现每个时间段多余一个次品的情况,这样的话就不符合二项分布了。要使其符合二项分布,就必须使n变大,现在让我们把n=8:

    这样子又能符合二项分布了:

    \binom{8}{7}p^{7}(1-p)^{^{1}}

    即只要不出现一个时间段内出现两个次品的情况,就能用二项分布解决。

    为了达成一个时间段内不出现两个次品的条件,我们干脆把n趋向于无穷,因为n越大,T分成的时间段就越多:

    更抽象一点,T时间里出现k个次品的概率为:(式子1)

    上式中,n趋于无穷,k是可以确定的,那么p应该怎么求呢?

    上面的式子1,已经符合二项分布的,而二项分布的期望为:

    因此:

    ----(式子2)

     

    有了式子2后,式子1可以变成:

    计算这个极限:

    因为当n \to \infty时:

    所以:

    最后把\mu =\lambda,得到泊松分布的概率密度函数的公式:

    画出概率密度函数:

    当k=8时,绿色部分加起来为0.93,即每天生产次品不超过8个的概率为0.93

    (三)总结:

    当p十分小且n也比较大的时候可以推荐用泊松分布(n大于等于20,p小于等于0.05)。

    (四)例题分析计算

    计算机硬件公司制造某芯片,次品率为0.1%,各芯片称为次品相互独立,求在1000个产品中至少有2只次品的概率,以X记产品中的次品数。

    解:

    用二项分布:

    P\left \{ X\geq 2 \right \}=1-P\left \{ X=0 \right \}-P\left \{ X=1 \right \} =1-(0.999)^{^{1000}}-\binom{1000}{1}(0.999)^{999}(0.001)\approx 0.2642411

    用泊松分布计算:

    由提:\lambda =1000\times 0.001=1,代入泊松分布的式子:

    P\left \{ X\geq 2 \right \}=1-P\left \{ X=0 \right \}-P\left \{ X=1 \right \}=1-e^{-1}-e^{^{-1}}\approx 0.2642411

    显然用泊松分布计算方便一点。

     

    展开全文
  • 当你学习指数分布的时候,经常会看到泊松分布的身影,网上的大部分教程讲的非常复杂,看完之后还是一头雾水。 本文本着通俗易懂的原则,使用生活中的例子,说明泊松分布和指数分布的关系。一下子学会了两种分布,有...

    当你学习指数分布的时候,经常会看到泊松分布的身影,网上的大部分教程讲的非常复杂,看完之后还是一头雾水。

    本文本着通俗易懂的原则,使用生活中的例子,说明泊松分布和指数分布的关系。一下子学会了两种分布,有没有很有成就感?

    泊松分布

    在日常生活中,许多事件是有一定的频率的,比如下面的例子。

    某公司平均每一小时接到三个用户电话。
    某超市平均每五小时卖掉一个玩具。
    一个网站平均每一分钟有二次访问。

    你有没有发现上面事件的一些共同点?细心的你会发现,上面的事件,只能估计事件发生的总数,但是不能知道具体发生的时间。如果我问你,上面的第一个例子,平均每一小时接到一个用户电话,下一小时接到几个电话?我们并不能准确知道。
    在这里插入图片描述
    泊松分布便是描述某段时间内,事件发生的次数的概率。

    泊松分布的概率密度函数公式如下,

    P ( N ( t ) = n ) = ( λ t ) n e − λ t n ! P(N(t)=n)=\frac{(\lambda t)^ne^{-\lambda t}}{n!} P(N(t)=n)=n!(λt)neλt
    上面的式子中, P P P表示概率, N N N表示某种函数关系, t t t表示时间段, n n n表示事件发生的次数。一小时内接到一个用户电话的概率表示为 P ( N ( 1 ) = 3 ) P(N(1)=3) P(N(1)=3) λ \lambda λ表示事件的频率。

    为了理解的更深入,咱们再多举一些例子。

    接下来两个小时,一个用户电话也没有的概率是0.025%,发生概率约等于零,计算方法如下所示,
    P ( N ( 2 ) = 0 ) = ( 3 × 2 ) 0 e − 3 × 2 0 ! ≈ 0.0025 P(N(2)=0)=\frac{(3\times2)^0e^{-3\times2}}{0!}\approx 0.0025 P(N(2)=0)=0!(3×2)0e3×20.0025

    接下来一个小时,至少有两个用户电话的概率是80%。计算方法如下所示,
    P ( N ( 1 ) ≥ 2 ) = 1 − P ( N ( 1 ) = 0 ) − P ( N ( 1 ) = 1 ) = 1 − ( 3 × 1 ) 0 e − 3 × 1 0 ! − ( 3 × 1 ) 1 e − 3 × 1 1 ! = 1 − e − 3 − 3 e − 3 = 1 − 4 e − 3 ≈ 0.8009 \begin{aligned} P(N(1)\geq 2)&=1-P(N(1)=0)-P(N(1)=1) \\ &=1-\frac{(3\times1)^0e^{-3\times1}}{0!}-\frac{(3\times1)^1e^{-3\times1}}{1!} \\ &=1-e^{-3}-3e^{-3} \\ &=1-4e^{-3} \\ &\approx 0.8009 \end{aligned} P(N(1)2)=1P(N(1)=0)P(N(1)=1)=10!(3×1)0e3×11!(3×1)1e3×1=1e33e3=14e30.8009

    通过上面的例子,相信大家对泊松分布的理解又上了一层楼。

    泊松分布的概率密度图大概长下面的样子,
    在这里插入图片描述
    在频率附近,事件的发生的概率最大。两边对称下降,意思是事件发生次数越大和越小概率越来越小。每小时接到三个用户的电话的概率是最大的,接到更多和更少的电话次数的概率变得越来越小。

    指数分布

    下面这些例子全是指数分布。

    来电的时间间隔。
    玩具销售的时间间隔。
    网站访问的时间间隔。

    细心的你发现了,上面的例子的共同点,时间间隔。

    指数分布描述事件发生的时间间隔的概率。

    指数分布和泊松分布有什么关系呢?指数分布的概率密度函数能从泊松分布的概率密度函数推导出来。

    为了通俗易懂,还是举例子来说明。

    假如下一个用户电话的间隔时间是 t t t,等价于 t t t时间内没有任何用户打电话。用公式表示如下所示,

    P ( X > t ) = P ( N ( t ) = 0 ) = ( λ t ) 0 e − λ t 0 ! = e − λ t \begin{aligned} P(X>t)&=P(N(t)=0) \\ &=\frac{(\lambda t)^0e^{-\lambda t}}{0!} \\ &=e^{-\lambda t} \end{aligned} P(X>t)=P(N(t)=0)=0!(λt)0eλt=eλt
    有了上式,用户在 t t t时间内打电话的概率是1减去上面的概率
    P ( X ≤ t ) = 1 − P ( X > t ) = 1 − e − λ t \begin{aligned} P(X\leq t)&=1-P(X>t) \\ &=1-e^{-\lambda t} \end{aligned} P(Xt)=1P(X>t)=1eλt

    有了上面的公式,我们计算一下接下来15分钟内,有用户打电话的概率是
    P ( X ≤ 0.25 ) = 1 − P ( X > t ) = 1 − e − 3 × 0.25 ≈ 0.5276 \begin{aligned} P(X\leq 0.25)&=1-P(X>t) \\ &=1-e^{-3\times 0.25} \\ &\approx0.5276 \end{aligned} P(X0.25)=1P(X>t)=1e3×0.250.5276
    我们再计算一下,用户接下来在15到30分钟内打电话的概率是
    P ( 0.25 ≤ X ≤ 0.5 ) = P ( X ≤ 0.5 ) − P ( X ≤ 0.25 ) = ( 1 − e − 3 × 0.5 ) − ( 1 − e − 3 × 0.25 ) = e − 0.75 − e − 1.5 ≈ 0.2492 \begin{aligned} P(0.25\leq X\leq 0.5)&=P(X\leq 0.5)-P(X\leq 0.25) \\ &=(1-e^{-3\times 0.5})-(1-e^{-3\times 0.25}) \\ &=e^{-0.75}-e^{-1.5} \\ &\approx 0.2492 \end{aligned} P(0.25X0.5)=P(X0.5)P(X0.25)=(1e3×0.5)(1e3×0.25)=e0.75e1.50.2492

    理解了吗?指数分布描述的是时间发生的时间间隔的概率。

    指数分布的概率密度函数长下面的样子。
    在这里插入图片描述
    因为概率密度函数图像呈现指数衰减的样子,所以起名叫指数分布。

    从上图能知道,随着时间间隔变长,事件发生的概率急剧下降。是指数式衰减的。

    还是上面的例子,每个小时内有三个用户打电话,下一个用户间隔2小时打电话的概率是0.25%,那么间隔3小时,4小时的概率,更加接近于0。

    总结

    一句话来说。

    泊松分布是单位时间内独立事件发生次数的概率分布。

    指数分布是独立事件的时间间隔的概率分布。

    展开全文
  • 泊松分布2.1.X=102.2.X小于等于10三.结果 一.二项分布 1.1.X=10 =BINOM.DIST(10,100,0.05,0) 1.2.X小于等于10 这个需要累计 =BINOM.DIST(10,100,0.05,1) 二.泊松分布 2.1.X=10 =POISSON.DIST(10,5,0) 2.2.X...
  • 离散型概率分布之三——泊松分布

    千次阅读 2018-05-05 21:56:42
    前面分别总结了一下二项分布和几何分布,这篇博客要总结一下泊松分布同系列博客,同样的思路。满足什么样的条件的分布才能称之为泊松分布?满足以下三个条件的分布就是泊松分布。(1)事件是独立的在概率论中,说两...
  • 3、选择二项分布概率函数 4、输入相应的参数 注: (1)在输入参数时点击相应的单元格即可 (2)最后一个空如果计算的是分布函数的值,填写:true ,如果计算的是概率函数的值填写:false 在此计算的是分布...
  • x=-3:0.2:3;...%泊松分布概率密度作图: x=0:20; y1=poisspdf(x,2.5);%以2.5 y2=poisspdf(x,5);%以5 y3=poisspdf(x,10);%以10 hold on plot(x,y1,':r*') plot(x,y2,':b*') plot(x,y3,':g*') hold off
  • 泊松分布

    千次阅读 2018-03-11 23:58:38
    序 你能预测去超市买方便面却发现没有调料包的概率吗? 或是你能预测你有多大的概率能骑上小黄歌会? 这些问题初看都很神奇,但都是可以被切切实实得计算出来的!...基本公式 设随机变量XXX表...
  • (1)泊松分布概率密度(不可靠度)计算公式MATLAB概率密度函数poisspdf调用格式:Y=poisspdf(x,λ),其中,x为随机变量;λ为不可靠度;(2)泊松分布累积概率密度函数(不可靠度函数)MATLAB累积概率密度函数poisscdf调用...
  • 离散型变量 如:二项分布、泊松分布 三者之间的关系 二项分布(Binomial distribution) 二项分布(Binomial distribution)是n重伯努利试验成功次数的离散概率分布,记作。伯努利试验是只有两种可能结果的单次随机...
  • 泊松分布的来源—公式推导—应用

    万次阅读 2018-05-29 13:27:19
    泊松分布由二项分布引出(二者都是离散型随机变量)首先必须由二项分布引出:如果做一件事情成功的概率是 p 的话,那么独立尝试做这件事情 n 次,成功次数的分布就符合二项分布。展开来说,在做的 n 次中,成功次数...
  • 概率分布之二项分布、泊松分布

    千次阅读 2019-08-03 22:41:13
    概率分布之二项分布、泊松分布、正态分布 1.概率分布 概率分布是指事件的不同结果对应的发生概率所构成的分布,可以利用二维坐标进行形象地解释。如下图所示,两幅图的横轴代表的都是事件所有的可能结果,纵轴则是...
  • 正确理解泊松分布

    千次阅读 2019-12-07 00:17:09
    那么我们大可停留在“只会做题”的阶段,因为试卷上不会出现“请发表一下你对泊松公式的看法”这样的题目,因为那样一来卷子就变得不容易批改,大部分考试都会出一些客观题,比如到底是泊松分布还是肉松分布。...
  • 在比特币创始论文的第11章中存在这样一个问题,就是为什么这个分布的期望为lamda=z*(q/p)?11. 计算设想如下场景:一个攻击者试图比诚实节点产生链条更快地制造替代性区块链。即便它达到了这一目的,但是整个系统也...
  • 泊松分布(poisson distribution)

    千次阅读 2021-01-11 22:12:02
    泊松分布是常见到的离散概率分布。 泊松分布的函数为: P(X=k)=λkk!e−λ,k=0,1,2…P(X = k)=\frac{\lambda^k}{k!}e^{-\lambda}, k=0,1,2\ldotsP(X=k)=k!λk​e−λ,k=0,1,2… 对此函数求和: ∑k=0+∞λkk!e−λ=e...
  • 泊松公式推导

    千次阅读 2021-03-03 18:06:37
    泊松分布是二项式分布的一种极限情况,一般用于时间或者面积这种可以无限细分的抽象概念。 问题引入 在一段时间T里面期望发生n次事件a,求在时间段T发生k次事件a的概率。(这里的期望指的是数学期望,就是n重伯努利...
  • 泊松分布 (Poisson Distribution) 定义 假设在一定时间间隔 (interval)中一个事件可能会发生0,1,2,…次,在一个间隔中平均发生事件的次数由λ\lambdaλ决定,λ\lambdaλ是事件发生比率 (event rate)。在一定时间...
  • 算法基础:泊松分布推导

    千次阅读 2019-11-14 11:39:54
    推导泊松分布公式,先理解一些概念   目录 先说说什么是二点分布 再说说二项分布 下面进入主题说说泊松分布 先说说什么是二点分布 抛一枚硬币,会出现两种情况: 出现花的一面设定为1...
  • 泊松分布以及相关分布的知识整理

    万次阅读 多人点赞 2019-03-31 09:48:14
    泊松分布是单位时间内事件发生的次数的概率。而泊松过程是是一种累积随机事件的发生次数的独立增量过程。泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。 泊松分布适合于描述单位时间内随机事件...
  • 泊松分布 & 指数分布 及其数字特征

    万次阅读 2018-10-05 05:41:17
    泊松分布概率函数为: 泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。 泊松分布适合于描述单位时间内随机事件发生的次数。 泊松分布的期望和方差均为 特征函数为 日常生活中,大量事件...
  • 二项分布与泊松分布

    千次阅读 2018-10-24 20:22:10
    要介绍二项分布,先要介绍伯努利实验,然后自然而然就想到了抛硬币问题,正面朝上的概率为p,反面朝上的概率为q (q = 1 - p),假设正面朝上标记为1,反面朝上为0,则一次伯努利实验的期望为p,方差为p*q。...
  • 1.2 概率分布概率分布=随机变量+概率+分布(在统计图中的形状);Python实现:科学计算SciPy的stats模块;#anaconda prompt下安装scipy包 conda install scipy #导入包,统计计算包的统计模块 import scipy.stats as...
  • 概率论——泊松分布

    2021-05-14 14:26:45
  • 2、概率分布概率分布=随机变量+概率+分布在python中的实现:科学计算包scipy的stats模块。3、概率分布概率分布分为两个类型,离散概率分布和连续概率分布。离散随机变量的概率计算公式要通过概率质量函数(PMF)来...
  • 又名两点分布或者0-1分布,是一个离散型概率分布,为纪念瑞士科学家雅各布·伯努利而命名。若伯努利试验成功,则伯努利随机变量取值为1。若伯努利试验失败,则伯努利随机变量取值为0。记其成功概率为p(0≤p≤1)p (0\...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 4,489
精华内容 1,795
关键字:

泊松分布的概率公式