精华内容
下载资源
问答
  • https://blog.csdn.net/michael_r_chang/article/details/39188321https://www.cnblogs.com/wybang/p/3206719.htmlhttps://blog.csdn.net/jteng/article/details/603346281. 伯努利分布伯努利分布(Bernoulli ...

    https://blog.csdn.net/michael_r_chang/article/details/39188321

    https://www.cnblogs.com/wybang/p/3206719.html

    https://blog.csdn.net/jteng/article/details/60334628

    1. 伯努利分布

    伯努利分布(Bernoulli distribution)又名两点分布0-1分布,介绍伯努利分布前首先需要引入伯努利试验(Bernoulli trial)

    • 伯努利试验是只有两种可能结果的单次随机试验,即对于一个随机变量X而言:

    伯努利试验都可以表达为“是或否”的问题。例如,抛一次硬币是正面向上吗?刚出生的小孩是个女孩吗?等等

    • 如果试验E是一个伯努利试验,将E独立重复地进行n次,则称这一串重复的独立试验为n重伯努利试验
    • 进行一次伯努利试验,成功(X=1)概率为p(0<=p<=1),失败(X=0)概率为1-p,则称随机变量X服从伯努利分布。伯努利分布是离散型概率分布,其概率质量函数为:

    2. 二项分布

    二项分布(Binomial distribution)是n重伯努利试验成功次数的离散概率分布。

    • 如果试验E是一个n重伯努利试验,每次伯努利试验的成功概率为p,X代表成功的次数,则X的概率分布是二项分布,记为X~B(n,p),其概率质量函数为

      显然,

    • 从定义可以看出,伯努利分布是二项分布在n=1时的特例
    • 二项分布名称的由来,是由于其概率质量函数中使用了二项系数,该系数是二项式定理中的系数,二项式定理由牛顿提出:

    • 二项分布的典型例子是扔硬币,硬币正面朝上概率为p, 重复扔n次硬币,k次为正面的概率即为一个二项分布概率。

    3. 多项分布

    多项式分布(Multinomial Distribution)是二项式分布的推广。二项式做n次伯努利实验,规定了每次试验的结果只有两个,如果现在还是做n次试验,只不过每次试验的结果可以有多m个,且m个结果发生的概率互斥且和为1,则发生其中一个结果X次的概率就是多项式分布。

    • 扔骰子是典型的多项式分布。扔骰子,不同于扔硬币,骰子有6个面对应6个不同的点数,这样单次每个点数朝上的概率都是1/6(对应p1~p6,它们的值不一定都是1/6,只要和为1且互斥即可,比如一个形状不规则的骰子),重复扔n次,如果问有k次都是点数6朝上的概率就是

    • 多项式分布一般的概率质量函数为:

    4. 贝塔分布

    在介绍贝塔分布(Beta distribution)之前,需要先明确一下先验概率、后验概率、似然函数以及共轭分布的概念。

    • 通俗的讲,先验概率就是事情尚未发生前,我们对该事发生概率的估计。利用过去历史资料计算得到的先验概率,称为客观先验概率; 当历史资料无从取得或资料不完全时,凭人们的主观经验来判断而得到的先验概率,称为主观先验概率。例如抛一枚硬币头向上的概率为0.5,这就是主观先验概率。
    • 后验概率是指通过调查或其它方式获取新的附加信息,利用贝叶斯公式对先验概率进行修正,而后得到的概率。
    • 先验概率和后验概率的区别:先验概率不是根据有关自然状态的全部资料测定的,而只是利用现有的材料(主要是历史资料)计算的;后验概率使用了有关自然状态更加全面的资料,既有先验概率资料,也有补充资料。另外一种表述:先验概率是在缺乏某个事实的情况下描述一个变量;而后验概率(Probability of outcomes of an experiment after it has been performed and a certain event has occured.)是在考虑了一个事实之后的条件概率。
    • 似然函数
    • 共轭分布(conjugacy):后验概率分布函数与先验概率分布函数具有相同形式

    好了,有了以上先验知识后,终于可以引入贝塔分布啦!!首先,考虑一点,在试验数据比较少的情况下,直接用最大似然法估计二项分布的参数可能会出现过拟合的现象(比如,扔硬币三次都是正面,那么最大似然法预测以后的所有抛硬币结果都是正面)。为了避免这种情况的发生,可以考虑引入先验概率分布来控制参数,防止出现过拟合现象。那么,问题现在转为如何选择

    先验概率和后验概率的关系为:

    二项分布的似然函数为(就是二项分布除归一化参数之外的后面那部分,似然函数之所以不是pdf,是因为它不需要归一化):

    如果选择的先验概率也与次方德乘积的关系,那么后验概率分布的函数形式就会跟它的先验函数形式一样了。具体来说,选择prior的形式是,那么posterior就会变成这个样子了(为pdf的归一化参数),所以posterior和prior具有相同的函数形式(都是也与次方的乘积),这样先验概率与后验概率就是共轭分布了。

    所以,我们选择了贝塔分布作为先验概率,其概率分布函数为:

    ,其中

    5. 狄利克雷分布

    狄利克雷分布(Dirichlet distribution)是多项分布的共轭分布,也就是它与多项分布具有相同形式的分布函数。

    • 概率分布函数为:

    6. 后记

    本篇博文只是将伯努利分布、二项分布、多项分布、贝塔分布和狄利克雷分布做了简单的介绍,其中涉及到大量的概率基础和高等数学的知识,文中的介绍只是粗浅的把这些分布的概念作了大概介绍,没有对这些分布的产生历史做介绍。我想,更好的介绍方式,应是从数学史的角度,将这几项分布的发现按照历史规律来展现,这样会更直观、形象。后续再补吧!


       在机器学习领域中,概率模型是一个常用的利器。用它来对问题进行建模,有几点好处:1)当给定参数分布的假设空间后,可以通过很严格的数学推导,得到模型的似然分布,这样模型可以有很好的概率解释;2)可以利用现有的EM算法或者Variational method来学习。通常为了方便推导参数的后验分布,会假设参数的先验分布是似然的某个共轭分布,这样后验分布和先验分布具有相同的形式,这对于建模过程中的数学推导可以大大的简化,保证最后的形式是tractable。

        在概率模型中,Dirichlet这个词出现的频率非常的高。初始机器学习的同学或者说得再广一些,在学习概率模型的时候,很多同学都不清楚为啥一个表现形式如此奇怪的分布Dirichlet分布会出现在我们的教科书中,它是靠啥关系攀上了多项分布(Multinomial distribution)这个亲戚的,以至于它可以“堂而皇之”地扼杀我大天朝这么多数学家和科学家梦想的?为了引出背后这层关系,我们需要先介绍一个概念——共轭先验(Conjugate Prior)

    • Conjugate Prior: In Bayesian probability theory, if the posterior distributions p(θ|x) are in the same family as the prior probability distribution p(θ), the prior and posterior are then called conjugate distributions, and the prior is called a conjugate prior for the likelihood. ----from wiki
    • 用中文来讲,在贝叶斯统计理论中,如果某个随机变量Θ的后验概率 p(θ|x)和气先验概率p(θ)属于同一个分布簇的,那么称p(θ|x)和p(θ)为共轭分布,同时,也称p(θ)为似然函数p(x|θ)的共轭先验。

        介绍了这个重要的概念之后,我们回到文章的正题。首先需要弄清楚什么是二项分布(Binomial distribution)。这个概念是从伯努利分布推进的。伯努利分布是一个离散型的随机分布,其中的随机变量只有两类取值,非正即负{+,-}。二项分布即重复n次的伯努利试验,记为 X~b(n,p)。概率密度函数(概率质量函数)为。再来看看Beta分布,给定参数,取值范围为[0,1]的随机变量x的概率密度函数,其中。这里假定,先验分布和似然概率如下所示:

    那么很容易知道后验概率为

         弄清楚了Beta分布和二项分布之间的关系后,对于接下来的Dirichlet 分布和多项分布(Multinomial distribution)的关系理解将会有非常大的帮助。多项分布,从字面上所表现出的含义,我们也大抵知道它的意思。它本身确实也是这样的,其单次试验中的随机变量的取值不再是0-1的,而是有多种离散值可能(1,2,3...,k),其中。多项分布的概率密度函数为。而Dirichlet分布的的密度函数形式也如出一辙:,其中。到这里,我们可以看到Beta分布和Dirichlet 分布有多相似啊,二项分布和多项分布有多相似啊

         再一次来看看共轭。假设有先验分布

    另有似然函数

    则后验概率

    ,和Dirichlet 分布形式一致。

        其实,细心的读者已经发现,这里这四类分布,如果但从数学形式上看,它们的组织形式都是一致的,都是通过乘积的形式构成,加上先验分布、似然函数和后言分布之间的乘积推导关系,可以很容易发现,它们所表现出的共轭性质很容易理解。


    Beta分布与Dirichlet分布的定义域均为[0,1],在实际使用中,通常将两者作为概率的分布,Beta分布描述的是单变量分布,Dirichlet分布描述的是多变量分布,因此,Beta分布可作为二项分布的先验概率,Dirichlet分布可作为多项分布的先验概率。这两个分布都用到了Gamma函数,所以,首先了解一下Gamma函数。

    1. Gamma函数

      首先看其表达式 
      Γ(x)=0tx1etdtΓ(x)=∫0∞tx−1e−tdt 
    这样的表达看懂都很难,更不知道那些数学家怎么想出来的。据LDA数学八卦中记录,在Gamma函数的发现中做出主要贡献的数学家有哥德巴赫、丹尼尔·伯努利(不是伯努利分布的那个伯努利),最终由欧拉解决这个问题(这些大数学家互相都认识的啊)。 
      Gamma函数是对阶乘在实数领域的扩展,也就是说,Γ(x+1)=xΓ(x)Γ(x+1)=xΓ(x),下面用分部积分的方法进行推导,如不关心,可以略过。 
      

    Γ(x)=0tx1etdt=1x0etdtx=1x(ettx|00txdet)=1x0txetdt=1xΓ(x+1)Γ(x)=∫0∞tx−1e−tdt=1x∫0∞e−tdtx=1x(e−ttx|0∞−∫0∞txde−t)=1x∫0∞txe−tdt=1xΓ(x+1)

    据PRML第71页(2.14)式,Gamma函数在Beta分布和Dirichlet分布中起到了归一化的作用。

    2. Beta分布

      Beta分布描述的是定义在区间[0,1]上随机变量的概率分布,由两个参数α>0α>0β>0β>0决定,通常记为μBeta(μ|α,β)μ∼Beta(μ|α,β),其概率密度函数如下 
      P(μ|α,β)=Γ(α+β)Γ(α)Γ(β)μα1(1μ)β1=1B(α,β)μα1(1μ)β1P(μ|α,β)=Γ(α+β)Γ(α)Γ(β)μα−1(1−μ)β−1=1B(α,β)μα−1(1−μ)β−1 
    其中,Γ()Γ(⋅)就是Gamma函数,B(α,β)B(α,β)为Beta函数,并且 
      B(α,β)=Γ(α)Γ(β)Γ(α+β)B(α,β)=Γ(α)Γ(β)Γ(α+β) 
    Beta分布的概率密度函数曲线如下图:(摘自wikipedia Beta distribution


    Beta distribution 

    由于Beta分布定义在区间[0,1]上,所以适合作为概率的分布。第一段提到Beta分布可作为二项分布的先验概率,那就需要从二项分布的定义来理解Beta分布的形式。已知二项分布的形式为: 
       p(x=k|n,μ)=Cknμk(1μ)nkp(x=k|n,μ)=Cnkμk(1−μ)n−k  
    μμ 进行后验概率估计时,其似然项是 μμ (1μ)(1−μ) 的指数形式,如果先验概率也选择为 μμ (1μ)(1−μ) 的指数形式,那么后验概率就仍然保持这种指数形式,这种性质叫做共轭分布,我们会在后面的文章中对共轭分布进行介绍。 
    因此,Beta分布就是 μμ (1μ)(1−μ) 的指数形式,其中Beta函数为归一化系数。Beta分布的均值和方差分别为 
       E[μ]=αα+βE[μ]=αα+β  
       var(μ)=αβ(α+β)2(α+β+1)var(μ)=αβ(α+β)2(α+β+1)

    3. Dirichlet分布

      Dirichlet分布是关于定义在区间[0,1]上的多个随机变量的联合概率分布,假设有dd个变量μiμi,并且di=1μi=1∑i=1dμi=1,记μ=(μ1,μ2,...,μd)μ=(μ1,μ2,...,μd),每个μiμi对应一个参数αi>0αi>0,记α=(α1,α2,...,αd)α=(α1,α2,...,αd)α^=di=1αiα^=∑i=1dαi,那么它的概率密度函数为 
    p(μ|α)=Dir(μ|α)=Γ(α^)Γ(α1)Γ(αd)di=1μαi1ip(μ|α)=Dir(μ|α)=Γ(α^)Γ(α1)⋯Γ(αd)∏i=1dμiαi−1 
      Dirichlet分布的每一个随机变量具有统计量如下: 
      E[μi]=αiα^E[μi]=αiα^ 
      var(μi)=αi(α^αi)α^2(α^+1)var(μi)=αi(α^−αi)α^2(α^+1) 
      cov(μi,μj)=αiαjα^2(α^+1)cov(μi,μj)=αiαjα^2(α^+1) 
      由于Dirichlet分布描述的是多个定义于区间[0,1]的随机变量的概率分布,所以通常将其用作多项分布参数μiμi的概率分布。



    展开全文
  • 二项分布

    千次阅读 2013-12-11 09:58:48
    二项分布[编辑] 维基百科,自由的百科全书 二项分布 机率 质量 函数 累积分布函数 参数  试验次数 (整数)  成功概率 (实数) 值域 概率密度函数 ...

    二项分布[编辑]

    维基百科,自由的百科全书
    二项分布
    机率 质量 函数
    累积分布函数
    参数 n \geq 0 试验次数 (整数)
    0\leq p \leq 1 成功概率 (实数)
    值域 k \in \{0,\dots,n\}\!
    概率密度函数 {n\choose k} p^k (1-p)^{n-k} \!
    累积分布函数 I_{1-p}(n-\lfloor k\rfloor, 1+\lfloor k\rfloor) \!
    标记 {{{notation}}}
    期望值 n\,p\!
    中位数 \{\lfloor np\rfloor, \lceil np \rceil\}之一
    众数 \lfloor (n+1)\,p\rfloor\!\lfloor (n+1)\,p\rfloor\!-1
    方差 n\,p\,(1-p)\!
    偏态 \frac{1-2\,p}{\sqrt{n\,p\,(1-p)}}\!
    峰态 \frac{1-6\,p\,(1-p)}{n\,p\,(1-p)}\!
    熵值 \frac{1}{2} \ln \left( 2 \pi n e p (1-p) \right) + O \left( \frac{1}{n} \right)\!
    动差生成函数 (1-p + p\,e^t)^n \!
    特征函数 (1-p + p\,e^{i\,t})^n \!

    概率论统计学中,二项分布n独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率p。这样的单次成功/失败试验又称为伯努利试验。实际上,当n = 1时,二项分布就是伯努利分布。二项分布是显著性差异二项试验的基础。

    详述[编辑]

    概率质量函数[编辑]

    一般地,如果随机变量\mathit{X}服从参数为\mathit{n}\mathit{p}的二项分布,我们记X \sim b(n,p)X \sim B(n,p).n次试验中正好得到k次成功的概率由概率质量函数给出:

     f(k;n,p) = \Pr(K = k) = {n\choose k}p^k(1-p)^{n-k}

    对于k = 0, 1, 2, ..., n,其中{n\choose k}=\frac{n!}{k!(n-k)!}

    二项式系数(这就是二项分布的名称的由来),又记为C(nk),  nCk,或nCk。该公式可以用以下方法理解:我们希望有k次成功(pk)和n − k次失败(1 − p)n − k。然而,k次成功可以在n次试验的任何地方出现,而把k次成功分布在n次试验中共有C(nk)个不同的方法。

    在制造二项分布概率的参考表格时,通常表格中只填上n/2个值。这是因为k > n/2时的概率可以从它的补集计算出:

    f(k;n,p)=f(n-k;n,1-p). \,

    因此,我们要看另外一个k和另外一个p(二项分布一般不是对称的)。然而,它的表现不是任意的。总存在一个整数M,满足

    (n+1)p-1 < M \leq (n+1)p. \,

    作为k的函数,表达式ƒ(knp)当k < M时单调递增,k > M时单调递减,只有当(n + 1)p是整数时例外。在这时,有两个值使ƒ达到最大:(n + 1)p和(n + 1)p − 1。M是伯努利试验的最可能的结果,称为众数。注意它发生的概率可以很小。

    累积分布函数[编辑]

    累积分布函数可以表示为:

    F(x;n,p) = \Pr(X \le x) = \sum_{i=0}^{\lfloor x \rfloor} {n\choose i}p^i(1-p)^{n-i}.

    其中\scriptstyle \lfloor x\rfloor\,是小于或等于x最大整数

    它也可以用正则化不完全贝塔函数来表示:

    \begin{align}F(k;n,p) & = \Pr(X \le k) = I_{1-p}(n-k, k+1) \\& = (n-k) {n \choose k} \int_0^{1-p} t^{n-k-1} (1-t)^k \, dt.\end{align}

    期望和方差[编辑]

    如果X ~ B(np)(也就是说,X是服从二项分布的随机变量),那么X期望值

        \operatorname{E}[X] = np

    方差

        \operatorname{Var}[X] = np(1 - p).

    这个事实很容易证明。首先假设有一个伯努利试验。试验有两个可能的结果:1和0,前者发生的概率为p,后者的概率为1 − p。该试验的期望值等于μ = 1 · p + 0 · (1−p) = p。该试验的方差也可以类似地计算:σ2 = (1−p)2·p + (0−p)2·(1−p) = p(1 − p).

    一般的二项分布是n次独立的伯努利试验的和。它的期望值和方差分别等于每次单独试验的期望值和方差的和:

        \mu_n = \sum_{k=1}^n \mu = np, \qquad    \sigma^2_n = \sum_{k=1}^n \sigma^2 = np(1 - p).

    众数和中位数[编辑]

    通常二项分布B(n, p)的众数等于⌊(n + 1)p⌋,其中e ⌊ ⌋ 是取整函数。然而,当(n + 1)p是整数且p不等于0或1时,分布有两个众数:(n + 1)p和(n + 1)p − 1。当p等于0或1时,众数相应地等于0或 n。这些情况可以综述如下:

        \text{mode} =       \begin{cases}        \lfloor (n+1)\,p\rfloor & \text{if }(n+1)p\text{ is 0 or a noninteger}, \\        (n+1)\,p\ \text{ and }\ (n+1)\,p - 1 &\text{if }(n+1)p\in\{1,\dots,n\}, \\        n & \text{if }(n+1)p = n + 1.      \end{cases}

    一般地,没有一个单一的公式可以求出二项分布的中位数,甚至中位数可能是不唯一的。然而有几个特殊的结果:

    • 如果np是整数,那么平均数、中位数和众数相等,都等于np[1][2]
    • 任何中位数m都位于区间⌊np⌋ ≤ m ≤ ⌈np⌉内。[3]
    • 中位数m不能离平均数太远:|m − np| ≤ min{ ln 2, max{p, 1 − p} }。[4]
    • 如果p ≤ 1 − ln 2,或p ≥ ln 2,或|m − np| ≤ min{p, 1 − p}(除了p = ½、n是奇数的情况以外),那么中位数是唯一的,且等于m = round(np)。[3][4]
    • 如果p = 1/2,且n是奇数,那么区间½(n − 1) ≤ m ≤ ½(n + 1)中的任何数m都是二项分布的中位数。如果p = 1/2且n是偶数,那么m = n/2是唯一的中位数。

    两个二项分布的协方差[编辑]

    如果有两个服从二项分布的随机变量XY,我们可以求它们的协方差。利用协方差的定义,当n = 1时我们有

    \operatorname{Cov}(X, Y) = \operatorname{E}(XY) - \mu_X \mu_Y.

    第一项仅当XY都等于1时非零,而μXμY分别为X = 1和Y = 1的概率。定义pBXY都等于1的概率,便得到

    \operatorname{Cov}(X, Y) = p_B - p_X p_Y, \,

    对于n次独立的试验,我们便有

    \operatorname{Cov}(X, Y)_n = n ( p_B - p_X p_Y ). \,

    如果XY是相同的变量,便化为上面的方差公式。

    与其他分布的关系[编辑]

    二项分布的和[编辑]

    如果X ~ B(np)和Y ~ B(mp),且XY相互独立,那么X + Y也服从二项分布;它的分布为

    X+Y \sim B(n+m, p).\,

    伯努利分布[编辑]

    伯努利分布是二项分布在n = 1时的特殊情况。X ~ B(1, p)与X ~ Bern(p)的意思是相同的。相反,任何二项分布B(np)都是n次独立伯努利试验的和,每次试验成功的概率为p

    泊松二项分布[编辑]

    二项分布是泊松二项分布的一个特殊情况。泊松二项分布n次独立、不相同的伯努利试验(pi)的和。如果X服从泊松二项分布,且p1 = … = pn =p,那么X ~ B(np)。

    正态近似[编辑]

    n = 6、 p = 0.5时的二项分布以及正态近似

    如果n足够大,那么分布的偏度就比较小。在这种情况下,如果使用适当的连续性校正,那么B(np)的一个很好的近似是正态分布

     \mathcal{N}(np,\, np(1-p)).

    n越大(至少20),近似越好,当p不接近0或1时更好。[5]不同的经验法则可以用来决定n是否足够大,以及p是否距离0或1足够远:

    • 一个规则是x=npn(1 − p)都必须大于 5。

    泊松近似[编辑]

    当试验的次数趋于无穷大,而乘积np固定时,二项分布收敛于泊松分布。因此参数为λ = np的泊松分布可以作为二项分布B(np)的近似,如果n足够大,而p足够小。[6]

    极限[编辑]

    • n趋于∞,p趋于0,而np固定于λ > 0,或至少np趋于λ > 0时,二项分布B(np)趋于期望值为λ的泊松分布
    • n趋于∞而p固定时,
    {X-np \over \sqrt{np(1-p)\ }}
    的分布趋于期望值为 0、 方差为 1的 正态分布。这个结果是 中心极限定理的一个特殊情况。

    例子[编辑]

    一个简单的例子如下:掷一枚骰子十次,那么掷得4的次数就服从n = 10、p = 1/6的二项分布。

    参见[编辑]

    展开全文
  • 二项分布和多项分布

    千次阅读 2017-07-11 19:56:57
    0-1分布: 在一次试验中,要么为0要么为1的分布,叫0-1分布二项分布: ...做n次伯努利实验,每次实验为1的概率为p,...换一种表达方式,做n次伯努利实验,每次实验为1的概率是p1, 实验为0的概率是p2,有p1+p2=1;

    0-1分布:

    在一次试验中,要么为0要么为1的分布,叫0-1分布。

    二项分布:

    做n次伯努利实验,每次实验为1的概率为p,实验为0的概率为1-p;有k次为1,n-k次为0的概率,就是二项分布B(n,p,k)。

    二项分布计算:

    B(n,p,k) = 


    换一种表达方式,做n次伯努利实验,每次实验为1的概率是p1, 实验为0的概率是p2,有p1+p2=1;问x1次为实验为1,x2次实验为0,有x1+x2=n,该事件的概率B(x1,x2,p1,p2)是多少?

    B(x1,x2,p1,p2) =


    多项式分布:

    推广一下,考虑如果有三种可能,即伯努利抛硬币试验中,硬币比较厚,有可能立起来,即可能是正面,反面,立起来,其概率分别是p1,p2,p3,那么进行n次试验以后,正面出现x1次,反面x2次,立起来x3次的(保证x1+x2+x3=n)概率是多少?

    可以按照上面的规律,猜想式子为:


    式子是正确的,这就是多项式的分布的表达式,下面从意义上证明一下式子:

    全排列有n!种情况,那么对于每一个正、反、立的序列:

    正正反立正反立……立反

    都包含这x1!*x2!x3!种全排列的情况,因此可知其成立。

    展开全文
  • 说起二项分布(binomial distribution),不得不提的前提是伯努利试验(Bernoulli experiment),也即n次独立重复试验。伯努利试验是在同样的条件下重复、相互独立进行的一种随机试验。伯努利试验的特点是:(1)每次试验...

    说起二项分布(binomial distribution),不得不提的前提是伯努利试验(Bernoulli experiment),也即n次独立重复试验。伯努利试验是在同样的条件下重复、相互独立进行的一种随机试验。

    伯努利试验的特点是:

    (1)每次试验中事件只有两种结果:事件发生或者不发生,如硬币正面或反面,患病或没患病;

    (2)每次试验中事件发生的概率是相同的,注意不一定是0.5;

    (3)n次试验的事件相互之间独立。

    举个实例,最简单的抛硬币试验就是伯努利试验,在一次试验中硬币要么正面朝上,要么反面朝上,每次正面朝上的概率都一样p=0.5,且每次抛硬币的事件相互独立,即每次正面朝上的概率不受其他试验的影响。如果独立重复抛n=10次硬币,正面朝上的次数k可能为0,1,2,3,4,5,6,7,8,9,10中的任何一个,那么k显然是一个随机变量,这里就称随机变量k服从二项分布。

    我们推导下随机变量X=k的分布律。显然0<=k<=n,n次抛硬币中获得k次正面,第1次正面在n次抛硬币中出现有n种方式,则第2次正面在n次抛硬币中出现有n-1种方式,以此类推,则出现的总可能方式是:n(n-1)...(n-k+1)种,如果我们并不考虑这k次正面出现的排列顺序,因此恰好出现k次的总可能性是n(n-1)...(n-k+1)/k!种,分子和分母同时乘以(n-k)!,则该式等于n!/(k!*(n-k)!),也就是通常的组合公式C(n,k)=n!/(k!*(n-k)!)。

    那么对于抛n次硬币,其中正面出现的次数是k,反面出现的次数必然为n-k次,不考虑顺序的情况下,则每一次恰好获得k次正面的概率是pk*(1-p)n-k,而n次试验中恰好出现k次正面的可能性是C(n,k)=n!/(k!*(n-k)!)种,因此,n次抛硬币中恰好出现k次的概率为

    P(X=k) = C(n,k) * pk*(1-p)n-k

    这就是二项分布的分布律,记作X~B(n,p),其中C(n,k)是组合数,在数学中也叫二项式系数,这就是二项分布名称的来历。判断某个随机变量X是否符合二项分布除了满足上述的伯努利试验外,关键是这个X是否表示事件发生的次数。二项分布的数学期望E(X)=n*p,方差D(X)=n*p*(1-p),具体证明可见《二项分布均值和方差的简单推导》。

    看一个示例:某人篮球投篮的命中率是0.3,总共投篮10次,问至少投中2次的概率?

    分析:

    (1)每次投篮有2种结果,投中或没投中;

    (2)每次投篮的投中概率是相同的,都为0.3;

    (3)每次投篮可认为是独立事件。

    因此,符合二项分布。

    a9231e39c522?from=timeline

    投中次数的概率质量分布

    显然,二项分布属于离散型分布。

    至少2次投中概率即:P(X>=2)=P(X=2)+P(X=3)+P(X=4)+...+P(X=10)。

    输出结果:0.85

    再看一个例子:某种疫苗注射后过敏反应的概率是0.08,问某社区卫生院在接种该疫苗100人后,少于3人有过敏反应的概率是多少?

    采用上例中的分析方法,该问题也属于二项分布问题。少于3人有过敏反应,即求:

    在实际应用中还有伯努利分布、两点分布、0-1分布等,它们与二项分布之间有什么关系呢?

    X~B(n,p),当n = 1时,二项分布就变成了伯努利分布(Bernoulli distribution),伯努利分布又称为“两点分布”或“0-1分布”,或者说伯努利分布/两点分布/0-1分布是二项分布在n=1时的特例,即伯努利分布、两点分布、0-1分布这三种分布是同一个分布的不同名称,又都是二项分布在n=1时的特例。

    泊松概率分布

    泊松概率是另外一个常用的离散型随机变量,它主要用于估计某事件在特定时间或空间中发生的次数。比如一天内中奖的个数,一个月内某机器损坏的次数等。

    泊松概率的成立条件是在任意两个长度相等的区间中,时间发生的概率是相同的,并且事件是否发生都是相互独立的。

    泊松概率既然表示事件在一个区间发生的次数,这里的次数就不会有上限,x取值可以无限大,只是可能性无限接近0,f(x)的最终值很小。

    a9231e39c522?from=timeline

    泊松概率还有一个重要性质,它的数学期望和方差相等。

    让我们先通过一个例子,了解什么是"泊松分布"。

    已知某家小杂货店,平均每周售出2个水果罐头。请问该店水果罐头的最佳库存量是多少?

    假定不存在季节因素,可以近似认为,这个问题满足以下三个条件:

    (1)顾客购买水果罐头是小概率事件。

    (2)购买水果罐头的顾客是独立的,不会互相影响。

    (3)顾客购买水果罐头的概率是稳定的。

    在统计学上,只要某类事件满足上面三个条件,它就服从"泊松分布"。

    各个参数的含义:

    P:每周销售k个罐头的概率。

    X:水果罐头的销售变量。

    k:X的取值(0,1,2,3...)。

    λ:每周水果罐头的平均销售量,是一个常数,本题为2。

    a9231e39c522?from=timeline

    从上表可见,如果存货4个罐头,95%的概率不会缺货(平均每19周发生一次);如果存货5个罐头,98%的概率不会缺货(平均59周发生一次)。

    泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数,宇宙中单位体积内星球的个数 ,耕地上单位面积内杂草的数目等 。

    展开全文
  • 离散型变量 如:二项分布、泊松分布 三者之间的关系 二项分布(Binomial distribution) 二项分布(Binomial distribution)是n重伯努利试验成功次数的离散概率分布,记作。伯努利试验是只有两种可能结果的单次随机...
  • 伯努利分布 瑞士数学家雅克·伯努利``(Jacques Bernoulli,1654~1705)首次研究独立重复试验(每次成功率为p)。在他去世后的第8年(1713年),他侄子...二项分布(Binomial Distribution, 维基百科)是n个独立的是...
  • 1. RNA-seq为什么是负二项分布? 2.负二项分布解释 3.DESeq2基于负二项分布找差异基因 4.生物信息学基础知识1 5.生物信息学基础知识2 6.广义线性回归模型 7.广义线性回归模型 ...
  • 0-1分布: 在一次试验中,要么为0要么为1的分布,叫0-1分布二项分布: 做n次伯努利实验,每次实验为1的...有k次为1,n-k次为0的概率,就是二项分布B(n,p,k)。 二项分布计算: B(n,p,k) =  换一种表达...
  • 二项分布(Binomial Distribution)

    万次阅读 2017-09-15 12:48:16
    二项分布(Binomial Distribution)
  • 文章目录伯努利分布二项分布项分布贝塔分布狄利克雷分布高斯分布 伯努利分布 伯努利分布(Bernoulli distribution)又名两点分布或0-1分布,介绍伯努利分布前首先需要引入伯努利试验(Bernoulli trial)。 伯努利...
  • 最近在撰写笔记 【Sklearn源码学习笔记】(含官网样例解读)无监督学习之高斯混合模型 的过程中,官方Sklearn源码中...本文分三个部分“【二项分布】”、“【多项分布】”、“【Beta分布】”、“【狄利克雷分布...
  • 二项分布的基本概念

    万次阅读 2016-11-14 10:48:31
    说起二项分布(binomial distribution),不得不提的前提是伯努利试验(Bernoulli experiment),也即n次独立重复试验。伯努利试验是在同样的条件下重复、相互独立进行的一种随机试验。  伯努利试验的特点是: (1)...
  • Python模拟二项分布

    千次阅读 2019-08-05 17:17:04
    Python的numpy库中有二项分布采样的函数: numpy.random.binomial(n,p,size=None) 3个参数:n表示伯努利试验次数,p表示伯努利试验得到正例的概率,size表示采样次数;返回结果为出现正例的次数k。 可以使用该...
  • 二项分布最大值,泊松分布的推导,几何分布的推导 (概统2.应用) 1.二项分布 二项分布就是独立事件n重伯努利试验,每次试验只有A发生与不发生两种结果,求n次试验中恰好发生k次的概率。 P{X=k} = $C_{n}^{k}p^{k}q...
  • 二项分布期望与方差的证明

    千次阅读 2017-08-31 09:39:39
    种子萌发试验,有n颗种子,每颗种子萌发的概率是p,发芽了x颗的概率就服从二项分布。 如果还是迷茫,就听我说说故事,在古代,大概明末清初的时候,瑞士有个家族,叫伯努利家族,出了很多数学家,有
  • 二项分布和泊松分布分析 一、泊松分布 日常生活中,大量的事件是有固定频率的: 它们的特点就是,我们可以预估这些事件的总数,但是没法知道具体的发生时间。已知平均每小时出生3个婴儿,请问下一个小时,会...
  • 完全原创,无半点抄袭 beta分布二项分布 共轭先验 beta分布与Dirichlet分布 Dirichlet分布与多项式分布
  • 方法SPSS中的二项分布检验,在样本小于或等于30时,按照计算二项分布概率的公式进行计算;样本数大于30时,计算的是Z统计量,认为在零假设下,Z统计量服从正态分布。Z统计量的计算公式如下SPSS将自动计算Z统计量,并...
  • 伯努利分布二项分布、几何分布、超几何分布、泊松分布都是离散型随机变量。 1 伯努利分布:就是常见的0-1 分布,各自的频率为1-p和p ,当x=0 或者x=1 的时候,: p(x) = 期望: 方差: 对于伯努利分布来说 ,...
  • 由于负二项分布的展开式不如二项分布那么常用,故在推导其期望方差等数字特征时,会碰到一些问题,本文展示了二项分布和其他分布的关系,并且给出了负二项分布的数字特征的推导过程,方便小伙伴理解,以减少想入门...
  • 1.伯努利分布二项分布  对于伯努利分布,我们是十分熟悉的,从小学开始,老师就教会我们如何对掷硬币这件事进行数据建模:对于一个二元随机变量,表示掷硬币结果为正面朝上,表示反面朝上。根据常识,我们都认为...
  • 比如几何分布的无记忆性、二项分布的泊松近似、超几何分布二项近似。。。。可作为离散分布的知识速查表。 目录 1. 二项分布b(n,p) 2. 泊松分布 3 超几何分布 4 几何分布 5 负二项分布 / 巴斯卡分布 6 常用...
  • 伯努利随机变量、二项分布、几何分布、超几何分布、泊松分布导语 对于任何一个学习概率论的童鞋来说,各种分布都是很头痛的一件事情,本篇主要讨论的是离散型随机变量.伯努利分布 伯努利分布就是我们常见的0-1分布...
  • 1. 单个二项分布检验用SPSS二项检验或者单样本T检验 2. 比较两个个二项分布差异性之类的可以用Anova或者独立样本T检验,后者可以得到置信区间。 3.上面的SPSS数据形式都是1和0的形式,用MATLAB生成即可。 譬如这样...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 313,904
精华内容 125,561
关键字:

二项分布的表示方法