精华内容
下载资源
问答
  • 二项分布公式中的c
    万次阅读
    2020-03-30 19:45:34

    本文链接个人站 | 简书 | CSDN
    版权声明:除特别声明外,本博客文章均采用 BY-NC-SA 许可协议。转载请注明出处。

    之前在介绍 DeepAR 等时间序列预测模型时,为了简单起见,我们使用了大家比较熟悉的正态分布作为示例。在实际应用中,需要根据数据本身的特点选择合适的分布。泊松分布、二项分布、以及负二项分布都可以用来刻画计数类数据。其中,泊松分布的 μ = σ 2 \mu=\sigma^2 μ=σ2,二项分布的 μ ≥ σ 2 \mu\geq\sigma^2 μσ2,负二项分布的 μ ≤ σ 2 \mu\leq\sigma^2 μσ2。在我日常接触的业务场景中, μ ≤ σ 2 \mu\leq\sigma^2 μσ2 较为常见,为此免不了要跟负二项分布打交道。

    虽然没什么必要,但是本着「有困难要上,没困难创造困难也要上」的精神,我们还是来推导一下负二项分布的相关公式。

    1. 定义

    一个成功概率为 p p p 的伯努利试验,不断重复,直至失败 r r r 次。此时成功的次数为一个随机变量,用 X X X 表示。称 X X X 服从负二项分布,记作 X ∼ N B ( r , p ) X\sim NB(r, p) XNB(r,p)

    需要注意的是,负二项分布的定义并不唯一。例如 tensorflow_probability 使用的定义与本文一致,而 scipy 则将 X X X 定义为伯努利试验成功 r r r 次时的失败次数。使用前一定要先看清楚,别问我怎么知道的。此外,Wikipedia 词条不同段落使用的定义竟然也不完全一致,或许是由不同的人编辑的。

    2. 概率质量函数

    X = k X=k X=k 时总共进行了 k + r k+r k+r 次试验,最后一次为失败,故前 k + r − 1 k+r-1 k+r1 次试验总共成功了 k k k 次,失败了 r − 1 r-1 r1 次。因此
    f ( k ; r , p ) ≡ P r ( X = k ) = ( k + r − 1 k ) p k ( 1 − p ) r f(k; r, p)\equiv Pr(X=k)=\tbinom{k+r-1}{k}p^k(1-p)^r f(k;r,p)Pr(X=k)=(kk+r1)pk(1p)r

    3. 期望

    根据定义
    E X = ∑ k = 0 ∞ k f ( k ; r , p ) = ∑ k = 1 ∞ k f ( k ; r , p ) = ∑ k = 1 ∞ k ( k + r − 1 ) ! k ! ( r − 1 ) ! p k ( 1 − p ) r = r p 1 − p ∑ k = 1 ∞ [ ( k − 1 ) + ( r + 1 ) − 1 ] ! ( k − 1 ) ! [ ( r + 1 ) − 1 ] ! p k − 1 ( 1 − p ) r + 1 = r p 1 − p ∑ k = 1 ∞ f ( k − 1 ; r + 1 , p ) \begin{aligned} \mathbb{E}X &=\sum\limits_{k=0}^{\infty}kf(k;r,p)\\ &=\sum\limits_{k=1}^{\infty}kf(k;r,p)\\ &=\sum\limits_{k=1}^{\infty}k\frac{(k+r-1)!}{k!(r-1)!}p^k(1-p)^r\\ &=\frac{rp}{1-p} \sum\limits_{k=1}^{\infty}\frac{[(k-1)+(r+1)-1]!}{(k-1)![(r+1)-1]!}p^{k-1}(1-p)^{r+1}\\ &=\frac{rp}{1-p} \sum\limits_{k=1}^{\infty}f(k-1;r+1,p) \end{aligned} EX=k=0kf(k;r,p)=k=1kf(k;r,p)=k=1kk!(r1)!(k+r1)!pk(1p)r=1prpk=1(k1)![(r+1)1]![(k1)+(r+1)1]!pk1(1p)r+1=1prpk=1f(k1;r+1,p)
    k ′ = k − 1 k'=k-1 k=k1 r ′ = r + 1 r'=r+1 r=r+1,显然
    ∑ k = 1 ∞ f ( k − 1 ; r + 1 , p ) = ∑ k ′ = 0 ∞ f ( k ′ ; r ′ , p ) = 1 \sum\limits_{k=1}^{\infty}f(k-1;r+1,p)=\sum\limits_{k'=0}^{\infty}f(k';r',p)=1 k=1f(k1;r+1,p)=k=0f(k;r,p)=1

    E X = r p 1 − p \mathbb{E}X = \frac{rp}{1-p} EX=1prp

    4. 方差

    首先计算
    E X 2 = ∑ k = 0 ∞ k 2 f ( k ; r , p ) = r p 1 − p ∑ k = 1 ∞ k f ( k − 1 ; r + 1 , p ) \begin{aligned} \mathbb{E}X^2 &=\sum\limits_{k=0}^{\infty}k^2f(k;r,p)\\ &=\frac{rp}{1-p}\sum\limits_{k=1}^{\infty}kf(k-1;r+1,p) \end{aligned} EX2=k=0k2f(k;r,p)=1prpk=1kf(k1;r+1,p)
    k ′ = k − 1 k'=k-1 k=k1 r ′ = r + 1 r'=r+1 r=r+1,考虑服从负二项分布的随机变量 Y ∼ N B ( r ′ , p ) Y\sim NB(r', p) YNB(r,p),其概率质量函数为 f ( k ′ ; r ′ , p ) f(k';r',p) f(k;r,p),显然
    ∑ k = 1 ∞ k f ( k − 1 ; r + 1 , p ) = ∑ k ′ = 0 ∞ ( k ′ + 1 ) f ( k ′ ; r ′ , p ) = E ( Y + 1 ) = E Y + 1 = r ′ p 1 − p + 1 = ( r + 1 ) p 1 − p + 1 = r p + 1 1 − p \begin{aligned} \sum\limits_{k=1}^{\infty}k f(k-1;r+1,p) &= \sum\limits_{k'=0}^{\infty}(k'+1)f(k';r',p)\\ &= \mathbb{E}(Y+1)\\ &= \mathbb{E}Y + 1\\ &= \frac{r'p}{1-p} + 1\\ &= \frac{(r+1)p}{1-p} + 1\\ &= \frac{rp+1}{1-p} \end{aligned} k=1kf(k1;r+1,p)=k=0(k+1)f(k;r,p)=E(Y+1)=EY+1=1prp+1=1p(r+1)p+1=1prp+1

    E X 2 = r p 1 − p ⋅ r p + 1 1 − p = r 2 p 2 + r p ( 1 − p ) 2 \mathbb{E}X^2 = \frac{rp}{1-p}\cdot \frac{rp+1}{1-p}= \frac{r^2p^2+rp}{(1-p)^2} EX2=1prp1prp+1=(1p)2r2p2+rp

    而根据定义
    V a r X = E ( X − E X ) 2 = E [ X 2 − 2 X E X + ( E X ) 2 ] = E X 2 − ( E X ) 2 = r 2 p 2 + r p ( 1 − p ) 2 − r 2 p 2 ( 1 − p ) 2 = r p ( 1 − p ) 2 \begin{aligned} \mathrm{Var}X &= \mathbb{E}(X-\mathbb{E}X)^2\\ &=\mathbb{E}[X^2-2X\mathbb{E}X + (\mathbb{E}X)^2]\\ &= \mathbb{E}X^2 - (\mathbb{E}X)^2\\ &= \frac{r^2p^2+rp}{(1-p)^2} - \frac{r^2p^2}{(1-p)^2}\\ &= \frac{rp}{(1-p)^2} \end{aligned} VarX=E(XEX)2=E[X22XEX+(EX)2]=EX2(EX)2=(1p)2r2p2+rp(1p)2r2p2=(1p)2rp

    我们在文章开头提到,负二项分布的 σ 2 ≥ μ \sigma^2\geq\mu σ2μ。由于 0 ≤ p ≤ 1 0\leq p\leq1 0p1,这个结论是显而易见的。

    5. 累积分布函数

    负二项分布的累积分布函数可以表示为正则不完全 Beta 函数:
    F ( k ; r , p ) = I 1 − p ( r , k + 1 ) F(k;r,p)=I_{1-p}(r, k+1) F(k;r,p)=I1p(r,k+1)
    证明如下:
    F ( k ; r , p ) ≡ P ( X ≤ k ) = ∑ x = 0 k f ( x ; r , p ) = ∑ x = 0 k ( x + r − 1 x ) p x ( 1 − p ) r \begin{aligned} F(k;r,p) &\equiv P(X\leq k)\\ &=\sum_{x=0}^kf(x;r,p)\\ &=\sum_{x=0}^k \tbinom{x+r-1}{x}p^x(1-p)^r \end{aligned} F(k;r,p)P(Xk)=x=0kf(x;r,p)=x=0k(xx+r1)px(1p)r
    q = 1 − p q=1-p q=1p,有
    F ( k ; r , p ) = F ( k ; r , 1 − q ) = ∑ x = 0 k ( x + r − 1 x ) ( 1 − q ) x q r F(k;r,p) = F(k;r,1-q) = \sum_{x=0}^k \tbinom{x+r-1}{x}(1-q)^xq^r F(k;r,p)=F(k;r,1q)=x=0k(xx+r1)(1q)xqr
    q q q 求偏导,得
    ∂ F ∂ q = ∑ x = 0 k ( x + r − 1 x ) [ − x ( 1 − q ) x − 1 q r + r ( 1 − q ) x q r − 1 ] = ∑ x = 0 k ( x + r − 1 x ) [ − x ( 1 − q ) x − 1 q r + r ( 1 − q ) x q r − 1 ] = ∑ x = 0 k ( x + r − 1 x ) [ x [ ( 1 − q ) − 1 ] ( 1 − q ) x − 1 q r − 1 + r ( 1 − q ) x q r − 1 ] = ∑ x = 0 k ( x + r − 1 x ) [ − x ( 1 − q ) x − 1 q r − 1 + ( x + r ) ( 1 − q ) x q r − 1 ] = − ∑ x = 0 k x ( x + r − 1 x ) ( 1 − q ) x − 1 q r − 1 + ∑ x = 0 k ( x + r ) ( x + r − 1 x ) ( 1 − q ) x q r − 1 = − ∑ x = 1 k x ( x + r − 1 x ) ( 1 − q ) x − 1 q r − 1 + ∑ x = 0 k ( x + r ) ( x + r − 1 x ) ( 1 − q ) x q r − 1 = − ∑ x = 1 k ( x + r − 1 ) ! ( x − 1 ) ! ( r − 1 ) ! ( 1 − q ) x − 1 q r − 1 + ∑ x = 0 k ( x + r ) ! x ! ( r − 1 ) ! ( 1 − q ) x q r − 1 = − r q 2 ∑ x = 1 k ( x + r − 1 ) ! ( x − 1 ) ! r ! ( 1 − q ) x − 1 q r + 1 + r q 2 ∑ x = 0 k ( x + r ) ! x ! r ! ( 1 − q ) x q r + 1 = − r q 2 ∑ x ′ = 0 k − 1 ( x ′ + r ) ! x ′ ! r ! ( 1 − q ) x ′ q r + 1 + r q 2 ∑ x = 0 k ( x + r ) ! x ! r ! ( 1 − q ) x q r + 1 = − r q 2 F ( k − 1 ; r + 1 , 1 − q ) + r q 2 F ( k ; r + 1 , 1 − q ) = r q 2 f ( k ; r + 1 , 1 − q ) \begin{aligned} \frac{\partial F}{\partial q} & = \sum_{x=0}^k \tbinom{x+r-1}{x}\left[-x(1-q)^{x-1}q^r+r(1-q)^x q^{r-1}\right]\\ & = \sum_{x=0}^k \tbinom{x+r-1}{x}\left[-x(1-q)^{x-1}q^r+r(1-q)^x q^{r-1}\right]\\ & = \sum_{x=0}^k \tbinom{x+r-1}{x}\left[x[(1-q)-1](1-q)^{x-1}q^{r-1}+r(1-q)^x q^{r-1}\right]\\ & = \sum_{x=0}^k \tbinom{x+r-1}{x}\left[-x(1-q)^{x-1}q^{r-1}+(x+r)(1-q)^x q^{r-1}\right]\\ &= - \sum_{x=0}^kx \tbinom{x+r-1}{x}(1-q)^{x-1}q^{r-1}+\sum_{x=0}^k(x+r) \tbinom{x+r-1}{x}(1-q)^x q^{r-1}\\ &= - \sum_{x=1}^kx \tbinom{x+r-1}{x}(1-q)^{x-1}q^{r-1}+\sum_{x=0}^k(x+r) \tbinom{x+r-1}{x}(1-q)^x q^{r-1}\\ &= - \sum_{x=1}^k \frac{(x+r-1)!}{(x-1)!(r-1)!}(1-q)^{x-1}q^{r-1}+\sum_{x=0}^k \frac{(x+r)!}{x!(r-1)!}(1-q)^x q^{r-1}\\ &= - \frac{r}{q^2}\sum_{x=1}^k \frac{(x+r-1)!}{(x-1)! r!}(1-q)^{x-1}q^{r+1}+\frac{r}{q^2}\sum_{x=0}^k \frac{(x+r)!}{x! r!}(1-q)^x q^{r+1}\\ &= - \frac{r}{q^2}\sum_{x'=0}^{k-1} \frac{(x'+r)!}{x' ! r!}(1-q)^{x' }q^{r+1}+\frac{r}{q^2}\sum_{x=0}^k \frac{(x+r)!}{x! r!}(1-q)^x q^{r+1}\\ &= - \frac{r}{q^2} F(k-1;r+1,1-q) + \frac{r}{q^2} F(k;r+1,1-q)\\ &= \frac{r}{q^2} f(k; r+1, 1-q) \end{aligned} qF=x=0k(xx+r1)[x(1q)x1qr+r(1q)xqr1]=x=0k(xx+r1)[x(1q)x1qr+r(1q)xqr1]=x=0k(xx+r1)[x[(1q)1](1q)x1qr1+r(1q)xqr1]=x=0k(xx+r1)[x(1q)x1qr1+(x+r)(1q)xqr1]=x=0kx(xx+r1)(1q)x1qr1+x=0k(x+r)(xx+r1)(1q)xqr1=x=1kx(xx+r1)(1q)x1qr1+x=0k(x+r)(xx+r1)(1q)xqr1=x=1k(x1)!(r1)!(x+r1)!(1q)x1qr1+x=0kx!(r1)!(x+r)!(1q)xqr1=q2rx=1k(x1)!r!(x+r1)!(1q)x1qr+1+q2rx=0kx!r!(x+r)!(1q)xqr+1=q2rx=0k1x!r!(x+r)!(1q)xqr+1+q2rx=0kx!r!(x+r)!(1q)xqr+1=q2rF(k1;r+1,1q)+q2rF(k;r+1,1q)=q2rf(k;r+1,1q)
    而根据正则不完全 Beta 函数的定义,有
    I 1 − p ( r , k + 1 ) = I q ( r , k + 1 ) = B ( q ; r , k + 1 ) B ( r , k + 1 ) = ∫ 0 q t r − 1 ( 1 − t ) k d t B ( r , k + 1 ) \begin{aligned} I_{1-p}(r, k+1) &= I_{q}(r, k+1)\\ &= \frac{B(q; r, k+1)}{B(r, k+1)}\\ &= \frac{ \int_0^qt^{r-1}(1-t)^k\mathrm dt}{B(r, k+1)} \end{aligned} I1p(r,k+1)=Iq(r,k+1)=B(r,k+1)B(q;r,k+1)=B(r,k+1)0qtr1(1t)kdt
    同样对 q q q 求偏导,得
    ∂ I q ∂ q = q r − 1 ( 1 − q ) k B ( r , k + 1 ) = Γ ( r + k + 1 ) Γ ( r ) Γ ( k + 1 ) q r − 1 ( 1 − q ) k = ( r + k ) ! ( r − 1 ) ! k ! q r − 1 ( 1 − q ) k = r q 2 ( r + k ) ! r ! k ! q r + 1 ( 1 − q ) k = r q 2 f ( k ; r + 1 , 1 − q ) \begin{aligned} \frac{\partial I_q}{\partial q} &= \frac{q^{r-1}(1-q)^k}{B(r, k+1)}\\ &= \frac{\Gamma(r+k+1)}{\Gamma(r)\Gamma(k+1)} q^{r-1}(1-q)^k\\ &= \frac{(r+k)!}{(r-1)! k!}q^{r-1}(1-q)^k\\ &= \frac{r}{q^2}\frac{(r+k)!}{r! k!}q^{r+1}(1-q)^k\\ &= \frac{r}{q^2} f(k; r+1,1-q) \end{aligned} qIq=B(r,k+1)qr1(1q)k=Γ(r)Γ(k+1)Γ(r+k+1)qr1(1q)k=(r1)!k!(r+k)!qr1(1q)k=q2rr!k!(r+k)!qr+1(1q)k=q2rf(k;r+1,1q)
    也就是说
    ∂ ∂ q F ( k ; r ; 1 − q ) = ∂ ∂ q I q ( r , k + 1 ) \frac{\partial}{\partial q} F(k;r;1-q)= \frac{\partial}{\partial q}I_q(r, k+1) qF(k;r;1q)=qIq(r,k+1)
    亦即
    F ( k ; r ; 1 − q ) = I q ( r , k + 1 ) + C F(k;r;1-q) = I_q(r, k+1) + C F(k;r;1q)=Iq(r,k+1)+C
    注意到 q = 0 q=0 q=0 时有
    { F ( k ; r , 1 ) = 0 I 0 ( r , k + 1 ) = 0 \begin{cases} F(k; r, 1) = 0\\ I_0(r, k+1) = 0 \end{cases} {F(k;r,1)=0I0(r,k+1)=0
    解得常数 C = 0 C=0 C=0

    证毕。

    6. 在时间序列预测模型中的使用

    DeepAR 等模型中,网络的输出目标是概率分布的参数。例如正态分布的 μ \mu μ σ \sigma σ。但对于负二项分布而言,让网络直接输出 μ \mu μ σ \sigma σ 是不合适的,因为在训练过程中很难保证输出的值满足 σ 2 ≥ μ \sigma^2\geq\mu σ2μ。那么让网络输出 r r r p p p 呢?似乎是可以的,只要保证 r > 0 r>0 r>0 0 ≤ p ≤ 1 0\leq p\leq 1 0p1 即可。前者可以使用 softplus 激活函数,后者可以使用 sigmoid 激活函数。有没有办法避免使用 sigmoid 呢?通常的做法是让网络输出 μ \mu μ α = 1 / r \alpha=1/r α=1/r,只要使用 softplus 激活函数确保二者均为正数即可。

    参考文献

    1. Negative binomial distribution - Wikipedia
    2. Beta function - Wikipedia
    3. Patil G P. On the evaluation of the negative binomial distribution with examples[J]. Technometrics, 1960, 2(4): 501-505.
    更多相关内容
  • 二项分布公式讲解

    千次阅读 2021-12-30 11:32:09
    二项分布概率公式中那个C后面上k下n是什么意思
    展开全文
  • 概率统计13——二项分布与多项分布

    千次阅读 2019-12-28 19:21:43
     如果随机试验仅有两个可能的结果,那么这两个结果可以用0和1表示,此时随机变量X将是一个0/1的变量,其分布是单个值随机变量的分布,称为伯努利分布。注意伯努利分布关注的是结果只有0和...

    原文 | https://mp.weixin.qq.com/s/bOchsmHTINKKlyabCQKMSg

    相关阅读

    最大似然估计(概率10)

    寻找“最好”(3)函数和泛函的拉格朗日乘数法

    伯努利分布

      如果随机试验仅有两个可能的结果,那么这两个结果可以用0和1表示,此时随机变量X将是一个0/1的变量,其分布是单个二值随机变量的分布,称为伯努利分布。注意伯努利分布关注的是结果只有0和1,而不管观测条件是什么。

    性质

      设p是随机变量等于1的概率,伯努利分布有一些特殊的性质:

      将上面的两个式子合并:

      伯努利变量是离散型,并且是一个0/1变量,它的数学期望是:

      方差是:

    极大似然

      最大似然估计(概率10)

      对于伯努利分布的质量函数来说,p是唯一的参数。如果给定N个独立同分布的样本 {x(1), x(2), ……, x(N)},x(t)是投硬币的结果,是随机变量,x(t)ϵ{0, 1},可以通过极大似然估计,根据样本推测出p的取值:

      取对数似然函数:

      这是个符合直觉的结果,即使没学过概率和极大似然也能得出这个结论。

    二项分布

      假设某个试验是伯努利试验,成功概率用p表示,那么失败的概率为1-p。现在进行了N次这样的试验,成功了x次,失败了N-x次,发生这种情况的概率是多少?

    质量函数

      对于每次实验来说,成功的概率都是p,失败的概率是1-p。假设已经完成了N次试验,并且前x次都成功了,后N-x次都失败了:

      x次成功的情况当然不止一种,比如成功和失败交叉在一起:

      这种成功和失败的排列顺序共有种不同的情况,因此对于任意N次伯努利试验,成功了x次的概率是:

      的另一种记法是 

      P(x)就是二项分布的质量函数,是N次伯努利试验中取得x次成功的概率。

    性质

      二项分布的均值和方差分别为Np和Np(1-p)。

      从二项分布的质量函数P(x)可知,概率分布只与试验次数N和成功概率p有关,p越接近0.5,二项分布将越对称。保持二项分布试验的次数N不变,随着成功概率p逐渐接近0.5,二项分布逐渐对称,且近似于均值为Np、方差为Np(1-p)的正态分布:

    多项分布

      多项分布是二项分布的扩展,其中随机试验的结果不是两种状态,而是K种互斥的离散状态,每种状态出现的概率为pi,p1 + p1 + … + pK = 1,在这个前提下共进行了N次试验,用x1~xK表示每种状态出现次数,x1 + x2 + …+ xK = N,称X=(x1, x2, …, xK)服从多项分布,记作X~PN(N:p1, p2,…,pn)。

    质量函数

      如果说二项分布的典型案例是扔硬币,那么多项分布就是扔骰子。骰子有6个不同的点数,扔一次骰子,每个点数出现的概率(对应p1~p6)都是1/6。重复扔N次,6点出现x次的概率是:  

     

      这和二项分布的质量函数类似。现在将问题扩展一下,扔N次骰子,1~6出现次数分别是x1~x6时的概率是多少?

      仍然和二项式类似,假设前x1次都是1点,之后的x2次都是2点……最后x6次都是6点:

      1~6出现次数分别是x1~x6的情况不止一种,1点出现x1次的情况有种;在1点出现x1次的前提下,2点出现x2次的情况有种;在1点出现x1次且2点出现x2次的前提下,3点出现x3的情况有种……扔N次骰子,1~6出现次数分别是x1~x6时的概率是:

      根据①:

      最终,扔骰子的概率质量函数是:

      把这个结论推广到多项分布:某随机实验如果有K种可能的结果C1~CK,它们出现的概率是p1~pK。在N随机试验的结果中,分别将C1~CK的出现次数记为随机变量X1~XK,那么C1出现x1次、C2出现x2次……CK出现xK次这种事件发生的概率是:

      其中x1 + x2 + …+ xK = N,p1 + p2 + …+ pK = 1。

    极大似然

      多项式的极大似然是指在随机变量X1=x1, X2=x2, ……, XK=xK时,最可能的p1~pK。

      对数极大似然:

      现在问题变成了求约束条件下的极值:

      根据拉格朗日乘子法:

      寻找“最好”(3)函数和泛函的拉格朗日乘数法

      根据约束条件:

      这也是个符合直觉的结论。面对有N个样本的K分类数据集,当pi = xi/N 时,Ci类最可能出现xi次。为了这个结论我们却大费周章,也许又有人因此而嘲笑概率简单了……


      出处:微信公众号 "我是8位的"

      本文以学习、研究和分享为主,如需转载,请联系本人,标明作者和出处,非商业用途! 

      扫描二维码关注作者公众号“我是8位的”

    展开全文
  • 二项分布计算

    2013-10-25 12:20:37
    统计学课上,为方便二项分布计算而编写的小程序。用法很简单,首先输入二项分布的N和p,然后输入计算范围,就可求出相应范围内的概率。 采用C语言编写。压缩包有源代码和exe文件。
  • 二项分布(一种离散分布

    千次阅读 2022-02-16 08:30:41
    二项分布 二项分布是伯努利分布的扩展,即重复n次试验,每次试验都符合伯努利分布 截图来源:Binomial distribution 三个二项分布例子对应的概率质量函数和累积分布函数 截图来源:Binomial distribution 考察...

    二项分布

    二项分布是伯努利分布的扩展,即重复n次试验,每次试验都只有两种结果成功/失败,所以每次试验都符合伯努利分布

    截图来源:Binomial distribution

    三个二项分布例子对应的概率质量函数和累积分布函数
    截图来源:Binomial distribution

    考察二项分布方法有两种:
    第一种:有 n n n 枚独立的硬币,并且每一枚硬币出现成功的概率都是 p p p. 同时抛掷它们,并记录正面出现的次数
    第二种:有一枚独立的硬币抛掷 n n n 次,记录正面出现的次数
    因为每次抛掷硬币都是独立的行为,所以抛掷 n n n 枚独立的硬币与抛掷一枚独立的硬币 n n n 次,这两种方法是等价的

    二项式分布的概率质量函数(PMF)如下:

    上图中二项式系数如下

    二项式分布的累积分布函数(CDF)如下:

    为确保是一个概率分布,要同时满足两个条件
    (1)所有概率都是非负的;
    (2)概率之和必须等于1

    第一个条件毋庸置疑是满足的,我们证明第二个条件是否满足
    根据二项式定理
    ( x + y ) n = ∑ k = 0 n C n k x k y n − k (x+y)^n=\sum_{k=0}^nC_n^kx^ky^{n-k} (x+y)n=k=0nCnkxkynk
    x = p 、 y = 1 − p x=p、y=1-p x=py=1p
    ∑ k = 0 n P ( X = k ) = ∑ k = 0 n C n k p k ( 1 − p ) n − k = ( p + ( 1 − p ) ) n = 1 \sum_{k=0}^nP(X=k)=\sum_{k=0}^nC_n^kp^k(1-p)^{n-k}=(p+(1-p))^n=1 k=0nP(X=k)=k=0nCnkpk(1p)nk=(p+(1p))n=1

    计算均值、方差

    利用期望的线性性质(避免了计算二项式系数之和):和的期望等于期望的和
    一个服从 Bin ( n , p ) \text{Bin}(n,p) Bin(n,p) 的随机变量 X X X n n n 个相互独立且服从 Bern ( n , p ) \text{Bern}(n,p) Bern(n,p) 的随机变量 X i X_i Xi 之和
    X = X 1 + X 2 + X 3 + ⋯ 9 X n X=X_1+X_2+X_3+\cdots 9X_n X=X1+X2+X3+9Xn
    因为每个 X i X_i Xi 都服从 Bern ( n , p ) \text{Bern}(n,p) Bern(n,p) 所以均值为 μ X = p \mu_X=p μX=p,方差都是 σ X i 2 = p ( 1 − p ) \sigma^2_{X_i}=p(1-p) σXi2=p(1p)
    μ X = E [ X ]   μ X = E [ X 1 + X 2 + X 3 + ⋯ + X n ]   μ X = E [ X 1 ] + ⋯ + E [ X n ]   μ X = p + ⋯ + p = n p \mu_X=E[X]\\ ~\\ \mu_X=E[X_1+X_2+X_3+\cdots +X_n]\\ ~\\ \mu_X=E[X_1]+\cdots+E[X_n]\\ ~\\ \mu_X=p+\cdots +p=np μX=E[X] μX=E[X1+X2+X3++Xn] μX=E[X1]++E[Xn] μX=p++p=np

    例子:


    展开全文
  • 二项分布最大值,泊松分布的推导,几何分布的推导 (概统2.应用) 1.二项分布 二项分布就是独立事件n重伯努利试验,每次试验只有A发生与不发生两种结果,求n次试验恰好发生k次的概率。 P{X=k} = $C_{n}^{k}p^{k}q...
  • 二项分布算法(伯努利实验)

    千次阅读 2017-11-04 21:14:24
    算法 二项分布
  • 几何分布二项分布有什么区别?

    万次阅读 多人点赞 2018-09-16 13:19:07
    各种常见的分布中二项分布和几何分布经常同时出现,在前面讲泊松分布的时候也简单提到了二项分布。那么,几何分布是什么分布?和二项分布又有什么区别? 几何分布 讲泊松分布的时候提到,二项分布的概率公式如下...
  • 实验三、二项分布与泊松分布实验实验序号:3 日期:2013 年 4 月 3 日班级数学学院2011级 C班学号114080185姓名邓伍丹实验名称二项分布与泊松分布实验问题的背景和目的:随着计算机技术的迅速发展,很多科学试验的全...
  • 算法之二项分布(c/c++版)

    千次阅读 2017-07-12 21:57:13
    二项分布是数学的概念,定义及公式定理不在此说明. 注:递归版第三步及递推都依赖于C(M-1,N-1)+C(M-1,N)=C(M,N)的变形 递归版: (我给递归版注释了1 2 3 是为了解析非递归版(递推版)同等的操作 1 2 3...
  • 二项分布和泊松概率分布2018-04-17

    千次阅读 2021-04-24 23:58:32
    说起二项分布(binomial distribution),不得不提的前提是伯努利试验(Bernoulli experiment),也即n次独立重复试验。伯努利试验是在同样的条件下重复、相互独立进行的一种随机试验。伯努利试验的特点是:(1)每次试验...
  • 二项分布均值,方差推导

    千次阅读 2017-08-22 15:41:49
    二项分布的期望,方差推导
  • 二项分布

    万次阅读 多人点赞 2016-09-16 21:13:13
    说起二项分布(binomial distribution),不得不提的前提是伯努利试验(Bernoulli experiment),也即n次独立重复试验。伯努利试验是在同样的条件下重复、相互独立进行的一种随机试验。   伯努利试验的特点是: (1)...
  • https://blog.csdn.net/michael_r_chang/article/details/39188321https://www.cnblogs.com/wybang/p/3206719.htmlhttps://blog.csdn.net/jteng/article/details/603346281. 伯努利分布伯努利分布(Bernoulli ...
  • 二项分布推导泊松分布

    万次阅读 2018-12-22 19:56:39
      二项分布:P(X=k)=Cnk⋅pk⋅(1−p)n−kP(X=k) = C_n^k\cdot p^k\cdot (1-p)^{n-k}P(X=k)=Cnk​⋅pk⋅(1−p)n−k 抛硬币   以抛硬币为例,ppp可以表示抛一次硬币,朝上的概率,P(X=k)P(X=k)P(X=k)表示抛nnn次...
  • 由于负二项分布的展开式不如二项分布那么常用,故在推导其期望方差等数字特征时,会碰到一些问题,本文展示了二项分布和其他分布的关系,并且给出了负二项分布的数字特征的推导过程,方便小伙伴理解,以减少想入门...
  • 二项分布,柏松分布和正态分布

    千次阅读 2019-11-24 19:35:33
    离散型随机变量的概率分布二项分布,柏松分布 连续性随机变量的概率分布:正态分布。 一,二项分布 满足条件: 1)每次试验事件只有两种结果:事件发生或者不发生,如硬币正面或反面,患病或没患病; 2)...
  • C语言实现 产生正态分布(高斯分布)随机数
  • 二项分布 二项的意思就是2种可能性 公式C是 比如 抛硬币5次(n),恰巧有3次正面朝上(x=3,抛硬币正面朝上概率p=1/2) 那么 结果为 再举个例子,,比如做选择题,成功概率为1/4,,,那么做...
  • 3.一个盒子装有5个球(3红2白),有放回依次从中抽取5个球 4.生产一种零件,出现次品的概率是0.04,生产这种零件4件 以上这些的特点都是:条件相同、独立重复性试验、发生或者不发生、发生的概率相同 例子: 投掷一...
  • 在看LDA的时候,遇到的数学公式分布有些多,因此在这里总结一下思路。 一、伯努利试验、伯努利过程与伯努利分布 先说一下什么是伯努利试验: 维基百科伯努利试验: 伯努利试验(Bernoulli trial)是只有两种...
  • 帕斯卡分布/负二项分布

    千次阅读 2021-03-29 19:49:41
    二项分布的正整数形式,描述第n次成功发生在第x次的概率 定义 在重复、独立的伯努利试验,设每次试验成功的概率为ppp,失败的概率为q=1−pq= 1- pq=1−p,若将试验进行到出现 rrr ( rrr 为常数 ) 次成功为止,以...
  • 项分布概率公式的理解

    千次阅读 2015-03-21 14:27:00
    项分布概率公式的理解   多项分布二项分布的推广。二项分布(也叫伯努利...二项分布时事件X只有2种取值,而多项分布的X有多种取值,多项分布的概率公式为 P(X1=x1,⋯,Xk=xk)={n!x1!,⋯,xk!px1⋯pxkwhen∑k...
  • **2018博客之星评选,如果喜欢我的文章,请投我一票,编号:No.... 二项分布有两个参数,一个 n 表示试验次数,一个 p 表示一次试验成功概率。现在考虑一列二项分布,其中试验次数 n 无限增加,而 p 是 n 的函数。 ...
  • 1. 二项分布与beta分布对应2. 多项分布与狄利克雷分布对应3. 二项分布是什么?n次bernuli试验服从 二项分布二项分布是N次重复bernuli试验结果的分布。 bernuli实验是什么?做一次抛硬币实验,该试验结果只有2种情况...
  • 伯努利分布二项分布和多项分布

    千次阅读 2020-09-28 09:48:15
    伯努利分布(Bernoulli distribution)又名 两点分布 或 0-1分布,在讲伯努利分布前首先需要介绍伯努利试验(Bernoulli Trial)。 1.1 伯努利试验 伯努利试验是只有两种可能结果的单词随机试验,即对于一个随机变量 ...
  • 浅谈两点分布二项分布,伽马分布,指数分布,泊松分布,卡方分布,t分布,F分布,均匀分布,正态分布,β分布,狄利克雷分布。(红丸子,白丸子,四喜丸子。。。) 我们知道,在数理统计,经常是和各种分布打...
  • 最常用二项实验为抛硬币实验。如果随机变量服从二项分布,那么概率x=k(成功的次数)公式如下:P(X=k) =n​Ck​∗pk∗(1−p)n−k参数说明:n: 实验次数k: 成功次数p: 实验成功的概率n​Ck​: n次实验获得k次成功。
  • 在每次试验只有两种可能的结果,而且两种结果发生与否互相对立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验都保持不变,则这一系列试验总称为n重伯努利实验,当试验次数为1时,二项分布服从 0...
  • SPSS八类常用非参数检验之 二项分布(Binomial)检验

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 104,360
精华内容 41,744
热门标签
关键字:

二项分布公式中的c