精华内容
下载资源
问答
  • 负二项分布
    万次阅读
    2020-03-30 19:45:34

    本文链接个人站 | 简书 | CSDN
    版权声明:除特别声明外,本博客文章均采用 BY-NC-SA 许可协议。转载请注明出处。

    之前在介绍 DeepAR 等时间序列预测模型时,为了简单起见,我们使用了大家比较熟悉的正态分布作为示例。在实际应用中,需要根据数据本身的特点选择合适的分布。泊松分布、二项分布、以及负二项分布都可以用来刻画计数类数据。其中,泊松分布的 μ = σ 2 \mu=\sigma^2 μ=σ2,二项分布的 μ ≥ σ 2 \mu\geq\sigma^2 μσ2,负二项分布的 μ ≤ σ 2 \mu\leq\sigma^2 μσ2。在我日常接触的业务场景中, μ ≤ σ 2 \mu\leq\sigma^2 μσ2 较为常见,为此免不了要跟负二项分布打交道。

    虽然没什么必要,但是本着「有困难要上,没困难创造困难也要上」的精神,我们还是来推导一下负二项分布的相关公式。

    1. 定义

    一个成功概率为 p p p 的伯努利试验,不断重复,直至失败 r r r 次。此时成功的次数为一个随机变量,用 X X X 表示。称 X X X 服从负二项分布,记作 X ∼ N B ( r , p ) X\sim NB(r, p) XNB(r,p)

    需要注意的是,负二项分布的定义并不唯一。例如 tensorflow_probability 使用的定义与本文一致,而 scipy 则将 X X X 定义为伯努利试验成功 r r r 次时的失败次数。使用前一定要先看清楚,别问我怎么知道的。此外,Wikipedia 词条不同段落使用的定义竟然也不完全一致,或许是由不同的人编辑的。

    2. 概率质量函数

    X = k X=k X=k 时总共进行了 k + r k+r k+r 次试验,最后一次为失败,故前 k + r − 1 k+r-1 k+r1 次试验总共成功了 k k k 次,失败了 r − 1 r-1 r1 次。因此
    f ( k ; r , p ) ≡ P r ( X = k ) = ( k + r − 1 k ) p k ( 1 − p ) r f(k; r, p)\equiv Pr(X=k)=\tbinom{k+r-1}{k}p^k(1-p)^r f(k;r,p)Pr(X=k)=(kk+r1)pk(1p)r

    3. 期望

    根据定义
    E X = ∑ k = 0 ∞ k f ( k ; r , p ) = ∑ k = 1 ∞ k f ( k ; r , p ) = ∑ k = 1 ∞ k ( k + r − 1 ) ! k ! ( r − 1 ) ! p k ( 1 − p ) r = r p 1 − p ∑ k = 1 ∞ [ ( k − 1 ) + ( r + 1 ) − 1 ] ! ( k − 1 ) ! [ ( r + 1 ) − 1 ] ! p k − 1 ( 1 − p ) r + 1 = r p 1 − p ∑ k = 1 ∞ f ( k − 1 ; r + 1 , p ) \begin{aligned} \mathbb{E}X &=\sum\limits_{k=0}^{\infty}kf(k;r,p)\\ &=\sum\limits_{k=1}^{\infty}kf(k;r,p)\\ &=\sum\limits_{k=1}^{\infty}k\frac{(k+r-1)!}{k!(r-1)!}p^k(1-p)^r\\ &=\frac{rp}{1-p} \sum\limits_{k=1}^{\infty}\frac{[(k-1)+(r+1)-1]!}{(k-1)![(r+1)-1]!}p^{k-1}(1-p)^{r+1}\\ &=\frac{rp}{1-p} \sum\limits_{k=1}^{\infty}f(k-1;r+1,p) \end{aligned} EX=k=0kf(k;r,p)=k=1kf(k;r,p)=k=1kk!(r1)!(k+r1)!pk(1p)r=1prpk=1(k1)![(r+1)1]![(k1)+(r+1)1]!pk1(1p)r+1=1prpk=1f(k1;r+1,p)
    k ′ = k − 1 k'=k-1 k=k1 r ′ = r + 1 r'=r+1 r=r+1,显然
    ∑ k = 1 ∞ f ( k − 1 ; r + 1 , p ) = ∑ k ′ = 0 ∞ f ( k ′ ; r ′ , p ) = 1 \sum\limits_{k=1}^{\infty}f(k-1;r+1,p)=\sum\limits_{k'=0}^{\infty}f(k';r',p)=1 k=1f(k1;r+1,p)=k=0f(k;r,p)=1

    E X = r p 1 − p \mathbb{E}X = \frac{rp}{1-p} EX=1prp

    4. 方差

    首先计算
    E X 2 = ∑ k = 0 ∞ k 2 f ( k ; r , p ) = r p 1 − p ∑ k = 1 ∞ k f ( k − 1 ; r + 1 , p ) \begin{aligned} \mathbb{E}X^2 &=\sum\limits_{k=0}^{\infty}k^2f(k;r,p)\\ &=\frac{rp}{1-p}\sum\limits_{k=1}^{\infty}kf(k-1;r+1,p) \end{aligned} EX2=k=0k2f(k;r,p)=1prpk=1kf(k1;r+1,p)
    k ′ = k − 1 k'=k-1 k=k1 r ′ = r + 1 r'=r+1 r=r+1,考虑服从负二项分布的随机变量 Y ∼ N B ( r ′ , p ) Y\sim NB(r', p) YNB(r,p),其概率质量函数为 f ( k ′ ; r ′ , p ) f(k';r',p) f(k;r,p),显然
    ∑ k = 1 ∞ k f ( k − 1 ; r + 1 , p ) = ∑ k ′ = 0 ∞ ( k ′ + 1 ) f ( k ′ ; r ′ , p ) = E ( Y + 1 ) = E Y + 1 = r ′ p 1 − p + 1 = ( r + 1 ) p 1 − p + 1 = r p + 1 1 − p \begin{aligned} \sum\limits_{k=1}^{\infty}k f(k-1;r+1,p) &= \sum\limits_{k'=0}^{\infty}(k'+1)f(k';r',p)\\ &= \mathbb{E}(Y+1)\\ &= \mathbb{E}Y + 1\\ &= \frac{r'p}{1-p} + 1\\ &= \frac{(r+1)p}{1-p} + 1\\ &= \frac{rp+1}{1-p} \end{aligned} k=1kf(k1;r+1,p)=k=0(k+1)f(k;r,p)=E(Y+1)=EY+1=1prp+1=1p(r+1)p+1=1prp+1

    E X 2 = r p 1 − p ⋅ r p + 1 1 − p = r 2 p 2 + r p ( 1 − p ) 2 \mathbb{E}X^2 = \frac{rp}{1-p}\cdot \frac{rp+1}{1-p}= \frac{r^2p^2+rp}{(1-p)^2} EX2=1prp1prp+1=(1p)2r2p2+rp

    而根据定义
    V a r X = E ( X − E X ) 2 = E [ X 2 − 2 X E X + ( E X ) 2 ] = E X 2 − ( E X ) 2 = r 2 p 2 + r p ( 1 − p ) 2 − r 2 p 2 ( 1 − p ) 2 = r p ( 1 − p ) 2 \begin{aligned} \mathrm{Var}X &= \mathbb{E}(X-\mathbb{E}X)^2\\ &=\mathbb{E}[X^2-2X\mathbb{E}X + (\mathbb{E}X)^2]\\ &= \mathbb{E}X^2 - (\mathbb{E}X)^2\\ &= \frac{r^2p^2+rp}{(1-p)^2} - \frac{r^2p^2}{(1-p)^2}\\ &= \frac{rp}{(1-p)^2} \end{aligned} VarX=E(XEX)2=E[X22XEX+(EX)2]=EX2(EX)2=(1p)2r2p2+rp(1p)2r2p2=(1p)2rp

    我们在文章开头提到,负二项分布的 σ 2 ≥ μ \sigma^2\geq\mu σ2μ。由于 0 ≤ p ≤ 1 0\leq p\leq1 0p1,这个结论是显而易见的。

    5. 累积分布函数

    负二项分布的累积分布函数可以表示为正则不完全 Beta 函数:
    F ( k ; r , p ) = I 1 − p ( r , k + 1 ) F(k;r,p)=I_{1-p}(r, k+1) F(k;r,p)=I1p(r,k+1)
    证明如下:
    F ( k ; r , p ) ≡ P ( X ≤ k ) = ∑ x = 0 k f ( x ; r , p ) = ∑ x = 0 k ( x + r − 1 x ) p x ( 1 − p ) r \begin{aligned} F(k;r,p) &\equiv P(X\leq k)\\ &=\sum_{x=0}^kf(x;r,p)\\ &=\sum_{x=0}^k \tbinom{x+r-1}{x}p^x(1-p)^r \end{aligned} F(k;r,p)P(Xk)=x=0kf(x;r,p)=x=0k(xx+r1)px(1p)r
    q = 1 − p q=1-p q=1p,有
    F ( k ; r , p ) = F ( k ; r , 1 − q ) = ∑ x = 0 k ( x + r − 1 x ) ( 1 − q ) x q r F(k;r,p) = F(k;r,1-q) = \sum_{x=0}^k \tbinom{x+r-1}{x}(1-q)^xq^r F(k;r,p)=F(k;r,1q)=x=0k(xx+r1)(1q)xqr
    q q q 求偏导,得
    ∂ F ∂ q = ∑ x = 0 k ( x + r − 1 x ) [ − x ( 1 − q ) x − 1 q r + r ( 1 − q ) x q r − 1 ] = ∑ x = 0 k ( x + r − 1 x ) [ − x ( 1 − q ) x − 1 q r + r ( 1 − q ) x q r − 1 ] = ∑ x = 0 k ( x + r − 1 x ) [ x [ ( 1 − q ) − 1 ] ( 1 − q ) x − 1 q r − 1 + r ( 1 − q ) x q r − 1 ] = ∑ x = 0 k ( x + r − 1 x ) [ − x ( 1 − q ) x − 1 q r − 1 + ( x + r ) ( 1 − q ) x q r − 1 ] = − ∑ x = 0 k x ( x + r − 1 x ) ( 1 − q ) x − 1 q r − 1 + ∑ x = 0 k ( x + r ) ( x + r − 1 x ) ( 1 − q ) x q r − 1 = − ∑ x = 1 k x ( x + r − 1 x ) ( 1 − q ) x − 1 q r − 1 + ∑ x = 0 k ( x + r ) ( x + r − 1 x ) ( 1 − q ) x q r − 1 = − ∑ x = 1 k ( x + r − 1 ) ! ( x − 1 ) ! ( r − 1 ) ! ( 1 − q ) x − 1 q r − 1 + ∑ x = 0 k ( x + r ) ! x ! ( r − 1 ) ! ( 1 − q ) x q r − 1 = − r q 2 ∑ x = 1 k ( x + r − 1 ) ! ( x − 1 ) ! r ! ( 1 − q ) x − 1 q r + 1 + r q 2 ∑ x = 0 k ( x + r ) ! x ! r ! ( 1 − q ) x q r + 1 = − r q 2 ∑ x ′ = 0 k − 1 ( x ′ + r ) ! x ′ ! r ! ( 1 − q ) x ′ q r + 1 + r q 2 ∑ x = 0 k ( x + r ) ! x ! r ! ( 1 − q ) x q r + 1 = − r q 2 F ( k − 1 ; r + 1 , 1 − q ) + r q 2 F ( k ; r + 1 , 1 − q ) = r q 2 f ( k ; r + 1 , 1 − q ) \begin{aligned} \frac{\partial F}{\partial q} & = \sum_{x=0}^k \tbinom{x+r-1}{x}\left[-x(1-q)^{x-1}q^r+r(1-q)^x q^{r-1}\right]\\ & = \sum_{x=0}^k \tbinom{x+r-1}{x}\left[-x(1-q)^{x-1}q^r+r(1-q)^x q^{r-1}\right]\\ & = \sum_{x=0}^k \tbinom{x+r-1}{x}\left[x[(1-q)-1](1-q)^{x-1}q^{r-1}+r(1-q)^x q^{r-1}\right]\\ & = \sum_{x=0}^k \tbinom{x+r-1}{x}\left[-x(1-q)^{x-1}q^{r-1}+(x+r)(1-q)^x q^{r-1}\right]\\ &= - \sum_{x=0}^kx \tbinom{x+r-1}{x}(1-q)^{x-1}q^{r-1}+\sum_{x=0}^k(x+r) \tbinom{x+r-1}{x}(1-q)^x q^{r-1}\\ &= - \sum_{x=1}^kx \tbinom{x+r-1}{x}(1-q)^{x-1}q^{r-1}+\sum_{x=0}^k(x+r) \tbinom{x+r-1}{x}(1-q)^x q^{r-1}\\ &= - \sum_{x=1}^k \frac{(x+r-1)!}{(x-1)!(r-1)!}(1-q)^{x-1}q^{r-1}+\sum_{x=0}^k \frac{(x+r)!}{x!(r-1)!}(1-q)^x q^{r-1}\\ &= - \frac{r}{q^2}\sum_{x=1}^k \frac{(x+r-1)!}{(x-1)! r!}(1-q)^{x-1}q^{r+1}+\frac{r}{q^2}\sum_{x=0}^k \frac{(x+r)!}{x! r!}(1-q)^x q^{r+1}\\ &= - \frac{r}{q^2}\sum_{x'=0}^{k-1} \frac{(x'+r)!}{x' ! r!}(1-q)^{x' }q^{r+1}+\frac{r}{q^2}\sum_{x=0}^k \frac{(x+r)!}{x! r!}(1-q)^x q^{r+1}\\ &= - \frac{r}{q^2} F(k-1;r+1,1-q) + \frac{r}{q^2} F(k;r+1,1-q)\\ &= \frac{r}{q^2} f(k; r+1, 1-q) \end{aligned} qF=x=0k(xx+r1)[x(1q)x1qr+r(1q)xqr1]=x=0k(xx+r1)[x(1q)x1qr+r(1q)xqr1]=x=0k(xx+r1)[x[(1q)1](1q)x1qr1+r(1q)xqr1]=x=0k(xx+r1)[x(1q)x1qr1+(x+r)(1q)xqr1]=x=0kx(xx+r1)(1q)x1qr1+x=0k(x+r)(xx+r1)(1q)xqr1=x=1kx(xx+r1)(1q)x1qr1+x=0k(x+r)(xx+r1)(1q)xqr1=x=1k(x1)!(r1)!(x+r1)!(1q)x1qr1+x=0kx!(r1)!(x+r)!(1q)xqr1=q2rx=1k(x1)!r!(x+r1)!(1q)x1qr+1+q2rx=0kx!r!(x+r)!(1q)xqr+1=q2rx=0k1x!r!(x+r)!(1q)xqr+1+q2rx=0kx!r!(x+r)!(1q)xqr+1=q2rF(k1;r+1,1q)+q2rF(k;r+1,1q)=q2rf(k;r+1,1q)
    而根据正则不完全 Beta 函数的定义,有
    I 1 − p ( r , k + 1 ) = I q ( r , k + 1 ) = B ( q ; r , k + 1 ) B ( r , k + 1 ) = ∫ 0 q t r − 1 ( 1 − t ) k d t B ( r , k + 1 ) \begin{aligned} I_{1-p}(r, k+1) &= I_{q}(r, k+1)\\ &= \frac{B(q; r, k+1)}{B(r, k+1)}\\ &= \frac{ \int_0^qt^{r-1}(1-t)^k\mathrm dt}{B(r, k+1)} \end{aligned} I1p(r,k+1)=Iq(r,k+1)=B(r,k+1)B(q;r,k+1)=B(r,k+1)0qtr1(1t)kdt
    同样对 q q q 求偏导,得
    ∂ I q ∂ q = q r − 1 ( 1 − q ) k B ( r , k + 1 ) = Γ ( r + k + 1 ) Γ ( r ) Γ ( k + 1 ) q r − 1 ( 1 − q ) k = ( r + k ) ! ( r − 1 ) ! k ! q r − 1 ( 1 − q ) k = r q 2 ( r + k ) ! r ! k ! q r + 1 ( 1 − q ) k = r q 2 f ( k ; r + 1 , 1 − q ) \begin{aligned} \frac{\partial I_q}{\partial q} &= \frac{q^{r-1}(1-q)^k}{B(r, k+1)}\\ &= \frac{\Gamma(r+k+1)}{\Gamma(r)\Gamma(k+1)} q^{r-1}(1-q)^k\\ &= \frac{(r+k)!}{(r-1)! k!}q^{r-1}(1-q)^k\\ &= \frac{r}{q^2}\frac{(r+k)!}{r! k!}q^{r+1}(1-q)^k\\ &= \frac{r}{q^2} f(k; r+1,1-q) \end{aligned} qIq=B(r,k+1)qr1(1q)k=Γ(r)Γ(k+1)Γ(r+k+1)qr1(1q)k=(r1)!k!(r+k)!qr1(1q)k=q2rr!k!(r+k)!qr+1(1q)k=q2rf(k;r+1,1q)
    也就是说
    ∂ ∂ q F ( k ; r ; 1 − q ) = ∂ ∂ q I q ( r , k + 1 ) \frac{\partial}{\partial q} F(k;r;1-q)= \frac{\partial}{\partial q}I_q(r, k+1) qF(k;r;1q)=qIq(r,k+1)
    亦即
    F ( k ; r ; 1 − q ) = I q ( r , k + 1 ) + C F(k;r;1-q) = I_q(r, k+1) + C F(k;r;1q)=Iq(r,k+1)+C
    注意到 q = 0 q=0 q=0 时有
    { F ( k ; r , 1 ) = 0 I 0 ( r , k + 1 ) = 0 \begin{cases} F(k; r, 1) = 0\\ I_0(r, k+1) = 0 \end{cases} {F(k;r,1)=0I0(r,k+1)=0
    解得常数 C = 0 C=0 C=0

    证毕。

    6. 在时间序列预测模型中的使用

    DeepAR 等模型中,网络的输出目标是概率分布的参数。例如正态分布的 μ \mu μ σ \sigma σ。但对于负二项分布而言,让网络直接输出 μ \mu μ σ \sigma σ 是不合适的,因为在训练过程中很难保证输出的值满足 σ 2 ≥ μ \sigma^2\geq\mu σ2μ。那么让网络输出 r r r p p p 呢?似乎是可以的,只要保证 r > 0 r>0 r>0 0 ≤ p ≤ 1 0\leq p\leq 1 0p1 即可。前者可以使用 softplus 激活函数,后者可以使用 sigmoid 激活函数。有没有办法避免使用 sigmoid 呢?通常的做法是让网络输出 μ \mu μ α = 1 / r \alpha=1/r α=1/r,只要使用 softplus 激活函数确保二者均为正数即可。

    参考文献

    1. Negative binomial distribution - Wikipedia
    2. Beta function - Wikipedia
    3. Patil G P. On the evaluation of the negative binomial distribution with examples[J]. Technometrics, 1960, 2(4): 501-505.
    更多相关内容
  • 瞬间产生功能 矩生成函数(MGF)。 随机变量的为 其中r > 0是直到实验停止的失败次数,而0 <= p <= 1是成功概率。 安装 $ npm install distributions-negative-binomial-mgf 要在浏览器中使用,请使用 。...
  • 讨论一类散度偏大的分布负二项分布的相关性质,以服从负二项分布的索赔次数为响应变量,引入风 险分级变量和对数联结函数,建立广义线性模型。采用极大似然估计法进行参数估计,并用 Wald检验法进行 检验。最后,利用 SAS...
  • 负二项分布(一种离散分布)

    千次阅读 2022-02-16 19:48:25
    负二项分布 负二项分布是伯努利分布的推广,它模拟了在指定(非随机)失败次数(表示为r)发生之前,一系列独立且同分布的伯努利试验中的成功次数

    负二项分布

    负二项分布是伯努利分布的推广,它模拟了在指定(非随机)失败次数(表示为r)发生之前,一系列独立且同分布的伯努利试验中的成功次数

    负二项分布可以用来确定一个系列中多于1次失败的概率
    比如:计算一台机器彻底崩溃前的天数、输掉系列赛冠军需要进行多少场比赛

    截图来源:Negative binomial distribution





    方差:
    Var = E [ X 2 ] − E [ X ] 2   Var = ∑ k = 0 ∞ k 2 ( k + r − 1 k ) p k ( 1 − p ) r − ( r p 1 − p ) 2 \text{Var}=E[X^2]-E[X]^2\\ ~\\ \text{Var}=\sum_{k=0}^{\infty}k^2\begin{pmatrix}k+r-1\\k\end{pmatrix}p^k(1-p)^r-(\frac{rp}{1-p})^2\\ Var=E[X2]E[X]2 Var=k=0k2(k+r1k)pk(1p)r(1prp)2
    通过微分恒等式来计算 E [ X 2 ] E[X^2] E[X2]
    p 2 d d p 1 = p 2 d d p ∑ k = 0 ∞ ( k + r − 1 k ) p k ( 1 − p ) r p^2\frac{d}{dp}1=p^2\frac{d}{dp}\sum_{k=0}^{\infty}\begin{pmatrix}k+r-1\\k\end{pmatrix}p^k(1-p)^r p2dpd1=p2dpdk=0(k+r1k)pk(1p)r
    最后整理求得
    E [ X 2 ] = r p + r 2 p 2 ( 1 − p ) 2   Var = E [ X 2 ] − E [ X ] 2 = r p + r 2 p 2 ( 1 − p ) 2 − ( r p 1 − p ) 2 = r p ( 1 − p ) 2   σ X 2 = r p ( 1 − p ) 2 E[X^2]=\frac{rp+r^2p^2}{(1-p)^2}\\ ~\\ \text{Var}=E[X^2]-E[X]^2=\frac{rp+r^2p^2}{(1-p)^2}-(\frac{rp}{1-p})^2=\frac{rp}{(1-p)^2}\\ ~\\ \sigma_X^2=\frac{rp}{(1-p)^2} E[X2]=(1p)2rp+r2p2 Var=E[X2]E[X]2=(1p)2rp+r2p2(1prp)2=(1p)2rp σX2=(1p)2rp

    例子:

    展开全文
  • 索赔次数服从泊松负二项分布的风险模型的破产概率,牛银菊,邓丽,对带有退保及随机投资收益的风险模型进行研究, 其中索赔次数服从泊松负二项分布, 且退保次数是保费收取次数的一个p-稀疏过程, 运用�
  • 这个 m 文件使用四种方法之一从负二项分布中生成随机数,并测试哪个更快。
  • 项分布负二项分布卡片

    千次阅读 2021-03-05 15:46:44
    目录二项分布性质负二项分布性质示例期望与方差 二项分布容易理解,负二项分布的描述不同模型稍有区别,记录一下。 二项分布 离散分布的一种,固定次数的独立试验时使用,每一次试验结果分为成功和失败两类,关心的...


    二项分布容易理解,负二项分布的描述不同模型稍有区别,记录一下。

    二项分布

    离散分布的一种,固定次数的独立试验时使用,每一次试验结果分为成功和失败两类,关心的是成功或失败的次数。

    二项分布概率密度为:

    P ( X = k ) = C n k p k q n − k \large\displaystyle P(X=k)=C_n^k p^kq^{n-k} P(X=k)=Cnkpkqnk

    其中:

    • p为单次试验成功的概率,q为失败的概率;
    • n为试验次数;
    • k表示成功k次,
      C n k = n ! k ! ( n − k ) ! \displaystyle C_n^k=\frac{n!}{k!(n-k)!} Cnk=k!(nk)!n!

    性质

    期望 E ( x ) = n p \displaystyle E(x)=np E(x)=np

    方差 V a r ( x ) = n p q \displaystyle Var(x)=npq Var(x)=npq

    负二项分布

    负二项分布有不同的描述,核心是放回抽取或者掷色子试验中,固定 成功(失败)的次数,描述 抽取/投掷 失败 (成功) 的次数概率分布。

    scipy.stats描述的模型:
    nbinom takes n and p as shape parameters where n is the number of successes, p is the probability of a single success, and (1-p) is the probability of a single failure.

    负二项分布将n和p作为形状参数,其中n是成功的次数,p 是单个成功的概率,1-p 是单个失败的概率。

    scipy中:
    抽取试验,单次成功的概率为 p p p,直到抽取 n n n次成功结束,这种情况下,失败次数 k k k符合负二项分布,其概率密度为:

    P ( X = k ) = C n + k − 1 n − 1 p n ( 1 − p ) k \displaystyle P(X=k)=C_{n+k-1}^{n-1}p^n(1-p)^k P(X=k)=Cn+k1n1pn(1p)k

    陈希孺老师教材中:
    抽取试验,单次成功的概率为 p p p,抽取试验直到抽取 k k k次失败结束,这种情况下,成功次数 n n n符合负二项分布,

    P ( X = n ) = C n + k − 1 k − 1 p n ( 1 − p ) k \displaystyle P(X=n)=C_{n+k-1}^{k-1}p^n(1-p)^k P(X=n)=Cn+k1k1pn(1p)k

    性质

    以scipy.stats模型为例,
    期望 E ( X ) = n p − n = n ( 1 − p ) p \displaystyle E(X) =\frac{n}{p}-n = \frac{n(1-p)}{p} E(X)=pnn=pn(1p)
    方差 V a r ( X ) = n ( 1 − p ) p 2 \displaystyle Var(X)=\frac{n(1-p)}{p^2} Var(X)=p2n(1p)

    示例

    掷色子,掷出1点为胜利:

    • 构造投掷18次筛子,投出1点的次数符合二项分布;
    • 现在考虑掷出3次胜利,问需要掷出多少次色子,比如结果是掷出了 k+3次色子,则k的分布符合 负二项分布

    scipy 实现及可视化

    import numpy as np
    import scipy.stats as stats
    import matplotlib.pyplot as plt
    plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
    plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
    
    fig, axs = plt.subplots(1,2,figsize=(10,4),dpi=100) 
    fig.subplots_adjust(wspace=0.3)
    # 单次试验成功率
    p = 1./6
    # 二项分布考虑掷色子18次,成功次数符合二项分布
    N = 18
    # 负二项分布考虑掷出成功n次,失败次数符合二项分布
    n = 3
    # 二项分布B(N,p)
    P_B= stats.binom(N,p)
    ## 成功次数0~18的概率分布
    x=np.arange(N)
    PF_B = P_B.pmf(x)
    
    # 负二项分布NB(n,p)
    P_NB = stats.nbinom(n,p)
    # 成功3次,失败次数 k 的概率分布
    k=np.arange(N)
    PF_NB = P_NB.pmf(k)
    
    axs[0].stem(x, PF_B, 'bo', label='固定总次数,成功次数: 二项分布')  
    axs[0].set_xticks(range(0,20,1)); 
    axs[0].legend(loc='upper left')  
    axs[0].set_ylim(0,0.3)
    
    ax2=axs[0].twinx() 
    ax2.plot(x,P_B.cdf(x),'r',label='累积概率')
    ax2.legend(loc='center right')
    ax2.grid()
    ax2.set_ylim(0,1.2)
    
    axs[1].stem(k, PF_NB, 'bo', label='固定成功次数,失败次数: 负二项分布')   
    axs[1].set_ylim(0,0.06)
    axs[1].set_xticks(range(0,20,1)); 
    axs[1].legend(loc='upper left')
    ax2=axs[1].twinx() 
    ax2.plot(x,P_NB.cdf(x),'r',label='累积概率')
    ax2.legend(loc=[0.02,0.8])
    ax2.grid()
    

    在这里插入图片描述

    期望与方差

    期望

    print(f'二项分布的期望: {stats.binom(18,1./6).expect():.1f}, \n
    		负二项分布的期望{stats.nbinom(3,1./6).expect():.1f}')
    

    输出为

    二项分布的期望: 3.0,
    负二项分布的期望15.0

    验算:
    二项分布 binom(18,1./6) 的期望 E ( X ) = n p = 18 ∗ 1 / 6 = 3 \displaystyle E(X) =np=18*1/6=3 E(X)=np=181/6=3
    负二项分布**nbinom(3,1./6)**的期望 E ( X ) = n p − n = 3 ∗ 6 − 3 = 15 \displaystyle E(X) =\frac{n}{p}-n = 3*6-3=15 E(X)=pnn=363=15
    方差

    print(f'二项分布的方差: {stats.binom(18,1./6).var():.1f}, \n负二项分布的方差{stats.nbinom(3,1./6).var():.1f}')
    

    二项分布**binom(18,1./6)的方差: 2.5,
    负二项分布
    nbinom(3,1./6)**的方差90.0

    验算
    二项分布 binom(18,1./6) 的方差 E ( X ) = n p q = 18 ∗ 1 / 6 ∗ 5 / 6 = 2.5 \displaystyle E(X) =npq=18*1/6*5/6=2.5 E(X)=npq=181/65/6=2.5
    负二项分布**nbinom(3,1./6)**的方差 E ( X ) = n ( 1 − p ) p 2 = 3 ∗ 5 / 6 ∗ 6 ∗ 6 = 90 \displaystyle E(X) =\frac{n(1-p)}{p^2}=3*5/6*6*6=90 E(X)=p2n(1p)=35/666=90

    展开全文
  • 此 m 文件返回参数为 R 和 P 的负二项分布的偏度、峰态和峰态超量。S、K 和 E 是输入参数的大小。 语法:function [s,k,e] = nbinskekur(r,p) 输入: r - 预定义的失败次数p - 概率参数(成功的概率) 输出: s - ...
  • 负二项分布:若干次试验,每次试验有 的概率出现目标事件,记 为出现 次目标事件所需要的总试验次数。首先我们先用最暴力的方法来直接推导它们的期望和方差。直接算E(X)和Var(X)二项分布的pmf:那么:把 提出来,...

    (好久没写知乎文章了,又不知道该写什么,就随便水一水吧)

    二项分布:

    equation?tex=n 次试验,每次试验有

    equation?tex=p 的概率出现目标事件,记

    equation?tex=x

    equation?tex=n 次试验后出现目标事件的次数;

    负二项分布:若干次试验,每次试验有

    equation?tex=p 的概率出现目标事件,记

    equation?tex=x 为出现

    equation?tex=r 次目标事件所需要的总试验次数。

    首先我们先用最暴力的方法来直接推导它们的期望和方差。

    直接算E(X)和Var(X)

    二项分布的pmf:

    equation?tex=f%28x%29%3D+%5Cleft%28+%5Cbegin%7Bmatrix%7D+n+%5C%5Cx+%5Cend%7Bmatrix%7D+%5Cright%29+p%5Ex%281-p%29%5E%7Bn-x%7D

    那么:

    equation?tex=%5Cbegin%7Balign%7D+E%28X%29%26%3D%5Csum_%7Bx%3D1%7D%5En+xf%28x%29+%5C%5C%26%3D%5Csum_%7Bx%3D1%7D%5En+x%5Cleft%28+%5Cbegin%7Bmatrix%7D+n+%5C%5Cx+%5Cend%7Bmatrix%7D+%5Cright%29+p%5Ex%281-p%29%5E%7Bn-x%7D+%5C%5C%26%3D%5Csum_%7Bx%3D1%7D%5Ennp+%5Cleft%28+%5Cbegin%7Bmatrix%7D+n-1+%5C%5Cx-1+%5Cend%7Bmatrix%7D+%5Cright%29p%5E%7Bx-1%7D%281-p%29%5E%7Bn-x%7D+%5Cend%7Balign%7D

    equation?tex=np 提出来,容易观察得出剩下那一部分也是一个二项分布的pmf,只不过

    equation?tex=n 变成了

    equation?tex=n-1

    equation?tex=x 变成了

    equation?tex=x-1 ,那么它求和后结果为1.

    因此:

    equation?tex=%5Cbegin%7Balign%7D++E%28X%29%26%3Dnp%5Csum_%7Bx%3D1%7D%5En+%5Cleft%28+%5Cbegin%7Bmatrix%7D+n-1+%5C%5Cx-1+%5Cend%7Bmatrix%7D+%5Cright%29p%5E%7Bx-1%7D%281-p%29%5E%7Bn-x%7D+%5C%5C%26%3Dnp++%5Cend%7Balign%7D

    为计算

    equation?tex=Var%28X%29 ,我们先计算

    equation?tex=E%28X%5E2%29

    equation?tex=%5Cbegin%7Balign%7D+E%28X%5E2%29%26%3D%5Csum_%7Bx%3D1%7D%5En+x%5E2%5Cleft%28+%5Cbegin%7Bmatrix%7D+n+%5C%5Cx+%5Cend%7Bmatrix%7D+%5Cright%29+p%5Ex%281-p%29%5E%7Bn-x%7D+%5C%5C%26%3D%5Csum_%7Bx%3D1%7D%5Ennp+%5Cleft%28+%5Cbegin%7Bmatrix%7D+n-1+%5C%5Cx-1+%5Cend%7Bmatrix%7D+%5Cright%29xp%5E%7Bx-1%7D%281-p%29%5E%7Bn-x%7D+%5C%5C%26%3Dnp%5Cleft%5B%5Csum_%7Bx%3D1%7D%5En%5Cleft%28+%5Cbegin%7Bmatrix%7D+n-1+%5C%5Cx-1+%5Cend%7Bmatrix%7D+%5Cright%29%28x-1%29p%5E%7Bx-1%7D%281-p%29%5E%7Bn-x%7D+%5C%5C%2B%5Csum_%7Bx%3D1%7D%5Enp%5E%7Bx-1%7D%281-p%29%5E%7Bn-x%7D%5Cright%5D+%5Cend%7Balign%7D

    右边两个求和,是将

    equation?tex=x 拆成

    equation?tex=%28x-1%29%2B1 的结果,显然第一个求和为二项分布

    equation?tex=B%28n-1%2Cp%29 的均值,第二个求和为二项分布pmf的和,即1。

    因此:

    equation?tex=E%28X%5E2%29%3Dnp%5B%28n-1%29p%2B1%5D

    那么:

    equation?tex=%5Cbegin%7Balign%7D+Var%28X%29%26%3DE%28X%5E2%29-%5BE%28X%29%5D%5E2+%5C%5C%26%3Dnp%281-p%29+%5Cend%7Balign%7D

    现在我们再来算负二项分布的

    equation?tex=E%28X%29

    equation?tex=Var%28X%29

    负二项分布的pmf:

    equation?tex=f%28x%29%3D+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x-1%5C%5Cr-1+%5Cend%7Bmatrix%7D+%5Cright%29+p%5Er%281-p%29%5E%7Bx-r%7D

    那么:

    equation?tex=%5Cbegin%7Balign%7D+E%28X%29%26%3D%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+xf%28x%29+%5C%5C%26%3D%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+x+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x-1%5C%5Cr-1+%5Cend%7Bmatrix%7D+%5Cright%29+p%5Er%281-p%29%5E%7Bx-r%7D+%5C%5C%26%3D%5Cfrac%7Br%7D%7Bp%7D%5Csum_%7Bx%3Dr%7D%5E%5Cinfty++%5Cleft%28+%5Cbegin%7Bmatrix%7D+x%5C%5Cr+%5Cend%7Bmatrix%7D+%5Cright%29+p%5E%7Br%2B1%7D%281-p%29%5E%7Bx-r%7D+%5Cend%7Balign%7D

    显然右边的求和式对应着负二项分布

    equation?tex=r

    equation?tex=r%2B1 时的pmf,因此求和为1.

    equation?tex=E%28X%29%3D%5Cfrac%7Br%7D%7Bp%7D

    另外,

    equation?tex=%5Cbegin%7Balign%7D+E%28X%5E2%29%26%3D%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+x%5E2f%28x%29+%5C%5C%26%3D%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+x%5E2+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x-1%5C%5Cr-1+%5Cend%7Bmatrix%7D+%5Cright%29+p%5Er%281-p%29%5E%7Bx-r%7D++%5C%5C%26%3D+%5Cfrac%7Br%7D%7Bp%7D%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+x+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x%5C%5Cr+%5Cend%7Bmatrix%7D+%5Cright%29+p%5E%7Br%2B1%7D%281-p%29%5E%7Bx-r%7D++%5C%5C%26%3D%5Cfrac%7Br%7D%7Bp%7D+%5Cleft%5B%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+%28x%2B1%29+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x%5C%5Cr+%5Cend%7Bmatrix%7D+%5Cright%29+p%5E%7Br%2B1%7D%281-p%29%5E%7Bx-r%7D++%5C%5C-%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x%5C%5Cr+%5Cend%7Bmatrix%7D+%5Cright%29+p%5E%7Br%2B1%7D%281-p%29%5E%7Bx-r%7D+%5Cright%5D+%5C%5C%26%3D%5Cfrac%7Br%7D%7Bp%7D%5Cleft%28%5Cfrac%7Br%2B1%7D%7Bp%7D-1+%5Cright%29+%5C%5C%26%3D%5Cfrac%7Br%28r-p%2B1%29%7D%7Bp%5E2%7D+%5Cend%7Balign%7D

    因此:

    equation?tex=Var%28X%29%3DE%28X%5E2%29-%5BE%28X%29%5D%5E2%3D%5Cfrac%7Br%281-p%29%7D%7Bp%5E2%7D

    (其实,在推导中pmf和为1的隐藏结论是需要通过级数去推的,这也意味着上述式子可以化成特殊级数形式,读者可以自行证明)

    用mgf进行计算会比上述方法稍微简单一些。

    MGF计算

    定义

    equation?tex=M%28t%29%3DE%28e%5E%7BtX%7D%29

    则:

    equation?tex=M%27%28t%29%3DE%28Xe%5E%7BtX%7D%29

    equation?tex=M%27%27%28t%29%3DE%28X%5E2e%5E%7BtX%7D%29

    那么:

    equation?tex=E%28X%29%3DM%27%280%29

    equation?tex=%5Cbegin%7Balign%7D+Var%28X%29%26%3DE%28X%5E2%29-%5BE%28X%29%5D%5E2+%5C%5C%26%3DM%27%27%280%29-M%27%5E2%280%29+%5Cend%7Balign%7D

    那么对于二项分布:

    equation?tex=%5Cbegin%7Balign%7D++M%28t%29%26%3D%5Csum_%7Bx%3D1%7D%5En+e%5E%7Btx%7Df%28x%29+%5C%5C%26%3D%5Csum_%7Bx%3D1%7D%5En+e%5E%7Btx%7D%5Cleft%28+%5Cbegin%7Bmatrix%7D+n+%5C%5Cx+%5Cend%7Bmatrix%7D+%5Cright%29+p%5Ex%281-p%29%5E%7Bn-x%7D+%5C%5C%26%3D%5Csum_%7Bx%3D1%7D%5En+%5Cleft%28+%5Cbegin%7Bmatrix%7D+n+%5C%5Cx+%5Cend%7Bmatrix%7D+%5Cright%29%28pe%5Et%29%5Ex%281-p%29%5E%7Bn-x%7D+%5C%5C%26%3D%281-p%2Bpe%5Et%29%5En+%5Cend%7Balign%7D

    equation?tex=M%27%28t%29%3Dnpe%5Et%281-p%2Bpe%5Et%29%5E%7Bn-1%7D

    equation?tex=%5Cbegin%7Balign%7D+M%27%27%28t%29%26%3DM%27%28t%29%2Bn%28n-1%29p%5E2e%5E%7B2t%7D%281-p%2Bpe%5Et%29%5E%7Bn-2%7D+%5Cend%7Balign%7D

    故:

    equation?tex=E%28X%29%3DM%27%280%29%3Dnp

    equation?tex=%5Cbegin%7Balign%7D+Var%28X%29%26%3DM%27%27%280%29-M%27%5E2%280%29+%5C%5C%26%3Dnp-np%5E2+%5C%5C%26%3Dnp%281-p%29+%5Cend%7Balign%7D

    对于负二项分布:

    equation?tex=%5Cbegin%7Balign%7D+M%28t%29%26%3D%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+e%5E%7Btx%7D+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x-1%5C%5Cr-1+%5Cend%7Bmatrix%7D+%5Cright%29+p%5Er%281-p%29%5E%7Bx-r%7D++%5C%5C%26%3D%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+e%5E%7Bt%28x-r%29%7D+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x-1%5C%5Cr-1+%5Cend%7Bmatrix%7D+%5Cright%29+%28pe%5Et%29%5Er%281-p%29%5E%7Bx-r%7D+%5C%5C%26%3D%28pe%5Et%29%5Er%5Csum_%7Bx%3D1%7D%5E%5Cinfty+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x-1%5C%5Cr-1+%5Cend%7Bmatrix%7D+%5Cright%29%5B%281-p%29e%5Et%5D%5E%7Bx-r%7D++%5Cend%7Balign%7D

    观察和式,令

    equation?tex=w%3D%281-p%29e%5Et

    equation?tex=%5Cbegin%7Balign%7D+%281-w%29%5E%7B-r%7D%26%3Dr%281-w%29%5E%7B-r-1%7D%2B%5Cfrac%7Br%28r%2B1%29%7D%7B2%7D%281-w%29%5E%7B-r-2%7D%2B%5Ccdots+%5C%5C%26%2B%5Cleft%28%5Cbegin%7Bmatrix%7Dx-1%5C%5Cr-1%5Cend%7Bmatrix%7D%5Cright%29%281-w%29%5E%7B-r-%28x-r%29%7D++%5Cend%7Balign%7D

    因此:

    equation?tex=M%28t%29%3D%28pe%5Et%29%5Er%281-w%29%5E%7B-r%7D%3D%5Cfrac%7B%28pe%5Et%29%5Er%7D%7B%5B1-%281-p%29e%5Et%5D%5Er%7D

    则:

    equation?tex=%5Cbegin%7Balign%7D+M%27%28t%29%26%3D%5Cfrac%7Br%28pe%5Et%29%5Er%5B1-%281-p%29e%5Et%5D%5Er%2Bre%5Et%281-p%29%28pe%5Et%29%5Er%5B1-%281-p%29e%5Et%5D%5E%7Br-1%7D%7D%7B%5B1-%281-p%29e%5Et%5D%5E%7B2r%7D%7D+%5C%5C%26%3D%5Cfrac%7Br%28pe%5Et%29%5Er%5B1-%281-p%29e%5Et%5D%2Bre%5Et%281-p%29%28pe%5Et%29%5Er%7D%7B%5B1-%281-p%29e%5Et%5D%5E%7Br%2B1%7D%7D+%5C%5C%26%3D%5Cfrac%7Br%28pe%5Et%29%5Er%7D%7B%5B1-%281-p%29e%5Et%5D%5E%7Br%2B1%7D%7D+%5Cend%7Balign%7D

    equation?tex=%5Cbegin%7Balign%7D+M%27%27%28t%29%26%3D%5Cfrac%7Br%5E2%28pe%5Et%29%5Er%5B1-%281-p%29e%5Et%5D%5E%7Br%2B1%7D%2Bre%5Et%28r%2B1%29%281-p%29%28pe%5Et%29%5Er%5B1-%281-p%29e%5Et%5D%5Er%7D%7B%5B1-%281-p%29e%5Et%5D%5E%7B2r%2B2%7D%7D+%5C%5C%26%3D%5Cfrac%7Br%5E2%28pe%5Et%29%5Er%5B1-%281-p%29e%5Et%5D%2Bre%5Et%28r%2B1%29%281-p%29%28pe%5Et%29%5Er%7D%7B%5B1-%281-p%29e%5Et%5D%5E%7Br%2B2%7D%7D+%5C%5C%26%3D%5Cfrac%7Br%5Br%2B%281-p%29e%5Et%5D%28pe%5Et%29%5Er%7D%7B%5B1-%281-p%29e%5Et%5D%5E%7Br%2B2%7D%7D+%5Cend%7Balign%7D

    故:

    equation?tex=E%28X%29%3DM%27%280%29%3D%5Cfrac%7Br%7D%7Bp%7D

    equation?tex=%5Cbegin%7Balign%7D+Var%28X%29%26%3DM%27%27%280%29-M%27%5E2%280%29+%5C%5C%26%3D%5Cfrac%7Br%28r%2B1-p%29%7D%7Bp%5E2%7D-%5Cfrac%7Br%5E2%7D%7Bp%5E2%7D+%5C%5C%26%3D%5Cfrac%7Br%281-p%29%7D%7Bp%5E2%7D+%5Cend%7Balign%7D

    当然,我们还可以把二项分布和负二项分布分别拆成若干次独立试验。

    利用伯努利分布和几何分布

    伯努利分布:可以看作二项分布中的单次试验,即

    equation?tex=n%3D1

    几何分布:可以看作负二项分布中

    equation?tex=r%3D1的情况。

    二项分布中的

    equation?tex=n 次试验相互独立,因此可以看作

    equation?tex=n 次相互独立的伯努利试验。

    而单次伯努利试验的期望:

    equation?tex=E%28X_i%29%3D1%5Ctimes+p%2B0%5Ctimes+%281-p%29%3Dp

    方差:

    equation?tex=Var%28X_i%29%3D%281-p%29%5E2p%2B%280-p%29%5E2%281-p%29%3Dp%281-p%29

    所以二项分布的均值:

    equation?tex=E%28Y%29%3D%5Csum_%7Bi%3D1%7D%5EnE%28X_i%29%3Dnp

    方差:

    equation?tex=%5Cbegin%7Balign%7D+Var%28Y%29%26%3DE%5Cleft%5C%7B%5BY-E%28Y%29%5D%5E2%5Cright%5C%7D+%5C%5C%26%3DE%5Cleft%5C%7B%5Cleft%5B%5Csum_%7Bi%3D1%7D%5EnX_i-%5Csum_%7Bi%3D1%7D%5EnE%28X_i%29%5Cright%5D%5E2%5Cright%5C%7D+%5C%5C%26%3DE%5Cleft%5C%7B%5Cleft%5B%5Csum_%7Bi%3D1%7D%5En%28X_i-E%28X_i%29%29%5Cright%5D%5E2%5Cright%5C%7D+%5C%5C%26%3DE%5Cleft%5C%7B%5Csum_%7Bi%3D1%7D%5En%5Csum_%7Bj%3D1%7D%5En%5BX_i-E%28X_i%29%5D%5BX_j-E%28X_j%29%5D%5Cright%5C%7D+%5C%5C%26%3D%5Csum_%7Bi%3D1%7D%5En%5Csum_%7Bj%3D1%7D%5EnE%5Cleft%5C%7B%5BX_i-E%28X_i%29%5D%5BX_j-E%28X_j%29%5D%5Cright%5C%7D+%5C%5C%26%3D%5Csum_%7Bi%3D1%7D%5E%7Bn-1%7D%5Csum_%7Bj%3Di%2B1%7D%5EnE%5BX_i-E%28X_i%29%5DE%5BX_j-E%28X_j%29%5D+%5C%5C%26%2B%5Csum_%7Bi%3D1%7D%5EnE%5Cleft%5C%7B%5BX_i-E%28X_i%29%5D%5E2%5Cright%5C%7D+%5C%5C%26%3D%5Csum_%7Bi%3D1%7D%5EnE%5Cleft%5C%7B%5BX_i-E%28X_i%29%5D%5E2%5Cright%5C%7D+%5C%5C%26%3D%5Csum_%7Bi%3D1%7D%5EnVar%28X_i%29+%5C%5C%26%3Dnp%281-p%29+%5Cend%7Balign%7D

    同理,我们计算几何分布的均值:

    equation?tex=E%28X_i%29%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+xp%281-p%29%5E%7Bx-1%7D

    equation?tex=%281-p%29E%28X_i%29%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+xp%281-p%29%5Ex

    两式相减:

    equation?tex=pE%28X_i%29%3Dp%2B%5Csum_%7Bx%3D1%7D%5E%5Cinfty+p%281-p%29%5Ex

    则:

    equation?tex=E%28X_i%29%3D1%2B%5Csum_%7Bx%3D1%7D%5E%5Cinfty%281-p%29%5Ex%3D%5Cfrac%7B1%7D%7Bp%7D

    计算方差前,计算

    equation?tex=E%28X_i%5E2%29

    equation?tex=E%28X_i%5E2%29%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+x%5E2p%281-p%29%5E%7Bx-1%7D

    equation?tex=q%3D1-p,则:

    equation?tex=%5Cbegin%7Balign%7D+E%28X_i%5E2%29%26%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+x%5E2%281-q%29q%5E%7Bx-1%7D+%5C%5C%26%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+x%5E2q%5E%7Bx-1%7D-%5Csum_%7Bx%3D1%7D%5E%5Cinfty+x%5E2q%5Ex+%5Cend%7Balign%7D

    equation?tex=f%28q%29%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+x%5E2q%5E%7Bx-1%7D

    则:

    equation?tex=%5Cint+f%28q%29dq%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+xq%5Ex%2BC

    错位相减得:

    equation?tex=%5Csum_%7Bx%3D1%7D%5E%5Cinfty+xq%5Ex%3D%5Cfrac%7B1%7D%7B1-q%7D%5Cleft%28q%2B%5Cfrac%7Bq%5E2%7D%7B1-q%7D%5Cright%29%3D%5Cfrac%7Bq%7D%7B%281-q%29%5E2%7D

    则:

    equation?tex=f%28q%29%3D%5Cfrac%7B1%2Bq%7D%7B%281-q%29%5E3%7D

    而对于

    equation?tex=%5Csum_%7Bx%3D1%7D%5E%5Cinfty+x%5E2q%5Ex ,我们将其拆成:

    equation?tex=%5Csum_%7Bx%3D1%7D%5E%5Cinfty+%28x%2B1%29%5E2q%5Ex-%5Csum_%7Bx%3D1%7D%5E%5Cinfty+2xq%5Ex-%5Csum_%7Bx%3D1%7D%5E%5Cinfty+q%5Ex

    equation?tex=g%28q%29%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+%28x%2B1%29%5E2q%5Ex

    equation?tex=%5Cint+g%28q%29dq%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+%28x%2B1%29q%5E%7Bx%2B1%7D%2BC

    错位相减得:

    equation?tex=%5Csum_%7Bx%3D1%7D%5E%5Cinfty%28x%2B1%29q%5E%7Bx%2B1%7D%3D%5Cfrac%7B1%7D%7B1-q%7D%5Cleft%282q%5E2%2B%5Cfrac%7Bq%5E3%7D%7B1-q%7D%5Cright%29%3D%5Cfrac%7B2q%5E2-q%5E3%7D%7B%281-q%29%5E2%7D

    则:

    equation?tex=g%28q%29%3D%5Cfrac%7Bq%28q%5E2-3q%2B4%29%7D%7B%281-q%29%5E3%7D

    equation?tex=%5Csum_%7Bx%3D1%7D%5E%5Cinfty+x%5E2q%5Ex%3D%5Cfrac%7Bq%5E2%2Bq%7D%7B%281-q%29%5E3%7D

    所以

    equation?tex=E%28X_i%5E2%29%3D%5Cfrac%7B1-q%5E2%7D%7B%281-q%29%5E3%7D%3D%5Cfrac%7B2-p%7D%7Bp%5E2%7D

    那么

    equation?tex=Var%28X_i%29%3DE%28X_i%5E2%29-%5BE%28X_i%29%5D%5E2%3D%5Cfrac%7B1-p%7D%7Bp%5E2%7D

    那么负二项分布的均值与方差为:

    equation?tex=E%28Y%29%3DrE%28X_i%29%3D%5Cfrac%7Br%7D%7Bp%7D%2CVar%28Y%29%3DrVar%28X_i%29%3D%5Cfrac%7Br%281-p%29%7D%7Bp%5E2%7D

    展开全文
  • 2. 数值模拟 2.1 绘制图像 2.2 不同死亡率下的平均存活率 写在后面   Source:Survival Rates and Negative Binomial (Francis, 2012) 炎炎夏日,你是否也深受蚊虫叮咬困扰? 本篇推文将帮助你用 ...
  • 由于负二项分布的展开式不如二项分布那么常用,故在推导其期望方差等数字特征时,会碰到一些问题,本文展示了二项分布和其他分布的关系,并且给出了负二项分布的数字特征的推导过程,方便小伙伴理解,以减少想入门...
  • r次成功的负二项分布等价于r个几何分布的实证
  • 帕斯卡分布/负二项分布

    千次阅读 2021-03-29 19:49:41
    负二项分布的正整数形式,描述第n次成功发生在第x次的概率 定义 在重复、独立的伯努利试验,设每次试验成功的概率为ppp,失败的概率为q=1−pq= 1- pq=1−p,若将试验进行到出现 rrr ( rrr 为常数 ) 次成功为止,以...
  • 负二项回归模型
  • R语言使用rnbinom函数生成符合负二项分布的随机数、使用plot函数可视化符合负二项分布的随机数(Negative binomial distribution)
  • 如果无穷随机变量序列是独立同分布(i.i.d.)的,而且每个随机变量都服从参数为p的伯努利分布,那么随机变量就形成参数为p的一系列伯努利试验。同样,如果n个随机变量独立同分布,并且都服从参数为p的伯努利分布,...
  • = 1的任何k返回x 成立,其中F是参数r和p的负二项分布的累积分布函数(CDF),其中r是直到实验停止的失败次数, p是成功概率。安装$ npm install distributions-negative-binomial-quantile 要在浏览器中使用,请...
  • title: 【概率论】5-5:负二项分布(The Negative Binomial Distribution) categories: - Mathematic - Probability keywords: - The Negative Binomial Distribution - The Geometric Distribution toc: true ...
  • R语言使用dnbinom函数生成负二项分布密度数据、使用plot函数可视化负二项分布密度数据(Negative binomial distribution)
  • 基于负二项分布模拟基因表达谱

    千次阅读 2020-03-26 16:25:29
    1. RNA-seq为什么是负二项分布2.负二项分布解释 3.DESeq2基于负二项分布找差异基因 4.生物信息学基础知识1 5.生物信息学基础知识2 6.广义线性回归模型 7.广义线性回归模型 ...
  • bioRxiv, 2016) 参考资料: (1) 【生信修炼手册】负二项分布在差异分析中的应用 (2) 【 生信百科】转录组差异表达筛选的真相 (3) 【生信媛】RNA-seq分析中的dispersion,你知道吗? (4) H. J. Pimentel, et al. ...
  • R语言glm.nb函数构建负二项分布回归模型(negative binomial)、使用epiDisplay包的poisgof函数对拟合的负二项分布回归模型进行拟合优度检验、即模型拟合的效果、验证模型是否有过度离散(overdispersion)等问题...
  • 在研究只允许部分服务台进入休假状态的多服务台M/M/c排队系统时,发现了条件Erlang分布的双参数加法性质,进一步研究发现相对应离散随机状态的负二项分布也具有类似的性质。本文证明了当X服从参数(m,p)的负二项...
  • 负二项分布,给出在熵损失函数下当可靠度的先验分布为Beta分布和幂分布时可靠度的Bayes估计、 E-Bayes估计及多层Bayes估计,并针对先验分布为幂分布的情形设计了相应的数值实验.实验结果表明,相对于负二项分布...
  • R语言负二项分布函数Negative Binomial Distribution(dnbinom, pnbinom, qnbinom & rnbinom )实战 目录 R语言负二项分布函数Negative Binomial Distribution(dnbinom, pnbinom, qnbinom & rnbinom )...
  • 文章在泊松分布评价模型改进的基础上提出了负二项分布的评价模型,对我国区域自主创新进行评价,充分考虑了影响区域自主创新的因素,并将这些因素纳入到评价模型中;实验研究结果表明,负二项分布模型运用于区域自主...
  • 本文列举了常见的离散分布,关于它们的背景、概率分布列、数学期望与方差,以及与之相关的一些重要性质;比如几何分布的无记忆性、二...5 负二项分布 / 巴斯卡分布 6 常用离散分布表 1. 二项分布b(n,p) 背景:...
  • 负二项分布在差异分析中的应用

    千次阅读 2018-09-28 19:18:00
    欢迎关注”生信修炼手册”!无论是DESeq还是edgeR, 在文章中都会提到是基于负二项分布进行差异分析的。为什么要要基于负二项分布呢?从统计学的角度出发,进行差异分析肯定会需要假设检验...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 43,309
精华内容 17,323
关键字:

负二项分布

友情链接: flyback_CCM.zip