精华内容
下载资源
问答
  • 二项分布的定义是什么
    2022-04-02 15:58:09

    随即试验:伯努利试验。

    P(A)=p

    n次试验,k次A事件发生,n-k次其他事件发生,1到n中选k,有C_{k}^{n}种情况,概率为

    P(X=k)=C_{k}^{n}p^{k}(1-p)^{n-k},0<p<1,k=0,1,...,n.

    称随机变量X服从参数为n,p的二项分布,X~B(n,p)

    C_{k}^{n}p^{k}(1-p)^{n-k}恰好为二项式(p+1-p)^{n}展开式中出现p^{k}的那一项,故二项分布由此得名。

    当n=1,成为0-1分布(伯努利分布、两点分布)

    更多相关内容
  • 二项分布(一种离散分布

    千次阅读 2022-02-16 19:48:25
    二项分布二项分布是伯努利分布的推广,它模拟了在指定(非随机)失败次数(表示为r)发生之前,一系列独立且同分布的伯努利试验中的成功次数

    负二项分布

    负二项分布是伯努利分布的推广,它模拟了在指定(非随机)失败次数(表示为r)发生之前,一系列独立且同分布的伯努利试验中的成功次数

    负二项分布可以用来确定一个系列中多于1次失败的概率
    比如:计算一台机器彻底崩溃前的天数、输掉系列赛冠军需要进行多少场比赛

    截图来源:Negative binomial distribution





    方差:
    Var = E [ X 2 ] − E [ X ] 2   Var = ∑ k = 0 ∞ k 2 ( k + r − 1 k ) p k ( 1 − p ) r − ( r p 1 − p ) 2 \text{Var}=E[X^2]-E[X]^2\\ ~\\ \text{Var}=\sum_{k=0}^{\infty}k^2\begin{pmatrix}k+r-1\\k\end{pmatrix}p^k(1-p)^r-(\frac{rp}{1-p})^2\\ Var=E[X2]E[X]2 Var=k=0k2(k+r1k)pk(1p)r(1prp)2
    通过微分恒等式来计算 E [ X 2 ] E[X^2] E[X2]
    p 2 d d p 1 = p 2 d d p ∑ k = 0 ∞ ( k + r − 1 k ) p k ( 1 − p ) r p^2\frac{d}{dp}1=p^2\frac{d}{dp}\sum_{k=0}^{\infty}\begin{pmatrix}k+r-1\\k\end{pmatrix}p^k(1-p)^r p2dpd1=p2dpdk=0(k+r1k)pk(1p)r
    最后整理求得
    E [ X 2 ] = r p + r 2 p 2 ( 1 − p ) 2   Var = E [ X 2 ] − E [ X ] 2 = r p + r 2 p 2 ( 1 − p ) 2 − ( r p 1 − p ) 2 = r p ( 1 − p ) 2   σ X 2 = r p ( 1 − p ) 2 E[X^2]=\frac{rp+r^2p^2}{(1-p)^2}\\ ~\\ \text{Var}=E[X^2]-E[X]^2=\frac{rp+r^2p^2}{(1-p)^2}-(\frac{rp}{1-p})^2=\frac{rp}{(1-p)^2}\\ ~\\ \sigma_X^2=\frac{rp}{(1-p)^2} E[X2]=(1p)2rp+r2p2 Var=E[X2]E[X]2=(1p)2rp+r2p2(1prp)2=(1p)2rp σX2=(1p)2rp

    例子:

    展开全文
  • (好久没写知乎文章了,又不知道该写什么,就随便水一水吧)二项分布: 次试验,每次试验有 的概率出现目标事件,记 为 次试验后出现目标事件的次数;负二项分布:若干次试验,每次试验有 的概率出现目标事件,记 为...

    (好久没写知乎文章了,又不知道该写什么,就随便水一水吧)

    二项分布:

    equation?tex=n 次试验,每次试验有

    equation?tex=p 的概率出现目标事件,记

    equation?tex=x

    equation?tex=n 次试验后出现目标事件的次数;

    负二项分布:若干次试验,每次试验有

    equation?tex=p 的概率出现目标事件,记

    equation?tex=x 为出现

    equation?tex=r 次目标事件所需要的总试验次数。

    首先我们先用最暴力的方法来直接推导它们的期望和方差。

    直接算E(X)和Var(X)

    二项分布的pmf:

    equation?tex=f%28x%29%3D+%5Cleft%28+%5Cbegin%7Bmatrix%7D+n+%5C%5Cx+%5Cend%7Bmatrix%7D+%5Cright%29+p%5Ex%281-p%29%5E%7Bn-x%7D

    那么:

    equation?tex=%5Cbegin%7Balign%7D+E%28X%29%26%3D%5Csum_%7Bx%3D1%7D%5En+xf%28x%29+%5C%5C%26%3D%5Csum_%7Bx%3D1%7D%5En+x%5Cleft%28+%5Cbegin%7Bmatrix%7D+n+%5C%5Cx+%5Cend%7Bmatrix%7D+%5Cright%29+p%5Ex%281-p%29%5E%7Bn-x%7D+%5C%5C%26%3D%5Csum_%7Bx%3D1%7D%5Ennp+%5Cleft%28+%5Cbegin%7Bmatrix%7D+n-1+%5C%5Cx-1+%5Cend%7Bmatrix%7D+%5Cright%29p%5E%7Bx-1%7D%281-p%29%5E%7Bn-x%7D+%5Cend%7Balign%7D

    equation?tex=np 提出来,容易观察得出剩下那一部分也是一个二项分布的pmf,只不过

    equation?tex=n 变成了

    equation?tex=n-1

    equation?tex=x 变成了

    equation?tex=x-1 ,那么它求和后结果为1.

    因此:

    equation?tex=%5Cbegin%7Balign%7D++E%28X%29%26%3Dnp%5Csum_%7Bx%3D1%7D%5En+%5Cleft%28+%5Cbegin%7Bmatrix%7D+n-1+%5C%5Cx-1+%5Cend%7Bmatrix%7D+%5Cright%29p%5E%7Bx-1%7D%281-p%29%5E%7Bn-x%7D+%5C%5C%26%3Dnp++%5Cend%7Balign%7D

    为计算

    equation?tex=Var%28X%29 ,我们先计算

    equation?tex=E%28X%5E2%29

    equation?tex=%5Cbegin%7Balign%7D+E%28X%5E2%29%26%3D%5Csum_%7Bx%3D1%7D%5En+x%5E2%5Cleft%28+%5Cbegin%7Bmatrix%7D+n+%5C%5Cx+%5Cend%7Bmatrix%7D+%5Cright%29+p%5Ex%281-p%29%5E%7Bn-x%7D+%5C%5C%26%3D%5Csum_%7Bx%3D1%7D%5Ennp+%5Cleft%28+%5Cbegin%7Bmatrix%7D+n-1+%5C%5Cx-1+%5Cend%7Bmatrix%7D+%5Cright%29xp%5E%7Bx-1%7D%281-p%29%5E%7Bn-x%7D+%5C%5C%26%3Dnp%5Cleft%5B%5Csum_%7Bx%3D1%7D%5En%5Cleft%28+%5Cbegin%7Bmatrix%7D+n-1+%5C%5Cx-1+%5Cend%7Bmatrix%7D+%5Cright%29%28x-1%29p%5E%7Bx-1%7D%281-p%29%5E%7Bn-x%7D+%5C%5C%2B%5Csum_%7Bx%3D1%7D%5Enp%5E%7Bx-1%7D%281-p%29%5E%7Bn-x%7D%5Cright%5D+%5Cend%7Balign%7D

    右边两个求和,是将

    equation?tex=x 拆成

    equation?tex=%28x-1%29%2B1 的结果,显然第一个求和为二项分布

    equation?tex=B%28n-1%2Cp%29 的均值,第二个求和为二项分布pmf的和,即1。

    因此:

    equation?tex=E%28X%5E2%29%3Dnp%5B%28n-1%29p%2B1%5D

    那么:

    equation?tex=%5Cbegin%7Balign%7D+Var%28X%29%26%3DE%28X%5E2%29-%5BE%28X%29%5D%5E2+%5C%5C%26%3Dnp%281-p%29+%5Cend%7Balign%7D

    现在我们再来算负二项分布的

    equation?tex=E%28X%29

    equation?tex=Var%28X%29

    负二项分布的pmf:

    equation?tex=f%28x%29%3D+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x-1%5C%5Cr-1+%5Cend%7Bmatrix%7D+%5Cright%29+p%5Er%281-p%29%5E%7Bx-r%7D

    那么:

    equation?tex=%5Cbegin%7Balign%7D+E%28X%29%26%3D%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+xf%28x%29+%5C%5C%26%3D%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+x+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x-1%5C%5Cr-1+%5Cend%7Bmatrix%7D+%5Cright%29+p%5Er%281-p%29%5E%7Bx-r%7D+%5C%5C%26%3D%5Cfrac%7Br%7D%7Bp%7D%5Csum_%7Bx%3Dr%7D%5E%5Cinfty++%5Cleft%28+%5Cbegin%7Bmatrix%7D+x%5C%5Cr+%5Cend%7Bmatrix%7D+%5Cright%29+p%5E%7Br%2B1%7D%281-p%29%5E%7Bx-r%7D+%5Cend%7Balign%7D

    显然右边的求和式对应着负二项分布

    equation?tex=r

    equation?tex=r%2B1 时的pmf,因此求和为1.

    equation?tex=E%28X%29%3D%5Cfrac%7Br%7D%7Bp%7D

    另外,

    equation?tex=%5Cbegin%7Balign%7D+E%28X%5E2%29%26%3D%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+x%5E2f%28x%29+%5C%5C%26%3D%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+x%5E2+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x-1%5C%5Cr-1+%5Cend%7Bmatrix%7D+%5Cright%29+p%5Er%281-p%29%5E%7Bx-r%7D++%5C%5C%26%3D+%5Cfrac%7Br%7D%7Bp%7D%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+x+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x%5C%5Cr+%5Cend%7Bmatrix%7D+%5Cright%29+p%5E%7Br%2B1%7D%281-p%29%5E%7Bx-r%7D++%5C%5C%26%3D%5Cfrac%7Br%7D%7Bp%7D+%5Cleft%5B%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+%28x%2B1%29+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x%5C%5Cr+%5Cend%7Bmatrix%7D+%5Cright%29+p%5E%7Br%2B1%7D%281-p%29%5E%7Bx-r%7D++%5C%5C-%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x%5C%5Cr+%5Cend%7Bmatrix%7D+%5Cright%29+p%5E%7Br%2B1%7D%281-p%29%5E%7Bx-r%7D+%5Cright%5D+%5C%5C%26%3D%5Cfrac%7Br%7D%7Bp%7D%5Cleft%28%5Cfrac%7Br%2B1%7D%7Bp%7D-1+%5Cright%29+%5C%5C%26%3D%5Cfrac%7Br%28r-p%2B1%29%7D%7Bp%5E2%7D+%5Cend%7Balign%7D

    因此:

    equation?tex=Var%28X%29%3DE%28X%5E2%29-%5BE%28X%29%5D%5E2%3D%5Cfrac%7Br%281-p%29%7D%7Bp%5E2%7D

    (其实,在推导中pmf和为1的隐藏结论是需要通过级数去推的,这也意味着上述式子可以化成特殊级数形式,读者可以自行证明)

    用mgf进行计算会比上述方法稍微简单一些。

    MGF计算

    定义

    equation?tex=M%28t%29%3DE%28e%5E%7BtX%7D%29

    则:

    equation?tex=M%27%28t%29%3DE%28Xe%5E%7BtX%7D%29

    equation?tex=M%27%27%28t%29%3DE%28X%5E2e%5E%7BtX%7D%29

    那么:

    equation?tex=E%28X%29%3DM%27%280%29

    equation?tex=%5Cbegin%7Balign%7D+Var%28X%29%26%3DE%28X%5E2%29-%5BE%28X%29%5D%5E2+%5C%5C%26%3DM%27%27%280%29-M%27%5E2%280%29+%5Cend%7Balign%7D

    那么对于二项分布:

    equation?tex=%5Cbegin%7Balign%7D++M%28t%29%26%3D%5Csum_%7Bx%3D1%7D%5En+e%5E%7Btx%7Df%28x%29+%5C%5C%26%3D%5Csum_%7Bx%3D1%7D%5En+e%5E%7Btx%7D%5Cleft%28+%5Cbegin%7Bmatrix%7D+n+%5C%5Cx+%5Cend%7Bmatrix%7D+%5Cright%29+p%5Ex%281-p%29%5E%7Bn-x%7D+%5C%5C%26%3D%5Csum_%7Bx%3D1%7D%5En+%5Cleft%28+%5Cbegin%7Bmatrix%7D+n+%5C%5Cx+%5Cend%7Bmatrix%7D+%5Cright%29%28pe%5Et%29%5Ex%281-p%29%5E%7Bn-x%7D+%5C%5C%26%3D%281-p%2Bpe%5Et%29%5En+%5Cend%7Balign%7D

    equation?tex=M%27%28t%29%3Dnpe%5Et%281-p%2Bpe%5Et%29%5E%7Bn-1%7D

    equation?tex=%5Cbegin%7Balign%7D+M%27%27%28t%29%26%3DM%27%28t%29%2Bn%28n-1%29p%5E2e%5E%7B2t%7D%281-p%2Bpe%5Et%29%5E%7Bn-2%7D+%5Cend%7Balign%7D

    故:

    equation?tex=E%28X%29%3DM%27%280%29%3Dnp

    equation?tex=%5Cbegin%7Balign%7D+Var%28X%29%26%3DM%27%27%280%29-M%27%5E2%280%29+%5C%5C%26%3Dnp-np%5E2+%5C%5C%26%3Dnp%281-p%29+%5Cend%7Balign%7D

    对于负二项分布:

    equation?tex=%5Cbegin%7Balign%7D+M%28t%29%26%3D%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+e%5E%7Btx%7D+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x-1%5C%5Cr-1+%5Cend%7Bmatrix%7D+%5Cright%29+p%5Er%281-p%29%5E%7Bx-r%7D++%5C%5C%26%3D%5Csum_%7Bx%3Dr%7D%5E%5Cinfty+e%5E%7Bt%28x-r%29%7D+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x-1%5C%5Cr-1+%5Cend%7Bmatrix%7D+%5Cright%29+%28pe%5Et%29%5Er%281-p%29%5E%7Bx-r%7D+%5C%5C%26%3D%28pe%5Et%29%5Er%5Csum_%7Bx%3D1%7D%5E%5Cinfty+%5Cleft%28+%5Cbegin%7Bmatrix%7D+x-1%5C%5Cr-1+%5Cend%7Bmatrix%7D+%5Cright%29%5B%281-p%29e%5Et%5D%5E%7Bx-r%7D++%5Cend%7Balign%7D

    观察和式,令

    equation?tex=w%3D%281-p%29e%5Et

    equation?tex=%5Cbegin%7Balign%7D+%281-w%29%5E%7B-r%7D%26%3Dr%281-w%29%5E%7B-r-1%7D%2B%5Cfrac%7Br%28r%2B1%29%7D%7B2%7D%281-w%29%5E%7B-r-2%7D%2B%5Ccdots+%5C%5C%26%2B%5Cleft%28%5Cbegin%7Bmatrix%7Dx-1%5C%5Cr-1%5Cend%7Bmatrix%7D%5Cright%29%281-w%29%5E%7B-r-%28x-r%29%7D++%5Cend%7Balign%7D

    因此:

    equation?tex=M%28t%29%3D%28pe%5Et%29%5Er%281-w%29%5E%7B-r%7D%3D%5Cfrac%7B%28pe%5Et%29%5Er%7D%7B%5B1-%281-p%29e%5Et%5D%5Er%7D

    则:

    equation?tex=%5Cbegin%7Balign%7D+M%27%28t%29%26%3D%5Cfrac%7Br%28pe%5Et%29%5Er%5B1-%281-p%29e%5Et%5D%5Er%2Bre%5Et%281-p%29%28pe%5Et%29%5Er%5B1-%281-p%29e%5Et%5D%5E%7Br-1%7D%7D%7B%5B1-%281-p%29e%5Et%5D%5E%7B2r%7D%7D+%5C%5C%26%3D%5Cfrac%7Br%28pe%5Et%29%5Er%5B1-%281-p%29e%5Et%5D%2Bre%5Et%281-p%29%28pe%5Et%29%5Er%7D%7B%5B1-%281-p%29e%5Et%5D%5E%7Br%2B1%7D%7D+%5C%5C%26%3D%5Cfrac%7Br%28pe%5Et%29%5Er%7D%7B%5B1-%281-p%29e%5Et%5D%5E%7Br%2B1%7D%7D+%5Cend%7Balign%7D

    equation?tex=%5Cbegin%7Balign%7D+M%27%27%28t%29%26%3D%5Cfrac%7Br%5E2%28pe%5Et%29%5Er%5B1-%281-p%29e%5Et%5D%5E%7Br%2B1%7D%2Bre%5Et%28r%2B1%29%281-p%29%28pe%5Et%29%5Er%5B1-%281-p%29e%5Et%5D%5Er%7D%7B%5B1-%281-p%29e%5Et%5D%5E%7B2r%2B2%7D%7D+%5C%5C%26%3D%5Cfrac%7Br%5E2%28pe%5Et%29%5Er%5B1-%281-p%29e%5Et%5D%2Bre%5Et%28r%2B1%29%281-p%29%28pe%5Et%29%5Er%7D%7B%5B1-%281-p%29e%5Et%5D%5E%7Br%2B2%7D%7D+%5C%5C%26%3D%5Cfrac%7Br%5Br%2B%281-p%29e%5Et%5D%28pe%5Et%29%5Er%7D%7B%5B1-%281-p%29e%5Et%5D%5E%7Br%2B2%7D%7D+%5Cend%7Balign%7D

    故:

    equation?tex=E%28X%29%3DM%27%280%29%3D%5Cfrac%7Br%7D%7Bp%7D

    equation?tex=%5Cbegin%7Balign%7D+Var%28X%29%26%3DM%27%27%280%29-M%27%5E2%280%29+%5C%5C%26%3D%5Cfrac%7Br%28r%2B1-p%29%7D%7Bp%5E2%7D-%5Cfrac%7Br%5E2%7D%7Bp%5E2%7D+%5C%5C%26%3D%5Cfrac%7Br%281-p%29%7D%7Bp%5E2%7D+%5Cend%7Balign%7D

    当然,我们还可以把二项分布和负二项分布分别拆成若干次独立试验。

    利用伯努利分布和几何分布

    伯努利分布:可以看作二项分布中的单次试验,即

    equation?tex=n%3D1

    几何分布:可以看作负二项分布中

    equation?tex=r%3D1的情况。

    二项分布中的

    equation?tex=n 次试验相互独立,因此可以看作

    equation?tex=n 次相互独立的伯努利试验。

    而单次伯努利试验的期望:

    equation?tex=E%28X_i%29%3D1%5Ctimes+p%2B0%5Ctimes+%281-p%29%3Dp

    方差:

    equation?tex=Var%28X_i%29%3D%281-p%29%5E2p%2B%280-p%29%5E2%281-p%29%3Dp%281-p%29

    所以二项分布的均值:

    equation?tex=E%28Y%29%3D%5Csum_%7Bi%3D1%7D%5EnE%28X_i%29%3Dnp

    方差:

    equation?tex=%5Cbegin%7Balign%7D+Var%28Y%29%26%3DE%5Cleft%5C%7B%5BY-E%28Y%29%5D%5E2%5Cright%5C%7D+%5C%5C%26%3DE%5Cleft%5C%7B%5Cleft%5B%5Csum_%7Bi%3D1%7D%5EnX_i-%5Csum_%7Bi%3D1%7D%5EnE%28X_i%29%5Cright%5D%5E2%5Cright%5C%7D+%5C%5C%26%3DE%5Cleft%5C%7B%5Cleft%5B%5Csum_%7Bi%3D1%7D%5En%28X_i-E%28X_i%29%29%5Cright%5D%5E2%5Cright%5C%7D+%5C%5C%26%3DE%5Cleft%5C%7B%5Csum_%7Bi%3D1%7D%5En%5Csum_%7Bj%3D1%7D%5En%5BX_i-E%28X_i%29%5D%5BX_j-E%28X_j%29%5D%5Cright%5C%7D+%5C%5C%26%3D%5Csum_%7Bi%3D1%7D%5En%5Csum_%7Bj%3D1%7D%5EnE%5Cleft%5C%7B%5BX_i-E%28X_i%29%5D%5BX_j-E%28X_j%29%5D%5Cright%5C%7D+%5C%5C%26%3D%5Csum_%7Bi%3D1%7D%5E%7Bn-1%7D%5Csum_%7Bj%3Di%2B1%7D%5EnE%5BX_i-E%28X_i%29%5DE%5BX_j-E%28X_j%29%5D+%5C%5C%26%2B%5Csum_%7Bi%3D1%7D%5EnE%5Cleft%5C%7B%5BX_i-E%28X_i%29%5D%5E2%5Cright%5C%7D+%5C%5C%26%3D%5Csum_%7Bi%3D1%7D%5EnE%5Cleft%5C%7B%5BX_i-E%28X_i%29%5D%5E2%5Cright%5C%7D+%5C%5C%26%3D%5Csum_%7Bi%3D1%7D%5EnVar%28X_i%29+%5C%5C%26%3Dnp%281-p%29+%5Cend%7Balign%7D

    同理,我们计算几何分布的均值:

    equation?tex=E%28X_i%29%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+xp%281-p%29%5E%7Bx-1%7D

    equation?tex=%281-p%29E%28X_i%29%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+xp%281-p%29%5Ex

    两式相减:

    equation?tex=pE%28X_i%29%3Dp%2B%5Csum_%7Bx%3D1%7D%5E%5Cinfty+p%281-p%29%5Ex

    则:

    equation?tex=E%28X_i%29%3D1%2B%5Csum_%7Bx%3D1%7D%5E%5Cinfty%281-p%29%5Ex%3D%5Cfrac%7B1%7D%7Bp%7D

    计算方差前,计算

    equation?tex=E%28X_i%5E2%29

    equation?tex=E%28X_i%5E2%29%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+x%5E2p%281-p%29%5E%7Bx-1%7D

    equation?tex=q%3D1-p,则:

    equation?tex=%5Cbegin%7Balign%7D+E%28X_i%5E2%29%26%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+x%5E2%281-q%29q%5E%7Bx-1%7D+%5C%5C%26%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+x%5E2q%5E%7Bx-1%7D-%5Csum_%7Bx%3D1%7D%5E%5Cinfty+x%5E2q%5Ex+%5Cend%7Balign%7D

    equation?tex=f%28q%29%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+x%5E2q%5E%7Bx-1%7D

    则:

    equation?tex=%5Cint+f%28q%29dq%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+xq%5Ex%2BC

    错位相减得:

    equation?tex=%5Csum_%7Bx%3D1%7D%5E%5Cinfty+xq%5Ex%3D%5Cfrac%7B1%7D%7B1-q%7D%5Cleft%28q%2B%5Cfrac%7Bq%5E2%7D%7B1-q%7D%5Cright%29%3D%5Cfrac%7Bq%7D%7B%281-q%29%5E2%7D

    则:

    equation?tex=f%28q%29%3D%5Cfrac%7B1%2Bq%7D%7B%281-q%29%5E3%7D

    而对于

    equation?tex=%5Csum_%7Bx%3D1%7D%5E%5Cinfty+x%5E2q%5Ex ,我们将其拆成:

    equation?tex=%5Csum_%7Bx%3D1%7D%5E%5Cinfty+%28x%2B1%29%5E2q%5Ex-%5Csum_%7Bx%3D1%7D%5E%5Cinfty+2xq%5Ex-%5Csum_%7Bx%3D1%7D%5E%5Cinfty+q%5Ex

    equation?tex=g%28q%29%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+%28x%2B1%29%5E2q%5Ex

    equation?tex=%5Cint+g%28q%29dq%3D%5Csum_%7Bx%3D1%7D%5E%5Cinfty+%28x%2B1%29q%5E%7Bx%2B1%7D%2BC

    错位相减得:

    equation?tex=%5Csum_%7Bx%3D1%7D%5E%5Cinfty%28x%2B1%29q%5E%7Bx%2B1%7D%3D%5Cfrac%7B1%7D%7B1-q%7D%5Cleft%282q%5E2%2B%5Cfrac%7Bq%5E3%7D%7B1-q%7D%5Cright%29%3D%5Cfrac%7B2q%5E2-q%5E3%7D%7B%281-q%29%5E2%7D

    则:

    equation?tex=g%28q%29%3D%5Cfrac%7Bq%28q%5E2-3q%2B4%29%7D%7B%281-q%29%5E3%7D

    equation?tex=%5Csum_%7Bx%3D1%7D%5E%5Cinfty+x%5E2q%5Ex%3D%5Cfrac%7Bq%5E2%2Bq%7D%7B%281-q%29%5E3%7D

    所以

    equation?tex=E%28X_i%5E2%29%3D%5Cfrac%7B1-q%5E2%7D%7B%281-q%29%5E3%7D%3D%5Cfrac%7B2-p%7D%7Bp%5E2%7D

    那么

    equation?tex=Var%28X_i%29%3DE%28X_i%5E2%29-%5BE%28X_i%29%5D%5E2%3D%5Cfrac%7B1-p%7D%7Bp%5E2%7D

    那么负二项分布的均值与方差为:

    equation?tex=E%28Y%29%3DrE%28X_i%29%3D%5Cfrac%7Br%7D%7Bp%7D%2CVar%28Y%29%3DrVar%28X_i%29%3D%5Cfrac%7Br%281-p%29%7D%7Bp%5E2%7D

    展开全文
  • 离散型变量 如:二项分布、泊松分布 三者之间的关系 二项分布(Binomial distribution) 二项分布(Binomial distribution)是n重伯努利试验成功次数的离散概率分布,记作。伯努利试验是只有两种可能结果的单次随机...

    变量类型:

    1. 连续型变量         如:指数分布、正态分布
    2. 离散型变量         如:二项分布、泊松分布

    三者之间的关系

    二项分布(Binomial distribution)

    二项分布(Binomial distribution)n重伯努利试验成功次数的离散概率分布,记作B(n,\pi )伯努利试验是只有两种可能结果的单次随机试验。

    伯努利试验都可以表达为“是或否”的问题。例如,抛一次硬币是正面向上吗?刚出生的小孩是个女孩吗?等等

    • 如果试验E是一个伯努利试验,将E独立重复地进行n次,则称这一串重复的独立试验为n重伯努利试验。
    • 进行一次伯努利试验,成功(X=1)概率为p(0<=p<=1),失败(X=0)概率为1-p,则称随机变量X服从伯努利分布。伯努利分布是离散型概率分布,伯努利分布(Bernoulli distribution)又名两点分布或0-1分布。

    二项分布的三个特点:

    • 每次实验结果,只能是两个互斥的结果之一。
    • 各次实验独立,各次的实验结果互不影响。。
    • 相同的实验条件下,每次实验中事件A的发生具有相同的概率\pi

    二项分布的概率函数P(X)可用公式

    P(X)=C_{n}^{X}\pi^{X}(1-\pi )^{n-X}

    其中,C_{n}^{X}=\frac{n!}{X!(n-X)!}

    对于任何二项分布,总有\sum_{X=0}^{n}P(X)=1

    例1.如果某地钩虫感染率为13%,随机观察当地150人,其中恰好有10人感染钩虫的概率有多大?

    分析: 
    (1)钩虫感染只有两个互斥的结果,即感染与非感染;
    (2)每个人被钩虫感染的概率相同;
    (3)人与人之间钩虫感染可假设为相互独立的,所以感染钩虫的人数 X 可认为服从 n = 150,π = 0.13的二项分布。

    P(X)=C_{n}^{X}\pi^{X}(1-\pi )^{n-X}

    P(X=10)=\frac{150!}{10!(150-10)!}\times (0.13^{10}\times 0.87^{(150-10)})=0.0055

    二项分布的特征

    • n,\pi是二项分布的两个参数,所以二项分布的形状取决于n,\pi(阳性率)。
    • \pi =0.5时分布对称,近似对称分布。
    • \pi ≠0.5时,分布呈偏态,特别是 n 较小时,\pi 偏离0.5越远,分布的对称性越差,但只要不接近1和0时,随着n的增大,分布逐渐逼近正态。
    • \pi1-\pi 不太小,而 n足够大,通常 n\pin(1-\pi )大于或等于5,我们常用正态近似的原理来处理二项分布的问题。

    二项分布的正态近似

    • 根据中心极限定理,在n较大,n\pin(1-\pi )均大于或等于5时,二项分布接近与正态分布。
    • n无穷大时,二项分布B(n,\pi)的极限分布是总体均数为\mu =n\pi,总体标准差为\sigma =\sqrt{n\pi (1-\pi )}的正态分布N(n\pi ,n\pi (1-\pi )),此时可用该正态分布进行估计。

    二项分布的均数和标准差

    对于任何一个二项分布B(n,\pi ),如果每次试验出现“阳性” 结果的概率均为\pi,则在 n 次独立重复实验中:

    1、出现  X 次阳性结果

    总体均数(出现阳性结果的次数X的均值):\mu_{X} =n\pi

    标准差(出现阳性结果的次数X的标准差):\sigma_{X} =\sqrt{n\pi (1-\pi )}

    2、阳性结果的频率记做为P=\frac{X}{n}

    P的总体均数(出现阳性结果频率P的均值):\mu_{P} =\pi

    标准差(出现阳性结果频率P的标准差):\sigma_{P} =\sqrt{\frac{\pi (1-\pi )}{n}}

    \sigma_{P}是频率P的标准误,反映阳性频率的抽样误差的大小。

    泊松分布(Poisson distribution)

    泊松分布是二项分布在阳性率特别小时的一种情形,用于描述单位时间、空间、面积等的罕见事件发生次数的概率分布,如:

    • 每毫升水中的大肠杆菌数
    • 单位时间(如1分钟)内放射性质点数
    • 每1000个新生儿中某出生缺陷、多胞胎、染色体异常等事件出现的例数

    泊松分布的三个特点:

    泊松分布是二项分布当中的一种特殊情况,则泊松分布也遵循二项分布的三个特点:

    • 观察结果相互独立
    • 每次试验只有两个结果
    • 发生的概率\pi不变

    如,人群中传染性疾病首例出现后便成为传染源,会增加后续病例出现的概率,因此病例数的分布不能看作是Poisson分布。

    又如,污染的牛奶中细菌成集落存在,单位容量牛奶中细菌数不能认为服从Poisson分布。 

    泊松分布分布一般记作P(\lambda ),其概率函数为: 

    P(X)=e^{-\lambda }\frac{\lambda ^{X}}{X!}

    式中,\lambda=n\pi为Poisson分布的总体均数(\pi表示概率);X 为观察单位内某稀有事件的发生次数;e 为自然对数的底,为常数,约等于2.71828,自然对数的底数e是由一个重要极限给出的:当n趋于无限时,\lim_{n \to +\propto }(1+\frac{1}{n})^n=e

    泊松定理(泊松分布是二项分布当中的一种特殊情况)

    设随机变量X(X=1,2,3,...)服从二项分布,即P(X)=C_{n}^{X}\pi^{X}(1-\pi )^{n-X}。其中,\pi(0<\pi <1)是与n有关的数,且设n\pi =\lambda >0是常数,则有\lim_{X \to \propto }P(X)=e^{-\lambda }\frac{\lambda ^{X}}{X!}X=1,2,3,...

    证明:依题设有\pi =\frac{\lambda }{n},代入P(X)=C_{n}^{X}\pi^{X}(1-\pi )^{n-X}中,有

    \begin{align}P(X) &=\frac{n(n-1)(n-2)...(n-X+1)}{X!}(\frac{\lambda }{n})^{X}(1-\frac{\lambda }{n})^{n-X} \\&=\frac{\lambda ^{X}}{X!}[\frac{n}{n}\cdot \frac{n-1}{n}\cdot \frac{n-2}{n}...\cdot \frac{n-X+1}{n}]\cdot(1-\frac{\lambda }{n}) ^{n}\cdot(1-\frac{\lambda }{n}) ^{-X} \\&=\frac{\lambda ^{X}}{X!}[1\cdot (1-\frac{1}{n})\cdot(1- \frac{2}{n})...\cdot (1-\frac{X-1}{n})]\cdot(1-\frac{\lambda }{n}) ^{n}\cdot(1-\frac{\lambda }{n}) ^{-X} \end{align}

    对于固定的X,有

    \lim_{n \to +\propto }1\cdot (1-\frac{1}{n})\cdot(1- \frac{2}{n})...\cdot (1-\frac{X-1}{n})=1

    \lim_{n \to +\propto }(1-\frac{\lambda }{n}) ^{n}=\lim_{n \to +\propto }(1-\frac{\lambda }{n}) ^{(-\frac{n}{\lambda })\cdot (-\lambda) }=e^{-\lambda }(根据\lim_{n \to +\propto }(1+\frac{1}{n})^n=e

    \lim_{n \to +\propto }(1-\frac{\lambda }{n}) ^{-X}=1

    所以\lim_{X \to \propto }P(X)=e^{-\lambda }\frac{\lambda ^{X}}{X!}X=1,2,3,...

    可见,二项分布的极限分布是泊松分布,当n很大,\pi很小时,可用e^{-\lambda }\frac{\lambda ^{X}}{X!}近似代替C_{n}^{X}\pi^{X}(1-\pi )^{n-X}(n\pi =\lambda ),一般n\geq 20,\pi \leq 0.05时,可采用上次近似公式代替。

    泊松分布的特征

    • 随着\lambda的增大,Poisson分布逐渐趋于对称分布。
    • \lambda>20时,Poisson分布可视为近似正态分布。

    下图表示出了\lambda对泊松分布的影响,\lambda表示泊松分布的均值。当\lambda变大时,不仅整个分布模式向右移动,数据也更加分散,方差随之变大。

    泊松分布的特性

    • 总体均数与总体方差相等:均为\lambda
    • 可加性:从总体均数分别为\lambda1 和\lambda2 的两个Poisson分布总体中各自随机抽出一份样本,其中稀有事件的发生次数分别为X_{1}X_{2} ,则合计发生数T=X_{1}+X_{2 }也服从Poisson分布,总体均数为\lambda1 +\lambda2 。

    可加性的运用:分5次,每次都是监测5毫升的水样,得到的\lambda都比20小,但是5次\lambda相加的之后形成的\lambda比20大的话,我们就可以10毫升水样当中的细菌数的分布用正态近似法了

    例:某放射性物质半小时内发出的脉冲数服从Poisson分布,平均为  360个,试估计该放射性物质半小时内发出的脉冲数大于400个的概率。

    \begin{align} P(X>400) & = 1-P(X\leq 400)\approx 1-\Phi (\frac{400+0.5-360}{\sqrt{360}}) \\ & = 1-\Phi(2.135)=0.0164 \end{align}

    其中,0.5表示连续型校正,表示处理离散型变量,应用到连续型的正态分布的时候,效果更佳的一种修正。

    注意:泊松分布不具备可乘性。

    指数分布

    设随机变量X的分布密度函数为

    f(x)=\left\{\begin{matrix} \lambda e^{-\lambda x},x>0\\ 0,x\leq 0 \end{matrix}\right.

    其中\lambda >0为常数,我们称X服从参数为\lambda的指数分布,记作X\sim E(\lambda ),其相应的分布函数为

    F(x)=\left\{\begin{matrix} 1-e^{-\lambda x},x>0 \\ 0,x\leq 0 \end{matrix}\right.

    f(x)F(x)的图形见下图。

    指数分布的特性

    • 总体均数E(X)=\frac{1}{\lambda},总体方差D(X)=\frac{1}{\lambda ^{2}}

    指数分布通常用作各种“寿命”的分布。例如,无线电元件的寿命,动物的寿命等,另外电话问题的通话时间、随机服务系统中的服务时间等都可以认为服从指数分布,因此,它在排队论和可靠性理论等领域中有广泛的应用。

    例、某电子元件的使用寿命X是一个连续型随机变量,其概率密度为

    f(x)=\left\{\begin{matrix} k e^{-\frac{x}{100}},x>0\\ 0,x\leq 0 \end{matrix}\right.

    (1)确定常数k

    (2)求寿命超过100小时的概率

    (3)已知该元件已经正常使用200小时,求它至少还能正常使用100小时的概率。

    解:

    (1)由概率密度函数性质2知

    \int_{0}^{+\propto }ke^{-\frac{x}{100}}dx=[-100ke^{-\frac{x}{100}}]|_{0}^{+\propto}=100k=1,得k=0.01

    (2)寿命超过100小时的概率为

    P(X>100)=1-F(100)=1-(1-e^{-0.01\times 100})=e^{-1}\approx 0.3679

    (3)条件概率

    \begin{align} P(X>300|X>200) &=\frac{P(X>300,X>200)}{P(X>200)}\\&=\frac{P(X>300)}{P(X>200)}\\&=\frac{e^{-3}}{e^{-2}}=e^{-1}\approx 0.3679 \end{align}

    由(2),(3)可知,该元件寿命超过100小时的概率等于已使用200小时的条件下至少还能使用100小时的概率,这个性质称为指数分布的“无记忆性”。

    若随机变量X对任意的s>0,t>0都有P(X>s+t|X>s)=P(X>t),则称X的分布具有无记忆性。

    因此,指数分布具有无记忆性,若某元件或动物的寿命服从指数分布,则上式表明,如果已知寿命长于s年,则再“活”t年的概率与s无关,即对过去的s时间没有记忆,也就是说只要在某时刻s仍“活”着,它的剩余寿命的分布和原来的寿命分布相同,所以人们也戏称指数分布是“永远年轻的”。

    正态分布(Normal distribution)

    正态分布的概率密度函数(即纵向的曲线高度)

    f(X)=\frac{1}{\sigma \sqrt{2\pi }}e^{-\frac{1}{2}(\frac{X-\mu }{\sigma })^{2}}-\infty < X< +\infty

    \sigma规定了曲线的形状,\mu反应了其在横轴上的位置不同。

    正态分布的特征

    • 关于x=\mu对称,即正态分布以均数为中心,左右对称。
    • x=\mu处取得概率密度函数的最大值,在x=\mu\pm \sigma处有拐点,表现为 钟形曲线。即正态曲线在横轴上方均数处最高。
    • 正态分布有两个参数,即均数\mu和标准差\sigma\mu是位置参数,\sigma是变异度参数(形状参数)。常用N(\mu ,\sigma ^{2})表示均数为\mu,标准差为\sigma的正态分布;用N(0 ,1)表示标准正态分布。
    • 正态曲线下面积分布有一定规律。横轴上正态曲线下的面积等于1(也常写作100%)。

    正态方程的积分式(概率分布函数):

    概率分布函数即为正态概率密度曲线下的面积 。

    F(X)=\frac{1}{\sigma \sqrt{2\pi }}\int_{-\infty }^{X}e^{-\frac{1}{2}(\frac{X-\mu }{\sigma })^{2}}dX

    F(X)为正态变量X的累计分布函数,反映正态曲线下,横轴尺度自-\inftyX的面积,即下侧累计面积。

    标准正态分布

    均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布

    对于任意一个服从正态分布N(\mu ,\sigma ^{2})的随机变量,可作如下的标准化变换,也称Z(z-score)变换

    其中,Z=\frac{X-\mu }{\sigma },标准正态分布的概率密度函数:f(Z)=\frac{1}{\sqrt{2\pi }}e^{-\frac{Z^{2}}{2}}

    标准正态分布方程积分式(概率分布函数):

    \Phi (Z)=\frac{1}{2\pi }\int_{-\infty }^{Z}e^{-\frac{Z^{2}}{2}}dZ

    \Phi (Z)为标准正态变量Z的累计分布函数,反映标准正态曲线下,横轴尺度自-\inftyZ的面积,即下侧累计面积,如下图所示。 

    标准正态分布表

    用查表代替计算必须注意:

    • 表中曲线下面积为-\inftyZ的面积。
    • \mu,\sigmaX已知时,先求出Z值, Z=\frac{X-\mu }{\sigma },再用Z值查表,得所求区间占总面积的比例。
    • \mu\sigma未知时,要用样本均数\overline{X}和样本标准差S来估计Z值,Z=\frac{X-\overline{X} }{S}
    • 曲线下对称于0的区间,面积相等。 
    • 曲线下横轴上的面积为1 (即100% )。

    正态分布是一种对称分布,其对称轴为直线X=\mu,即均数位置。

    理论上:

    • \mu \pm 1\sigma范围内曲线下的面积占总面积的68.27%
    • \mu \pm 1.96\sigma范围内曲线下的面积占总面积的95%
    • \mu \pm 2.58\sigma范围内曲线下的面积占总面积的99% 

    实际上:

    • \overline{X} \pm 1S范围内曲线下的面积占总面积的68.27%
    • \overline{X} \pm 1.96S范围内曲线下的面积占总面积的95%
    • \overline{X} \pm 2.58 S范围内曲线下的面积占总面积的99% 

    实际应用中,我们一般将1.96看似成2,2.58看似成3。

    标准正态分布的\mu=0,\sigma=1,则 

    • \mu \pm 1\sigma相当于区间(­1,1)
    • \mu \pm 1.96\sigma相当于区间(­1.96,1.96)
    • \mu \pm 2.58\sigma相当于区间(­2.58,2.58)
    • 区间(­1,1)的面积:1-2\Phi (-1)=1­-2×0.1587=0.6826=68.26% 
    • 区间(­1.96,1.96)的面积:1-2\Phi (-1.96 )=1­-2×0.0250=0.9500=95.00%
    • 区间(­2.58,2.58)的面积:1-2\Phi (-2.58)=1­-2×0.0049=0.9902=99.02% 

    例: 已知某地1986年120名8岁男童身高均数 \overline{X}=123.02cmS=4.79cm,估计(1)该地8岁男孩身高在130cm以上者占该地8岁男孩总数的百分比;(2)身高界于120cm~128cm者占该地8岁男孩总数的比例;(3)该地80%男孩身高集中在哪个范围?

    (1)先做标准化转换:

    Z=\frac{X-\overline{X} }{S}=\frac{130-123.02}{4.79}=1.46

    \Phi (-Z)=\Phi (-1.46)=0.0721         根据标准正态分布的对称性

    理论上该地8岁男孩身高在130 cm以上者占该地8岁男孩总数的7.21%。

    (2)

    Z_{1}=\frac{X_{1}-\overline{X} }{S}=\frac{120-123.02}{4.79}=-0.63      \Phi (Z_{1})=\Phi (-0.63)=0.2643

    Z_{2}=\frac{X_{2}-\overline{X} }{S}=\frac{128-123.02}{4.79}=1.04         \Phi (Z_{2})=1-\Phi (-1.04)=0.8508

    \Phi (Z_{2})-\Phi (Z_{1})=0.8508-0.2643=0.5865

    (3)

    查标准正态分布界值表,标准正态分布曲线下左侧面积为0.10所对应的Z值为­1.28,所以80%的8岁男孩身高值集中在\overline{X} \pm 1.28S区间内,即116.9cm~129.2cm

    正态分布的应用

    制定参考值范围的步骤:

    • 选择足够数量的正常人作为调查对象。
    • 样本含量足够大。
    • 确定取单侧还是取双侧正常值范围。

    有些指标过高过低都是异常的,我们需要制定双侧的正常值范围

    有些指标过低才是异常的,比如肺活量,我们只要制定单侧的正常值范围

    • 选择适当的百分界限。

    在实际操作当中,我们一般将正常人中的5%排除在外,计算95%参考值范围。

    • 选择适当的计算方法。

    正态近似法:适用于正态分布或近似正态分布的资料。

    例1  某地调查120名健康女性血红蛋白,直方图显示,其分布近似于正态分布,得均数为117.4g/L,标准差为10.2g/L  ,试估计该地正常女性血红蛋白的95%医学参考值范围。

    分析:正常人的血红蛋白过高过低均为异常,要制定双侧正常值范围。

     \overline{X} \pm 1.96S=117.4\pm 1.96\times 10.2 = 97.41\sim 137.39

    该指标的95%医学参考值范围为97.41~137.39(g/L) 

    百分位数法:适用于偏态分布资料。 

    例2 某年某市调查了200例正常成人血铅含量(μg/100g)  如下,试估计该市成人血铅含量的95%医学参考值范围。

    分析:血铅的分布为偏峰分布,且血铅含量只以过高为异常,要用百分位数法制定单侧上限。

    P_{95}=L+\frac{i}{f_{x}}(n\cdot x \%-\sum f_{L})=38+\frac{5}{7}(200\times 95\%-189)=38.7\mu g /100g

     

     

     

    展开全文
  • https://blog.csdn.net/michael_r_chang/article/details/39188321https://www.cnblogs.com/wybang/p/3206719.htmlhttps://blog.csdn.net/jteng/article/details/603346281. 伯努利分布伯努利分布(Bernoulli ...
  • 二项分布和泊松概率分布2018-04-17

    千次阅读 2021-04-24 23:58:32
    说起二项分布(binomial distribution),不得不提的前提是伯努利试验(Bernoulli experiment),也即n次独立重复试验。伯努利试验是在同样的条件下重复、相互独立进行的一种随机试验。伯努利试验的特点是:(1)每次试验...
  • n次独立重复试验与二项分布定义.pdf
  • 此 m 文件返回参数为 R 和 P 的负二项分布的偏度、峰态和峰态超量。S、K 和 E 是输入参数的大小。 语法:function [s,k,e] = nbinskekur(r,p) 输入: r - 预定义的失败次数p - 概率参数(成功的概率) 输出: s - ...
  • 在我们生活中,抛出硬币无非是落下是...1、二项分布什么二项分布(Binomial Distribution)是概率统计中非常基础、非常实用的一种分布二项分布就是只有两个可能结果的分布,比如成功或失败。说明现象:在给...
  • 二项分布定义以及二项分布检验的理论与方法
  • 二项分布

    万次阅读 2020-03-30 19:45:34
    本文链接:个人站 | 简书 | CSDN 版权声明:除特别声明外,本博客文章均采用 BY-NC-SA 许可协议。...泊松分布二项分布、以及负二项分布都可以用来刻画计数类数据。其中,泊松分布的 μ=σ2\...
  • 二项分布的基本概念

    万次阅读 2016-11-14 10:48:31
    说起二项分布(binomial distribution),不得不提的前提是伯努利试验(Bernoulli experiment),也即n次独立重复试验。伯努利试验是在同样的条件下重复、相互独立进行的一种随机试验。  伯努利试验的特点是: (1)...
  • 、主要结果 步骤 1:确定您的过程是否稳定 步骤 2:确定数据是否服从二项分布 步骤 3:评估缺陷单元的百分比 步骤一: 在评估过程的能力之前,确定过程是否稳定。如果过程不稳定,则估计的过程能力可能不可靠。 ...
  • python 二项分布

    千次阅读 2022-04-24 13:50:57
    一、定义 1.1 0-1分布 也称伯努力分布 若随机变量X只有两个可能的取值0和1,其概率分布...二项分布是指在只有两个结果的n次独立的伯努利试验中,所期望的结果出现次数的概率,记 B(n,k,p)=Cnkpk(1−p)n−k B (n,k,p)=
  • 二项分布最大值,泊松分布的推导,几何分布的推导 (概统2.应用) 1.二项分布 二项分布就是独立事件n重伯努利试验,每次试验只有A发生与不发生两种结果,求n次试验中恰好发生k次的概率。 P{X=k} = $C_{n}^{k}p^{k}q...
  • n次独立重复试验与二项分布教学设计定义.pdf
  • 二项分布是随机独立事件的可能结果是2个,对于这2个结果的概率分布;因此,多项式分布是随机独立事件的可能结果是多个(大于2个),对于多个可能结果的概率分布;伯努利分布是随机独立事件的结果为0和1两种情况的...
  • 瑞士数学家雅克·伯努利(Jacques Bernoulli,1654~1705)首次研究独立重复试验(每次成功率为p)。在他去世后的第8年(1713年),他侄子尼克拉斯出版了伯努利的著作...伯努利分布(Bernoulli distribution)又名两点分布或0
  • 伯努利分布二项分布和多项分布

    千次阅读 2020-09-28 09:48:15
    伯努利分布(Bernoulli distribution)又名 两点分布 或 0-1分布,在讲伯努利分布前首先需要介绍伯努利试验(Bernoulli Trial)。 1.1 伯努利试验 伯努利试验是只有两种可能结果的单词随机试验,即对于一个随机变量 ...
  • 原标题:最大似然法估计二项分布参数前面我们学习了解了最大似然法求解正态分布参数,求解指数分布参数。今天我们再来看看最大似然法如何求解二项分布参数。1.二项分布与似然值估计公式二项分布基本公式求发生...
  • 浅谈两点分布二项分布,伽马分布,指数分布,泊松分布,卡方分布,t分布,F分布,均匀分布,正态分布,β分布,狄利克雷分布。(红丸子,白丸子,四喜丸子。。。) 我们知道,在数理统计中,经常是和各种分布打...
  • 伯努利分布(Bernoulli Distribution) 又名两点分布或者0-1分布,是一个离散型概率分布,为纪念瑞士科学家雅各布·伯努利而命名。若伯努利试验成功,则伯努利随机变量取值为1。若伯努利试验失败,则伯努利随机变量...
  • 基础知识 二项分布有两个参数,一个 n 表示试验次数,一个 p 表示一次试验成功概率。...2.实际运用中当 n 很大时一般都用正态分布来近似计算二项分布,但是如果同时 np 又比较小(比起 n来说很小)
  •  伯努利分布就是我们常见的0-1分布,即它的随机变量只取0或者1,各自的频率分别取1−p1−p和pp,当x=0x=0或者x=1x=1时,我们数学定义为:  p(x)=px∗(1−p)1−x p(x)=px∗(1−p)1−x  其它情况下p(x...
  • (好久没写知乎文章了,又不知道该写什么,就随便水一水吧)二项分布: 次试验,每次试验有 的概率出现目标事件,记 为 次试验后出现目标事件的次数;负二项分布:若干次试验,每次试验有 的概率出现目标事件,记 为...
  • 统计学:基本知识及随机变量分布规律 1、统计学基本知识:均值、方差、标准差 - 总体(Population) 抽样(Sample) 均值(mean) μ=∑i=1NxiN\mu = \frac{\sum_{i=1}^{N}{x_i}}{N}μ=N∑i=1N​xi...
  • 二项分布和多项分布

    千次阅读 2019-10-12 10:38:34
    二项分布和多项分布 二项分布(binomial distribution):nnn重伯努利随机实验,假设X∈{0,1,⋯ ,n}X \in \{ 0, 1, \cdots, n \}X∈{0,1,⋯,n}表示事件111发生的次数。若事件111的发生的概率为θ\thetaθ,则XXX...
  • 帕斯卡分布/负二项分布

    千次阅读 2021-03-29 19:49:41
    二项分布的正整数形式,描述第n次成功发生在第x次的概率 定义 在重复、独立的伯努利试验,设每次试验成功的概率为ppp,失败的概率为q=1−pq= 1- pq=1−p,若将试验进行到出现 rrr ( rrr 为常数 ) 次成功为止,以...
  • 当然,我们都学过概率论,所以我们也知道,这其实就是中心极限定理——特别的,这里是二项分布逼近正态分布的情况,然后我们对它采取标准化操作,变为标准正态分布。以下我们还是从直观的、统计的角度来看待、感受...
  • 定义上可以看成是几何分布的推广,从推导形式上也可以看成二项分布的推广。由于负二项分布的展开式不如二项分布那么常用,故在推导其期望方差等数字特征时,会碰到一些问题,本文展示了二项分布和其他分布的关系,...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 496,728
精华内容 198,691
热门标签
关键字:

二项分布的定义是什么