精华内容
下载资源
问答
  • 由于负二项分布的展开式不如二项分布那么常用,故在推导其期望方差等数字特征时,会碰到一些问题,本文展示了二项分布和其他分布的关系,并且给出了负二项分布的数字特征的推导过程,方便小伙伴理解,以减少想入门...

    一、引言

    负二项分布(又名帕斯卡分布)和两点分布、二项分布、几何分布、超几何分布和泊松分布一样是常见的离散型分布。从定义上可以看成是几何分布的推广,从推导形式上也可以看成二项分布的推广。由于负二项分布的展开式不如二项分布那么常用,故在推导其期望方差等数字特征时,会碰到一些问题,本文展示了二项分布和其他分布的关系,并且给出了负二项分布的数字特征的推导过程,方便小伙伴理解,以减少想入门统计学的伙伴记忆负担。乔舰,范淑芬在文献[1]中具体列出了负二项分布的五种定义形式,以及多种求期望方差的方法。

    黎明的清新在她的博客常见分布的数学期望、方差与特征函数推导(一)离散型分布一文中推导了常见的离散分布的数字特征。

    二、负二项分布定义的引出与理解

    2.1 实际意义

    在实际的生活中,负二项分布可以应用到很多场景。一个人在获得r次满分前,没有获得满分的次数。一台机器在坏掉之前,可以使用的天数。可以看出负二项分布有总的次数失败两种定义方式。事实上,这两种定义方式本质等价,本文使用总的次数来定义负二项分布。

    2.2 初始定义

    这下面我们直接给出负二项分布的定义并解释的含义。
    定义一 XX是服从负二项分布的随机变量,在一系列的独立的伯努利实验中,每次实验成功的概率是p,r是提前设定的成功实验次数。则XX的概率密度函数是:
    P(x=k)=(k1r1)pr(1p)kr.(1)P(x=k)=\binom{k-1}{r-1}p^{r}(1-p)^{k-r}. \tag{1} 其中kk从r取到无穷。此时XX~NB(r,p).NB(r,p).
    为了读者方便对比给出
    定义二 YY是服从二项分布的随机变量,在一系列的独立的伯努利实验中,每次实验成功的概率是p,n是总的实验次数。则YY的概率密度函数是:
    P(y=k)=(nk)pk(1p)nk.P(y=k)=\binom{n}{k}p^{k}(1-p)^{n-k}. 其中kk从0取到n。此时YY~B(n,p).B(n,p).

    2.3 重新定义“负”二项分布

    面对负二项分布的定义直观含义很好理解,但是对于为啥是负,很多初学的小伙伴显然很迷无从理解,下面我们对原始定义重新整理定义。

    下面的公式推导来源于维基百科负二项分布词条,由于最近进不去那个网页,这里手动引用说明一下,不再注明链接。下面公式只能凭借印象自推,如有错误私信指正,不胜感激。

    P(x=k)=(k1r1)pr(1p)kr=(k1)!(r1)!(kr)!pr(1p)kr=(k1)(k2)(k1(k1r))(kr)!pr(1p)kr=(1)kr(r)(r+1)(k+1)(kr)!pr(1p)kr=(1)kr(rkr)pr(1p)kr=(rkr)pr(1+p)kr\begin{aligned} P(x=k) &\left.=\binom{k-1}{r-1}p^{r}(1-p)^{k-r} \right. \\ &\left. = \frac{(k-1)!}{(r-1)!(k-r)!}p^{r}(1-p)^{k-r} \right. \\ &\left.=\frac{(k-1)(k-2)\cdots(k-1-(k-1-r))}{(k-r)!}p^{r}(1-p)^{k-r} \right.\\ &\left.=(-1)^{k-r}\frac{(-r)(-r+1)\cdots(-k+1)}{(k-r)!}p^{r}(1-p)^{k-r} \right.\\ &\left.=(-1)^{k-r}\binom{-r}{k-r}p^{r}(1-p)^{k-r} \right. \\ &\left.=\binom{-r}{k-r}p^{r}(-1+p)^{k-r} \right. \\ \end{aligned}
    定义三 ZZ是服从负二项分布的随机变量,在一系列的独立的伯努利实验中,每次实验成功的概率是p,r是提前设定的成功实验次数。则XX的概率密度函数是:
    P(z=k)=(rkr)pr(1+p)kr P(z=k)=\binom{-r}{k-r}p^{r}(-1+p)^{k-r}
    其中kk从r取到无穷。此时ZZ~NB(r,p).NB(r,p).
    推导出上述公式显然和二项分布定义比较相似。我们知道二项分布来源于二项展开式,那么我们可以把二项展开式推广到负整指数上么?想来是可以的。我们继续从二项展开式出发进行推导。

    2.3 推导前的知识准备

    定义三知识帮助大家了解负二项分布“”的来源,我们接下来的推导使用定义一中的公式。我们知道公式(1)作为概率密度函数,满足:
    k=r+ P(X=k)=1(2) \sum_{k=r}^{+\infty~} P(X=k)=1 \tag{2}
    将公式(1)带代入公式(2)变形的得到下面公式。
    pr=k=r+ (k1r1)(1p)kr(3) p^{-r}=\sum_{k=r}^{+\infty~}\binom{k-1}{r-1}(1-p)^{k-r} \tag{3}
    q=1pq=1-p,则:
    1qr=k=r+ (k1r1)qkr (1-q)^{-r}=\sum_{k=r}^{+\infty~}\binom{k-1}{r-1}q^{k-r}
    有了上述推导,我们给出广义的二项展开式的定义。
    定理一 1<x<1-1<x<1,n是正整数,有如下形式:
    (1x)n=k=0+ (nk)xk (1-x)^{-n}=\sum_{k=0}^{+\infty~}\binom{n}{k}x^{k}
    定理一的证明可以用数学归纳法比较简单,为节省篇幅读者自证。

    三、数字特征推导

    负二项分布的数字特征的求法主要分为两种:
    1、拆分为几何分布。
    2、定义直接求。
    拆分法比较显然,这里不再赘述。下面用定义法去推导。
    为了阅读方便这里把定义一随机变量XX的概率密度函数拿过来。
    P(X=k)=(k1r1)pr(1p)kr.P(X=k)=\binom{k-1}{r-1}p^{r}(1-p)^{k-r}.

    3.1 期望

    E(X)=prk=r+ k(k1r1)(1p)kr=prk=r+ (kr)(k1kr)(1p)kr+rk=r+ P(X=k)=prt=0+ t(t+r1t)(1p)t+r,(t=k-r)=prt=0+ t(t+r1r1)(1p)t+r,上一行的等价变形=prt=1+ t(t+r1)!(r1)!t!(1p)t+r=rprt=1+ (t+r1)!r!(t1)!(1p)t+r=rprk=0+ (k+r)!r!k!(1p)k+1+r,(k=t-1), 嘿嘿,字母不多来回用了=r(1p)prpr1+r,自行查看公式(3)=rp\begin{aligned} E(X) &\left.=p^{r}\sum_{k=r}^{+\infty~}k\binom{k-1}{r-1}(1-p)^{k-r} \right. \\ &\left.=p^{r}\sum_{k=r}^{+\infty~}(k-r)\binom{k-1}{k-r}(1-p)^{k-r}+r\sum_{k=r}^{+\infty~}P(X=k) \right. \\ &\left.=p^{r}\sum_{t=0}^{+\infty~}t\binom{t+r-1}{t}(1-p)^{t}+r \right.\text {,(t=k-r)} \\ &\left.=p^{r}\sum_{t=0}^{+\infty~}t\binom{t+r-1}{r-1}(1-p)^{t}+r \right.\text {,上一行的等价变形} \\ &\left.=p^{r}\sum_{t=1}^{+\infty~}t\frac{(t+r-1)!}{(r-1)!t!}(1-p)^{t}+r \right. \\ &\left.=rp^{r}\sum_{t=1}^{+\infty~}\frac{(t+r-1)!}{r!(t-1)!}(1-p)^{t}+r \right. \\ &\left.=rp^{r}\sum_{k=0}^{+\infty~}\frac{(k+r)!}{r!k!}(1-p)^{k+1}+r \right. \text {,(k=t-1), 嘿嘿,字母不多来回用了}\\ &\left.=r(1-p)p^{r}p^{-r-1}+r \right. \text {,自行查看公式(3)}\\ &\left.=\frac{r}{p} \right. \end{aligned}

    3.2 方差

    为了求得方差先求二阶原点距。
    E(X2)=prk=r+ k2(k1r1)(1p)kr=r(r+1)(1p)2+2pr2+rp(1p)r2p2p2,方法和上述期望的求法一致(配方)=r(1p)+r2p2\begin{aligned} E(X^{2}) &\left.=p^{r}\sum_{k=r}^{+\infty~}k^{2}\binom{k-1}{r-1}(1-p)^{k-r} \right. \\ &\left.= \frac{r(r+1)(1-p)^{2}+2pr^{2}+rp(1-p)-r^{2}p^{2}}{p^{2}} \right.\text {,方法和上述期望的求法一致(配方)} \\ &\left.= \frac{r(1-p)+r^2}{p^2} \right. \\ \end{aligned}
    D(X)=E(X2)(E(X))2=r(1p)p2\begin{aligned} D(X) &\left.=E(X^2)-(E(X))^2 \right. \\ &\left.= \frac{r(1-p)}{p^2} \right. \\ \end{aligned}

    四、R语言中的负二项分布

    在R语言中也有相应函数可用于负二项分布,本文介绍四个分别是:

    4.1函数表格

    函数 含义
    dnbinom 输入次数、规模、概率 返回发生x次失败事件的概率
    pnbinom 返回输入参数的累积概率
    qnbinom 返回对应的分位点
    rnbinom 返回每组发生失败事件的次数

    下面贴出函数的具体入口参数。详细例子请参照函数例子。

    ?dnbinom
    

    4.2 函数参数展示

    dnbinom

    function (x, size, prob, mu, log = FALSE) 
    {
        if (!missing(mu)) {
            if (!missing(prob)) 
                stop("'prob' and 'mu' both specified")
            .Call(C_dnbinom_mu, x, size, mu, log)
        }
        else .Call(C_dnbinom, x, size, prob, log)
    }
    

    pnbinom

    function (q, size, prob, mu, lower.tail = TRUE, log.p = FALSE) 
    {
        if (!missing(mu)) {
            if (!missing(prob)) 
                stop("'prob' and 'mu' both specified")
            .Call(C_pnbinom_mu, q, size, mu, lower.tail, log.p)
        }
        else .Call(C_pnbinom, q, size, prob, lower.tail, log.p)
    }
    

    qnbinom

    function (p, size, prob, mu, lower.tail = TRUE, log.p = FALSE) 
    {
        if (!missing(mu)) {
            if (!missing(prob)) 
                stop("'prob' and 'mu' both specified")
            .Call(C_qnbinom_mu, p, size, mu, lower.tail, log.p)
        }
        else .Call(C_qnbinom, p, size, prob, lower.tail, log.p)
    }
    

    rnbinom

    function (n, size, prob, mu) 
    {
        if (!missing(mu)) {
            if (!missing(prob)) 
                stop("'prob' and 'mu' both specified")
            .Call(C_rnbinom_mu, n, size, mu)
        }
        else .Call(C_rnbinom, n, size, prob)
    }
    

    参考文献

    [1]乔舰,范淑芬.负二项分布随机变量数字特征的求解[J].高等数学研究,2017,20(02):32-34.

    展开全文
  • 二项分布和多项分布

    2018-07-19 13:24:00
    首先二项分布和多项分布都是离散型分布 一 、项式分布 (一)二项分布的基本概念 首先说一下伯努利试验,即n次独立重复试验,是在同样的条件下重复、相互独立进行的一种随机试验。 伯努利试验的特点是: ...

        首先二项分布和多项分布都是离散型分布

    一 、二项式分布

    (一)二项分布的基本概念

        首先说一下伯努利试验,即n次独立重复试验,是在同样的条件下重复、相互独立进行的一种随机试验。

        伯努利试验的特点是:

            (1)每次试验中事件只有两种结果:事件发生或者不发生,如硬币正面或反面,患病或没患病;

            (2)每次试验中事件发生的概率是相同的,注意不一定是0.5;

            (3)n次试验的事件相互之间独立。

        举个实例,最简单的抛硬币试验就是伯努利试验,在一次试验中硬币要么正面朝上,要么反面朝上,每次正面朝上的概率都一样p=0.5,且每次抛硬币的事件相互独立,即每次正面朝上的概率不受其他试验的影响。如果独立重复抛n=10次硬币,正面朝上的次数k可能为0,1,2,3,4,5,6,7,8,9,10中的任何一个,那么k显然是一个随机变量,这里就称随机变量k服从二项分布。

        我们推导下随机变量X=k的分布律。显然0<=k<=n,n次抛硬币中获得k次正面,第1次正面在n次抛硬币中出现有n种方式,则第2次正面在n次抛硬币中出现有n-1种方式,以此类推,则出现的总可能方式是:n(n-1)...(n-k+1)种,如果我们并不考虑这k次正面出现的排列顺序,因此恰好出现k次的总可能性是n(n-1)...(n-k+1)/k!种,分子和分母同时乘以(n-k)!,则该式等于n!/(k!*(n-k)!),也就是通常的组合公式C(n,k)=n!/(k!*(n-k)!)。

        那么对于抛n次硬币,其中正面出现的次数是k,反面出现的次数必然为n-k次,不考虑顺序的情况下,则每一次恰好获得k次正面的概率是pk*(1-p)n-k,而n次试验中恰好出现k次正面的可能性是C(n,k)=n!/(k!*(n-k)!)种,因此,n次抛硬币中恰好出现k次的概率为:

                                                                                                            P(X=k) = C(n,k) * pk*(1-p)n-k

        这就是二项分布的分布律,即二项分布的的概率质量函数,记作X~B(n,p),其中C(n,k)是组合数,在数学中也叫二项式系数,这就是二项分布名称的来历。

        二项分布的均值:E(x)=np

        二项分布的方差:Var(x)=np(1-p)

    (二)二项分布的实现(python)

        numpy给出的api是:

    numpy.random.RandomState.binomial(n, p, size=None)
    

        表示对一个二项分布进行采样(size表示采样的次数),参数中的n,p分别对应于公式中的n,p,函数的返回值表示n中成功(success)的次数(也即k)。我们以一个具体的实例进行阐释:

    说野外正在进行9(n=9)口石油勘探井的发掘工作,每一口井能够开发出油的概率是0.1(p=0.1)。请问,最终所有的勘探井都勘探失败的概率?

         我们手动用公式计算得:

                                                                 

        python实现如下:

    import numpy as np
    n, p = 9, .1
    a=sum((np.random.binomial(n, p, size=30000)==0))/30000.
    print a
    

     运行结果为:0.387333333333

    二、多项式分布

    (一)基本概念

        多项式分布是指单次试验中随机变量的取值不在是0-1,而是有多种离散值可能(1,2,3,4.....k)。比如投6个面的骰子试验,N次试验结果服从K=6的多项分布。其中:

                                                                                                             

        多项分布的概率密度函数为:

                                             

        其中:       

                    

     

                       

     (二)例子

        假设萤火虫对食物的喜欢程序,我们给三种选择:花粉,蚜虫,面团。假设20%的萤火虫喜欢花粉,35%的萤火虫喜欢蚜虫,45%的萤火虫喜欢面团。我们对30只萤火虫做实验,发现8只喜欢花粉,10只喜欢蚜虫,12只喜欢面团,这件事的概率为:

                                                                               

     

     

    参考来源:

    https://blog.csdn.net/qq280929090/article/details/53156655

    https://blog.csdn.net/lanchunhui/article/details/50172659

     

    转载于:https://www.cnblogs.com/171207xiaohutu/p/9335258.html

    展开全文
  • 二项分布的条件: 1) 每次实验结果 , 只能是两个互斥的...2. 二项分布的分布特征 : 1) 二项分布的形状取决于n ,π 。 2) 当π=0.5 时分布对称 , 近似对称分布 。 3) 当π≠0.5 时 , 分布呈偏态 , 特别是 n ...

    二项分布的条件:

    1)  每次实验结果 , 只能是两个互斥的结果之一 。
    2)  相同的实验条件下 , 每次实验中事件A 的发生具有相同的概率 π 。
    3)  各次实验独立 , 各次的实验结果互不影响 。

    2.  二项分布的分布特征 :

    1)  二项分布的形状取决于n ,π 。
    2)  当π=0.5 时分布对称 , 近似对称分布 。
    3)  当π≠0.5 时 , 分布呈偏态 , 特别是 n  较小时 ,π 偏离0.5 越远 , 分布的
    对称性越差 , 但只要不接近1 和0 时 , 随着 n  的增大 , 分布逐渐逼近正态 。

    R 函数: dbinom(x, size, prob, log = FALSE) x,预测x个数的阳性概率,size 总的实验次数, prob 每次的阳性概率

    R 函数:pbinom()函数 该函数给出事件的累积概率

    实例:

    如果某地钩虫感染率为13%,随机观察当地150人,10人感染钩虫的概率有多大?至少有20人感染钩虫的概率有多大?

    > dbinom(10,150,0.13)

    > pbinom(19, 150, 0.13) -1

     

    标准正态分布的µ=0 ,σ=1 , 则
    µ ±σ 相当于区间(­1 ,1) ,
    µ ±1.96σ 相当于区间(­1.96 ,1.96),
    µ ±2.58σ 的区间相当于区间(­2.58 ,2.58) 。
    区间(­1,1) 的面积:1­2Φ(­1)=1­2 ×0.1587=0.6826=68.26%
    区间(­1.96,1.96) 的 面积:1­2Φ(­1.96)=1­2 ×0.0250=0.9500=95.00%
    区间(­2.58,2.58) 的面积:1­2Φ(­2.58)=1­2 ×0.0049=0.9902=99.02%

    R函数:

    dnorm()函数

    dnorm函数给出给定平均值和标准偏差在每个点的概率分布的高度。

    dnorm(x, mean = 0, sd = 1)

    .pnorm()函数

    该函数给出正态分布随机数小于给定数值的概率。它也被称为“累积分布函数”。

    pnorm(x, mean = 0, sd = 1)

     

     

    参考:mooc 医学统计学

     

    展开全文
  • 二项分布

    千次阅读 2013-12-11 09:58:48
    二项分布[编辑] 维基百科,自由的百科全书 二项分布 机率 质量 函数 累积分布函数 参数  试验次数 (整数)  成功概率 (实数) 值域 概率密度函数 ...

    二项分布[编辑]

    维基百科,自由的百科全书
    二项分布
    机率 质量 函数
    累积分布函数
    参数 n \geq 0 试验次数 (整数)
    0\leq p \leq 1 成功概率 (实数)
    值域 k \in \{0,\dots,n\}\!
    概率密度函数 {n\choose k} p^k (1-p)^{n-k} \!
    累积分布函数 I_{1-p}(n-\lfloor k\rfloor, 1+\lfloor k\rfloor) \!
    标记 {{{notation}}}
    期望值 n\,p\!
    中位数 \{\lfloor np\rfloor, \lceil np \rceil\}之一
    众数 \lfloor (n+1)\,p\rfloor\!\lfloor (n+1)\,p\rfloor\!-1
    方差 n\,p\,(1-p)\!
    偏态 \frac{1-2\,p}{\sqrt{n\,p\,(1-p)}}\!
    峰态 \frac{1-6\,p\,(1-p)}{n\,p\,(1-p)}\!
    熵值 \frac{1}{2} \ln \left( 2 \pi n e p (1-p) \right) + O \left( \frac{1}{n} \right)\!
    动差生成函数 (1-p + p\,e^t)^n \!
    特征函数 (1-p + p\,e^{i\,t})^n \!

    概率论统计学中,二项分布n独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率p。这样的单次成功/失败试验又称为伯努利试验。实际上,当n = 1时,二项分布就是伯努利分布。二项分布是显著性差异二项试验的基础。

    详述[编辑]

    概率质量函数[编辑]

    一般地,如果随机变量\mathit{X}服从参数为\mathit{n}\mathit{p}的二项分布,我们记X \sim b(n,p)X \sim B(n,p).n次试验中正好得到k次成功的概率由概率质量函数给出:

    f(k;n,p) = \Pr(K = k) = {n\choose k}p^k(1-p)^{n-k}

    对于k = 0, 1, 2, ..., n,其中{n\choose k}=\frac{n!}{k!(n-k)!}

    二项式系数(这就是二项分布的名称的由来),又记为C(nk),  nCk,或nCk。该公式可以用以下方法理解:我们希望有k次成功(pk)和n − k次失败(1 − p)n − k。然而,k次成功可以在n次试验的任何地方出现,而把k次成功分布在n次试验中共有C(nk)个不同的方法。

    在制造二项分布概率的参考表格时,通常表格中只填上n/2个值。这是因为k > n/2时的概率可以从它的补集计算出:

    f(k;n,p)=f(n-k;n,1-p). \,

    因此,我们要看另外一个k和另外一个p(二项分布一般不是对称的)。然而,它的表现不是任意的。总存在一个整数M,满足

    (n+1)p-1 < M \leq (n+1)p. \,

    作为k的函数,表达式ƒ(knp)当k < M时单调递增,k > M时单调递减,只有当(n + 1)p是整数时例外。在这时,有两个值使ƒ达到最大:(n + 1)p和(n + 1)p − 1。M是伯努利试验的最可能的结果,称为众数。注意它发生的概率可以很小。

    累积分布函数[编辑]

    累积分布函数可以表示为:

    F(x;n,p) = \Pr(X \le x) = \sum_{i=0}^{\lfloor x \rfloor} {n\choose i}p^i(1-p)^{n-i}.

    其中\scriptstyle \lfloor x\rfloor\,是小于或等于x最大整数

    它也可以用正则化不完全贝塔函数来表示:

    \begin{align}F(k;n,p) & = \Pr(X \le k) = I_{1-p}(n-k, k+1) \\& = (n-k) {n \choose k} \int_0^{1-p} t^{n-k-1} (1-t)^k \, dt.\end{align}

    期望和方差[编辑]

    如果X ~ B(np)(也就是说,X是服从二项分布的随机变量),那么X期望值

    \operatorname{E}[X] = np

    方差

    \operatorname{Var}[X] = np(1 - p).

    这个事实很容易证明。首先假设有一个伯努利试验。试验有两个可能的结果:1和0,前者发生的概率为p,后者的概率为1 − p。该试验的期望值等于μ = 1 · p + 0 · (1−p) = p。该试验的方差也可以类似地计算:σ2 = (1−p)2·p + (0−p)2·(1−p) = p(1 − p).

    一般的二项分布是n次独立的伯努利试验的和。它的期望值和方差分别等于每次单独试验的期望值和方差的和:

    \mu_n = \sum_{k=1}^n \mu = np, \qquad    \sigma^2_n = \sum_{k=1}^n \sigma^2 = np(1 - p).

    众数和中位数[编辑]

    通常二项分布B(n, p)的众数等于⌊(n + 1)p⌋,其中e ⌊ ⌋ 是取整函数。然而,当(n + 1)p是整数且p不等于0或1时,分布有两个众数:(n + 1)p和(n + 1)p − 1。当p等于0或1时,众数相应地等于0或 n。这些情况可以综述如下:

    \text{mode} =       \begin{cases}        \lfloor (n+1)\,p\rfloor & \text{if }(n+1)p\text{ is 0 or a noninteger}, \\        (n+1)\,p\ \text{ and }\ (n+1)\,p - 1 &\text{if }(n+1)p\in\{1,\dots,n\}, \\        n & \text{if }(n+1)p = n + 1.      \end{cases}

    一般地,没有一个单一的公式可以求出二项分布的中位数,甚至中位数可能是不唯一的。然而有几个特殊的结果:

    • 如果np是整数,那么平均数、中位数和众数相等,都等于np[1][2]
    • 任何中位数m都位于区间⌊np⌋ ≤ m ≤ ⌈np⌉内。[3]
    • 中位数m不能离平均数太远:|m − np| ≤ min{ ln 2, max{p, 1 − p} }。[4]
    • 如果p ≤ 1 − ln 2,或p ≥ ln 2,或|m − np| ≤ min{p, 1 − p}(除了p = ½、n是奇数的情况以外),那么中位数是唯一的,且等于m = round(np)。[3][4]
    • 如果p = 1/2,且n是奇数,那么区间½(n − 1) ≤ m ≤ ½(n + 1)中的任何数m都是二项分布的中位数。如果p = 1/2且n是偶数,那么m = n/2是唯一的中位数。

    两个二项分布的协方差[编辑]

    如果有两个服从二项分布的随机变量XY,我们可以求它们的协方差。利用协方差的定义,当n = 1时我们有

    \operatorname{Cov}(X, Y) = \operatorname{E}(XY) - \mu_X \mu_Y.

    第一项仅当XY都等于1时非零,而μXμY分别为X = 1和Y = 1的概率。定义pBXY都等于1的概率,便得到

    \operatorname{Cov}(X, Y) = p_B - p_X p_Y, \,

    对于n次独立的试验,我们便有

    \operatorname{Cov}(X, Y)_n = n ( p_B - p_X p_Y ). \,

    如果XY是相同的变量,便化为上面的方差公式。

    与其他分布的关系[编辑]

    二项分布的和[编辑]

    如果X ~ B(np)和Y ~ B(mp),且XY相互独立,那么X + Y也服从二项分布;它的分布为

    X+Y \sim B(n+m, p).\,

    伯努利分布[编辑]

    伯努利分布是二项分布在n = 1时的特殊情况。X ~ B(1, p)与X ~ Bern(p)的意思是相同的。相反,任何二项分布B(np)都是n次独立伯努利试验的和,每次试验成功的概率为p

    泊松二项分布[编辑]

    二项分布是泊松二项分布的一个特殊情况。泊松二项分布n次独立、不相同的伯努利试验(pi)的和。如果X服从泊松二项分布,且p1 = … = pn =p,那么X ~ B(np)。

    正态近似[编辑]

    n = 6、p = 0.5时的二项分布以及正态近似

    如果n足够大,那么分布的偏度就比较小。在这种情况下,如果使用适当的连续性校正,那么B(np)的一个很好的近似是正态分布

    \mathcal{N}(np,\, np(1-p)).

    n越大(至少20),近似越好,当p不接近0或1时更好。[5]不同的经验法则可以用来决定n是否足够大,以及p是否距离0或1足够远:

    • 一个规则是x=npn(1 − p)都必须大于 5。

    泊松近似[编辑]

    当试验的次数趋于无穷大,而乘积np固定时,二项分布收敛于泊松分布。因此参数为λ = np的泊松分布可以作为二项分布B(np)的近似,如果n足够大,而p足够小。[6]

    极限[编辑]

    • n趋于∞,p趋于0,而np固定于λ > 0,或至少np趋于λ > 0时,二项分布B(np)趋于期望值为λ的泊松分布
    • n趋于∞而p固定时,
    {X-np \over \sqrt{np(1-p)\ }}
    的分布趋于期望值为 0、方差为 1的正态分布。这个结果是中心极限定理的一个特殊情况。

    例子[编辑]

    一个简单的例子如下:掷一枚骰子十次,那么掷得4的次数就服从n = 10、p = 1/6的二项分布。

    参见[编辑]

    展开全文
  • 二项分布代码

    2013-12-29 23:01:58
    二项分布matlab代码 仅供参考 手动输入
  • 说起二项分布(binomial distribution),不得不提的前提是伯努利试验(Bernoulli experiment),也即n次独立重复试验。伯努利试验是在同样的条件下重复、相互独立进行的一种随机试验。伯努利试验的特点是:(1)每次试验...
  • 《数理统计》课本上对二项分布、泊松分布以及正态分布的特征函数的推导过程没有详细描述,我在利用现有公式对上述三种分布推导一遍,并对相关性质知识进行回顾,以此记录。 特征函数 特征函数是实变量的复值函数,...
  • 二项分布的定义、性质、分布图形特征、相互关系、与正态分布的关系
  • 离散型变量 如:二项分布、泊松分布 三者之间的关系 二项分布(Binomial distribution) 二项分布(Binomial distribution)是n重伯努利试验成功次数的离散概率分布,记作。伯努利试验是只有两种可能结果的单次随机...
  • 实验三、二项分布与泊松分布实验实验序号:3 日期:2013 年 4 月 3 日班级数学学院2011级 C班学号114080185姓名邓伍丹实验名称二项分布与泊松分布实验问题的背景和目的:随着计算机技术的迅速发展,很多科学试验的全...
  • 最近在撰写笔记 【Sklearn源码学习笔记】(含官网样例解读)无监督学习之高斯混合模型 的过程中,官方Sklearn源码中...本文分三个部分“【二项分布】”、“【多项分布】”、“【Beta分布】”、“【狄利克雷分布...
  • **2018博客之星评选,如果喜欢我的文章,请投我一票,编号:No.... 二项分布有两个参数,一个 n 表示试验次数,一个 p 表示一次试验成功概率。现在考虑一列二项分布,其中试验次数 n 无限增加,而 p 是 n 的函数。 ...
  • 分布与分布关系1、二项分布2、几何分布3、泊松分布4、二项分布转化泊松分布,泊松转化正态分布 1、二项分布   n次独立重复试验,每次事件出现的结果只有两个,出现同一结果的概率相同为p;   抛硬币,假设硬币不...
  • 二项分布

    千次阅读 2020-03-30 19:45:34
    本文链接:个人站 | 简书 | CSDN 版权声明:除特别声明外,本博客文章均采用 BY-NC-SA 许可协议。...泊松分布、二项分布、以及负二项分布都可以用来刻画计数类数据。其中,泊松分布的 μ=σ2\...
  • 离散型随机变量的概率分布:二项分布,柏松分布 连续性随机变量的概率分布:正态分布。 一,二项分布 满足条件: 1)每次试验中事件只有两种结果:事件发生或者不发生,如硬币正面或反面,患病或没患病; 2)...
  • 二项分布的概念与特征

    千次阅读 2011-03-25 14:17:00
     二项分布的概念与特征  一、二项分布的概念 在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,称为项分类变量(dichotomous variable),如对病人治疗结果的有效与无效,某种...
  • 概率分布之二项分布、泊松分布

    千次阅读 2019-08-03 22:41:13
    概率分布之二项分布、泊松分布、正态分布 ...2.离散型概率分布——二项分布 在现实生活中,许多事件或结果只有两个,或者结果只有一个是我们想要,其他不是我们想要的。例如,买了福利彩票,有中奖和不中奖两种结...
  • 从这里学习总结如下,以下内容均来源:...二项分布:离散概率分布 总共n次,事件发生概率p,其中发生x次概率的概率计算可得: 二项分布可用于采集在临床研究中死于心脏病的人数、
  • 分布 分布律或概率密度 期望 方差 特征函数 0-1分布 P(X=1)=p,P(X=0)=q,0<...1,p+q=1P(X=1)=p,P(X=0)=q,\\0<...二项分布 P(X=k)=Cnkpkqn−k0<p<1,p+q=1,k=0...nP(X=k) = C_n^kp^kq^{n-k} \\0<p<...
  • 离散型随机变量,二项分布,泊松分布,指数分布,几何分布(概统2.知识) 1.0-1分布 。例如抛硬币,正面朝上设为1,反面朝上设为0 分布律为 结果随机变量X 1 0 概率 P p 1-p ...
  • 基础知识 二项分布有两个参数,一个 n 表示试验次数,一个 p 表示一次试验成功概率。...2.实际运用中当 n 很大时一般都用正态分布来近似计算二项分布,但是如果同时 np 又比较小(比起 n来说很小)
  • 二项分布是多次伯努利,即扔多次硬币;(多次值实验) 泊松分布是 ppp 很小的项,即扔好多好多次硬币,且扔出正面概率极小; 正态分布是 nnn 很大的项,即扔好多好多次硬币,且硬币是完全相同的; 一、泊松...
  • 二项分布的基本概念

    万次阅读 2016-11-14 10:48:31
    说起二项分布(binomial distribution),不得不提的前提是伯努利试验(Bernoulli experiment),也即n次独立重复试验。伯努利试验是在同样的条件下重复、相互独立进行的一种随机试验。  伯努利试验的特点是: (1)...
  • 浅谈两点分布,二项分布,伽马分布,指数分布,泊松分布,卡方分布,t分布,F分布,均匀分布,正态分布,β分布,狄利克雷分布。(红丸子,白丸子,四喜丸子。。。) 我们知道,在数理统计中,经常是和各种分布打...
  • 二项分布、伯努利分布、泊松分布等

    万次阅读 多人点赞 2018-08-08 16:49:08
    这个知识点的整理起源于vivo图像...伯努利分布亦称“零一分布”、“两点分布”。 如果随机变量X只取0和1两个值,并且相应的概率为:   则称随机变量X服从参数为p的伯努利分布,若令q=1一p,则X的概率函数可写...
  • 概率分布:二项分布

    2021-07-12 08:50:34
    二项分布 二项分布(binomial distribution)就是在重复n次独立的伯努利试验(Bernoulli experiment)中,所期望结果出现次数的概率分布。 伯努利试验的特点: 每次试验中只有两种可能的结果,而且两种结果发生与否...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 132,015
精华内容 52,806
关键字:

二项分布特点