精华内容
下载资源
问答
  • 0-1分布: 在一次试验中,要么为0要么为1的分布,叫0-1分布二项分布: 做n次伯努利实验,每次实验为1的...有k次为1,n-k次为0的概率,就是二项分布B(n,p,k)。 二项分布计算: B(n,p,k) =  换一种表达...

    http://blog.csdn.net/shuimu12345678/article/details/30773929

    0-1分布:

    在一次试验中,要么为0要么为1的分布,叫0-1分布。

    二项分布:

    做n次伯努利实验,每次实验为1的概率为p,实验为0的概率为1-p;有k次为1,n-k次为0的概率,就是二项分布B(n,p,k)。

    二项分布计算:

    B(n,p,k) = 

    换一种表达方式,做n次伯努利实验,每次实验为1的概率是p1, 实验为0的概率是p2,有p1+p2=1;问x1次为实验为1,x2次实验为0,有x1+x2=n,该事件的概率B(x1,x2,p1,p2)是多少?

    B(x1,x2,p1,p2) =

    多项式分布:

    推广一下,考虑如果有三种可能,即伯努利抛硬币试验中,硬币比较厚,有可能立起来,即可能是正面,反面,立起来,其概率分别是p1,p2,p3,那么进行n次试验以后,正面出现x1次,反面x2次,立起来x3次的(保证x1+x2+x3=n)概率是多少?

    可以按照上面的规律,猜想式子为:

    式子是正确的,这就是多项式的分布的表达式,下面从意义上证明一下式子:

    全排列有n!种情况,那么对于每一个正、反、立的序列:

    正正反立正反立……立反

    都包含这x1!*x2!x3!种全排列的情况,因此可知其成立。

     

     

    伽马函数:

    伽马函数是阶乘的拓展,其表达式为

    据说利用分布积分可以得到(具体方法不知):

    那么很容易的到自然数域中的:

    Beta函数:

    学习伽马函数是为学习Beta函数准备的,Beta函数的表达式为

    Beta函数是为了Beta分布做准备,Beta分布的定义式为:

    展开全文
  • 圆电流磁感线的分布及磁感应强度的函数表达式.pdf
  • https://blog.csdn.net/michael_r_chang/article/details/39188321https://www.cnblogs.com/wybang/p/3206719.htmlhttps://blog.csdn.net/jteng/article/details/603346281. 伯努利分布伯努利分布(Bernoulli ...

    https://blog.csdn.net/michael_r_chang/article/details/39188321

    https://www.cnblogs.com/wybang/p/3206719.html

    https://blog.csdn.net/jteng/article/details/60334628

    1. 伯努利分布

    伯努利分布(Bernoulli distribution)又名两点分布0-1分布,介绍伯努利分布前首先需要引入伯努利试验(Bernoulli trial)

    • 伯努利试验是只有两种可能结果的单次随机试验,即对于一个随机变量X而言:

    伯努利试验都可以表达为“是或否”的问题。例如,抛一次硬币是正面向上吗?刚出生的小孩是个女孩吗?等等

    • 如果试验E是一个伯努利试验,将E独立重复地进行n次,则称这一串重复的独立试验为n重伯努利试验
    • 进行一次伯努利试验,成功(X=1)概率为p(0<=p<=1),失败(X=0)概率为1-p,则称随机变量X服从伯努利分布。伯努利分布是离散型概率分布,其概率质量函数为:

    2. 二项分布

    二项分布(Binomial distribution)是n重伯努利试验成功次数的离散概率分布。

    • 如果试验E是一个n重伯努利试验,每次伯努利试验的成功概率为p,X代表成功的次数,则X的概率分布是二项分布,记为X~B(n,p),其概率质量函数为

      显然,

    • 从定义可以看出,伯努利分布是二项分布在n=1时的特例
    • 二项分布名称的由来,是由于其概率质量函数中使用了二项系数,该系数是二项式定理中的系数,二项式定理由牛顿提出:

    • 二项分布的典型例子是扔硬币,硬币正面朝上概率为p, 重复扔n次硬币,k次为正面的概率即为一个二项分布概率。

    3. 多项分布

    多项式分布(Multinomial Distribution)是二项式分布的推广。二项式做n次伯努利实验,规定了每次试验的结果只有两个,如果现在还是做n次试验,只不过每次试验的结果可以有多m个,且m个结果发生的概率互斥且和为1,则发生其中一个结果X次的概率就是多项式分布。

    • 扔骰子是典型的多项式分布。扔骰子,不同于扔硬币,骰子有6个面对应6个不同的点数,这样单次每个点数朝上的概率都是1/6(对应p1~p6,它们的值不一定都是1/6,只要和为1且互斥即可,比如一个形状不规则的骰子),重复扔n次,如果问有k次都是点数6朝上的概率就是

    • 多项式分布一般的概率质量函数为:

    4. 贝塔分布

    在介绍贝塔分布(Beta distribution)之前,需要先明确一下先验概率、后验概率、似然函数以及共轭分布的概念。

    • 通俗的讲,先验概率就是事情尚未发生前,我们对该事发生概率的估计。利用过去历史资料计算得到的先验概率,称为客观先验概率; 当历史资料无从取得或资料不完全时,凭人们的主观经验来判断而得到的先验概率,称为主观先验概率。例如抛一枚硬币头向上的概率为0.5,这就是主观先验概率。
    • 后验概率是指通过调查或其它方式获取新的附加信息,利用贝叶斯公式对先验概率进行修正,而后得到的概率。
    • 先验概率和后验概率的区别:先验概率不是根据有关自然状态的全部资料测定的,而只是利用现有的材料(主要是历史资料)计算的;后验概率使用了有关自然状态更加全面的资料,既有先验概率资料,也有补充资料。另外一种表述:先验概率是在缺乏某个事实的情况下描述一个变量;而后验概率(Probability of outcomes of an experiment after it has been performed and a certain event has occured.)是在考虑了一个事实之后的条件概率。
    • 似然函数
    • 共轭分布(conjugacy):后验概率分布函数与先验概率分布函数具有相同形式

    好了,有了以上先验知识后,终于可以引入贝塔分布啦!!首先,考虑一点,在试验数据比较少的情况下,直接用最大似然法估计二项分布的参数可能会出现过拟合的现象(比如,扔硬币三次都是正面,那么最大似然法预测以后的所有抛硬币结果都是正面)。为了避免这种情况的发生,可以考虑引入先验概率分布来控制参数,防止出现过拟合现象。那么,问题现在转为如何选择

    先验概率和后验概率的关系为:

    二项分布的似然函数为(就是二项分布除归一化参数之外的后面那部分,似然函数之所以不是pdf,是因为它不需要归一化):

    如果选择的先验概率也与次方德乘积的关系,那么后验概率分布的函数形式就会跟它的先验函数形式一样了。具体来说,选择prior的形式是,那么posterior就会变成这个样子了(为pdf的归一化参数),所以posterior和prior具有相同的函数形式(都是也与次方的乘积),这样先验概率与后验概率就是共轭分布了。

    所以,我们选择了贝塔分布作为先验概率,其概率分布函数为:

    ,其中

    5. 狄利克雷分布

    狄利克雷分布(Dirichlet distribution)是多项分布的共轭分布,也就是它与多项分布具有相同形式的分布函数。

    • 概率分布函数为:

    6. 后记

    本篇博文只是将伯努利分布、二项分布、多项分布、贝塔分布和狄利克雷分布做了简单的介绍,其中涉及到大量的概率基础和高等数学的知识,文中的介绍只是粗浅的把这些分布的概念作了大概介绍,没有对这些分布的产生历史做介绍。我想,更好的介绍方式,应是从数学史的角度,将这几项分布的发现按照历史规律来展现,这样会更直观、形象。后续再补吧!


       在机器学习领域中,概率模型是一个常用的利器。用它来对问题进行建模,有几点好处:1)当给定参数分布的假设空间后,可以通过很严格的数学推导,得到模型的似然分布,这样模型可以有很好的概率解释;2)可以利用现有的EM算法或者Variational method来学习。通常为了方便推导参数的后验分布,会假设参数的先验分布是似然的某个共轭分布,这样后验分布和先验分布具有相同的形式,这对于建模过程中的数学推导可以大大的简化,保证最后的形式是tractable。

        在概率模型中,Dirichlet这个词出现的频率非常的高。初始机器学习的同学或者说得再广一些,在学习概率模型的时候,很多同学都不清楚为啥一个表现形式如此奇怪的分布Dirichlet分布会出现在我们的教科书中,它是靠啥关系攀上了多项分布(Multinomial distribution)这个亲戚的,以至于它可以“堂而皇之”地扼杀我大天朝这么多数学家和科学家梦想的?为了引出背后这层关系,我们需要先介绍一个概念——共轭先验(Conjugate Prior)

    • Conjugate Prior: In Bayesian probability theory, if the posterior distributions p(θ|x) are in the same family as the prior probability distribution p(θ), the prior and posterior are then called conjugate distributions, and the prior is called a conjugate prior for the likelihood. ----from wiki
    • 用中文来讲,在贝叶斯统计理论中,如果某个随机变量Θ的后验概率 p(θ|x)和气先验概率p(θ)属于同一个分布簇的,那么称p(θ|x)和p(θ)为共轭分布,同时,也称p(θ)为似然函数p(x|θ)的共轭先验。

        介绍了这个重要的概念之后,我们回到文章的正题。首先需要弄清楚什么是二项分布(Binomial distribution)。这个概念是从伯努利分布推进的。伯努利分布是一个离散型的随机分布,其中的随机变量只有两类取值,非正即负{+,-}。二项分布即重复n次的伯努利试验,记为 X~b(n,p)。概率密度函数(概率质量函数)为。再来看看Beta分布,给定参数,取值范围为[0,1]的随机变量x的概率密度函数,其中。这里假定,先验分布和似然概率如下所示:

    那么很容易知道后验概率为

         弄清楚了Beta分布和二项分布之间的关系后,对于接下来的Dirichlet 分布和多项分布(Multinomial distribution)的关系理解将会有非常大的帮助。多项分布,从字面上所表现出的含义,我们也大抵知道它的意思。它本身确实也是这样的,其单次试验中的随机变量的取值不再是0-1的,而是有多种离散值可能(1,2,3...,k),其中。多项分布的概率密度函数为。而Dirichlet分布的的密度函数形式也如出一辙:,其中。到这里,我们可以看到Beta分布和Dirichlet 分布有多相似啊,二项分布和多项分布有多相似啊

         再一次来看看共轭。假设有先验分布

    另有似然函数

    则后验概率

    ,和Dirichlet 分布形式一致。

        其实,细心的读者已经发现,这里这四类分布,如果但从数学形式上看,它们的组织形式都是一致的,都是通过乘积的形式构成,加上先验分布、似然函数和后言分布之间的乘积推导关系,可以很容易发现,它们所表现出的共轭性质很容易理解。


    Beta分布与Dirichlet分布的定义域均为[0,1],在实际使用中,通常将两者作为概率的分布,Beta分布描述的是单变量分布,Dirichlet分布描述的是多变量分布,因此,Beta分布可作为二项分布的先验概率,Dirichlet分布可作为多项分布的先验概率。这两个分布都用到了Gamma函数,所以,首先了解一下Gamma函数。

    1. Gamma函数

      首先看其表达式 
      Γ(x)=0tx1etdtΓ(x)=∫0∞tx−1e−tdt 
    这样的表达看懂都很难,更不知道那些数学家怎么想出来的。据LDA数学八卦中记录,在Gamma函数的发现中做出主要贡献的数学家有哥德巴赫、丹尼尔·伯努利(不是伯努利分布的那个伯努利),最终由欧拉解决这个问题(这些大数学家互相都认识的啊)。 
      Gamma函数是对阶乘在实数领域的扩展,也就是说,Γ(x+1)=xΓ(x)Γ(x+1)=xΓ(x),下面用分部积分的方法进行推导,如不关心,可以略过。 
      

    Γ(x)=0tx1etdt=1x0etdtx=1x(ettx|00txdet)=1x0txetdt=1xΓ(x+1)Γ(x)=∫0∞tx−1e−tdt=1x∫0∞e−tdtx=1x(e−ttx|0∞−∫0∞txde−t)=1x∫0∞txe−tdt=1xΓ(x+1)

    据PRML第71页(2.14)式,Gamma函数在Beta分布和Dirichlet分布中起到了归一化的作用。

    2. Beta分布

      Beta分布描述的是定义在区间[0,1]上随机变量的概率分布,由两个参数α>0α>0β>0β>0决定,通常记为μBeta(μ|α,β)μ∼Beta(μ|α,β),其概率密度函数如下 
      P(μ|α,β)=Γ(α+β)Γ(α)Γ(β)μα1(1μ)β1=1B(α,β)μα1(1μ)β1P(μ|α,β)=Γ(α+β)Γ(α)Γ(β)μα−1(1−μ)β−1=1B(α,β)μα−1(1−μ)β−1 
    其中,Γ()Γ(⋅)就是Gamma函数,B(α,β)B(α,β)为Beta函数,并且 
      B(α,β)=Γ(α)Γ(β)Γ(α+β)B(α,β)=Γ(α)Γ(β)Γ(α+β) 
    Beta分布的概率密度函数曲线如下图:(摘自wikipedia Beta distribution


    Beta distribution 

    由于Beta分布定义在区间[0,1]上,所以适合作为概率的分布。第一段提到Beta分布可作为二项分布的先验概率,那就需要从二项分布的定义来理解Beta分布的形式。已知二项分布的形式为: 
      p(x=k|n,μ)=Cknμk(1μ)nkp(x=k|n,μ)=Cnkμk(1−μ)n−k 
    μμ进行后验概率估计时,其似然项是μμ(1μ)(1−μ)的指数形式,如果先验概率也选择为μμ(1μ)(1−μ)的指数形式,那么后验概率就仍然保持这种指数形式,这种性质叫做共轭分布,我们会在后面的文章中对共轭分布进行介绍。 
    因此,Beta分布就是μμ(1μ)(1−μ)的指数形式,其中Beta函数为归一化系数。Beta分布的均值和方差分别为 
      E[μ]=αα+βE[μ]=αα+β 
      var(μ)=αβ(α+β)2(α+β+1)var(μ)=αβ(α+β)2(α+β+1)

    3. Dirichlet分布

      Dirichlet分布是关于定义在区间[0,1]上的多个随机变量的联合概率分布,假设有dd个变量μiμi,并且di=1μi=1∑i=1dμi=1,记μ=(μ1,μ2,...,μd)μ=(μ1,μ2,...,μd),每个μiμi对应一个参数αi>0αi>0,记α=(α1,α2,...,αd)α=(α1,α2,...,αd)α^=di=1αiα^=∑i=1dαi,那么它的概率密度函数为 
    p(μ|α)=Dir(μ|α)=Γ(α^)Γ(α1)Γ(αd)di=1μαi1ip(μ|α)=Dir(μ|α)=Γ(α^)Γ(α1)⋯Γ(αd)∏i=1dμiαi−1 
      Dirichlet分布的每一个随机变量具有统计量如下: 
      E[μi]=αiα^E[μi]=αiα^ 
      var(μi)=αi(α^αi)α^2(α^+1)var(μi)=αi(α^−αi)α^2(α^+1) 
      cov(μi,μj)=αiαjα^2(α^+1)cov(μi,μj)=αiαjα^2(α^+1) 
      由于Dirichlet分布描述的是多个定义于区间[0,1]的随机变量的概率分布,所以通常将其用作多项分布参数μiμi的概率分布。



    展开全文
  • EL表达式函数

    千次阅读 2013-07-14 14:37:12
    1.fn:contains 判断字符串是否包含...2.fn:containsIgnoreCase 判断字符串是否包含另外一个字符串(大小写无关) test="${fn:containsIgnoreCase(name,searchString)}">  3.fn:endsWith 判断字符串是否以另外字符串结束

    1.fn:contains 判断字符串是否包含另外一个字符串 <c:iftest="${fn:contains

    (name,searchString)}">   
    2.fn:containsIgnoreCase 判断字符串是否包含另外一个字符串(大小写无关)<c:if

    test="${fn:containsIgnoreCase(name,searchString)}">   
    3.fn:endsWith 判断字符串是否以另外字符串结束 <c:iftest="${fn:endsWith

    (filename,".txt")}">   
    4.fn:escapeXml 把一些字符转成XML表示,例如<字符应该转为&lt;

    ${fn:escapeXml(param:info)}   
    5.fn:indexOf 子字符串在母字符串中出现的位置 ${fn:indexOf(name,"-")}   
    6.fn:join 将数组中的数据联合成一个新字符串,并使用指定字符格开 ${fn:join

    (array,";")}   
    7.fn:length 获取字符串的长度,或者数组的大小 ${fn:length

    (shoppingCart.products)}   
    8.fn:replace 替换字符串中指定的字符 ${fn:replace(text, "-","&#149;")}   
    9.fn:split 把字符串按照指定字符切分 ${fn:split(customerNames,";")}   
    10.fn:startsWith 判断字符串是否以某个子串开始 <c:iftest="${fn:startsWith

    (product.id,"100-")}">   
    11.fn:substring 获取子串 ${fn:substring(zip, 6,-1)}   
    12.fn:substringAfter 获取从某个字符所在位置开始的子串${fn:substringAfter

    (zip,"-")}   
    13.fn:substringBefore 获取从开始到某个字符所在位置的子串

    ${fn:substringBefore(zip,"-")}   
    14.fn:toLowerCase 转为小写${fn.toLowerCase(product.name)}   
    15.fn:toUpperCase 转为大写字符${fn.UpperCase(product.name)}   
    16.fn:trim 去除字符串前后的空格 ${fn.trim(name)} 

     

    称呼Functions 标签库为标签库,倒不如称呼其为函数库来得更容易理解些。因为 Functions 标签库并没有提供传统的标签来为JSP 页面的工作服务,而是被用于 EL 表达式语句中。在 JSP2.0 规范下出现的 Functions 标签库为 EL表达式语句提供了许多更为有用的功能。 Functions 标签库分为两大类,共 16 个函数。
    长度函数: fn:length
    字符串处理函数: fn:contains 、 fn:containsIgnoreCase 、 fn:endsWith 、fn:escapeXml 、 fn:indexOf 、 fn:join 、 fn:replace 、 fn:split 、fn:startsWith 、 fn:substring 、 fn:substringAfter 、fn:substringBefore 、 fn:toLowerCase 、 fn:toUpperCase 、fn:trim
    以下是各个函数的用途和属性以及简单示例。
    9.7.1  长度函数 fn:length 函数
        长度函数 fn:length 的出现有重要的意义。在 JSTL1.0 中,有一个功能被忽略了,那就是对集合的长度取值。虽然java.util.Collection 接口定义了 size 方法,但是该方法不是一个标准的 JavaBean 属性方法(没有get,set 方法),因此,无法通过 EL 表达式“ ${collection.size} ”来轻松取得。
    fn:length 函数正是为了解决这个问题而被设计出来的。它的参数为 input,将计算通过该属性传入的对象长度。该对象应该为集合类型或 String 类型。其返回结果是一个 int类型的值。下面看一个示例。
    <%ArrayList arrayList1 = new ArrayList();
                               arrayList1.add("aa");
                               arrayList1.add("bb");
                               arrayList1.add("cc");
    %>
    <%request.getSession().setAttribute("arrayList1",arrayList1);%>
    ${fn:length(sessionScope.arrayList1)}
    假设一个 ArrayList 类型的实例“ arrayList1 ”,并为其添加三个字符串对象,使用 fn:length函数后就可以取得返回结果为“ 3 ”。
    9.7.2  判断函数 fn:contains 函数
    fn:contains 函数用来判断源字符串是否包含子字符串。它包括 string 和 substring 两个参数,它们都是String 类型,分布表示源字符串和子字符串。其返回结果为一个 boolean 类型的值。下面看一个示例。
    ${fn:contains("ABC", "a")}<br>
    ${fn:contains("ABC", "A")}<br>
    前者返回“ false ”,后者返回“ true ”。
    9.7.3 fn:containsIgnoreCase 函数
    fn:containsIgnoreCase 函数与 fn:contains 函数的功能差不多,唯一的区别是fn:containsIgnoreCase 函数对于子字符串的包含比较将忽略大小写。它与 fn:contains 函数相同,包括string 和 substring 两个参数,并返回一个 boolean 类型的值。下面看一个示例。
    ${fn:containsIgnoreCase("ABC","a")}<br>
    ${fn:containsIgnoreCase("ABC","A")}<br>
    前者和后者都会返回“ true ”。
    9.7.4  词头判断函数 fn:startsWith 函数
    fn:startsWith 函数用来判断源字符串是否符合一连串的特定词头。它除了包含一个 string 参数外,还包含一个subffx 参数,表示词头字符串,同样是 String 类型。该函数返回一个 boolean 类型的值。下面看一个示例。
    ${fn:startsWith ("ABC","ab")}<br>
    ${fn:startsWith ("ABC","AB")}<br>
    前者返回“ false ”,后者返回“ true ”。
    9.7.5  词尾判断函数 fn:endsWith 函数
    fn:endsWith 函数用来判断源字符串是否符合一连串的特定词尾。它与 fn:startsWith 函数相同,包括 string和 subffx 两个参数,并返回一个 boolean 类型的值。下面看一个示例。
    ${fn:endsWith("ABC", "bc")}<br>
    ${fn:endsWith("ABC", "BC")}<br>
    前者返回“ false ”,后者返回“ true ”。
    9.7.6  字符实体转换函数 fn:escapeXml 函数
    fn:escapeXml 函数用于将所有特殊字符转化为字符实体码。它只包含一个 string 参数,返回一个 String类型的值。
    9.7.8  字符匹配函数 fn:indexOf 函数
    fn:indexOf 函数用于取得子字符串与源字符串匹配的开始位置,若子字符串与源字符串中的内容没有匹配成功将返回“ -1 ”。它包括string 和 substring 两个参数,返回结果为 int 类型。下面看一个示例。
    ${fn:indexOf("ABCD","aBC")}<br>
    ${fn:indexOf("ABCD","BC")}<br>
    前者由于没有匹配成功,所以返回 -1 ,后者匹配成功将返回位置的下标,为 1 。
    ${fn:substring(str,0,3)}此函数为截取字符串的函数

    原文链接:http://blog.csdn.net/jokehello/article/details/7444123


    JSTL对Map集合的操作

    1、迭代 
         当forEach 的items属性中的表达式的值是java.util.Map时,则var中命名的变量的类型就是 

         java.util.Map.Entry。这时var=entry的话,用表达式${entry.key}取得键名。 

      用表达式${entry.value}得到每个entry的值。这是因为java.util.Map.Entry对象有getKey和getValue方 

     法,表达式语言遵守JavaBean的命名约定。 example: 

    Java代码  收藏代码
    1.        
    2. <c:forEach items="${map}" var="entry">  
    3.    <c:out value="${entry.key}" />  
    4.    <c:out value="${entry.value}" />  
    5. </c:forEach>  

    2、根据key变量求值 
          如果事先知道key那么很容易根据${map.key值}就可以得到值对象,但是如果key是一个变量呢? 

         有一个问题,如果给定一个key的变量如何使用EL得到对象呢,这里需要使用EL表达式中的[]来解决, 
        解决方法如示例: 
    Java代码  收藏代码
    1. <c:out value="${map[key]}" />  
      
    <!-- 这里的map就是 java.util.Map对像,key是这个map里的一个key --> 

    展开全文
  • 二项分布

    千次阅读 2013-12-11 09:58:48
    二项分布[编辑] ...累积分布函数 参数  试验次数 (整数)  成功概率 (实数) 值域 概率密度函数 累积分布函数 标记 {{{notation}}} 期望值

    二项分布[编辑]

    维基百科,自由的百科全书
    二项分布
    机率 质量 函数
    累积分布函数
    参数 n \geq 0 试验次数 (整数)
    0\leq p \leq 1 成功概率 (实数)
    值域 k \in \{0,\dots,n\}\!
    概率密度函数 {n\choose k} p^k (1-p)^{n-k} \!
    累积分布函数 I_{1-p}(n-\lfloor k\rfloor, 1+\lfloor k\rfloor) \!
    标记 {{{notation}}}
    期望值 n\,p\!
    中位数 \{\lfloor np\rfloor, \lceil np \rceil\}之一
    众数 \lfloor (n+1)\,p\rfloor\!\lfloor (n+1)\,p\rfloor\!-1
    方差 n\,p\,(1-p)\!
    偏态 \frac{1-2\,p}{\sqrt{n\,p\,(1-p)}}\!
    峰态 \frac{1-6\,p\,(1-p)}{n\,p\,(1-p)}\!
    熵值 \frac{1}{2} \ln \left( 2 \pi n e p (1-p) \right) + O \left( \frac{1}{n} \right)\!
    动差生成函数 (1-p + p\,e^t)^n \!
    特征函数 (1-p + p\,e^{i\,t})^n \!

    概率论统计学中,二项分布n独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率p。这样的单次成功/失败试验又称为伯努利试验。实际上,当n = 1时,二项分布就是伯努利分布。二项分布是显著性差异二项试验的基础。

    详述[编辑]

    概率质量函数[编辑]

    一般地,如果随机变量\mathit{X}服从参数为\mathit{n}\mathit{p}的二项分布,我们记X \sim b(n,p)X \sim B(n,p).n次试验中正好得到k次成功的概率由概率质量函数给出:

    f(k;n,p) = \Pr(K = k) = {n\choose k}p^k(1-p)^{n-k}

    对于k = 0, 1, 2, ..., n,其中{n\choose k}=\frac{n!}{k!(n-k)!}

    二项式系数(这就是二项分布的名称的由来),又记为C(nk),  nCk,或nCk。该公式可以用以下方法理解:我们希望有k次成功(pk)和n − k次失败(1 − p)n − k。然而,k次成功可以在n次试验的任何地方出现,而把k次成功分布在n次试验中共有C(nk)个不同的方法。

    在制造二项分布概率的参考表格时,通常表格中只填上n/2个值。这是因为k > n/2时的概率可以从它的补集计算出:

    f(k;n,p)=f(n-k;n,1-p). \,

    因此,我们要看另外一个k和另外一个p(二项分布一般不是对称的)。然而,它的表现不是任意的。总存在一个整数M,满足

    (n+1)p-1 < M \leq (n+1)p. \,

    作为k的函数,表达式ƒ(knp)当k < M时单调递增,k > M时单调递减,只有当(n + 1)p是整数时例外。在这时,有两个值使ƒ达到最大:(n + 1)p和(n + 1)p − 1。M是伯努利试验的最可能的结果,称为众数。注意它发生的概率可以很小。

    累积分布函数[编辑]

    累积分布函数可以表示为:

    F(x;n,p) = \Pr(X \le x) = \sum_{i=0}^{\lfloor x \rfloor} {n\choose i}p^i(1-p)^{n-i}.

    其中\scriptstyle \lfloor x\rfloor\,是小于或等于x最大整数

    它也可以用正则化不完全贝塔函数来表示:

    \begin{align}F(k;n,p) & = \Pr(X \le k) = I_{1-p}(n-k, k+1) \\& = (n-k) {n \choose k} \int_0^{1-p} t^{n-k-1} (1-t)^k \, dt.\end{align}

    期望和方差[编辑]

    如果X ~ B(np)(也就是说,X是服从二项分布的随机变量),那么X期望值

    \operatorname{E}[X] = np

    方差

    \operatorname{Var}[X] = np(1 - p).

    这个事实很容易证明。首先假设有一个伯努利试验。试验有两个可能的结果:1和0,前者发生的概率为p,后者的概率为1 − p。该试验的期望值等于μ = 1 · p + 0 · (1−p) = p。该试验的方差也可以类似地计算:σ2 = (1−p)2·p + (0−p)2·(1−p) = p(1 − p).

    一般的二项分布是n次独立的伯努利试验的和。它的期望值和方差分别等于每次单独试验的期望值和方差的和:

    \mu_n = \sum_{k=1}^n \mu = np, \qquad    \sigma^2_n = \sum_{k=1}^n \sigma^2 = np(1 - p).

    众数和中位数[编辑]

    通常二项分布B(n, p)的众数等于⌊(n + 1)p⌋,其中e ⌊ ⌋ 是取整函数。然而,当(n + 1)p是整数且p不等于0或1时,分布有两个众数:(n + 1)p和(n + 1)p − 1。当p等于0或1时,众数相应地等于0或 n。这些情况可以综述如下:

    \text{mode} =       \begin{cases}        \lfloor (n+1)\,p\rfloor & \text{if }(n+1)p\text{ is 0 or a noninteger}, \\        (n+1)\,p\ \text{ and }\ (n+1)\,p - 1 &\text{if }(n+1)p\in\{1,\dots,n\}, \\        n & \text{if }(n+1)p = n + 1.      \end{cases}

    一般地,没有一个单一的公式可以求出二项分布的中位数,甚至中位数可能是不唯一的。然而有几个特殊的结果:

    • 如果np是整数,那么平均数、中位数和众数相等,都等于np[1][2]
    • 任何中位数m都位于区间⌊np⌋ ≤ m ≤ ⌈np⌉内。[3]
    • 中位数m不能离平均数太远:|m − np| ≤ min{ ln 2, max{p, 1 − p} }。[4]
    • 如果p ≤ 1 − ln 2,或p ≥ ln 2,或|m − np| ≤ min{p, 1 − p}(除了p = ½、n是奇数的情况以外),那么中位数是唯一的,且等于m = round(np)。[3][4]
    • 如果p = 1/2,且n是奇数,那么区间½(n − 1) ≤ m ≤ ½(n + 1)中的任何数m都是二项分布的中位数。如果p = 1/2且n是偶数,那么m = n/2是唯一的中位数。

    两个二项分布的协方差[编辑]

    如果有两个服从二项分布的随机变量XY,我们可以求它们的协方差。利用协方差的定义,当n = 1时我们有

    \operatorname{Cov}(X, Y) = \operatorname{E}(XY) - \mu_X \mu_Y.

    第一项仅当XY都等于1时非零,而μXμY分别为X = 1和Y = 1的概率。定义pBXY都等于1的概率,便得到

    \operatorname{Cov}(X, Y) = p_B - p_X p_Y, \,

    对于n次独立的试验,我们便有

    \operatorname{Cov}(X, Y)_n = n ( p_B - p_X p_Y ). \,

    如果XY是相同的变量,便化为上面的方差公式。

    与其他分布的关系[编辑]

    二项分布的和[编辑]

    如果X ~ B(np)和Y ~ B(mp),且XY相互独立,那么X + Y也服从二项分布;它的分布为

    X+Y \sim B(n+m, p).\,

    伯努利分布[编辑]

    伯努利分布是二项分布在n = 1时的特殊情况。X ~ B(1, p)与X ~ Bern(p)的意思是相同的。相反,任何二项分布B(np)都是n次独立伯努利试验的和,每次试验成功的概率为p

    泊松二项分布[编辑]

    二项分布是泊松二项分布的一个特殊情况。泊松二项分布n次独立、不相同的伯努利试验(pi)的和。如果X服从泊松二项分布,且p1 = … = pn =p,那么X ~ B(np)。

    正态近似[编辑]

    n = 6、p = 0.5时的二项分布以及正态近似

    如果n足够大,那么分布的偏度就比较小。在这种情况下,如果使用适当的连续性校正,那么B(np)的一个很好的近似是正态分布

    \mathcal{N}(np,\, np(1-p)).

    n越大(至少20),近似越好,当p不接近0或1时更好。[5]不同的经验法则可以用来决定n是否足够大,以及p是否距离0或1足够远:

    • 一个规则是x=npn(1 − p)都必须大于 5。

    泊松近似[编辑]

    当试验的次数趋于无穷大,而乘积np固定时,二项分布收敛于泊松分布。因此参数为λ = np的泊松分布可以作为二项分布B(np)的近似,如果n足够大,而p足够小。[6]

    极限[编辑]

    • n趋于∞,p趋于0,而np固定于λ > 0,或至少np趋于λ > 0时,二项分布B(np)趋于期望值为λ的泊松分布
    • n趋于∞而p固定时,
    {X-np \over \sqrt{np(1-p)\ }}
    的分布趋于期望值为 0、方差为 1的正态分布。这个结果是中心极限定理的一个特殊情况。

    例子[编辑]

    一个简单的例子如下:掷一枚骰子十次,那么掷得4的次数就服从n = 10、p = 1/6的二项分布。

    参见[编辑]

    展开全文
  • 对于N(0,1)标准正太分布总体的抽样分布 χ^2分布,t分布,f分布 χ^2分布: χ2(n)=X12+X22+……+Xn2χ^2(n)=X_1^2+X_2^2+……+X_n^2χ2(n)=X12​+X22​+……+Xn...伽马函数-利用偶函数性质与换元-正态分布 对普通正态总
  • 威布尔分布是概率密度函数(PDF),广泛用于气象数据的研究。 通过使用威布尔分布对风速v进行统计分析,可以估算出平均风速,v周围的方差和风中的平均功率密度。 这些计算涉及伽玛函数Γ,特别是Γ(1 + 1 / k),Γ...
  • 函数式编程思想 面向对象的思想 做一件事,找一个能解决这件事的对象,调用对象的方法完成 ...Lambda表达式 初次体验 public static void main(String[] args) { new Thread(new Runnable() { @Override ...
  • 维联合分布的密度函数计算

    万次阅读 2016-11-01 20:02:03
    维联合分布的密度函数计算@(概率论)已知随机向量(X1,X2)(X_1,X_2)的概率密度为f(x1,x2)f(x_1,x_2),设Y1=2X1,Y2=13x2Y_1 = 2X_1,Y_2 = {1\over 3}x_2,则随机向量(Y1,Y2)(Y_1,Y_2)的概率密度f(y1,y2)=?f(y_1,y_2) = ...
  • 径向分布函数

    万次阅读 热门讨论 2018-10-14 17:22:15
    径向分布函数RDF实现算法 RDF实现算法 RDF是径向分布函数的Radical distribution function的缩写,指的是给定一个空间,在此空间以一个对象为中心,去寻找周围对象的的概率。对于分子模拟的径向分布函数实则也是求解...
  • EL表达式函数的使用

    2013-03-08 15:19:20
    在使用之前加入2句引入的代码 1.fn:contains 判断字符串是否包含另外一个字符串 2.fn:containsIgnoreCase 判断字符串是否包含另外一个字符串(大小写无关) 3.fn:endsWith 判断字符串是否以另外字符串结束 4....
  • 累积分布函数 分布。 随机变量的为 其中alpha是形状参数, beta是分布的速率参数。 gamma是较低的。 安装 $ npm install distributions-gamma-cdf 要在浏览器中使用,请使用 。 用法 var cdf = require ( '...
  • 正态分布函数(高斯函数)详解

    万次阅读 2019-05-16 16:50:32
    正态分布 ...2.正态分布函数曲线的性质: 3.正态分布的概率分布函数 概率分布函数是正态分布曲线的定积分,公式为: 正态分布曲线与x轴围成的面积是1(积分区间是负无穷到正无穷) 的值代表...
  • 1. 介绍连续型随机变量的分布函数及其概率密度 2. 介绍均匀分布,指数分布,正态分布的性质以及必要性证明
  • 有很多统计推断是基于正态分布的假设,以标准正态分布变量为基石而构造的三个著名统计量在实际中有广泛的应用,这是因为这三个统计量不仅有明确背景,而且其抽样分布的密度函数有显式表达式,它们被称为统计中的“三...
  • 正态分布 概率密度函数PDF

    万次阅读 2017-12-09 09:29:17
    正态分布的概率密度函数均值为μ 方差为σ2 (或标准差σ)是高斯函数的一个实例: 。 (请看指数函数以及π.) 如果一个随机变量X服从这个分布,我们写作 X ~ N(μ,σ2). 如果μ = 0
  • 绘制二元正态分布的密度函数图和等高线图,mesh函数(密度图)和contour函数(等高线)
  • Excel数据频率分布FREQUENCY函数 FREQUENCY函数可以一列垂直数组返回某个区域中数据的频率...FREQUENCY函数可以一列垂直数组返回某个区域中数据的频率分布 FREQUENCY函数表达式为:FREQUENCY(data_array,bins_array)
  • 自变量是随机变量,它可以取很多值,每个值都对应这一个概率,这些所有概率加起来等于1,这是我们知道的关于概率最...分布函数和前面三个有点不太一样,分布函数某一点的值是该点前面所有概率的累加。 分布函...
  • 第一种是进行多项式拟合,数学上可以证明,任意函数都可以表示为多项式形式。具体示例如下。 ###拟合年龄 import numpy as np import matplotlib.pyplot as plt   #定义x、y散点坐标 x = [10,20,30,40,50,60,70,80...
  • 二项分布和多项分布

    万次阅读 2014-06-14 19:34:21
    二项分布: 做n
  • 分布函数总结

    千次阅读 2017-12-19 23:05:09
    各种重要的分布函数本Markdown编辑器使用[StackEdit][6]修改而来,用它写博客,将会带来全新的体验哦: Markdown和扩展Markdown简洁的语法 代码块高亮 图片链接和图片上传 LaTex数学公式 UML序列图和流程图 ...
  • 概率论分布函数

    2020-04-06 10:27:28
    1、什么是分布函数分布函数(英文Cumulative Distribution Function, 简称CDF),是概率统计中重要的函数 2、它可以用来干什么?在这里插入代码片 分布函数可以完整地描述随机变量的统计规律,并且决定随机变量...
  • 2.二项分布和几何分布 3. 泊松分布 4.正态分布 一、期望 期望这个概念,初高中就学过了吧,所以这里就简单说一下定义。 1.离散型随机变量的期望 2.连续型随机变量的期望 3.期望的...
  • 对给定容量为n的二项分布样本X1,X2,…,Xn,在刻度平方误差损失函数下,利用共轭先验分布讨论二项分布参数θ的Bayes估计,得到了该参数的Bayes估计可容许性的一个充要条件,并给出多层Bayes估计的表达式.
  • 【机器学习】正态分布的判别函数

    千次阅读 2014-06-01 10:16:03
    下面求概率密度函数在[-2,2]上的积分 syms x; p=int(1/sqrt(2*pi)*exp(-(x.^2)/2),-2,2); 显然,高斯分布图的峰值为 , 概率密度函数 在区间 内的积分值为0.9545. (2)多变量密度函数: 连续的...
  • 经验分布函数

    千次阅读 2019-12-18 21:58:21
    求X经验分布函数 【解 】: 把样本值按从小到大的顺序排列为 于是得经验分布函数为 说明 (1) 经验分布函数Fn(x)是一个阶梯形函数, 当样本容量增大时, 相邻两阶梯的跃度变低, 阶梯宽度变窄, 容易想像, 这样的阶.....
  • 机器学习-累计分布函数(CDF)

    万次阅读 2018-08-23 12:04:35
    1.累计分布函数(The Cumulative Distribution Function):在x点左侧事件发生的总和。 累计分布函数的特性: ①因为累计分布函数是计算x点左侧的点的数量,所以累计分布函数CDF是单调递增的。 ②CDF比没有直方...
  • 文章目录2.5 随机变量的函数分布离散型随机变量的函数分布连续型随机变量的函数分布 本小节讲的就是一个题型:已知随机变量XXX的函数求含XXX一维表达式函数。 离散型随机变量的函数分布 已知随机变量XXX的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 65,913
精华内容 26,365
关键字:

二项分布的分布函数的表达式