精华内容
下载资源
问答
  • PDF:概率密度函数(probability density function), 在数学,连续型随机变量的概率密度函数(在至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。...

    ###一. 概念解释

    PDF:概率密度函数(probability density function), 在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。

    PMF : 概率质量函数(probability mass function), 在概率论中,概率质量函数是离散随机变量在各特定取值上的概率。

    CDF : 累积分布函数 (cumulative distribution function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。
    ###二. 数学表示

    PDF:如果XX是连续型随机变量,定义概率密度函数为fX(x)f_X(x)fX(x),用PDF在某一区间上的积分来刻画随机变量落在这个区间中的概率,即

    Pr⁡(a≤X≤b)=∫abfX(x)dx\Pr\left(a \leq X \leq b\right) =\int_{a}^{b} f_X(x) dxPr(aXb)=abfX(x)dx
    PMF:如果XX离散型随机变量,定义概率质量函数为fX(x)f_X(x)fX(x),PMF其实就是高中所学的离散型随机变量的分布律,即
    fX(x)=Pr⁡(X=x)f_X(x)=\Pr\left( X=x \right)fX(x)=Pr(X=x)
    比如对于掷一枚均匀硬币,如果正面令KaTeX parse error: Expected '}', got 'EOF' at end of input: \text{XKaTeX parse error: Expected 'EOF', got '}' at position 1: }̲=1,如果反面令X=0X=0X=0,那么它的PMF就是
    fX(x)={12 if x∈{0,1}0 if x∉{0,1}f_X\left( x \right) =\begin{cases} &\frac{1}{2} \text{ if } x\in\left \{ 0,1 \right \} \\ & 0\text{ if } x\notin\left \{ 0,1 \right \}\end{cases}fX(x)={21 if x{0,1}0 if x/{0,1}
    CDF:不管是什么类型(连续/离散/其他)的随机变量,都可以定义它的累积分布函数,有时简称为分布函数。

    对于连续型随机变量,显然有
    FX(x)=Pr⁡(X≤x)=∫−∞xfX(t)dtF_X\left( x \right) =\Pr\left( X\leq x \right) =\int_{-\infty}^{x}f_X(t)dtFX(x)=Pr(Xx)=xfX(t)dt
    那么CDF就是PDF的积分,PDF就是CDF的导数。
    对于离散型随机变量,其CDF是分段函数,比如举例中的掷硬币随机变量,它的CDF为
    FX(x)=Pr⁡(X≤x)={0 if x<012 if 0≤x<11 if x≥1F_X\left( x \right) =\Pr\left ( X\leq x \right )=\begin{cases}& 0\text{ if } x<0 \\ & \frac{1}{2}\text{ if } 0\leq x< 1 \\& 1\text{ if }x\geq 1\end{cases}FX(x)=Pr(Xx)=0 if x<021 if 0x<11 if x1
    ###三.概念分析

    根据上述,我们能得到一下结论:

    1)PDF是连续变量特有的,PMF是离散随机变量特有的;
     2)PDF的取值本身不是概率,它是一种趋势(密度)只有对连续随机变量的取值进行积分后才是概率,也就是说对于连续值确定它在某一点的概率是没有意义的;
     3)PMF的取值本身代表该值的概率。

    ###四.分布函数的意义

    我们从两点来分析分布函数的意义:
      
      1.为什么需要分布函数?

    对于离散型随机变量,可以直接用分布律来描述其统计规律性,而对于非离散型的随机变量,如连续型随机变量,因为我们无法一一列举出随机变量的所有可能取值,所以它的概率分布不能像随机变量那样进行描述,于是引入PDF,用积分来求随机变量落入某个区间的概率。分布律不能描述连续型随机变量,密度函数不能描述离散随机变量,因此需要找到一个统一方式描述随机变量统计规律,这就有了分布函数。另外,在现实生活中,有时候人们感兴趣的是随机变量落入某个范围内的概率是多少,如掷骰子的数小于3点的获胜,那么考虑随机变量落入某个区间的概率就变得有现实意义了,因此引入分布函数很有必要。
      2. 分布函数的意义

    分布函数F(x)F(x)在点xx处的函数值表示XX落在区间(−∞,x](−∞,x]内的概率,所以分布函数就是定义域为RR的一个普通函数,因此我们可以把概率问题转化为函数问题,从而可以利用普通的函数知识来研究概率问题,增大了概率的研究范围。
      


    微信号

    ### 五:深度理解参考文献

    http://www.dataguru.cn/thread-150756-1-1.html
      https://www.zhihu.com/question/23022012
      https://www.zhihu.com/question/36853661
      https://www.zhihu.com/question/21911186
      http://wenku.baidu.com/view/823a0bb9f111f18582d05a14.html

    展开全文
  • 机器学习()-概率

    千次阅读 2018-10-04 13:00:02
    2、概率无向图模型: 3、团与最大团 4、HMM解决的三个问题 5、三种问题的概率计算方法 (1)概率计算问题(前向-后向算法): (2)学习算法(Baum-Welch): (3)预测算法(维比特算法): 条件随机场(CRF...

    目录

    贝叶斯决策论“”

     独立同分布:

    隐马尔科夫模型: 

    1、成对、局部、全局马尔科夫性

    2、概率无向图模型: 

    3、团与最大团

    4、HMM解决的三个问题

    5、三种问题的概率计算方法

    (1)概率计算问题(前向-后向算法):

    (2)学习算法(Baum-Welch):

    (3)预测算法(维比特算法):

    条件随机场(CRF)

    1、线性链条随机场:

    2、线性链CRF的参数化形式

    3、条件随机场的条件概率推导

    4、如何计算CRF:

    CRF 与 HMM 的比较:

    总结:


     


    联合/先验/后验概率、似然函数

    贝叶斯决策论“”

    现实任务中,机器学习所要实现的是基于有限的样本集尽可能准确地估计出后验概率P\left ( c \right |x),有两种策略:

    • 给定样本 x,可通过直接建模P\left ( c \right |x)来预测类别 c,这样得到的是“判别式模型”;
    • 也可先对概率分布P\left ( c ,x)(联合概率)建模,然后再由此获得P\left ( c \right |x),这样得到的是“生成式模型”;
    • LR,LDA,SVN,DT,条件随机场(CRF)等都是判别式模型,生成式模型有隐马尔可夫模型(HMM),Navie Bayes,马尔科夫随机场,knn等;

     独立同分布

    在概率统计理论中,指随机过程中,任何时刻的取值都为随机变量,如果这些随机变量服从同一分布,并且互相独立,那么这些随机变量是独立同分布

    一文搞懂HMM     通俗易懂

    马尔可夫随机场 MRF

    条件随机场CRF - 表示

    条件随机场(CRF)

    隐马尔科夫模型: 

    1、成对、局部、全局马尔科夫性


     

    2、概率无向图模型: 


      设有联合概率分布P(Y),由无向图G=(V,E)表示,在图G中,结点表示随机变量,边表示随机变量之间的依赖关系。

    如果联合概率分布P(Y)满足成对、局部或全局马尔可夫性,就称此联合概率分布为概率无向图模型或马尔可夫随机场。 
      尽管在给定每个节点的条件下,分配给该节点一个条件概率是可能的,无向图的无向性导致我们不能用条件概率参数化表示联合概率,而要从一组条件独立的原则中找出一系列局部函数的乘积来表示联合概率。 
      最简单的局部函数是定义在图结构中的团上的势函数,并且是严格正实值的函数形式。 


    3、团与最大团

      无向图G中任何两个结点均有边连接的结点子集称为,若C是无向图G的一个团,并且不能再加进任何一个G的结点使其称为一个更大的团,则称此C为最大团

         将概率无向图模型的联合概率分布表示为其最大团上的随机变量的函数的乘积形式的操作,成为概率无向图模型的因子分解


    4、HMM解决的三个问题

     

    HMM解决的三个问题:
    1:评估问题,已知模型参数 λ= (A, B, π),计算某个观测序列发生的概率,即求P(O|λ)
    用前向算法或者后向算法求解此类问题,以前向算法为例
    前向算法给出了一个重要的变量---前向变量αt(i)表示在t时刻HMM输出给定观测序列O1O2...Ot,并且状态为Si的概率
    2:解码问题,给出观测序列O和模型μ,怎样选择一个状态序列S(s1,s2,...st+1),能最好的解释观测序列O
    此问题采用了维特比算法
    3:学习问题,如何调整模型参数 λ=(π, A, B), 使得P(O|λ)较大?
    此问题面向不同的语料库有不同的方式
    a.对于观测序列和状态序列都有的立项预料库,直接用较大似然估计即可获得参数λ
    b.对于只知道观测序列的,应用EM算法的实现前向后向算法求解


    5、三种问题的概率计算方法

    (1)概率计算问题(前向-后向算法):

    求P(O|λ);为了方便起见,像隐马尔可夫模型一样,引进前向-后向向量,递归地计算以上概率及期望值,这样的算法称为前向-后向算法;

     即:前向概率为 ,给定模型参数 \lambda ,在 t 时刻的状态与部分观测序列( t 时刻及之前的观测序列)的联合概率;

    从第一个时刻的前向概率开始,往后递推求和求下一个时刻的前向概率;第一个时刻的前向概率 \alpha _{i}\left ( 1 \right ):第一个时刻状态为第 i 号状态的概率是\pi _{i},在第 i 号状态时得到 y_{i} 这个观测的概率是B_{iy1},则前向概率为:\alpha _{i}\left ( 1 \right ) = \pi _{i}B_{iy1}

    t+1时刻的前向概率:由于状态的不可观测性,我们需要考虑 t 时刻所有可能的状态;先求t时刻的状态转移到t+1时刻状态的总概率:  t 时刻的可能状态(q1,q2,...qn)转移到 t+1 时刻且 t+1时刻的状态为 q_{i } 的所有概率求和,然后再乘以由 t+1 时刻的状态 i 得到观测的概率b_{i}\left ( O_{i+1} \right )

    即:t+1 时刻的前向概率为: t 时刻的前向概率对所有可能状态求和  *  t+1 时刻的状态得到观测的概率;

    P(O|λ)为前向概率之和,P(O|λ) = α1(T) +α2(T) + ... + αn(T),即给定模型参数 \lambda 和观测序列 O下,观测序列 O 出现的概率P(O|λ)了;具体如下:

     前向概率的递推公式:

    后向算法是反过来的;

    第t时刻有第i个状态的概率 = t时刻的前向概率 * t时刻的后向概率

    参考链接:隐马尔可夫(HMM)、前/后向算法、Viterbi算法 再次总结


    (2)学习算法(Baum-Welch):

    已知观测序列 O,估计模型参数 \lambda,使在该模型下观测序列 P\left ( O \right|\lambda ) 最大;用极大似然估计的方法估计参数;这里用了EM算法的思想,对完全数据取对数似然,然后极大化似然函数Q\left ( \lambda ,\bar{\lambda } \right )=\sum log\pi _{i}P\left ( O,I \right|\bar{\lambda } )求模型参数;\bar{\lambda } 为模型当前的估计值, \lambda为要极大化的隐马尔可夫模型参数;(例如:O 为观测随机变量的数据, I为隐随机变量的数据(状态序列),O和I 连在一起称完全数据;O称为不完全数据;)

    算法步骤如下: 

    总结: Baum-Welch算法 就是通过观


    (3)预测算法(维比特算法):

            条件随机场的预测问题是给定条件随机场P(Y|X)和输入序列(观测序列)x,求条件概率最大的输出序列(标记序列),即对观测序列进行标注。条件随机场的预测算法是著名的维特比算法.

    维比特算法的思想:

    1. 先从前向后推出一步步可能的路径,最终会得到从起点到终点的 M 条路径;
    2. 确定终点之后再反过来选前面的路径;
    3. 确定最优路径;

    条件随机场(CRF)

         设X与Y是随机变量,P(Y|X)是在给定X的条件下Y的条件概率分布。若随机变量Y构成一个由无向图G=(V,E)表示的马尔可夫随机场。即在给定观察序列X的条件下,每个随机变量Y_{v} 都满足马尔科夫特性,即

      那么条件概率分布P(Y|X)就是一个条件随机场(conditional random fields, CRF)。CRF本质就是给定了观测值集合的MRF(马尔可夫随机场);

    如果信息是与时间或空间的前后有关联时要考虑到CRF。CRFs非常适用于中文的词性标注;

    1、线性链条随机场:

    2、线性链CRF的参数化形式

    Z是规范因子

    3、条件随机场的条件概率推导

    tk是定义在边上的特征函数,称为转移特征,它依赖于当前和前一个位置,t(yi-1, yi, x, i)表达“在给定观测x的情况下从上个节点yi-1转移到这个节点yi的情况”。

    sl是定义在节点上的特征函数,称为状态特征,依赖于当前位置,表达“当前节点yi是不是标记x的情况”。

    它的输出值是0或者1,0表示要评分的标注序列不符合这个特征,1表示要评分的标注序列符合这个特征。

     


    4、如何计算CRF:


    CRF 与 HMM 的比较:

    CRF是判别式模型,直接构建观测序列(输入)和状态序列(输出)的条件概率分布P(y | x),因为没有y的知识,所以无法生成样本,只能判断分类。CRF并不能像HMM那样通过隐含序列推断最可能是观测序列,因为CRF模型中并没有计算p(x|y),不是生成模型。HMM是生成模型。

    CRF是无向图模型,对(y1,y2 | x)建模;HMM是有向图模型。

    HMM有三个假设,观测值是独立的,当前状态只与上一状态有关;CRF抛弃了这两个假设,用到了上下文信息,1or2-gram;

    HMM:对转移概率和表现概率直接建模,统计共现概率。

    MEMM:是对转移概率和表现概率建立联合概率,统计时统计的是条件概率,由于其只在局部做归一化,所以易陷入局部最优。

    CRF:在全局范围内统计归一化的概率,不像MEMM是在局部统计归一化概率。是全局最优的解。解决了MEMM中标注偏置的问题。

    参考:HMM ,MHMM,CRF 优缺点与区别


    总结:

    隐马尔可夫模型,马尔可夫随机场,条件随机场

    随机场:一组随机变量,属于同一个样本空间;

    HMM :有向图

    生成式模型,直接对观测值和状态值得联合概率建模,求P(x|s),只与状态转移概率,输出观测值概率,状态初始概率有关;

    包含两类数据,观测序列(可见),状态序列(隐藏,不可见);

    两个假设:1)任意时刻的隐藏状态只依赖于它前一个的隐藏状态;2)任意时刻的观测值只依赖于当前时刻的观测状态;

    解决三个基本问题:模型参数\lambda \left ( A,B,\pi \right ),A为状态转移概率,B为给定状态,π为初始概率,解决:

    1)给定 λ 下,求P(O|λ);

    2)如何调整λ ,使 max P(O|λ);

    3)由观测序列反推状态序列,找一个最好解释观测序列的状态序列;

         由观测值反求最好的序列 ,涉及到矩阵求最短路径用  维比特算法(动态规划);

    缺点:基于它得两个假设,使其不能够更多的考虑上下文信息,ansj中文分词用的就是n-gram+HMM;

    MRF(马尔可夫随机场):

    是一个马尔可夫网;团:任意两个结点直接都有连接;最大团:如果团加一个结点就破坏了团的性质,称为最大团;我们用将最大团的势函数的乘积来表示联合概率,乘以一个归一化常数Z,Z等于对每个x下的最大团势函数的乘积求和;

    MHMM(最大熵隐马尔可夫模型):

    考虑了相邻状态之间的依赖关系,也考虑了整个观测序列,再MRF的基础上先归一化,再求团势函数的乘积,所以容易得到局部最优;

    CRF(条件随机场):无向图

    判别式模型,直接构建观测序列(输入)和状态序列(输出)的条件概率分布P(Y|X);

    定义:设 X 和 Y 是随机变量,P(Y|X)是给定 X 条件下 Y 的概率,在给定 x 的条件下,任意随机变量 Y_{v} 都满足马尔可夫特性(成对、局部、全局马尔可夫性,直观理解就是这些性质保证了变量的独立性),那么称条件概率分布P(Y|X)是条件随机场;

    优点:抛弃了HMM的两个假设,利用了上下文的信息,相比MHMM,在全局范围内统计归一化概率,容易得到全局最优;

    应用:分词,词性标注

     

     欢迎大家指错,不尽感谢~

    【本系列是根据网上资源和个人见解总结而来的,如需转载请备注原文链接。】

     

    展开全文
  • 用户写博客的过程,内容实时保存在浏览器缓存,在用户关闭浏览器或者其它异常情况下,内容不会丢失。用户再次打开浏览器时,会显示上次用户正在编辑的没有发表的内容。 博客发表后,本地缓存将被删除。  ...

    欢迎使用Markdown编辑器写博客

    本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:

    • Markdown和扩展Markdown简洁的语法
    • 代码块高亮
    • 图片链接和图片上传
    • LaTex数学公式
    • UML序列图和流程图
    • 离线写博客
    • 导入导出Markdown文件
    • 丰富的快捷键

    快捷键

    • 加粗 Ctrl + B
    • 斜体 Ctrl + I
    • 引用 Ctrl + Q
    • 插入链接 Ctrl + L
    • 插入代码 Ctrl + K
    • 插入图片 Ctrl + G
    • 提升标题 Ctrl + H
    • 有序列表 Ctrl + O
    • 无序列表 Ctrl + U
    • 横线 Ctrl + R
    • 撤销 Ctrl + Z
    • 重做 Ctrl + Y

    Markdown及扩展

    Markdown 是一种轻量级标记语言,它允许人们使用易读易写的纯文本格式编写文档,然后转换成格式丰富的HTML页面。 —— [ 维基百科 ]

    使用简单的符号标识不同的标题,将某些文字标记为粗体或者斜体,创建一个链接等,详细语法参考帮助?。

    本编辑器支持 Markdown Extra ,  扩展了很多好用的功能。具体请参考Github.

    表格

    Markdown Extra 表格语法:

    项目 价格
    Computer $1600
    Phone $12
    Pipe $1

    可以使用冒号来定义对齐方式:

    项目 价格 数量
    Computer 1600 元 5
    Phone 12 元 12
    Pipe 1 元 234

    定义列表

    Markdown Extra 定义列表语法:
    项目1
    项目2
    定义 A
    定义 B
    项目3
    定义 C

    定义 D

    定义D内容

    代码块

    代码块语法遵循标准markdown代码,例如:

    @requires_authorization
    def somefunc(param1='', param2=0):
        '''A docstring'''
        if param1 > param2: # interesting
            print 'Greater'
        return (param2 - param1 + 1) or None
    class SomeClass:
        pass
    >>> message = '''interpreter
    ... prompt'''

    脚注

    生成一个脚注1.

    目录

    [TOC]来生成目录:

    数学公式

    使用MathJax渲染LaTex 数学公式,详见math.stackexchange.com.

    • 行内公式,数学公式为:Γ(n)=(n1)!nNΓ(n)=(n−1)!∀n∈N
    • 块级公式:

    x=b±b24ac2ax=−b±b2−4ac2a

    更多LaTex语法请参考 这儿.

    UML 图:

    可以渲染序列图:

    Created with Raphaël 2.1.2张三张三李四李四嘿,小四儿, 写博客了没?李四愣了一下,说:忙得吐血,哪有时间写。

    或者流程图:

    Created with Raphaël 2.1.2开始我的操作确认?结束yesno
    • 关于 序列图 语法,参考 这儿,
    • 关于 流程图 语法,参考 这儿.

    离线写博客

    即使用户在没有网络的情况下,也可以通过本编辑器离线写博客(直接在曾经使用过的浏览器中输入write.blog.csdn.net/mdeditor即可。Markdown编辑器使用浏览器离线存储将内容保存在本地。

    用户写博客的过程中,内容实时保存在浏览器缓存中,在用户关闭浏览器或者其它异常情况下,内容不会丢失。用户再次打开浏览器时,会显示上次用户正在编辑的没有发表的内容。

    博客发表后,本地缓存将被删除。 

    用户可以选择 把正在写的博客保存到服务器草稿箱,即使换浏览器或者清除缓存,内容也不会丢失。

    注意:虽然浏览器存储大部分时候都比较可靠,但为了您的数据安全,在联网后,请务必及时发表或者保存到服务器草稿箱

    浏览器兼容

    1. 目前,本编辑器对Chrome浏览器支持最为完整。建议大家使用较新版本的Chrome。
    2. IE9以下不支持
    3. IE9,10,11存在以下问题
      1. 不支持离线功能
      2. IE9不支持文件导入导出
      3. IE10不支持拖拽文件导入


    1. 这里是 脚注内容.
    展开全文
  • 点球大战概率问题

    千次阅读 2017-09-20 23:22:40
    本人是个足球迷,从06年世界杯开始看球,09年开始彻底爱上足球。...在这里,我们的前提条件是假设进球概率为p,暂考虑其他因素,考虑球员踢球这一事件为一次独立实验。那么我们对这个问题建立概率模型,就是做...

    本人是个足球迷,从06年世界杯开始看球,09年开始彻底爱上足球。关注五大联赛,欧洲冠军联赛等众多国际赛事。在足球的赛事中,在我看来,最让人刺激的就是终场前的绝杀了,除此之外,就是点球大战了。一直对点球大战中先手后手获胜的概率比较好奇,因此,闲暇时对该问题进行了研究。

    在这里,我们的前提条件是假设进球概率为p,暂不考虑其他因素,考虑球员踢球这一事件为一次独立实验。那么我们对这个问题建立概率模型,就是做n次独立重复试验,当然,是受限制条件的独立重复试验。根据足球点球大战规则,在前5轮互射点球过程中,如果没有分出胜负,则依次进行一轮定胜负,直到有一方胜出为止。而前五轮的结束条件也有很多种情形。那么,对前五轮的各种情形进行分析:(假设先手为A队,后手为B队)(注:C(m,n)代表以m为底的组合数)

    首先,我们要明确的是,点球大战至少要踢三轮。

    那么我们依次考虑三轮,四轮,五轮结束比赛的情形:

    三轮结束:只有一种情形。A3:0B。对应的赢球概率为p^3*(1-p)^3。

    四轮结束:要分以下情形:

    A2:0B 这种情形下,对应的概率为P = C(4,2)*p^2*(1-p)^6

    A3:1B 这种情形下,要分情况:不能提前结束比赛。对应的概率为P = C(3,1)*p^4*(1-p)^4+C(3,2)*p^4*C(3,1)*(1-p)^4

    A3:0B 这种情形下,对应的概率为P = C(3,2)*p^3*(1-p)^4

    A4:2B 这种情形下,对应的概率为P = C(3,2)*p^6*(1-p)^2

    A4:1B 这种情形下,对应的概率为P = C(3,1)*p^5*(1-p)^2

    五轮结束:要分以下情形:

    A5:3B 这种情形下,对应的概率为P = C(4,3)*p^8*(1-p)

    A5:4B 这种情形下,对应的概率为P = C(5,1)*p^9*(1-p)

    A4:3B 这种情形下,要分情况:不能提前结束比赛。对应的概率为P = C(4,3)*p^7*(1-p)^3+ C(4,3)*p^7*C(4,3)*(1-p)^2

    A4:2B 这种情形下,对应的概率为P = C(4,1)*p^6*C(4,2)*(1-p)^3

    A3:2B 这种情形下,要分情况:不能提前结束比赛。对应的概率为P = C(4,3)*p^5*C(4,2)*(1-p)^5+ C(4,2)*p^5*C(4,2)*(1-p)^5

    A3:1B 这种情况下,对应的概率为P = C(4,2)*p^4*C(4,1)*(1-p)^5

    A2:1B 这种情况下,对应的概率为P = C(4,2)*p^3*C(4,1)*(1-p)^7+ C(4,1)*p^3*C(4,1)*(1-p)^7

    A2:0B 这种情况下,对应的概率为P = C(4,1)*p^2*(1-p)^7

    A1:0B 这种情况下,对应的概率为P = C(5,1)*p*(1-p)^9

    将上述情形的概率累加得到:

    P(5轮内A胜) = p^3*(1-p)^3+6*p^2*(1-p)^6+12*p^4*(1-p)^4+3*p^3*(1-p)^4+3*p^6*(1-p)^2+3*p^5*(1-p)^2+4*p^8*(1-p)+5*p^9*(1-p)+4*p^7*(1-p)^3+16*p^7*(1-p)^2+24*p^6*(1-p)^3+60*p^5*(1-p)^5+24*p^4*(1-p)^5+40*p^3*(1-p)^7+4*p^2*(1-p)^7+5*p*(1-p)^9

    =-p*(114*p^9 - 602*p^8 + 1419*p^7 - 1960*p^6 + 1780*p^5 - 1126*p^4 + 505*p^3 - 160*p^2 + 35*p - 5)


    而5轮平局有6种情形,概率为:P(5轮内A平)=C(5,0)*C(5,0)*(1-p)^10+C(5,1)*p^2*C(5,1)*(1-p)^8+C(5,2)*p^4*C(5,2)*(1-p)^6+C(5,3)*p^6*C(5,3)*(1-p)^4+C(5,4)*p^8*C(5,4)*(1-p)^2+C(5,5)*p^10*C(5,5)


    而对于5轮平局之后的情形,大概能猜到获胜概率为0.5。数学推导为:假设A获胜的概率为P1,那么,A要拿下比赛,要么他第一次进球了,要么没进球,而且没进球的情形下又重新回到当前状态,其状态为S这样可以得到一个状态转移概率表达式为:

    P1(S) = p*(1-p)+(1-p)^2*P1(S)+p^2*P1(S)解得P1(S) = 0.5。

    综上,可以求得P(最终A胜)=P(5轮内A胜)+P(5轮内A平)*0.5 = 12*p^10 - 28*p^9 + 16*p^8 + 1/2,是一个关于p的多项式。

    matlab绘图:



    在0.85左右达到最大值,胜率为0.74左右。而最低胜率为0.5,取决于p。

    这样一来,在不考虑其他因素,如场外信息,球员心态等的条件下可以认为,先罚点球的一方胜率更高。

    本文从概率意义上对点球大战的获胜情况进行研究,如有错误,还望指正。








    展开全文
  • 算法导论_第章_概率分析和随机算法 本章大概介绍了概率论的知识,都是些理论知识和其部分运用。 先来介绍一下雇佣问题: 假设你要雇佣一个新的办公室助理,雇佣代理每天想你推荐一个应聘者(连续推荐n个),...
  • 桥牌概率问题

    千次阅读 2018-02-13 00:00:00
    概率在桥牌有着极其广泛和重要的作用,深刻影响着牌手的策略,甚至能够决定成败。其中,最基本也最关键的,就是对手各花色的牌型分布问题。依据概率理论分析,我们能够得到普遍情况下牌型分布的规律,而这些规律也...
  • 概率中的PDF,PMF,CDF

    万次阅读 多人点赞 2016-06-15 13:15:18
    PDF:概率密度函数(probability density function), 在数学,连续型随机变量的概率密度函数(在至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。...
  • 在很多场景的计算,最终得到的数值例如123.45678,要截取2位小数得到123.45,而不是默认的四舍五入方法得到123.46,如何...小数点后取2位(四舍五不入)的方法 方法一: 一.小数点后取2位(四舍五入...
  • 先验概率、后验概率以及共轭先验

    万次阅读 多人点赞 2016-05-11 22:24:35
    在贝叶斯学派的观点,先验概率、后验概率以及共轭先验的概念非常重要。而在机器学习,我们阅读很多资料时也要频繁地跟他们打交道。所以理清这些概念很有必要。本文将通过几个例子详细解释关于先验概率、后验概率...
  • 在本节,我们将给出一组概率假设,在此假设下,最小二乘回归是一种非常自然的算法。 让我们假设目标变量和输入是通过下面的方程关联的 上面的是误差项,用于考虑建模时忽略的变量所产生的影响( 比如可能某些...
  • 概率算法

    千次阅读 2013-11-02 17:03:02
     随机数在概率算法设计扮演着十分重要的角色。在现实计算机上无法产生真正的随机数,因此在概率算法使用的随机数都是一定程度上随机的,即伪随机数。 线性同余法是产生伪随机数的最常用的方法。由线性同余法...
  • 博饼过程概率

    千次阅读 2014-02-24 11:15:47
    博饼过程概率  又是一年中秋,博饼骰子声传遍大街小巷。这是厦门的一道独特的风景线。常常听到同事朋友在争论博饼到底哪个更难博,有说四进的,也有说对堂的。咱是工科出身,做的又是统计分析,当然喜欢拿...
  • 先验概率的估计相对来说比较简单,一般有两种方法,其一可以用训练数据各类出现的频率来估计得到;其二可以依靠经验,不管哪种方法都不会很难,而对于类条件概率密度来说,估计往往会难得多,因此对于它的估计会是...
  • 游戏的随机概率

    千次阅读 2018-01-22 20:19:36
    许多玩家在抽卡时抱怨脸黑,很难抽到所需要的卡牌,而又有一部分玩家反应运气好能连着抽到紫卡,检查了下随机相关逻辑代码,并没有找出问题所在,玩家运气好与坏只是觉得真有可能是概率原因。 测试开服了几天之后...
  • 03 图模型推理算法  这节了解一下概率图模型的推理算法(Inference algorithm),也就是如何求边缘概率(marginalization probability)。...准确推理就是通过把分解的式子相干的变量积分掉(离散的就是求
  • 面试概率题目

    千次阅读 多人点赞 2019-08-12 08:59:39
    现在的面试,大部分公司都会问道概率相关的问题,我们现在给出几道常见的概率问题. 1. 三角形问题 题目: 给你一根铅笔,将铅笔折两次,组成三角形的概率是多大. 解析: 设: 铅笔长度是1, 折两次之后,得到三条边,对应...
  • 总结:这章由雇佣问题引出了概率分析和随机算法。概率分析一般用于确定一些算法的运行时间。而随机化算法用来强行使算法的输入符合某种概率分布,随机... 引理:给定样本空间S和S的事件A,令XA=I{A},则E[XA]=Pr{A}
  • 周的第十题: 巷子呈直线,长L0 = 400 m,艾波宁宁宁以v0 = 4 m/s 初速等速穿越。士兵时时  刻刻瞄准她;第t 秒时是否击中她,是随时间t 的均匀的泊松事件(Poisson process),且  与距离离无关。其中,平均每...
  • 可以用它来理解条件概率、先后验概率、全概率公式和贝叶斯公式,非常划算。 大概是一个这样的问题:有一个信号的发射端和接收端。发射端只发射A、B两种信号,其中发射信号A的概率为0.6,发射信号B的概率为0.4。当...
  • 概率图模型是机器学习的一个分支,它研究如何使用概率分布来描述世界,并对其进行有用的预测。 了解概率模型有多个理由。 首先,它是一个迷人的科学领域,有着美丽的理论,以惊人的方式将两种截然不同的数学分支...
  • 概率分布的cdf,pdf, pmf

    千次阅读 2018-06-25 12:56:42
    概念解释PDF:概率密度函数(probability density function), 在数学,连续型随机变量的概率密度函数(在至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的...
  • 概率密度函数是概率论的核心概念之一,用于描述连续型随机变量所服从的概率分布。 从随机事件说起 回忆我们在学习概率论时的经历,随机事件是第一个核心的概念,它定义为可能发生也可能发生的事件,因此是否发生...
  • 十四)Merton模型与KMV模型预测违约概率

    万次阅读 多人点赞 2020-05-07 16:15:29
    Merton模型将违约概率与期权定价公式结合,PD=N(-d2);KMV模型在Merton模型的基础上提出了违约距离dd的概念,并且将债务价值改进为违约实施点,期望违约概率EDF=N(-dd),dd是一个很好的相对指标。
  • 机器学习的数学:概率统计

    千次阅读 2019-10-16 23:30:03
    详解 6 大核心板块:概率思想、随机变量、统计推断、随机过程、采样理论、概率模型,筑牢机器学习核心基础。 教你熟练使用 Python 工具库:依托 NumPy、SciPy、Matplotlib、Pandas 工具,无缝对接工程实践。 有理论...
  • 排列的任何一个,每种都以相等的概率出现。 随机算法 在许多情况下,我们对输入分布知识知之甚少;即使知道关于输入分布的某些信息,也无法对这种分布建立模型。然而通过使一个算法的某些部分的行为...
  • 四、贝叶斯网络 原文:Bayesian ... 建立一个好的模型并容易:我们在介绍看到,垃圾邮件分类的朴素模型需要我们指定一些参数,这些参数对于英文单词数量是指数级的! 在本章中,我们将了解避免这类复...
  • 深度分析游戏的随机概率

    千次阅读 2017-10-30 14:50:06
    许多玩家在抽卡时抱怨脸黑,很难抽到所需要的卡牌,而又有一部分玩家反应运气好能连着抽到紫卡,检查了下随机相关逻辑代码,并没有找出问题所在,玩家运气好与坏只是觉得真有可能是概率原因。 测试开服了几天...
  • 先验概率、后验概率、似然函数

    万次阅读 2016-10-06 19:11:38
    直接看我这篇文章更清楚 ...问题的"因"出现的概率· 中文名 先验概率 外文名 prior probability 分 类 客观先验概率,主观先验概率 释 义 根据以往经验和分析得到的概率 又 ...
  • 赌博默示录概率

    千次阅读 2010-06-12 08:35:00
    简单介绍一下国王和奴隶的玩法,给没看过电影的童鞋们了解一下: 一共两套牌,每套张,国王一方有一张国王牌,4张市民牌;奴隶一方有一张奴隶牌,4张市民牌。 游戏规则是玩家双方各选择一套牌,...
  • 概率随机生成重复的数

    千次阅读 2015-11-26 18:01:30
    一、1到n n个数字随机全排序,或者说,随机生成1到n n个重复的数字 用空间换时间,需要空间复杂度为o(n),时间复杂度为o(n) 用一维数组顺序存储1到n这n个数字。 然后先在1到n随机生成一个下标,输出该下标对应的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 137,627
精华内容 55,050
关键字:

五不中概率