精华内容
下载资源
问答
  • 分布函数

    2018-08-07 15:08:58
    概率分布函数

    概率分布函数
    这里写图片描述

    展开全文
  • 如何简单理解概率分布函数和概率密度函数?

    万次阅读 多人点赞 2018-09-11 16:56:19
    本篇文章是在《应该如何理解概率分布函数和概率密度函数?》的基础上整理来的。非常感谢原作者。 目录 1先从离散型随机变量和连续性随机变量说起 2离散型随机变量的概率函数,概率分布和分布函数 2.1概率函数和...

    本篇文章是在《应该如何理解概率分布函数和概率密度函数?》的基础上整理来的。非常感谢原作者。

    目录

    1 先从离散型随机变量和连续性随机变量说起

    2 离散型随机变量的概率函数,概率分布和分布函数

    2.1 概率函数和概率分布

    2.1.1 概率函数

    2.1.1 概率分布

    2.2 分布函数

    3 连续型随机变量的概率函数和分布函数

    4 参考文献


     

    1 先从离散型随机变量和连续性随机变量说起

    对于如何分辨离散型随机变量和连续性随机变量,在贾俊平老师的《统计学》教材中,给出了这样的区分:

    如果随机变量的值都可以逐个列举出来,则为离散型随机变量。如果随机变量X的取值无法逐个列举则为连续型变量。

    进一步解释,离散型随机变量是指其数值只能用自然数或整数单位计算的则为离散变量。例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得。反之,在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。例如,生产零件的规格尺寸,人体测量的身高,体重,胸围等为连续变量,其数值只能用测量或计量的方法取得。

    形象点来解释::

    画一幅画,左边是梯子,右边是斜坡。
    像梯子一样能说出有多少层的,可描述的,是离散型随机变量;
    像斜坡一样不能说出有多少层阶梯,不可描述的,是连续性随机变量。
    需要注意的是,实际操作中梯子的阶高可能很小,看起来很像斜坡,需要放大看。

    2 离散型随机变量的概率函数,概率分布和分布函数

    在理解概率分布函数和概率密度函数之前,我们先来看看概率函数和概率分布是咋回事。

    为什么我们花这么大的力气去研究这个概念。因为它实在太重要了,为什么呢?在这里,直接引用陈希孺老师在他所著的《概率论与数理统计》这本书中说的:

    研究一个随机变量,不只是要看它能取哪些值,更重要的是它取各种值的概率如何!

    这句是本文的核心内容,本文的所有概念,包括概率密度,概率分布,概率函数,都是在描述概率!

    2.1 概率函数和概率分布

    2.1.1 概率函数

    概率函数,就是用函数的形式来表达概率。

    pi=P(X=ai)(i=1,2,3,4,5,6)

    在这个函数里,自变量(X)是随机变量的取值,因变量(pi)是取值的概率。它就代表了每个取值的概率,所以顺理成章的它就叫做了X的概率函数。从公式上来看,概率函数一次只能表示一个取值的概率。比如P(X=1)=1/6,这代表用概率函数的形式来表示,当随机变量取值为1的概率为1/6,一次只能代表一个随机变量的取值。

    2.1.1 概率分布

    接下来讲概率分布,顾名思义就是概率的分布,这个概率分布还是讲概率的。我认为在理解这个概念时,关键不在于“概率”两个字,而在于“分布”这两个字。为了理解“分布”这个词,我们来看一张图。

                                                                     离散型随机变量的值和概率的分布列表

    在很多教材中,这样的列表都被叫做离散型随机变量的“概率分布”。其实严格来说,它应该叫“离散型随机变量的值分布和值的概率分布列表”,这个名字虽然比“概率分布”长了点,但是肯定好理解了很多。因为这个列表,上面是值,下面是这个取值相应取到的概率,而且这个列表把所有可能出现的情况全部都列出来了!

    举个例子吧,一颗6面的骰子,有1,2,3,4,5,6这6个取值,每个取值取到的概率都为1/6。那么你说这个列表是不是这个骰子取值的”概率分布“?

    长得挺像的,上面是取值,下面是概率,这应该就是骰子取值的“概率分布”了吧!大错特错!少了一个最重要的条件!对于一颗骰子的取值来说,它列出的不是全部的取值,把6漏掉了!

    2.2 分布函数

    说完概率分布,就该说说分布函数了。这个分布函数是个简化版的东西!全名应该叫概率分布函数

    看看下图中的分布律,这里的分布律明明就是我们刚刚讲的“概率函数”,完全就是一个东西。但是我知道很多教材就是叫分布律的。

                                                                    概率分布函数就是把概率函数累加

    我们来看看图上的公式,其中的F(x)就代表概率分布函数啦。这个符号的右边是一个长的很像概率函数的公式,但是其中的等号变成了小于等于号的公式。你再往右看看,这是一个一个的概率函数的累加!

    发现概率分布函数的秘密了吗?它其实根本不是个新事物,它就是概率函数取值的累加结果!所以它又叫累积概率函数!

    概率函数和概率分布函数就像是一个硬币的两面,它们都只是描述概率的不同手段!


    3 连续型随机变量的概率函数和分布函数

    连续型随机变量的“概率函数”换了一个名字,叫做“概率密度函数”。

    为啥要这么叫呢?我们还是借用大师的话来告诉你,在陈希孺老师所著的《概率论与数理统计》这本书中,

    如果这么解析你还是不太懂的话,看看下面的这个公式:

    概率密度函数用数学公式表示就是一个定积分的函数,定积分在数学中是用来求面积的,而在这里,你就把概率表示为面积即可!

    左边是F(x)连续型随机变量分布函数画出的图形,右边是f(x)连续型随机变量的概率密度函数画出的图像,它们之间的关系就是,概率密度函数是分布函数的导函数

    两张图一对比,你就会发现,如果用右图中的面积来表示概率,利用图形就能很清楚的看出,哪些取值的概率更大!所以,我们在表示连续型随机变量的概率时,用f(x)概率密度函数来表示,是非常好的!

    但是,可能读者会有这样的问题:

    Q:概率密度函数在某一点的值有什么意义?

    A:比较容易理解的意义,某点的 概率密度函数 即为 概率在该点的变化率(或导数)。很容易误以为 该点概率密度值 为 概率值.

    比如: 距离(概率)和速度(概率密度)的关系.

    • 某一点的速度, 不能以为是某一点的距离
    • 没意义,因为距离是从XX到XX的概念
    • 所以, 概率也需要有个区间.
    • 这个区间可以是x的邻域(可以无限趋近于0)。对x邻域内的f(x)进行积分,可以求得这个邻域的面积,就代表了这个邻域所代表这个事件发生的概率。

    4 参考文献

    【1】https://www.jianshu.com/p/b570b1ba92bb

    【2】https://www.zhihu.com/question/23237834

     


     

     

     

    展开全文
  • 文章目录二元随机变量分布函数、边际分布函数及条件分布函数联合分布函数分布函数 F(x,y)F(x, y)F(x,y) 的性质边际分布函数条件分布函数 二元随机变量分布函数、边际分布函数及条件分布函数 联合分布函数 定义: ...

    二元随机变量分布函数、边际分布函数及条件分布函数


    联合分布函数


    定义:(X,Y)(X,Y) 是二元随机变量,对于任意实数 x,yx, y,二元函数

    F(x,y)=P{(Xx)(Yy)}=记成P(Xx,Yy) F(x,y)=P\{(X\leq x) \bigcap (Y\leq y)\} \overset{\text{记成}}{=}P(X\leq x,Y\leq y)

    称为二元随机变量 (X,Y)(X, Y)联合分布函数


    例 1: 设随机变量 XX 在 1、2、3、4 四个整数中等可能地取一个值,随机变量 YY1X1\sim X 中等可能地取一个整数值,求 F(3.5,2)F(3.5, 2).

    解: XYX、Y 的取值情况均为 1,2,3,4;当 i,j=1,,4i,j=1,\cdots,4

    P(X=i,Y=j)=P(X=i)P(Y=jX=i)={14×1i,ij14×0,i<jP(X=i,Y=j)=P(X=i)P(Y=j|X=i)=\begin{cases} \cfrac{1}{4}\times\cfrac{1}{i}, &i\geq j \\ \\ \cfrac{1}{4} \times 0, &i<j \end{cases}

    联合概率分布律如下:

    XY12341140002181800311211211204116116116116 \begin{array}{c|cc} _X\bcancel{\quad^Y} & 1 & 2 & 3 & 4 \\ \hline 1 & \cfrac{1}{4} & 0 & 0 & 0 \\ \\ 2 & \cfrac{1}{8} & \cfrac{1}{8} & 0 & 0 \\ \\ 3 & \cfrac{1}{12} & \cfrac{1}{12} & \cfrac{1}{12} & 0 \\ \\ 4 & \cfrac{1}{16} & \cfrac{1}{16} & \cfrac{1}{16} & \cfrac{1}{16} \end{array}

    F(3.5,2)=P(X3.5,Y2)F(3.5, 2) = P(X\leq 3.5, Y\leq 2)

    =14+0+18+18+112+112=23=\cfrac{1}{4} + 0 + \cfrac{1}{8} + \cfrac{1}{8} + \cfrac{1}{12} + \cfrac{1}{12} = \cfrac{2}{3}

    一般得:
    F(x,y)=P(Xx,Yy)=xix,yjyP(X=xi,Y=yj)F(x,y) = P(X\leq x, Y\leq y)=\sum_{x_i\leq x, y_j\leq y} P(X=x_i, Y=y_j)

    二元离散型随机变量概率分布

    image.png

    F(x,y)={0,x<1y<11/4,1x<2,y12/3,3x<4,2y<31,x4,y4 F(x,y)= \begin{cases} 0, & x<1 或 y<1 \\ 1/4, &1\leq x < 2, y\geq 1 \\ \quad & \quad \cdots \\ \color{lime}{2/3,} & \color{lime}{3 \leq x < 4, 2 \leq y < 3} \\ \quad & \quad \cdots \\ 1, & x\geq 4, y\geq 4 \end{cases}

    分布函数 F(x,y)F(x, y) 的性质


    1. F(x,y)F(x,y) 关于 x,yx, y 单调不减, 即:

        x1<x2    F(x1,y)F(x2,y)\quad \,\,\,\, x_1 < x_2 \implies F(x_1,y)\leq F(x_2,y)

        y1<y2    F(x,y1)F(x,y2)\quad \,\,\,\, y_1 < y_2 \implies F(x,y_1)\leq F(x,y_2)

    分布函数1.jpg\quad \quad \quad \quad分布函数2.jpg

    1. 0F(x,y)1,F(+,+)=10\leq F(x,y) \leq 1, F(+\infty, +\infty)=1

        \quad \,\,\,\, 对任意 xxyy 有:

        F(,y)=F(x,)=F(,)=0\quad \,\,\,\, F(-\infty, y)=F(x,-\infty)=F(-\infty,-\infty)=0

    1. F(x,y)F(x,y) 关于 x,yx,y 右连续,即:

    limϵ0+F(x+ϵ,y)=F(x,y)以及limϵ0+F(x,y+ϵ)=F(x,y) \lim_{\epsilon\to 0^{+}} F(x+\epsilon, y) = F(x,y) \quad \text{以及} \quad \lim_{\epsilon\to 0^{+}} F(x, y+\epsilon) = F(x,y)

    1. x1<x2,y1<y2x_1 < x_2, y_1<y_2,则有

        P(x1<Xx2,y1<Yy2)=F(x2,y2)F(x2,y1)F(x1,y2)+F(x1,y1)0\quad \,\,\,\, P(x_1<X\leq x_2, y_1<Y\leq y_2)=F(x_2,y_2)-F(x_2,y_1)-F(x_1,y_2)+F(x_1,y_1)\geq 0

    分布函数3.jpg

    边际分布函数


    二元随机变量 (X,Y)(X,Y)作为整体,有其联合分布函数 F(x,y)F(x,y)XXYY 也有它们自己的分布函数,分别记为:FX(x),FY(y)F_X(x),F_Y(y),并称他们为边际分布函数

    FX(x)=F(x,+)=limyF(x,y)FY(y)=F(+,y)=limxF(x,y) \begin{aligned} & F_X(x) = F(x,+\infty) = \lim_{y\to \infty}F(x,y) \\ & F_Y(y) = F(+\infty, y) = \lim_{x\to \infty}F(x,y) \end{aligned}

    即在分布函数 F(x,y)F(x,y) 中,令 y+y\to +\infty,就能得到 FX(x)F_X(x)FY(y)F_Y(y)同理


    例 2:(X,Y)(X,Y) 的分布函数

    F(x,y)={1e0.5xe0.5y+e0.5(x+y),x0,y00,其他 F(x,y)= \begin{cases} 1-e^{-0.5x}-e^{-0.5y}+e^{-0.5(x+y)}, &x\leq 0, y\leq 0 \\ \quad \quad \quad \quad 0, & \text{其他} \end{cases}

    XX 的边际分布函数 FX(x)F_X(x)

    解:
    FX(x)=F(x,+)=limy+F(x,y)={limy+(1e0.5xe0.5y+e0.5(x+y)),x00,x<0={1e0.5x,x00,x<0 \begin{aligned} F_X(x) &=F(x,+\infty)=\lim_{y\to +\infty}F(x,y) \\ &=\begin{cases} \lim_{y\to +\infty}(1-e^{-0.5x}-e^{-0.5y}+e^{-0.5(x+y)}), & x\geq 0 \\ \\ 0, & x<0 \end{cases} \\ &=\begin{cases} 1-e^{-0.5x}, & x\geq 0 \\ 0, & x<0 \end{cases} \end{aligned}

    条件分布函数


    定义:P(Y=y)>0P(Y=y)>0,则在 Y=yY=y 条件下,XX 的条件分布函数为:

    FXY(xy)=P(XxY=y)=P(Xx,Y=y)P(Y=y) F_{X|Y}(x|y) = P(X\leq x|Y=y)=\cfrac{P(X\leq x, Y=y)}{P(Y=y)}

    YY 位离散型随机变量,就可满足 P(Y=y)>0P(Y=y)>0,但当 YY 为连续型随机变量时,显然 P(Y=y)=0P(Y=y)=0,所以这时不能这样定义条件分布函数。

    P(Y=y)=0P(Y=y)=0,但对任一 ϵ>0,P(y<Yy+ϵ)>0\epsilon > 0, P(y<Y\leq y+\epsilon)>0,则在 Y=yY=y 条件下, XX 的条件分布函数定义为:

    FXY(xy)=limϵ0+P(Xxy<Yy+ϵ)=limϵ0+P(Xx,y<Yy+ϵ)P(y<Yy+ϵ) \begin{aligned} F_{X|Y}(x|y) &= \lim_{\epsilon\to 0^{+}}P(X\leq x|y<Y\leq y+\epsilon) \\ &=\lim_{\epsilon\to 0^{+}}\cfrac{P(X\leq x,y<Y\leq y+\epsilon)}{P(y<Y\leq y+\epsilon)} \end{aligned}

    此时,仍记为 P(XxY=y)P(X\leq x|Y=y)

    即:FXY(xy)=P(XxY=y)F_{X|Y}(x|y) = P(X\leq x|Y=y)


    例 3:

    FX(x)={0,x<10.3,1x<21,x2,FY(y)={0,y<00.4,0y<11,y1, F_X(x)= \begin{cases} 0, & x<1 \\ 0.3, &1\leq x<2 \\ 1, & x\geq 2 \end{cases},\quad F_Y(y)= \begin{cases} 0, &y<0 \\ 0.4, &0\leq y<1 \\ 1, &y\geq 1 \end{cases},

    P(X=1,Y=0)=0.1P(X=1,Y=0)=0.1,求

    (1)联合分布律;

    (2)当 Y=0Y=0 时,XX 的条件分布律 P(X=kY=0)P(X=k|Y=0)

    (3) Y=0Y=0 时, XX 的条件分布函数。

    解: (1) 由分布函数知,这两个变量是离散型的,分布律先写在联合分布律表中。注意:P(X=x0)=F(x0)F(x00)P(X=x_0)=F(x_0)-F(x_0-0)

    XY01pi10.10.20.320.30.40.7pj0.40.6 \begin{array}{c|cc|c} _X\bcancel{\quad^Y} & 0 & 1 & p_{i\cdot} \\ \hline 1 & 0.1 & \color{fuchsia}{0.2} & \color{red}{0.3} \\ 2 & \color{fuchsia}{0.3} & \color{fuchsia}{0.4} & \color{red}{0.7}\\ \hline p_{\cdot j} & \color{red}{0.4} & \color{red}{0.6} & \end{array}

    (2)P(X=kY=0)=P(X=k,Y=0)P(Y=0)=P(X=k,Y=0)0.4,k=1,2P(X=k|Y=0)=\cfrac{P(X=k,Y=0)}{P(Y=0)}=\cfrac{P(X=k,Y=0)}{0.4}, \, k=1,2

    X12P(X=kY=0)0.250.75 \begin{array}{c|cc} X & 1 & 2 \\ \hline P(X=k|Y=0) & 0.25 & 0.75 \end{array}

    (3)
    FXY(x0)=P(XxY=0)={0,x<10.25,1x<21,x2 \begin{aligned} F_{X|Y}(x|0)&=P(X\leq x|Y=0) \\ &=\begin{cases} 0, & x<1 \\ 0.25, & 1\leq x < 2 \\ 1, & x\geq 2 \end{cases} \end{aligned}

    展开全文
  • R语言的各种分布函数

    万次阅读 多人点赞 2017-09-23 16:36:46
    R语言的各种分布函数: 至于具体的用法了,大家可以使用help命令,根据实际情况来进行使用 R提供工具来计算累计分布函数p(cummulative distribution function CDF),概率密度函数d和分位数函数q,另外...

    R语言的各种分布函数:

     

    至于具体的用法了,大家可以使用help命令,根据实际情况来进行使用




     



     

     

    R提供工具来计算累计分布函数p(cummulative distribution function CDF),概率密度函数d和分位数函数q,另外在各种概率分布前加r表示产生随机序列

    (R这种直接在分布前面加前缀的语法太难读了,pt() 误以为还是一个函数,实际上的含义是p(t()),为什么不写成这个格式呢? 不过t()返回什么好...)


    常见概率分布

     

    离散型


     

    1.二项分布Binomial distribution:binom

    二项分布指的是N重伯努利实验,记为X ~ b(n,p),E(x)=np,Var(x)=np(1-p)

    pbinom(q,size,prob), q是特定取值,比如pbinom(8,20,0.2)指第8次伯努利实验的累计概率。size指总的实验次数,prob指每次实验成功发生的概率

    dbinom(x,size,prob), x同上面的q同含义。dfunction()对于离散分布来说结果是特定值的概率,对连续变量来说是密度(Density)

    rbinom(n, size, prob),产生n个b(size,prob)的二项分布随机数

    qbinom(p, size, prob),quantile function 分位数函数。

    分位数:

    若概率0<p<1,随机变量X或它的概率分布的分位数Za。是指满足条件p(X>Za)=α的实数。如t分布的分位数表,自由度f=20和α=0.05时的分位数为1.7247。 --这个定义指的是上侧α分位数

    α分位数:

    实数α满足0 <α<1 时,α分位数是使P{X< xα}=F(xα)=α的数xα

    双侧α分位数是使P{X<λ1}=F(λ1)=0.5α的数λ1、使 P{X>λ2}=1-F(λ2)=0.5α的数λ2。

    qbinom是上侧分位数,如qbinom(0.95,100,0.2)=27,指27之后P(x>=27)>=0.95。即对于b(100,0.2)为了达到0.95的概率至少需要27次重复实验。


     


    2.负二项分布negative binomial distribution (帕斯卡分布)nbinom

    掷骰子,掷到一即视为成功。则每次掷骰的成功率是1/6。要掷出三次一,所需的掷骰次数属于集合 { 3, 4, 5, 6, ... } 。掷到三次一的掷骰次数是负二项分布的随机变量。

    dnbinom(4,3,1/6)=0.0334898,四次连续三次1的概率为这个数。

    概率函数为f(k;r,p)=choose(k+r-1,r-1)*p^r*(1-p)^k, 当r=1时这个特例分布是几何分布

    rnbinom(n,size,prob,mu) 其中n是需要产生的随机数个数,size是概率函数中的r,即连续成功的次数,prob是单词成功的概率,mu未知..(mu是希腊字母υ的读音)


    3.几何分布Geometric Distribution,geom

    n次伯努利试验,前n-1次皆失败,第n次才成功的机率

    dgeom(x,prob),注意这里的x取值是0:n,即dgeom(0,0.2)=0.2,以上的二项分布和负二项分布也是如此。

    ngeom(n,prob)


    4.超几何分布Hypergeometric Distribution,hyper

    它描述了由有限个(m+n)物件中抽出k个物件,成功抽出指定种类的物件的次数(不归还)。

    概率:p(x) = choose(m, x) choose(n, k-x) / choose(m+n, k) for x = 0, ..., k. 

     

    当n=1时,这是一个0-1分布即伯努利分布,当n接近无穷大∞时,超几何分布可视为二项分布

    rhyper(nn,m,n,k),nn是需要产生的随机数个数,m是白球数(计算目标是取到x个白球的概率),n是黑球数,k是抽取出的球个数

    dhyper(x, m, n, k)



    5.泊松分布 Poisson Distribution,pois

     

    p(x) = lambda^x exp(-lambda)/x!

    for x = 0, 1, 2, .... The mean and variance are E(X) = Var(X) = λ.  x ~ π(λ)

    泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率.泊松分布适合于描述单位时间内随机事件发生的次数。如某一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数等等.

    rpois(n, lambda)

    dpois(x,lambda)


    连续型

     

    6.均匀分布 Uniform Distribution,unif

    f(x) = 1/(max-min) for min <= x <= max. 

     

    runif(n,min,max).

    生成16位数的随机数:as.character(runif(1,1000000000000000,9999999999999999))

    dunif(x,min,max)=1,恒定等于1/(max-min).

    对于连续变量,dfunction的值是x去特定值代入概率密度函数得到的函数值。


    7.正态分布Normal Distribution,norm

    f(x) = 1/(sqrt(2 pi) sigma) e^-((x - mu)^2/(2 sigma^2)) 

    其中mu是均值,sigma是standard deviation标准差

    理论上可以证明如果把许多小作用加起来看做一个变量,那么这个变量服从正态分布

    rnorm(n,mean=0,sd=1)后两个参数如果不填则默认为0,1。

    dnorm(x,mean,sd),sd是标准差。

    画出正态分布概率密度函数的大致图形:

    x<-seq(-3,3,0.1)

    plot(x,dnorm(x)) plot中的x,y要有相关关系才会形成函数图。

    qnorm(p,mean,sd),这个还是上侧分位数,如qnorm(0.05)=-1.644854,即x<=这个数的累计概率小于0.05

     

    3sigma法则:对于正态分布的x,x取值在(mean-3sd,mean+3sd)几乎是在肯定的。

    因为pnorm(3)-pnorm(-3)=0.9973002

     

    用正太分布产生一个16位长的随机数字:

    as.character(10^16*rnorm(1))



    8.伽玛分布Gamma Distribution,gamma

    http://zh.wikipedia.org/w/index.php?title=伽玛分布&variant=zh-cn

     

    假设随机变量X为 等到第α件事发生所需之等候时间。

     

    f(x)= 1/(s^a Gamma(a)) x^(a-1) e^-(x/s) for x >= 0, a > 0 and s > 0.

     

    Gamma分布中的参数α,称为形状参数(shape parameter),即上式中的s,β称为尺度参数(scale parameter)上式中的a

    E(x)=s*a, Var(x)=s*a^2. 当shape=1/2,scale=2时,这样的gamma分布是自由度为1的开方分布

     

    http://zh.wikipedia.org/wiki/File:Gamma_distribution_pdf.png

     

    dgamma(x,shape,rate=1,scale=1/rate), 请注意R在这里提供的rate是scale尺度参数的倒数,如果dgamma(0,1,2)则表示dgamma(0,shape=1,rate=2),而非dgamma(0,shape=1,scale=2)

    pgamma(q, shape, rate = 1, scale = 1/rate, lower.tail = TRUE,

           log.p = FALSE)

    qgamma(p, shape, rate = 1, scale = 1/rate, lower.tail = TRUE,

           log.p = FALSE)

    rgamma(n, shape, rate = 1, scale = 1/rate)


    9.指数分布Exponential Distribution,exp

    指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等等。

     

    记作X ~ Exponential(λ)。

     

    f(x) = lambda e^(- lambda x) for x >= 0. 

     

    其中lambda λ > 0是分布的一个参数,常被称为率参数(rate parameter). E(x)=1/λ,Var(x)=1/λ^2

     

    dexp(x, rate = 1, log = FALSE)

    pexp(q, rate = 1, lower.tail = TRUE, log.p = FALSE)

    qexp(p, rate = 1, lower.tail = TRUE, log.p = FALSE)

    rexp(n, rate = 1)

    假设在公交站台等公交车平均10分钟有一趟车,那么每小时候有6趟车,即每小时出现车的次数~ Exponential(1/6)

    我们可以产生10个这些随机数看看rexp(10,1/6)

    60/(rexp10,1/6)即为我们在站台等车的随机时间,如下:

     [1]  6.443148 24.337131  6.477096  2.824638 15.184945 14.594903

     [7]  7.133842  8.222400 42.609784 15.182827

    可以看见竟然有一个42.6分钟的随机数出现,据说这种情况下你可以投诉上海的公交公司。

    不过x符合指数分布,1/x还符合指数分布吗?

    pexp(6,1/6)=0.6321206, 也就是说这种情况下只有37%的可能公交车会10分钟以内来。

    按照以上分析一个小时出现的公交车次数应该不符合指数分布。


    10.卡方分布(non-central)Chi-Squared Distribution,chisq

    它广泛的运用于检测数学模型是否适合所得的数据,以及数据间的相关性。数据并不需要呈正态分布

    k个标准正态变量的平方和即为自由度为k的卡方分布。

    E(x)=k,Var(x)=2k.

     

    dchisq(x, df, ncp=0, log = FALSE)

    pchisq(q, df, ncp=0, lower.tail = TRUE, log.p = FALSE)

    qchisq(p, df, ncp=0, lower.tail = TRUE, log.p = FALSE)

    rchisq(n, df, ncp=0)

    其中df为degrees of freedom。ncp是non-centrality parameter (non-negative).ncp=0时是central卡方分布,ncp不为0时,表示这个卡方分布是由非标准正态分布组合而成,ncp=这些正态分布的均值的平方和。



    11.β分布Beta Distribution,beta

    变量x仅能出现于0到1之间。

    空气中含有的气体状态的水分。表示这种水分的一种办法就是相对湿度。即现在的含水量与空气的最大含水量(饱和含水量)的比值。我们听到的天气预告用语中就经常使用相对湿度这个名词。

    相对湿度的值显然仅能出现于0到1之间(经常用百分比表示)。冬季塔里木盆地的日最大相对湿度和夏季日最小相对湿度。证实它们都符合贝塔分布

    dbeta(x, shape1, shape2, ncp = 0, log = FALSE)

    pbeta(q, shape1, shape2, ncp = 0, lower.tail = TRUE, log.p = FALSE)

    qbeta(p, shape1, shape2, ncp = 0, lower.tail = TRUE, log.p = FALSE)

    rbeta(n, shape1, shape2, ncp = 0)

    shape1,shape2是beta分布的两个参数。E(x)=s1/(s1+s2),var(x)=s1*s2/(s1+s2)^2 * (s1+s2+1)


    12.t分布Student t Distribution,t

    应用在当对呈正态分布的母群体的均值进行估计。当母群体的标准差是未知的但却又需要估计时,我们可以运用学生t 分布。

    学生t 分布可简称为t 分布。其推导由威廉·戈塞于1908年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生(Student)这一笔名。之后t 检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为学生分布。

    dt(x, df, ncp, log = FALSE)

    pt(q, df, ncp, lower.tail = TRUE, log.p = FALSE)

    qt(p, df, ncp, lower.tail = TRUE, log.p = FALSE)

    rt(n, df, ncp)

    其中df是自由度,ncp是non-centrality parameter delta,If omitted, use the central t distribution。ncp出现时表示分布由非标准的卡方分布构成。


    13.F分布

    一个F-分布的随机变量是两个卡方分布变量的比率。F-分布被广泛应用于似然比率检验,特别是方差分析中

    df(x, df1, df2, ncp, log = FALSE)

    pf(q, df1, df2, ncp, lower.tail = TRUE, log.p = FALSE)

    qf(p, df1, df2, ncp, lower.tail = TRUE, log.p = FALSE)

    rf(n, df1, df2, ncp)

    df1,df2是两个自由度,ncp同t分布中的ncp。

     

     

     

    展开全文
  • 累积分布函数(Cumulative Distribution Function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。一般以大写CDF标记,,与概率密度函数probability density function(小写pdf)相对。...
  • 累计分布函数与互补累计分布函数

    千次阅读 2018-08-14 15:03:51
    累积分布函数(Cumulative Distribution Function,CDF),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。一般以大写CDF标记,,与概率密度函数probability density function(小写pdf)...
  • 累积分布函数(Cumulative Distribution Function,CDF),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。一般以大写CDF标记,,与概率密度函数probability density function(小写pdf)...
  • 1. 联合分布函数 2. 联合分布函数示例 3. 二元离散型随机变量概率分布图 4.二元离散型随机变量分布函数的性质 5. 边际分布函数 6. 边际分布函数求解示例 7. 条件分布函数 ....
  • 概率函数 概率分布 分布函数

    千次阅读 2018-07-29 10:34:13
    先来讨论离散型随机变量的概率分布,概率函数,分布函数 概率函数:用函数的形式来表达概率(一次只能表示一个取值的概率) 概率分布:理解这个概念的重点在“分布”二字。下图可以表示的是:离散型随机变量的值...
  • 密度函数、分布律、分布函数

    千次阅读 2019-09-15 13:24:52
    密度函数、分布律、分布函数,傻傻分不清。 密度函数 连续随机变量:概率密度函数(PDF),简称密度函数。在某一区间上的积分来刻画随机变量落在这个区间中的概率。 分布律 离散型随机变量:概率质量函数(PMF)称作...
  • 均匀分布的概率密度函数和分布函数学习笔记1

    万次阅读 多人点赞 2017-08-25 17:18:06
    1. 两者的定义  概率密度函数:用于直观地描述连续性随机变量(离散型的随机变量下该函数称为分布律), ... 分布函数:用于描述随机变量落在任一区间上的概率。如果将x看成数轴上的随机点的坐标 ...
  • 正态分布函数(高斯函数)详解

    万次阅读 2019-05-16 16:50:32
    正态分布 ...2.正态分布函数曲线的性质: 3.正态分布的概率分布函数 概率分布函数是正态分布曲线的定积分,公式为: 正态分布曲线与x轴围成的面积是1(积分区间是负无穷到正无穷) 的值代表...
  • 经验分布函数理解

    万次阅读 多人点赞 2018-06-20 10:51:56
    1 正文简介(数学语言) 经验分布函数是与样本经验测度相关的分布函数。 该分布函数是在n个数据点中的每一个上都跳跃1 / n的阶梯函数。 其在测量变量的任何指定值处的值是小于或等于指定值的测量变量的观测值的数。...
  • 经验分布函数

    千次阅读 2019-12-18 21:58:21
    求X经验分布函数 【解 】: 把样本值按从小到大的顺序排列为 于是得经验分布函数为 说明 (1) 经验分布函数Fn(x)是一个阶梯形函数, 当样本容量增大时, 相邻两阶梯的跃度变低, 阶梯宽度变窄, 容易想像, 这样的阶.....
  • 随机变量的分布函数

    千次阅读 2019-09-20 11:03:35
    一、分布函数 1.1、分布函数定义 1.2、分布函数的用途 1.2、阶梯函数 1.2.1、例1 1.2.2、例2 1.3、F(x)的性质 1.3.1、例
  • 径向分布函数

    万次阅读 热门讨论 2018-10-14 17:22:15
    径向分布函数RDF实现算法 RDF实现算法 RDF是径向分布函数的Radical distribution function的缩写,指的是给定一个空间,在此空间以一个对象为中心,去寻找周围对象的的概率。对于分子模拟的径向分布函数实则也是求解...
  • 分布函数特点

    2020-06-21 10:02:26
    1.单调不减 2.x->-,F(x)=0 3.x->+,F(x)=1 所以,如果F(x)是分布函数,那么F(|x|)就不是分布函数,因为x趋近于负无穷大时,F=1,而F(x^3)可以是分布函数,因为符合上面的三点
  • 概率分布函数 概率密度函数

    千次阅读 2019-08-27 09:59:05
    离散型随机变量的概率分布 对于离散型随机变量,设 为变量X的取值,而 ...对于连续型随机变量,设变量X取值于区间(a,b),并假设其分布函数F(x)为单调增函数,且在 间可微分及其导数F’(x...
  • 一、CDF(cumulative distribution function)累积分布函数就是 分布函数,即概率密度函数的积分。 二、针对一组IOU值的CDF曲线:IOU值作为横坐标(从小到大),每个IOU值出现的概率等于IOU值出现的个数除于总个数...
  • 概率论 各种分布及其期望、方差、分布函数

    万次阅读 多人点赞 2017-12-29 23:13:15
    概率论 各种分布及其期望、方差、分布函数 (0-1)分布 二项分布 X~b(n,p) 泊松分布 X~π(λ)π(λ)\pi(\lambda) 均匀分布 X~U(a,b) 指数分布 正态/高斯分布 X~N(μ,σ2μ,σ2\mu,\sigma^2) ——————————...
  • 2、概率统计:统计是根据数据(一组数据),根据分布模型(比如正态分布),可以得到一个带参数的分布模型(比如mu和theda),然后根据这个分布模型,去求解发生某个时间的概率,需要查询分布函数图。这就需要知道...
  • 逆累计分布函数

    千次阅读 2019-08-05 20:50:45
    累计分布函数(CDF)是概率分布函数(PDF)的积分。这很好理解。 逆累计分布函数(ICDF)简单地说,是累计分布函数的反函数。 CDF:已知横轴(某一事件)求纵轴(概率); ICDF:已知纵轴(概率)求横轴(某一事件...
  • 正态分布函数

    2019-09-23 02:04:29
    1)使用MatLab画出正态分布的概率密度...%正态分布函数。figure;axes1=axes('Pos',[0.1 0.1 0.85 0.85]);plot(x,y);set(axes1,'YLim',[-0.01 0.43],'XLim',[-3 3]); 图1: 2)验证概率密度函数在区间(-∞,∞)上的积...
  • 第二条曲线用了正态分布函数曲线进行拟合。 import numpy as np import pandas as pd import matplotlib.pyplot as plt datas = np.array([64.3, 65.0, 65.0, 67.2, 67.3, 67.3, 67.3, 67.3, 68.0, 68.0, 68.8, ...
  • 正态分布 密度函数与分布函数

    千次阅读 2013-01-06 15:55:53
    概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值在某一个确定的取值点附近的可能性的函数。 而随机变量的取值落某个点的概率 是零 落在在某个区域之内的... 物质的双体分布函数
  • 密度函数,特征函数和分布函数

    千次阅读 2018-08-16 23:09:00
    特征函数和 cdf(cumulative distribution function,也叫分布函数)一样提供了另外一种描述随机变量的方法:https://blog.csdn.net/lanchunhui/article/details/54618901 和 cdf 一样,能够完整地确定随机变量...
  • 泊松分布函数

    万次阅读 2018-02-08 11:06:13
    泊松分布函数
  • 条件分布函数(离散-条件分布律)

    千次阅读 2019-09-21 07:45:50
    一、分布函数定义 二、二元随机变量的分布函数 2.1、联合分布函数

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 24,088
精华内容 9,635
关键字:

分布函数