精华内容
下载资源
问答
  • 常见的离散分布和连续分布
    千次阅读
    2021-06-06 18:36:11

    一、离散型分布

    1.1 伯努利分布

    在一次试验中,事件 A A A出现的概率为 p p p,不出现的概率为 q = 1 − p q=1-p q=1p,若以 β \beta β记事件 A A A出现的次数,则 β \beta β 0 , 1 0, 1 0,1两值,相应的概率分布为 b k = P { β = k } = p k q 1 − k , k = 0 , 1 (1) b_k=P\{\beta=k\}=p^kq^{1-k}, k=0,1\tag1 bk=P{β=k}=pkq1k,k=0,1(1)
    这个分布称为伯努利分布,亦称为两点分布

    1.2 二项分布

    n n n重伯努利试验中,若以 μ \mu μ记作成功的次数,则它是一个随机变量, μ \mu μ可能取的值为 0 , 1 , 2 ⋯   , n 0,1,2\cdots,n 0,1,2,n,其对应的概率分布为 b ( k ; n , p ) = P { μ = k } = C n k p k q n − k , k = 0 , 1 , 2 ⋯   , n (2) b(k;n,p)=P\{\mu=k\}=C_n^kp^kq^{n-k}, k=0,1,2\cdots,n\tag2 b(k;n,p)=P{μ=k}=Cnkpkqnk,k=0,1,2,n(2)
    简记为 μ ∼ B ( n , p ) \mu\sim B(n,p) μB(n,p)

    1.3泊松分布

    若随机变量 ξ \xi ξ可取一切非负整数值,且 p { ξ = k } = λ k k ! e − λ , k = 0 , 1 , 2 ⋯ (3) p\{\xi=k\}=\frac{\lambda^k}{k!}e^{-\lambda}, k=0,1,2\cdots\tag3 p{ξ=k}=k!λkeλ,k=0,1,2(3)
    其中, λ > 0 \lambda\gt0 λ>0,则称 ξ \xi ξ服从泊松分布,简记为 ξ ∼ P ( λ ) \xi\sim P(\lambda) ξP(λ)

    1.4 几何分布

    在成功概率为 p p p的伯努利试验中,若以 η \eta η记成功首次出现时的试验次数,则 η \eta η为随机变量,它可能取的值为 1 , 2 , 3 ⋯ 1,2,3\cdots 1,2,3,其概率分布为 g ( k , p ) = P { η = k } = q k − 1 p , k = 1 , 2 , ⋯ (4) g(k,p)=P\{\eta=k\}=q^{k-1}p, k=1, 2, \cdots\tag4 g(k,p)=P{η=k}=qk1p,k=1,2,(4)
    简记为 η ∼ g ( k , p ) \eta\sim g(k,p) ηg(k,p)

    几何分布有一个重要的性质——无记忆性
    假定已知在前 m m m次试验中没有出现成功,那么为了达到首次成功还需要再等待的次数为 η ′ \eta^{'} η,其概率分布为 P { η ′ = k } = P { η = m + k ∣ η > m } = P { η = m + k } P { η > m } = q m + k − 1 p q m = q k − 1 p , k = 1 , 2 , ⋯ P\{\eta^{'}=k\}=P\{\eta=m+k|\eta\gt m\}=\frac{P\{\eta=m+k\}}{P\{\eta\gt m\}}=\frac{q^{m+k-1}p}{q^m}=q^{k-1}p, k=1,2,\cdots P{η=k}=P{η=m+kη>m}=P{η>m}P{η=m+k}=qmqm+k1p=qk1p,k=1,2,
    可见, η ′ \eta^{'} η的分布还是几何分布,即为了达到首次成功还需要再等待的次数与前面的失败次数无关。

    1.5 帕斯卡分布

    在成功概率为 p p p的伯努利试验中,若以 ζ \zeta ζ记第 r r r次成功出现时的试验次数,则 ζ \zeta ζ是随机变量,取值 r , r + 1 , ⋯ r, r+1, \cdots r,r+1,,其概率分布为帕斯卡分布: P { ζ = k } = C k − 1 r − 1 p r q k − r , k = r , r + 1 , ⋯ (5) P\{\zeta=k\}=C_{k-1}^{r-1}p^{r}q^{k-r},k=r,r+1,\cdots\tag 5 P{ζ=k}=Ck1r1prqkr,k=r,r+1,(5)

    二、连续型分布

    首先需要知道的是,连续型随机变量取个别值的概率为 0 0 0,即 P { ξ = c } = 0 P\{\xi=c\}=0 P{ξ=c}=0。在图型上,密度函数对各种分布的特征的显示要比分布函数优胜的多,因此它比分布函数更加常用。

    2.1 均匀分布

    a , b a, b a,b为有限数,由下列密度函数定义的分布称为 [ a , b ] [a,b] [a,b]上的均匀分布 p ( x ) = { 1 b − a , a ≤ x ≤ b 0 , x < a 或 x > b (6) p(x)=\begin{cases}\frac{1}{b-a}, &a\le x \le b\\ 0, &x\lt a或x\gt b \end{cases}\tag6 p(x)={ba1,0,axbx<ax>b(6)
    记作 U [ a , b ] U[a,b] U[a,b]

    2.2 正态分布

    密度函数为 p ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , − ∞ < x < ∞ (7) p(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}, -\infty\lt x\lt \infty\tag7 p(x)=2π σ1e2σ2(xμ)2,<x<(7)
    其中, σ > 0 \sigma\gt0 σ>0 μ \mu μ σ \sigma σ均为常数,这种分布称为正态分布,简记为 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)。特别的,当 μ = 0 , σ = 1 \mu=0, \sigma=1 μ=0,σ=1时,称为标准正态分布,记为 N ( 0 , 1 ) N(0,1) N(0,1),相应的密度函数和分布函数记为 φ ( x ) \varphi(x) φ(x) Φ ( x ) \Phi(x) Φ(x)

    可以验证,如果随机变量 ξ \xi ξ服从正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2),那么 ξ − μ σ \frac{\xi-\mu}{\sigma} σξμ服从 N ( 0 , 1 ) N(0,1) N(0,1)。而且 p { ∥ ξ − μ ∣ < σ } ≈ 68.27 % (8) p\{\|\xi-\mu|\lt\sigma\}\approx68.27\%\tag8 p{ξμ<σ}68.27%(8)
    p { ∥ ξ − μ ∣ < 2 σ } ≈ 95.45 % (9) p\{\|\xi-\mu|\lt2\sigma\}\approx95.45\%\tag9 p{ξμ<2σ}95.45%(9)
    p { ∥ ξ − μ ∣ < 3 σ } ≈ 99.73 % (10) p\{\|\xi-\mu|\lt3\sigma\}\approx99.73\%\tag{10} p{ξμ<3σ}99.73%(10)

    2.3 指数分布

    密度函数为 p ( x ) = { λ e − λ x , x ≥ 0 0 , x < 0 p(x)=\begin{cases} \lambda e^{-\lambda x}, &x\ge0\\ 0, &x\lt0 \end{cases} p(x)={λeλx,0,x0x<0,分布函数为 F ( x ) = { 1 − e − λ x , x ≥ 0 0 , x < 0 F(x)=\begin{cases} 1 - e^{-\lambda x}, &x\ge0\\ 0, &x\lt0 \end{cases} F(x)={1eλx,0,x0x<0,其中 λ > 0 \lambda\gt0 λ>0为参数,这分布称为指数分布,简记为 E x p ( λ ) Exp(\lambda) Exp(λ)。常用它来作各种“寿命”分布的近似,例如电子元件的寿命,某些动物的寿命,电话问题中的通话时间等。
    另外,与几何分布类似, p { ξ ≥ s + t ∣ ξ ≥ s } = P { ξ ≥ t } p\{\xi\ge s+t|\xi\ge s\}=P\{\xi\ge t\} p{ξs+tξs}=P{ξt}

    在这里插入图片描述

    更多相关内容
  • 概率统计:离散分布和连续分布

    万次阅读 2019-06-27 17:02:45
    1. 几何分布 几何分布式离散型概率分布,如伯努利试验中,得到第一次成功的试验次数。

    1. 几种分布分类

    (1) 离散分布:
     伯努利分布(零一分布,两点分布),二项分布,几何分布,泊松分布(Poisson分布)

    (2) 连续分布:
     指数分布,正态分布(高斯分布),均匀分布

    (3) 抽样分布:
     卡方分布(X2分布),F分布,T分布

    (4) 其它分布:
     多项分布,Beta分布,Dirichlet分布

    2. 基本概念

    概率密度函数
    概率密度函数是描述某个连续随机变量的值在某个确定值附近的可能性。

    累积分布
    累积分布是随机变量小于等于某个确定值的所有可能性。

    3. 离散分布

    3.1 伯努利分布
    (1) 应用场景 
    只有两种实验结果。

    在这里插入图片描述
    3.2 二项分布
    描述在独立n次实验中成功次数,相当于多次进行伯努利实验。
    在这里插入图片描述

    3.3 几何分布
    描述伯努利试验中,第一次成功所进行的试验次数。

    随机变量X表示第一次成功所进行试验的次数。

    在这里插入图片描述

    3.4 泊松分布

    某一区间内发生随机事件次数的概率分布。

    在这里插入图片描述
    泊松分布不具有记忆性,比如:

    4. 连续分布

    4.1 均匀分布
    在取值范围内,随机变量出现的概率均一样。
    概率密度函数:
    在这里插入图片描述

    期望和方差:
    在这里插入图片描述
    在这里插入图片描述

    4.2 高斯分布(正态分布)
    适用于连续型数据或者数据离散性小,数据基本符合正态分布特点。

    概率密度函数,期望和方差:
    在这里插入图片描述
    正态分布的的普遍性可以中心极限定理得到。几个随机变量(独立同分布)的和形成的分布,服从高斯分布。

    4.3 指数分布
    两次随机事件发生时间间隔的概率分布。

    指数分布可以用泊松分布推导得到:
    在这里插入图片描述

    λ> 0是分布的一个参数,常被称为率参数(rate parameter),即每单位时间内发生某事件的次数。


    最近开通了个公众号,主要分享机器学习原理与数学联系,推荐系统,风控等算法相关的内容,感兴趣的伙伴可以关注下。
    在这里插入图片描述
    公众号相关的学习资料会上传到QQ群596506387,欢迎关注。


    参考:

    1. xieyan0811 简书
    展开全文
  • 2 离散型随机变量的概率分布 2.1 二项分布 2.2 超几何分布  2.2.1 概念 2.2.2 举例 2.3 泊松分布  3 连续型随机变量的概率分布 3.1 均匀分布  3.1.1 概念 3.2 正态分布...

    目录

     

    1 基本概念

    2 离散型随机变量的概率分布

    2.1 二项分布

    2.2 超几何分布 

    2.2.1 概念

    2.2.2 举例

    2.3 泊松分布 

    3 连续型随机变量的概率分布

    3.1 均匀分布 

    3.1.1 概念

    3.2 正态分布

    3.2.1 概念

    3.3  指数分布 

    3.3.1 概念

    3.3.2 举例

    4 参考文献


    1 基本概念

    在之前的博文中,已经明白了概率分布函数和概率密度函数。下面来讲解一下常见的离散型和连续型随机变量概率分布。

    在此之前,介绍几个基本概念:

    • 均值(期望值expected value):\mu=E(x)=\sum xp(x)
    • 方差(variance): \sigma^2=E[(x-\mu)^2]=\sum (x-\mu)^2p(x)
    • 标准差(standard deviation):\sigma =\sqrt {\sigma^2}

    其中,可以证明E[(x-\mu^2)]=E(x^2)-\mu^2

    2 离散型随机变量的概率分布

    2.1 二项分布

    如果进行n次不同的实验,每次试验完全相同并且只有两种可能的结果,这样的实验结果分布情况就是二项分布。最简单的比如投掷一枚硬币,不管进行多少次实验,实验结果都只有正面朝上或者反面朝上,这就是一个简单的二项分布。 

    二项分布概率分布:

    p(x)=C_{n}^{x} p^xq^{n-x} \space (x=0,1,2,3···,n)

    其中:n代表n次实验,x表示实验结果为T的次数,q是实验结果为T的概率,q=1-p,表示实验结果为F的概率。

    二项分布的 
    均值:\mu=np
    方差:\sigma^2=npq
    标准差:\sigma=\sqrt {npq}
    二项分布对于结果只有两种情况的随机事件有非常好的描述,属于日常生活中最常见、最简单的随机变量概率分布,在知道某种实验结果概率的情况下,能够很好推断实验次数后发生其中某一结果次数的概率。

    2.2 超几何分布 

    2.2.1 概念

    超几何分布和二项分布比较相似,二项分布每次实验完全一样,而超几何分布前一次的实验结果会影响后面的实验结果。简单地讲,二项分布抽取之后放回元素,而超几何分布是无放回的抽取。 
    超几何分布的概率分布,均值和方差

    p(x)=\frac{C_{r}^{x}C_{N-r}^{n-x}}{C_{N}^{n}}

    \mu=\frac{nr}{N}

    \sigma^2=\frac{r(N-r)n(N-n)}{N^2(N-1)}

    2.2.2 举例

    在一个口袋中装有30个球,其中有10个红球,其余为白球,这些球除颜色外完全相同。游戏者一次从中摸出5个球。摸到至少4个红球就中一等奖,那么获一等奖的概率是多少?

    解:由题意可见此问题归结为超几何分布模型。

    其中N = 30. r = 10. n = 5.

    P(一等奖)= P(X=4)+ P(X=5)

    由公式

     p(X=x)=\frac{C_{r}^{x}C_{N-r}^{n-x}}{C_{N}^{n}}

    ,x=0,1,2,...得:

    P(一等奖) = 106/3393

    2.3 泊松分布 

    2.3.1 概念

    泊松分布适合于描述单位时间内随机事件发生的次数。泊松分布适合于描述单位时间(或空间)内随机事件发生的次数。如某一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数,一块产品上的缺陷数,显微镜下单位分区内的细菌分布数等等。

    泊松分布的概率分布,均值和方差: 

    p(x)=\frac{\lambda^xe^{-\lambda}}{x!}\space (x=0,1,2,···)

    泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。

    \mu=\lambda

    \sigma^2=\lambda

    2.3.2 举例

    采用0.05J/㎡紫外线照射大肠杆菌时,每个基因组平均产生3个嘧啶二体。实际上每个基因组二体的分布是服从泊松分布的,将取如下形式:

    ……

    3 连续型随机变量的概率分布

    3.1 均匀分布 

    3.1.1 概念

    均匀概率分布(uniform probability distribution)是指连续随机变量所有可能出现值出现概率都相同。 
    均匀分布 
    均匀分布的概率分布,均值,方差和标准差: 

    f(x)=\frac{1}{b-a}(a\leq x\leq b)

    均值:\mu=\frac{a+b}{2}

    方差:\sigma=\frac{(b-a)^2}{12}
    标准差:\sigma=\frac{b-a}{\sqrt {12}}

    如何求解均值和标准差:

    3.2 正态分布

    3.2.1 概念

    正态分布是统计学中常见的一种分布,表现为两边对称,是一种钟型的概率分布(bell curve),其概率密度图为:

    æ­£æåå¸

    概率密度函数为:

    其中,\mu是正态随机变量的均值; \sigma是标准差; \pi是圆周率,约等于3.1416··· ;e=2.71828⋅⋅⋅

    特别的,当\mu=0\sigma=1的正态分布,被称为标准正态分布(standard distribution),此时有:

    正态分布转化为标准正态分布: 
    正态分布x,均值是μ,标准差是σ,z定义为z=\frac{x-\mu }{\sigma}

    正态分布来近似二项分布 :
    当n足够大的时候,正态分布对于离散型二项分布能够很好地近似。 
    二项分布

    评价正态分布 :
    如何来确定数据是否正态分布,主要有以下几种方法: 
    1. 图形感受法:建立直方图或者枝干图,看图像的形状是否类似正态曲线,既土墩形或者钟形,并且两端对称。 
    2. 计算区间\bar x\pm s,\bar x\pm 2s,\bar x\pm 3s,看落在区间的百分比是否近似于68%,95%,100%。(切比雪夫法则和经验法则) 
    3. 求IQR和标准差s,计算IQR/s,如若是正态分布,则IQR/s≈1.3.
    4. 建立正态概率图,如果近似正态分布,点会落在一条直线上。 

    æ­£ææ¦çå¾

    3.3  指数分布 

    3.3.1 概念

    指数分布是描述泊松分布中事件发生时间间隔的概率分布。除了用于泊松过程的分析,还有许多其他应用,如以下场景:

    • 世界杯比赛中进球之间的时间间隔
    • 超市客户中心接到顾客来电之间的时间间隔
    • 流星雨发生的时间间隔
    • 机器发生故障之间的时间间隔
    • 癌症病人从确诊到死亡的时间间隔

    指数分布有如下的适用条件: 
    1. x是两个事件发生之间的时间间隔,并且x>0; 
    2. 事件之间是相互独立的; 
    3. 事件发生的频率是稳定的; 
    4. 两个事件不能发生在同一瞬间。

    这几个条件实质上也是使用泊松分布的前提条件。如果满足上述条件,则x是一个指数随机变量,x的分布是一个指数分布。如果不满足上述条件,那么需要使用Weibull分布或者gamma分布。

    指数分布只有一个参数,“λ”,λ是事件发生的频率,在不同的应用场景中可能有不同名称:

    • 事件频率
    • 到达频率
    • 死亡率
    • 故障率
    • 转变率
    • …………

    λ是单元时间内事件发生的次数,这里需要注意的是,单元时间可以是秒,分,小时等不同的单位,同时λ根据单元时间度量的不同,其数值也不一样。如单元时间为1小时,λ为6,则单元时间1分钟,λ为6/60=0.1

    指数分布的概率密度函数(probability density func,PDF)由λ和x(时间)构成:

    f(x)=\lambda e^{-\lambda x}

    均值:\mu=\frac{1}{\lambda}

    方差:\sigma^2=\frac{1}{\lambda}

    3.3.2 举例

    一个设备出现多次故障的时间间隔记录如下:

    23, 261, 87, 7, 120, 14, 62, 47, 225, 71, 246, 21, 42, 20, 5, 12, 120, 11, 3, 14, 71, 11, 14, 11, 16, 90, 1, 16, 52, 95

    根据上面数据,我们可以计算得到该设备发生故障的平均时间是59.6小时,即单位小时时间内发生故障事件的次数为λ=1/59.6=0.0168。 
    那么该设备在3天(72小时)内出现故障的概率是多大呢?即求P(x<72),这就需要计算指数分布的累积分布函数: 

    P(X<72)=\int_{0}^{72}\lambda e^{-\lambda x}dx=1-e^{-\lambda(72)}=1-e^{-0.0168*72}=0.7017
    也即该设备3天内出现故障的概率大于70%。


    4 参考文献

    【1】统计学:离散型和连续型随机变量的概率分布

    【2】指数分布

     

    展开全文
  • 4.3常见离散和连续型的期望与方差 离散型 0-1分布 二项分布 推导时,np后面的那段式子其实是(p + q)^n,又因为 p + q == 1 所以EX = np 几何分布 证明过程中使用了级数的性质 泊松分布 连续型 均匀分布 指数...

    4.3常见离散型和连续型的期望与方差

    离散型

    0-1分布

    在这里插入图片描述

    二项分布

    推导时,np后面的那段式子其实是(p + q)^n,又因为 p + q == 1 所以EX = np
    在这里插入图片描述
    在这里插入图片描述

    几何分布

    证明过程中使用了级数的性质

    在这里插入图片描述
    在这里插入图片描述

    泊松分布在这里插入图片描述

    连续型

    均匀分布

    在这里插入图片描述

    指数分布

    在这里插入图片描述

    在这里插入图片描述

    正态分布

    在这里插入图片描述

    总结

    在这里插入图片描述
    几何分布和指数分布的方差单独记

    在这里插入图片描述

    展开全文
  • 离散型随机变量和连续型随机变量及其常见分布

    万次阅读 多人点赞 2018-09-24 15:11:04
    离散型随机变量及其分布率 若随机变量XXX只能取有限个数值x1,x2,...,xnx_1,x_2,...,x_nx1​,x2​,...,xn​或可列无穷多个数值x1,x2,...,xn,...x_1,x_2,...,x_n,...x1​,x2​,...,xn​,...,则称XXX为离散型随机变量...
  • 概率分布和正态分布想要构建一个预测模型,那么需要:了解目标变量的基本性质,手段是重复试验根据试验结果确定,需要预测的变量是一个离散值还是一个连续值为可能的备选值分配概率,比如概率为0的值...
  • 写在前面:PDF:概率密度函数,连续型随机变量的概率密度函数是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数,针对的是连续型。PMF : 概率质量函数,概率质量函数是离散随机变量在各特定...
  • 总结一下概统用到的各种分布,以及其期望方差。
  • 当我们说概率分布时,取决于上下文,它可能与离散随机变量或连续随机变量有关。 When the random variable is discrete, probability distribution means, how the total probability is distributed over various ...
  • 1. 离散和连续型随机变量的定义离散型随机变量(discrete random variable):取值是可数的个值的随机变量, 比如投掷一枚骰子的朝上的点数,可能是1,2,3,4,5,6;比如南京大学四食堂吃饭的人数,可能是0,1,2···...
  • 本节知识点 1.随机变量及其分布函数的定义 2.离散型随机变量 定义:随机变量可能取得的...常见连续型随机变量:均匀分布、正态分布和标准正态分布、指数分布                     ...
  • 伯努利分布(0-1分布、两点分布):进行一次伯努利试验,表示单个二元变量x∈{0,1}x\in \{0,1\}x∈{0,1}的分布,使用单个连续变量μ∈[0,1]\mu\in[0,1]μ∈[0,1]表示x=1x=1x=1的概率。 Bern(x∣μ)=μx(1−μ)1−...
  • 离散型随机变量的取值为有限个或者无限可列个(整数集是典型的无限可列),这个算概率的时候很简单,即随机变量取某个值的时候,概率对应多少。 连续型随机变量的取值为无限不可列个(实数集是典型的无限不可列) ...
  • 离散概率分布的介绍及Python运用

    千次阅读 2020-07-30 17:52:32
    显然,离散往往意味着与自然数密切相关,本文下面介绍几种常见离散概率分布及其Python运用。 一、离散均匀分布:掷骰子 均匀分布分为离散连续两种情况,这里介绍离散的情况。离散型均匀分布指有限个数值拥有...
  • 1. 介绍连续型随机变量的分布函数及其概率密度 2. 介绍均匀分布,指数分布,正态分布的性质以及必要性证明
  • 文章目录一、二维离散型随机变量函数的分布二、二维连续型随机变量函数的分布和分布密度 一、二维离散型随机变量函数的分布 二、二维连续型随机变量函数的分布和分布密度 首先,我们有两个随机变量 X, Y。它们的概率...
  • 离散型变量分布:0—1分布,二项分布,泊松分布,几何分布连续型:均匀分布,指数分布;卷积公式的意义、表达及记忆
  • 概率分布是指用于表述随机变量取值的概率规律,包括连续分布和离散分布。 下面作了这些概率分布的一个思维导图。 文章目录概率分布1、离散概率分布1.1、两点分布2.2、 二项分布1.3、几何分布1.4、超几何分布...
  • 文章目录一、0-1 分布二、二项分布三、泊松分布四、几何分布五、超几何分布六、负二项分布 一、0-1 分布 所谓的 0-1 分布,大家要记住它的几个特点: 随机变量 X 只取 0 或 1 两种值。所以结果也只有两种(概率分布...
  • 【小白话通信】离散分布的生成

    千次阅读 2015-05-09 11:35:32
    本文讲解的不是离散、连续分布的一些性质如:方差、期望概率密度函数pdf(若为离散分布,则是概率质量函数pmf)等。本文要讲解的是如何通过均匀分布来产生其他各种分布的方法。尽管很多编程语言的函数库中包含了这些...
  • 随机变量之常见分布

    千次阅读 2022-04-24 16:23:54
    0、概述 统计分析是可以帮助人们认清、刻画不确定性的方法。总体是某一特定事物可能发生结果的集合, 随机变量(Random ...常用的离散型随机变量分布包括:0-1分布、二项分布、泊松分布和二项式分布等。常用的连续...
  • 文章目录一、采样方法二、轮盘...即用较少量的样本点(经验分布)来近似总体分布,并刻画总体分布中的不确定性。从这个角度来说,采样其实也是一种信息降维,可以起到简化问题的作用。 对当前的数据集进行重采样,可以充分...
  • 离散型随机变量的常见概率分布

    千次阅读 2018-01-07 21:48:37
    伯努利0-1分布 事件A在某次试验中发生的概率稳定计为pp,但A要么发生要么不发生,随机变量XX,单次试验中A发生记为1,没有发生记为0,则P(X=1)=p,P(X=0)=1−pP(X=1)=p,P(X=0)=1-p,也可以统一成这个公式: f(x|p)=...
  • 常见概率分布介绍

    千次阅读 2019-07-11 18:44:38
    常见概率分布 Bernoulli分布 Bernoulli分布是单个二值随机变量分布, 单参数ϕ​\phi​ϕ​∈[0,1]控制,ϕ​\phi​ϕ​给出随机变量等于1的概率. 主要性质有: P(x)=px(1−p)1−x={p if x=1q if&...
  • 大纲:常见离散型概率分布(二项,几何,超几何,泊松)常见连续型概率分布(指数,正态,均匀)三大抽样分布(卡方,t,F)一些推论和分布之间的关系离散分布二项分布实验重复n次,每次实验相互独立(伯努利...
  • 离散型随机变量及其分布

    千次阅读 2019-09-18 18:24:05
    离散型随机变量的定义: 若随机变量X的取值为有限个或可数 离散, 则称X为离散型随机变量。 二、分布 2.1、0-1分布
  • 注:本文针对常用的连续分布:正态分布、均匀分布、指数分布、伽马分布、卡方分布与贝塔分布作了大致的介绍,需要记住它们的参数、数学期望与方差、以及密度函数,一个分布就是一个概率模型。 目录 各种分布之间...
  • 概率密度函数、概率分布函数、常见概率分布

    万次阅读 多人点赞 2020-10-27 09:30:58
    概率密度函数是概率论中的核心概念之一,用于描述连续型随机变量所服从的概率分布。 从随机事件说起 回忆我们在学习概率论时的经历,随机事件是第一个核心的概念,它定义为可能发生也可能不发生的事件,因此是否发生...
  • 连续特征和离散特征的处理

    千次阅读 2019-01-08 08:25:17
    连续特征   z-score标准化:这是最常见的特征预处理方式,基本所有的线性模型在拟合的时候都会做 z-score标准化。具体的方法是求出样本特征x的均值mean标准差std,然后用(x-mean)/std来代替原特征。这样特征就...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 22,666
精华内容 9,066
热门标签
关键字:

常见的离散分布和连续分布