-
常见的离散型和连续型随机变量的概率分布
2018-09-12 11:37:512 离散型随机变量的概率分布 2.1二项分布 2.2超几何分布 2.2.1 概念 2.2.2 举例 2.3泊松分布 3 连续型随机变量的概率分布 3.1均匀分布 3.1.1 概念 3.2 正态分布 3.2.1 概念 3.3指数分布 3.3.1 概念 ...目录
1 基本概念
在之前的博文中,已经明白了概率分布函数和概率密度函数。下面来讲解一下常见的离散型和连续型随机变量概率分布。
在此之前,介绍几个基本概念:
- 均值(期望值expected value):
- 方差(variance):
- 标准差(standard deviation):
其中,可以证明
2 离散型随机变量的概率分布
2.1 二项分布
如果进行n次不同的实验,每次试验完全相同并且只有两种可能的结果,这样的实验结果分布情况就是二项分布。最简单的比如投掷一枚硬币,不管进行多少次实验,实验结果都只有正面朝上或者反面朝上,这就是一个简单的二项分布。
二项分布概率分布:
其中:n代表n次实验,x表示实验结果为T的次数,q是实验结果为T的概率,q=1-p,表示实验结果为F的概率。
二项分布的
均值:
方差:
标准差:
二项分布对于结果只有两种情况的随机事件有非常好的描述,属于日常生活中最常见、最简单的随机变量概率分布,在知道某种实验结果概率的情况下,能够很好推断实验次数后发生其中某一结果次数的概率。2.2 超几何分布
2.2.1 概念
超几何分布和二项分布比较相似,二项分布每次实验完全一样,而超几何分布前一次的实验结果会影响后面的实验结果。简单地讲,二项分布抽取之后放回元素,而超几何分布是无放回的抽取。
超几何分布的概率分布,均值和方差2.2.2 举例
在一个口袋中装有30个球,其中有10个红球,其余为白球,这些球除颜色外完全相同。游戏者一次从中摸出5个球。摸到至少4个红球就中一等奖,那么获一等奖的概率是多少?
解:由题意可见此问题归结为超几何分布模型。
其中N = 30. r = 10. n = 5.
P(一等奖)= P(X=4)+ P(X=5)
由公式
,x=0,1,2,...得:
P(一等奖) = 106/3393
2.3 泊松分布
2.3.1 概念
泊松分布适合于描述单位时间内随机事件发生的次数。泊松分布适合于描述单位时间(或空间)内随机事件发生的次数。如某一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数,一块产品上的缺陷数,显微镜下单位分区内的细菌分布数等等。
泊松分布的概率分布,均值和方差:
泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。
2.3.2 举例
采用0.05J/㎡紫外线照射大肠杆菌时,每个基因组平均产生3个嘧啶二体。实际上每个基因组二体的分布是服从泊松分布的,将取如下形式:
……
3 连续型随机变量的概率分布
3.1 均匀分布
3.1.1 概念
均匀概率分布(uniform probability distribution)是指连续随机变量所有可能出现值出现概率都相同。
均匀分布的概率分布,均值,方差和标准差:均值:
方差:
标准差:如何求解均值和标准差:
3.2 正态分布
3.2.1 概念
正态分布是统计学中常见的一种分布,表现为两边对称,是一种钟型的概率分布(bell curve),其概率密度图为:
概率密度函数为:
其中,
是正态随机变量的均值;
是标准差;
是圆周率,约等于3.1416··· ;e=2.71828⋅⋅⋅
特别的,当
且
的正态分布,被称为标准正态分布(standard distribution),此时有:
正态分布转化为标准正态分布:
正态分布x,均值是μ,标准差是σ,z定义为正态分布来近似二项分布 :
当n足够大的时候,正态分布对于离散型二项分布能够很好地近似。评价正态分布 :
如何来确定数据是否正态分布,主要有以下几种方法:
1. 图形感受法:建立直方图或者枝干图,看图像的形状是否类似正态曲线,既土墩形或者钟形,并且两端对称。
2. 计算区间,看落在区间的百分比是否近似于68%,95%,100%。(切比雪夫法则和经验法则)
3. 求IQR和标准差s,计算IQR/s,如若是正态分布,则IQR/s≈1.3.
4. 建立正态概率图,如果近似正态分布,点会落在一条直线上。3.3 指数分布
3.3.1 概念
指数分布是描述泊松分布中事件发生时间间隔的概率分布。除了用于泊松过程的分析,还有许多其他应用,如以下场景:
- 世界杯比赛中进球之间的时间间隔
- 超市客户中心接到顾客来电之间的时间间隔
- 流星雨发生的时间间隔
- 机器发生故障之间的时间间隔
-
癌症病人从确诊到死亡的时间间隔
指数分布有如下的适用条件:
1. x是两个事件发生之间的时间间隔,并且x>0;
2. 事件之间是相互独立的;
3. 事件发生的频率是稳定的;
4. 两个事件不能发生在同一瞬间。这几个条件实质上也是使用泊松分布的前提条件。如果满足上述条件,则x是一个指数随机变量,x的分布是一个指数分布。如果不满足上述条件,那么需要使用Weibull分布或者gamma分布。
指数分布只有一个参数,“λ”,λ是事件发生的频率,在不同的应用场景中可能有不同名称:
- 事件频率
- 到达频率
- 死亡率
- 故障率
- 转变率
- …………
λ是单元时间内事件发生的次数,这里需要注意的是,单元时间可以是秒,分,小时等不同的单位,同时λ根据单元时间度量的不同,其数值也不一样。如单元时间为1小时,λ为6,则单元时间1分钟,λ为6/60=0.1
指数分布的概率密度函数(probability density func,PDF)由λ和x(时间)构成:
均值:
方差:
3.3.2 举例
一个设备出现多次故障的时间间隔记录如下:
23, 261, 87, 7, 120, 14, 62, 47, 225, 71, 246, 21, 42, 20, 5, 12, 120, 11, 3, 14, 71, 11, 14, 11, 16, 90, 1, 16, 52, 95
根据上面数据,我们可以计算得到该设备发生故障的平均时间是59.6小时,即单位小时时间内发生故障事件的次数为λ=1/59.6=0.0168。
那么该设备在3天(72小时)内出现故障的概率是多大呢?即求P(x<72),这就需要计算指数分布的累积分布函数:
也即该设备3天内出现故障的概率大于70%。4 参考文献
【2】指数分布
- 均值(期望值expected value):
-
离散型随机变量和连续型随机变量及其常见分布
2018-09-24 15:11:04离散型随机变量及其分布率 若随机变量XXX只能取有限个数值x1,x2,...,xnx_1,x_2,...,x_nx1,x2,...,xn或可列无穷多个数值x1,x2,...,xn,...x_1,x_2,...,x_n,...x1,x2,...,xn,...,则称XXX为离散型随机变量...离散型随机变量及其分布率
若随机变量只能取有限个数值或可列无穷多个数值,则称为离散型随机变量
要掌握一个离散型随机变量的统计规律,必须知道的所有可能取的值以及每一个可能值的概率
定义:设离散型随机变量所有可能的取值为,取各个可能值的概率,即事件的概率为则称该式子为离散型随机变量的分布律。分布律也常用表格形式表示:
X 由于随机变量的分布函数可以完整地描述随机变量的统计规律,因此,由离散型随机变量的分布律可以推出分布函数,反之亦然。
设是离散型随机变量的分布函数,则的分布律易得
常见的离散型随机变量的概率分布
1、两点分布
若随机变量的只能取与,且它的分布律为即则称服从参数为的两点分布
特别地,当时两点分布也叫分布,记为分布或
2、二项分布
若随机变量的分布律为则称服从参数为的二项分布,记为
这与重伯努利试验中事件发生次的概率计算公式一致可知,若,就可以用来表示重伯努利试验中事件恰好发生次
二项分布的近似计算
①泊松近似:
泊松近似即泊松定理
当,当很大()且很小()时,可以用泊松分布来近似拟合二项分布,有:其中②标准正太近似:
当,当充分大时,可以用标准正太分布来近似拟合二项分布,有:拓展:
多项式展开定理:幂级数展开定理:
3、泊松分布
泊松定理:设是一常数,是正整数。若,则对任一固定的非负整数有:
若随机变量的分布律为则称服从参数为的泊松分布,记为或
泊松分布的概率值为:
连续型随机变量及其概率密度函数
定义:设是随机变量,是它的分布函数,若存在一个非负可积函数,使得对任意的,有:则称为连续型随机变量,其中称为的概率密度函数,简称概率密度或密度函数
概率密度函数的性质
- 非负性:
- 规范性:
- 若在处是连续的,则分布函数的导数等于概率密度函数,即:
- 若是连续型随机变量,对,有,即对于连续型随机变量,取得某一点的概率为0(注意这里的概率为0不代表不可能事件)
常见的连续型随机变量的概率分布
1、均匀分布
若随机变量的概率密度函数为则称在区间上服从均匀分布,记为
易知,并且
均匀分布中的分布函数为
2、指数分布
若随机变量的概率密度函数为其中为常数
则称随机变量服从参数为(失效率)的指数分布,记为
显然,且:指数分布中的分布函数为:
3、正态分布
若随机变量的概率密度函数为其中为常数,则称服从参数为的正态分布或高斯分布,记为
显然 ,且
标准正态分布 :
若标准正态分布的分布函数:标准正态分布的概率密度函数:标准正态分布的具体值可以通过查表得知:标准正态分布表 -
概率论(二)随机变量及其概率分布——离散和连续型随机变量及其分布函数
2018-09-15 16:30:47常见的离散性随机变量:0-1分布、二项分布和泊松分布 3.连续型随机变量 定义 分布函数和概率密度函数 常见的连续型随机变量:均匀分布、正态分布和标准正态分布、指数分布 ...本节知识点
1.随机变量及其分布函数的定义
2.离散型随机变量
定义:随机变量可能取得的值是有限个或者可列无限个
概率分布列
分布函数
常见的离散性随机变量:0-1分布、二项分布和泊松分布
3.连续型随机变量
定义
分布函数和概率密度函数
常见的连续型随机变量:均匀分布、正态分布和标准正态分布、指数分布
-
t分布 u分布 卡方分布_常见的统计分布--数据分析
2021-01-04 14:15:47大纲:常见的离散型概率分布(二项,几何,超几何,泊松)常见的连续型概率分布(指数,正态,均匀)三大抽样分布(卡方,t,F)一些推论和分布之间的关系离散型分布二项分布实验重复n次,每次实验相互独立(伯努利...大纲:
- 常见的离散型概率分布(二项,几何,超几何,泊松)
- 常见的连续型概率分布(指数,正态,均匀)
- 三大抽样分布(卡方,t,F)
- 一些推论和分布之间的关系
离散型分布
- 二项分布
实验重复n次,每次实验相互独立(伯努利实验),实验有两种结果,成功概率p,失败概率1-p。
在二项分布中,我们关注的是在n次试验中成功的次数(区别于几何分布)。
举个栗子:
当我们要计算抛硬币n次,恰巧有x次正面朝上的概率,可以使用二项分布的公式:
二项概率的数学期望为E(x) = np,方差D(x) = np(1-p)。
- 几何分布
几何分布(英语:Geometric distribution)指的是以下两种离散型概率分布中的一种:
- 在伯努利试验中,得到一次成功所需要的试验次数 X
- 在得到第一次成功之前所经历的失败次数 X
n重伯努利实验
在第X次成功的概率:
- 超几何分布
超几何分布是统计学上一种离散概率分布。它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的个数(不归还 (without replacement))。
例如:从N个样本中抽取n个,N个中有r个不合格的,求抽到x个不合格样本的概率。
超几何分布的概率分布,均值和方差:
- 泊松分布
泊松概率的成立条件是在任意两个长度相等的时间区间中,事件发生的概率是相同的,并且事件是否发生都是相互独立的。
x代表发生x次,u代表发生次数的数学期望,概率函数为:
实际计算过程中用这个公式更好理解:
t是你要计算的时间区间长度,t=1时即为泊松分布(单位时间),扩展后的函数是泊松过程。
泊松分布的数学期望和方差相等,因此E(x) = D(x) = λ。
连续型分布
- 均匀分布
在取值区间内出现概率相同(常数)
概率密度函数,均值和方差:
- 指数分布
指数分布是连续型概率分布!!!放在这里是因为它跟泊松分布关系密切,可以由泊松分布推导而来。
指数分布是事件的时间间隔的概率。时间间隔大于t,等同于t时间内事件次数为0的概率,而后者的概率可以由泊松过程给出。
推导过程:
指数分布的期望和方差:若以λ为参数,则是E(X)=1/λ D(X)=1/λ²
- 正态分布
正态分布的经验法则:
均值±标准差:68.3%
均值±2标准差:95.4%
均值±3标准差:99.7%抽样分布
- 点估计和区间估计
点估计:用样本统计量估计总体参数,未给出估计的可靠程度(置信度)
区间估计:给定置信水平,以估计值为中心给出真实值可能出现的区间范围。
- 大数定律和中心极限定理
大数定律:样本量趋近于无穷时,样本均值收敛到总体期望
中心极限定理:
1,样本均值约等于总体均值
2,抽样次数趋近于无穷时,样本均值围绕总体均值呈现正态分布(无论总体分布是否服从正态分布)- 标准差与标准误
标准差 = 一次抽样中个体分数间的离散程度,反映了个体分数对样本均值的代表性,用于描述统计
标准误 = 多次抽样中样本均值间的离散程度,反映了样本均值对总体均值的代表性,用于推论统计
- 卡方分布
概率密度函数及其形状:
当自由度n增大时,卡方分布的概率密度函数趋于对称。
卡方分布的性质:
- t分布
在讲t分布之前先了解下t检验和z检验:
- Z-Test 用于大样本(n>30),或总体方差已知;
- T-Test 在小样本(n<30),且总体方差未知时,适用性优于Z-Test,而在大样本时,T-Test 与 Z-Test 结论趋同。
单样本t统计量:由于总体标准差未知,一般用样本标准差S估计总体标准差
双样本t统计量:
t统计量的分布服从t分布。当样本量无限大时,t分布无限接近于正态分布N(0,1)。
自由度为n的t分布
概率密度函数及其形状:
t变量的性质:当n趋向于无穷大时,t变量的极限分布为N(0,1)。
- F分布
概率密度函数及其图形:
自由度为m,n的F分布的密度函数
F分布的自由度m和n是有顺序的, 当m≠n时, 若将自由度m和n的顺序颠倒一下, 得到的是两个不同的F分布.
F变量的性质:
几个重要推论和分布间的关系
- 正态变量线性函数的分布
- 正态变量样本均值和样本方差的分布
- 一些推论
参考资料:
小白都能看懂的95%置信区间_bitcarmanlee的博客-CSDN博客
https://blog.csdn.net/anshuai_aw1/article/details/82656691
《商务与经济统计》学习笔记(七)-各统计分布知识点归纳_天阑之蓝的博客-CSDN博客
如何七周成为数据分析师15:读了本文,你就懂了概率分布 | 人人都是产品经理
-
泊松分布的分布函数_常见概率分布汇总
2020-12-03 08:56:40下面列举常见的离散型概率分布和连续型概率分布。离散型概率分布1、柏松概率分布定义柏松分布是一种常见的离散型概率分布,它主要用来估计在特定时间段或空间中某事件发生的次数。泊松实验的性质:第一、在任意两个... -
概率论-常见的概率分布模型
2020-03-06 19:11:37文章目录常见的概率分布模型离散概率分布函数连续概率分布函数联合分布函数多项分布(Multinomial Distribution)多项分布简介多项分布公式解析伯努利分布(Bernoulli Distribution)伯努利分布简介伯努利分布的期望... -
一些常见的概率分布
2021-02-02 09:44:14本文主要汇总了一些常见概率分布的概率质量函数(密度函数),矩母函数,均值和方差。其中矩母函数定义为: ϕ(t)=E[etX] \phi(t)=E[e^{tX}] ϕ(t)=E[etX] 一、离散概率分布 离散概率分布 概率质量函数p(x) 矩母... -
MATLAB之常见随机变量分布的PDF和CDP
2020-11-26 10:33:01参考“随机变量概率分布函数汇总-离散型分布+连续型分布”,了解不同随机变量分布的定义及函数表达式。 2. MATLAB函数 3. 分布的CDF和PDF图形 参考“MATLAB概率统计函数(1)” 注意理解各随机变量分布的本质... -
常见分布总结-高斯分布、伯努利分布、泊松分布、几何分布、beta分布
2019-04-01 17:53:05概率分布是指用于表述随机变量取值的概率规律,包括连续分布和离散分布。 下面作了这些概率分布的一个思维导图。 文章目录概率分布1、离散概率分布1.1、两点分布2.2、 二项分布1.3、几何分布1.4、超几何分布... -
如何画正太分布曲线_python scipy.stats实现各种常见的统计分布
2021-01-10 17:14:09scipy.stats包含了各种连续分布和离散分布模型。这篇小文使用scipy.stats来实现几种常见的统计分布。---------1. 伯努利分布:伯努利试验单次随机试验,只有"成功(值为1)"或"失败(值为0)"这两种结果,又名两点分布... -
概率论:常见概率分布
2014-09-05 09:54:52常见离散概率分布 Note: 一般的二项分布是n次独立的伯努利试验的和。它的期望值和方差分别等于每次单独试验的期望值和方差的和。 皮皮blog ...常见的概率分布_文库下载http://www.wenkuxiazai.com/d -
概率论中常见分布总结以及python的scipy库使用:两点分布、二项分布、几何分布、泊松分布、均匀分布、指数...
2020-06-04 11:50:49概率分布有两种类型:离散(discrete)概率分布和连续(continuous)概率分布。 离散概率分布也称为概率质量函数(probability mass function)。离散概率分布的例子有伯努利分布(Bernoulli distribution)、二项... -
scipy 概率 泊松分布_概率论中常见分布总结以及python的scipy库使用:两点分布、二项分布、几何分布、泊松...
2021-01-30 08:06:17概率分布有两种类型:离散(discrete)概率分布和连续(continuous)概率分布。离散概率分布也称为概率质量函数(probability mass function)。离散概率分布的例子有伯努利分布(Bernoulli distribution)、二项分布... -
常见概率分布图表总结
2017-03-21 09:54:00摘要: 1.常见离散变量的分布 ...3.1 在贝叶斯概率理论中,如果后验概率和先验概率满足同样的分布律,那么先验分布和后验分布被叫做共轭分布 3.2 证明Beta分布和二项分布互为共轭分布: ... -
程序员的自我修养之数学基础11:期望、方差、常见分布(均匀分布、二项分布、泊松分布、正态分布)
2019-09-11 16:00:282.二项分布和几何分布 3. 泊松分布 4.正态分布 一、期望 期望这个概念,初高中就学过了吧,所以这里就简单说一下定义。 1.离散型随机变量的期望 2.连续型随机变量的期望 3.期望的... -
标准柯西分布_数据自习室03-常见概率分布
2021-01-05 10:22:35这周我们学习常见的的概率分布,主要分为离散型分布和连续型分布。1. 离散型分布离散型分布表示数据分布是点状,不连续的,如抛硬币1次,出现正面的次数这个事件,P(正面)=0.5,P(不出现正面)=0.5。1)伯努利分布... -
scipy 概率 泊松分布_概率论中常见分布总结以及python的scipy库使用
2021-01-17 12:44:35概率分布有两种类型:离散(discrete)概率分布和连续(continuous)概率分布。离散概率分布也称为概率质量函数(probability mass function)。离散概率分布的例子有伯努利分布(Bernoulli distribution)、二项分布... -
f分布的k阶矩_统计学入门级:常见概率分布+python绘制分布图
2021-01-04 14:15:30我的公众号是关于自己在数据分析/挖掘学习过程中的一些技术和总结分享,文章会持续更新......基本概念离散型随机变量如果随机变量X的所有取值都可以逐个列举出来,则称X为离散型随机变量。相应的概率分布有二项分布... -
python泊松分布概率密度函数_概率论中常见分布总结以及python的scipy库使用
2020-12-21 19:31:23概率分布有两种类型:离散(discrete)概率分布和连续(continuous)概率分布。离散概率分布也称为概率质量函数(probability mass function)。离散概率分布的例子有伯努利分布(Bernoulli distribution)、二项分布... -
常见分布与假设检验知识点框架
2020-06-27 23:27:02一般随机变量 随机变量的两种类型 离散型随机变量 连续型随机变量 常见分布 离散型分布 二项分布(Binormial distribution) 泊松分布(Poisson distribution) 二项分布、泊松分布、...其他连续分布 常见分布的均值和方差 -
概率论常见分布总结以及在python中的应用
2018-11-08 00:03:56概率分布有两种类型:离散(discrete)概率分布和连续(continuous)概率分布。 离散概率分布也称为概率质量函数(probability mass function)。离散概率分布的例子有伯努利分布(Bernoulli distribution)、二项... -
方差及常见分布的方差计算与推导
2020-07-08 14:33:051. 介绍方差定义和性质 2. 离散型随机变量(01分布,二项分布,泊松分布,几何分布,超几何分布)和连续型随机变量(均匀分布,指数分布,正态分布)分布的方差计算以及推导过程,并汇总形成表格,方便查阅和记录 -
概率论中常见分布总结以及python的scipy库使用
2020-08-08 12:49:43概率分布有两种类型:离散(discrete)概率分布和连续(continuous)概率分布。 离散概率分布也称为概率质量函数(probability mass function)。离散概率分布的例子有伯努利分布(Bernoulli distribution)、二项... -
数学期望及常见分布的期望计算与推导
2020-07-01 14:04:281. 介绍数学期望定义和性质 2. 离散型随机变量(01分布,二项分布,泊松分布,几何分布,超几何分布)和连续型随机变量(均匀分布,指数分布,正态分布)分布的期望计算以及推导过程,并汇总形成表格,方便查阅和记录 -
泊松分布 流量发生器_【心得篇】常见随机变量的概率分布
2020-12-03 08:56:32根据随机变量的取值范围,我们可以区分出离散型随机变量{取值为整数}和连续型随机变量{取值为实数}。事实上还有混合型随机变量,但不在本文讨论的范围之内。每个离散随机变量的本质特征在于其概率密度函数(或分布律... -
常见分布与假设检验
2020-06-27 11:13:42常用的离散型随机分布:二项分布,泊松分布 1.2 连续型随机变量 对于连续型随机变量,使用概率密度函数(probability density function),简称PDF,来描述其分布情况。 连续型随机变量的特点在于取任何固定值的概率都...
-
nodejs
-
app软件测试全栈系列精品课程
-
系统资源路径
-
docker file使用指南
-
MySQL 备份与恢复详解(高低版本 迁移;不同字符集 相互转换;表
-
2012-2015年中级互联网技术真题.pdf
-
HC32L130开发寄存器版视频连载3
-
基于Flink+Hudi构建企业亿级云上实时数据湖教程(PC、移动、小
-
L2-021 点赞狂魔 (25 分)
-
数据分析师八大能力培养 Part6 寻找原因能力.pdf
-
2016通信中级互联网真题.pdf
-
龙芯生态应用开发基础:C语言精要
-
FFmpeg4.3系列之16:WebRTC之小白入门与视频聊天的实战
-
BGLight.zip
-
什么是双亲委派机制
-
DNAMAN.exe
-
优质博客文档
-
实现 MySQL 读写分离的利器 mysql-proxy
-
【C++】解决ASIO中:no member named ‘get_io_service’
-
11. 含k个3的数.cpp