-
MATLAB 画正态分布和对数正态分布的概率密度函数
2020-06-23 22:55:24正态分布 函数形式:y=normpdf(x,mu,sigma) x - x轴数据,如 x=-10:0.01:10;...对数正态分布 函数形式:y=lognpdf(x,mu,sigma) x - x轴数据,如 x=0:0.01:10; mu - 均值,默认为0; sigma - 标准差,默认为1;..正态分布
函数形式:y
=normpdf
(x,mu,sigma)x - x轴数据,如 x=-10:0.01:10; 注意正态分布,正负对称!
mu - 均值,默认为0;
sigma - 标准差,默认为1;
实例
x=-10:0.01:10;y=normpdf(x,0,1);plot(x,y);
对数正态分布
函数形式:y
=
lognpdf(x,mu,sigma)x - x轴数据,如 x=0:0.01:10;
mu - 均值,默认为0;
sigma - 标准差,默认为1;
实例:
x=0:0.01:10;y=lognpdf(x,0,1);plot(x,y);
-
对数正态分布_常见的数据分布(正态分布,ZIPF分布,偏态分布)
2020-12-13 14:30:49中文名称:正态分布英文名称:normal distribution定义1:概率论中最重要的一...正态分布(normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计...中文名称:正态分布
英文名称:normal distribution
定义1:概率论中最重要的一种分布,也是自然界最常见的一种分布。该分布由两个参数——平均值和方差决定。概率密度函数曲线以均值为对称中线,方差越小,分布越集中在均值附近。
正态分布(normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:则其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。
服从正态分布的随机变量的概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。
Zipf分布
有一个基本定律,就是大家常说对于内容的访问遵循80/20原则,也就是20%的内容,会占有80%的访问量。
Zipf分布与其类似。
这是一个定性的原则,定量来说,内容访问近似符合Zipf定律(Zipf's law), 这个定律是美国语言学家Zipf发现的,他在1932年研究英文单词的出现频率时,发现如果把单词频率从高到低的次序排列,每个单词出现频率和它的符号访问排名存在简单反比关系:
这里 r 表示一个单词的出现频率的排名,P(r)表示排名为r的单词的出现频率.
(单词频率分布中 C约等于0.1, a约等于1)
后人将这个分布称为齐夫分布,这个分布是一个统计型的经验规律,描述了这样一个定理:只有少数英文单词经常被使用,大部分的单词很少被使用。这个定理也在很多分布里面得到了验证,比如人们的收入,互联网的网站数量和访问比例,互联网内容和访问比例(其他分>布两个常数有所不同,a越大,分布越密集,对于VOD来说某些时候符合双zipf分布)。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~··
(来自维基百科)
齐夫定律可以表述为:在自然语言的语料库里,一个单词出现的频率与它在频率表里的排名成反比。所以,频率最高的单词出现的频率大约是出现频率第二位的单词的2倍,而出现频率第二位的单词则是出现频率第四位的单词的2倍。这个定律被作为任何与power law probability distributions有关的事物的参考。
理论
这个“定律”是哈佛大学的语言学家George Kingsley Zipf(IPA[zɪf])1949年发表的。
比如,在 Brown 语料库中,“the”是最常见的单词,它在这个语料库中出现了大约7%(100万单词中出现69971次)。正如齐夫定律中所描述的一样,出现次数为第二位的单词“of”占了整个语料库中的3.5%(36411次),之后的是“and”(28852次)。仅仅135个字汇就占了Brown 语料库的一半。
齐夫定律是一个实验定律,而非理论定律。齐夫分布可以在很多现象中被观察到。齐夫分布的在现实中的起因是一个争论的焦点。 齐夫定律很容易用点阵图观察,坐标为log(排名)和log(频率)。比如,“the”用上述表述可以描述为x = log(1), y = log(69971)的点。如果所有的点接近一条直线,那么它就遵循齐夫定律。
最简单的齐夫定律的例子是“1/f function”。给出一组齐夫分布的频率,按照从最常见到非常见排列,第二常见的频率是最常见频率的出现次数的½,第三常见的频率是最常见的频率的1/3,第n常见的频率是最常见频率出现次数的1/n。然而,这并不精确,因为所有的项必须出现一个整数次数,一个单词不可能出现2.5次。然而,在一个广域范围内并且做出适当的近似,许多自然现象都符合齐夫定律。
===========================================================================
zipf law :在给定的语料中,对于任意一个term,其频度(freq)的排名(rank)和freq的乘积大致是一个常数。
It is known that the number of incoming links to pages on the Web follows a Zipfian distribution. That is, a small number of Web pages have an extremely large number of links pointing to them, while a majority of pages have only a small number of incoming links.
Zipf定律是文献计量学的重要定律之一,它和罗特卡定律、布拉德福定律一起被并称为文献计量学的三大定律。
对于CDN的内容管理,也近似符合Zipf 定律,就是大家常说对于内容的访问遵循80/20原则,也就是20%的内容,会占有80%的访问量。
zipf law
这里 r 表示一个单词的出现频率的排名,P(r)表示排名为r的单词的出现频率.
(单词频率分布中 C约等于0.1, a约等于1)
后人将这个分布称为zipf distribution,中文名称为齐普夫分布或Zeta 分布。这是一个离散事件分布,广泛应用于语言学,保险学,网络模拟,以及对稀疏事件的建模中。
它表明在英语单词中,只有极少数的词被经常使用,而绝大多数词很少被使用。实际上,包括汉语在内的许多国家的语言都有这种特点。这个定律后来在很多领域得到了同样的验证,包括网站的访问者数量、城镇的大小和每个国家公司的数量。。这个定理也在很多分布里面得到了验证,比如人们的收入,互联网的网站数量和访问比例,互联网内容和访问比例(其他分布两个常数有所不同,a越大,分布越密集,对于VOD来说某些时候符合双zipf分布)。
比起枯燥的公式,图表更具有说服力,下面是用三百个严格符合zipf 分布的数据点描绘成的图,其中横轴表示排名,纵轴表示访问的频率,分别使用线性坐标和对数坐标表示:
zipf distribution
可以看到对数坐标下是一条完美的直线。
偏态分布(Skewed distribution)
频数分布有正态分布和偏态分布之分。正态分布是指多数频数集中在中央位置,两端的频数分布大致对称。
偏态分布是指频数分布不对称,集中位置偏向一侧。若集中位置偏向数值小的一侧,称为正偏态分布;集中位置偏向数值大的一侧,称为负偏态分布。
如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布;同样的,如果频数分布的高峰向右偏移,长尾向左延伸则成为负偏态分布,也称左偏态分布。
峰左移,右偏,正偏
峰右移,左偏,负偏
偏态分布只有满足一定的条件(如样本例数够大等)才可以看做近似正态分布。
与正态分布相对而言,偏态分布有两个特点:
一是左右不对称(即所谓偏态);
二是当样本增大时,其均数趋向正态分布。
-
对数正态分布_数学文化(四十五) | 正态分布
2020-12-14 12:17:35定义内容正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等...若随机变量服从一个位置参数、尺度参数的概率分布,记为:则其概率密度函数为正态分布的数学期望值或...点击蓝字
关注我们
统计也是数学中必不可缺少的一环,今天我们来了解一下统计中常用的正态分布吧!
定义内容
正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量服从一个位置参数、尺度参数的概率分布,记为:则其概率密度函数为正态分布的数学期望值或期望值等于位置参数,决定了分布的位置;其方差的开平方或标准差等于尺度参数,决定了分布的幅度。
主要特点
⒈估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。
⒉制定参考值范围:
⑴正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。
⑵百分位数法 常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。
⒊质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,以 作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。
⒋正态分布是许多统计方法的理论基础。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。
影响地位
正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布。从理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。
微信公众号
抖音
微博
QQ
编辑:杨坪
审核:张媛 王天慈 李倩 王源铭
-
机器学习小组知识点17:对数正态分布(Logarithmic Normal Distribution)
2016-11-22 15:27:21概率密度函数在概率论与统计学中,对数正态分布是对数为正态分布的任意随机变量的概率分布。如果 XX 是正态分布的随机变量,则 exp(X)exp(X) 为对数正态分布;同样,如果Y Y 是对数正态分布,则 ln(Y)ln(Y) 为正态...这块儿我是真的没听说过,所以直接抄了维基百科,维基万岁!
概率密度函数
在概率论与统计学中,对数正态分布是对数为正态分布的任意随机变量的概率分布。如果 X 是正态分布的随机变量,则 exp(X)为对数正态分布;同样,如果Y是对数正态分布,则 ln(Y)为正态分布。 如果一个变量可以看作是许多很小独立因子的乘积,则这个变量可以看作是对数正态分布。一个典型的例子是股票投资的长期收益率,它可以看作是每天收益率的乘积。 对于 x>0,对数正态分布的概率密度函数为:
f(x;μ,σ)=1xσ2π−−√e−(lnx−μ)2/2σ2
其中 μ 与 σ分别是变量对数的平均值与标准差。
推导过程:概率微分不变性。
一个正的随机变量 x是对数正态分布,当且仅当x是正态分布。那么:N(lnx;μ,σ)=1σ2π−−√exp[−(lnx−μ)22σ2].
利用概率微分不变性,有N(lnx)dlnx=N(lnx)dlnxdxdx=N(lnx)dxx=lnN(x)dx,,
其中,lnN(x;μ,σ)=1xσ2π−−√exp[−(lnx−μ)22σ2], x>0
是对数正态分布函数。期望和方差:
期望为
E(X)=eμ+σ2/2
方差为var(X)=(eσ2−1)e2μ+σ2.
给定期望值与方差,也可以用这个关系求μ与 σ:μ=ln(E(X))−12ln(1+var(X)E(X)2),σ2=ln(1+var(X)E(X)2).
注意:已知变换后的数据的统计特征可以反过来推导出原始数据的统计特征,不存在数据信息的损失(可以看到对数转换后变量的均值可以直接由样本数据的均值得到,但不进行变化却需要由样本均值方差两方面去推断得到),也可以发现对数正态分布实际上是对数据进行了对数变化,从而变成了正态分布,这样更加方便的得到了相关的统计学变量。局部期望
随机变量 X在阈值k上的局部期望定义为
g(k)=∫∞k(x−k)f(x)dx
其中f(x)是概率密度。对于对数正态概率密度,这个定义可以表示为g(k)=exp(μ+σ2/2)Φ(−ln(k)+μ+σ2σ)−kΦ(−ln(k)+μσ)
其中 Φ 是标准正态部分的累积分布函数。对数正态分布的局部期望在保险业及经济领域都有应用,著名的Black-Scholes期权定价公式便可由此推导出。相关分布(与高斯分布的关系)
如果 Y=ln(X)Y=ln(X) 与X∼Log-N(μ,σ2),则 Y∼N(μ,σ2)是正态分布。
如果Xm∼Log-N(μ,σ2m), m=1...n¯¯¯¯¯¯¯是有同样 μ 参数、而 σ 可能不同的统计独立对数正态分布变量 ,并且 Y=∏m=1nXm,则 Y 也是对数正态分布变量: Y∼Log-N(nμ,∑m=1nσ2m)。
这是因为在高斯分布求和的分布性质。
在股票中的应用
对数正态分布一般被用来描述增长率。比如股票指数,假设今天标普从2000点涨到了2020,相比于n年前的某一天它从100点涨到101点,虽然今天上涨了20点,远高于另一天上涨的1点,但这两天的上涨率是相同的(1%)。
至于为什么要取对数log(x2/x1),而不是直接用x2/x1,看一眼对数曲线就明白了。(x1,x2分别表示第一天和第二天的股指)。
它有几个很好的性质:
1.假如增长率不变,那么log(1)=0,位于正态分布的中央
2.log(1/a) = -log(a),也就是说股票在一段时间内涨到两倍和跌一半的概率是一样的
3.x为正(股指永远不会为负值),y值能取正无穷到负无穷。 -
对数正态lognormal分布图像
2015-12-15 19:16:04在概率论与统计学中,对数正态分布是对数为正态分布的任意随机变量的概率分布。如果 X 是服从正态分布的随机变量,则 exp(X) 服从对数正态分布;同样,如果 Y 服从对数正态分布,则 ln(Y) 服从正态分布。 如果一... -
matlab径向分布函数作图_常见的概率分布(matlab作图)
2020-12-20 15:22:35一、常见的概率分布表1.1 概率分布分类表连续随机变量分布连续统计量分布离散随机变量分布分布分布二项分布连续均匀分布非中心 分布离散均匀分布(Gamma)分布分布几何分布指数分布非中心 分布超几何分布正态分布分布... -
matlab中evrnd函数_MATLAB 概率分布函数
2020-12-20 20:57:271概率密度函数函数名对应分布的概率密度函数betapdf贝塔分布的概率密度函数binopdf二项分布的概率密度函数chi2pdf卡方分布的概率密度函数...的概率密度函数normpdf正态(高斯)分布的概率密度函数lognpdf对数正... -
matlab中表示拉普拉斯分布_分布拟合——正态/拉普拉斯/对数高斯/瑞利 分布
2020-12-20 23:59:05时间:2017-03-16 20:30:20声明:欢迎被转载,记得注明出处~前言本文为曲线与分布拟合的一部分,主要介绍正态分布、拉普拉斯分布等常用分布拟合的理论推导以及代码实现。一、理论推导假设数据独立同分布。对于任意... -
chi2inv函数 matlab_[转载]常见的概率分布(matlab作图)
2020-12-20 23:11:55一、常见的概率分布表1.1 概率分布分类表连续随机变量分布连续统计量分布离散随机变量分布分布分布二项分布连续均匀分布非中心 分布离散均匀分布(Gamma)分布分布几何分布指数分布非中心 分布超几何分布正态分布分布... -
概率论和统计学中重要的分布函数
2020-08-19 08:25:50随机变量在概率空间中遵循不同类型...对数正态分布(Log Normal Distribution) 幂律分布(Power Law Distribution) 分布函数的使用 引言 每当我们遇到任何概率实验,我们谈论的是随机变量,它只不过是获取实验预期结果的 -
行人检测论文笔记:Pedestrian Detection - An Evaluation of the State of the Art
2017-02-18 20:21:21知识点 对数正态分布(lognormally distributed):对数为正态分布的任意随机变量的概率分布。 如果 X 是正态分布的随机变量...对数正态分布的概率密度函数为:对数平均:对数平均与几何平均相等,并且比算数平均,对 -
常用的概率分布类型及其特征
2011-01-06 20:44:51式中:t,σ为正数,μ和σ分别称为对数正态分布的“对数均值”和“对数标准差”。 3.4 为进行统计推断所构造的分布 3.4.1 t分布(学生氏分布) t—分布常用于区间估计、正态总体的假设检验以及机械概率设计之... -
煤系岩体参数概率分布及Bayes优化
2020-06-23 06:07:50正确确定煤系岩体力学参数的概率分布是松散含水层下采煤顶板...计算结果表明,8煤顶板砂岩强度参数全部接受正态分布和对数正态分布,优化后的方差有所下降,可以提高覆岩采动稳定可靠性分析结果,从而达到优化目的。 -
5.2.2 一些重要的噪声概率密度函数
2020-07-05 21:15:36分别是高斯噪声、瑞利噪声、伽马噪声、指数噪声、均匀噪声及椒盐噪声,他们的概率密度函数、均值及方差如下表所示,另外,《数字信号处理matlabb版》中额外给出了一种称之为对数正态分布的噪声,也附加在下表中: ... -
考虑土壤参数不确定性影响的浅埋基础沉降概率分析
2020-06-04 21:29:34因此,每种方法的输出(用于分析输入变量的概率分布函数的概念)都是目标函数的概率分布的函数。 在本研究中,三种形式的沉降中心,刚性基础拐角的沉降可靠度都拟合有正态概率分布和对数正态分布两种类型。 为此,... -
03 ,似然函数求解 :目标函数推导,对数似然求解,最小二乘法
2020-07-11 17:33:181 ,真实值函数推导 : 真实值正态曲线 定义 : 跟数据曲线很相似的函数 个人思考 : 1 ,目的 : 得到数据的正态分布图 2 ,已知 : 高斯分布图 ( ...似然函数 : 将样本中的每个值,带入到方程中,将每个样本的概率 -
双参数威布尔分布(Weibull分布)参数计算(根据故障数据,求双参数威布尔分布的参数详细步骤)
2020-10-26 23:05:361.双参数威布尔分布的概率密度函数、概率分布函数、可靠度函数: 2.预处理故障数据 将故障数据按时间排序,假设设备分别在以下时间点失效:11.1 、23.5、58.4……则将此时间从小到大排序。并计算中位秩。中位秩的... -
硐室围岩力学参数分布特征与可靠性探讨
2020-07-19 05:01:30分别对这两种试验结果进行检验,结果表明,单轴抗压服从正态分布,抗拉强度服从对数正态分布;利用FLAC软件,对硐室围岩中的应力进行了计算,获得了50个最大主应力和50个最小主应力;采用相同假设检验法,证明最大、最小主... -
MATLAB 概率统计
2019-04-07 21:03:46常见分布的随机数的产生 函数 随机数名 unifrnd 连续均匀分布 unidrnd 离散均匀分布 exprnd 指数分布 normrnd 正态分布 ...对数正态分布 nbinrnd 负二项式分布 ncfrnd 非中心 ... -
约束条件耦合的风路可靠度新数学模型
2020-05-31 17:57:23针对目前风量分布中依靠经验认识全部近似认为是正态分布的情况,利用概率图分析法给出了判断风量分布的严格定义,且给出了基于对数正态分布的风量分布模型,证明了并非所有风量分布均服从正态分布。正态分布由于规律性... -
一种多光束发射和接收FSO系统的信道建模方法
2021-02-09 07:44:45在这几种分布的基础上,将它们推广到多光束发射和接收FSO系统,分别推导出了基于对数正态分布、负指数分布以及Gamma-Gamma分布的多光束发射和接收FSO系统的光强闪烁概率密度分布函数,建立起多光束发射和接收系统... -
numpy学习笔记5——常用函数4
2020-09-17 17:44:56文章目录基本符号表示求逆矩阵解线性方程求特征值和特征向量奇异值分解对角化分解奇异值的定义:奇异值分解的定义:奇异值的求解举例...import numpy as np 基本符号表示 A−1A=EA^{-1} A=EA−1A=E 则A−1A^{... -
线性回归为什么使用平方损失函数
2019-06-06 15:53:44,随机误差服从正态分布(高斯分布) are distributed IID,随机误差是独立同分布的 于是目标变量的条件概率分布: 注意: 整个训练集的似然函数为: 对数似然函数为: 因此,最大化对数似然函数,... -
极大似然估计与贝叶斯估计的比较
2019-04-25 15:56:54已知某个随机样本符合某种概率分布,但是其中某个具体参数不清楚,通过极大似然估计得到,该使这个随机样本出现的概率最大。 一般步骤 1.写出似然函数: 2.对似然函数取对数: 3.对求偏导数: 4.解似然方程组:... -
论文研究-金融危机前后世界主要股票指数的金融风险:基于.pdf
2019-09-20 10:33:12选取2004--2006年(平稳区间)和2007--2009年(危机区间)全球28支股票指数作为样本, 计算标准化后的日对数收益率,利用t分布和正态分布对概率密度分布 函数进行拟合.... -
可靠性:适用于Python的可靠性工程工具包-https:reliability.readthedocs.ioenlatest-源码
2021-02-26 07:26:15支持指数,Weibull,Gamma,Gumbel,正态,对数正态,对数和Beta概率分布 平均剩余寿命,分位数,描述性统计摘要,分布随机抽样 概率密度函数(PDF),累积分布函数(CDF),生存函数(SF),危害函数(HF)和累积... -
论文研究 - 具有可变更换成本的突然失效项目的修改后的更换模型
2020-05-25 03:17:10此外,发现组替换成本分别遵循数据集I和II的对数正态分布和两参数Weibull分布。 基于实证研究,我们发现在现有模型和拟议模型的成本最小化方面,个人替代政策要优于群体替代政策。 鉴于结果,建议对现有的替代政策... -
montecarlo计算结构可靠度的matlab程序-matlab work.rar
2019-08-12 18:40:04montecarlo计算结构可靠度的matlab程序-...1.三种常用分布函数(正态,对数正态,极值一型)的随机数的生成。 2.可靠度度功能函数 3.可靠指标与概率的转换 4.有中文的注释 5.这是一个关于结构可靠度分析的两个实例 -
EM算法之高斯混合模型详细推导过程
2014-05-27 13:19:10那么有下面的公式那么样本x 是一个服从多元高斯分布的随机试验中产生的抽样那么可以写出关于样本值(第i个样本)的概率密度函数,假设一共c个类别那么我们可以定义m个观测样本的对数似然函数对数复合函数求导公式代入... -
matlab函数大全-matlab函数大全.doc
2019-08-12 22:08:31gammaln 函数的对数 gca 获得当前轴句柄 gcbo 获得正执行"回调"的对象句柄 gcf 获得当前图对象句柄 gco 获得当前对象句柄 geomean 几何平均值 get 获知对象属性 getfield 获知构架数组的域 getframe 获取...
-
免费简单粗暴帝国CMS7.5UTF8会员中心用户后台HTML5自适应响应式模板精心优化版
-
MySQL 触发器
-
curselib:curselib-源码
-
UCLA-GE:我在UCLA的GE课程的课程设置-源码
-
【狗狗币】狗狗币在2月份在Twitter上的受欢迎程度超过了比特币
-
5G智慧场馆白皮书.pdf
-
互动1-源码
-
聊聊MyBatis缓存机制
-
异地恋时钟之旅.zip
-
递归神经网络的基于图的依赖分析
-
MySQL DML 语言(插入、更新与删除数据)
-
【linux】解压|压缩|打包命令(tar|zip|rar|bz)
-
MediaPlayer.7z
-
Squid 代理服务器-详细配置配写(三种代理,日志、ACL访问控制)
-
ecma-源码
-
最近消息:Filecoin网络已升级至V10
-
投标方法论
-
C#Winform桌面开发编程上位机基础入门
-
MySQL 数据库权限管理(用户高级管理和精确访问控制)
-
vue2.0+node.js+MongoDB全栈打造商城系统【问题记录】