精华内容
下载资源
问答
  • 对数正态分布的应用
    万次阅读 多人点赞
    2017-11-01 16:02:07

    2017.11.1 人要有发耻心和羞耻心,突然想到了这么一句话,MARK一个博客

    困惑了好久,还是写个博客Mark一下,方便以后查询使用

    • 概率密度函数
    • 局部期望

    - 相关分布

    概率密度函数

    对数正态分布是对数为正态分布的任意随机变量的概率分布。如果 Y 是正态分布的随机变量,则exp(Y)是对数正态分布;同样,如果 X 是对数正态分布,则ln(X)为正态分布,如果一个变量可以看成是许多很小独立因子的乘积,则这个变量可以看作是对数正态分布。 给定一个 x>0 ,对数正态分布的概率密度函数为:

    f(x;μ;σ)=12πxσe(lnxμ)22σ2

    其中, μ σ 分别是变量对数的平均值和标准差。期望值和方差分别为:
    E(X)=eμ+σ2/2

    var(X)=(eσ21)e2μ+σ2

    给定期望值与方差,也可以用这个关系求 μ σ 的大小
    μ=ln(E(X))12ln(1+var(X)E(X)2)
    σ2=ln(1+var(X)E(X)2)

    求解时,需要将 μ σ 计算出来带入到上面的 f(x;μ;σ) 中使用matlab带有的 logncdflognpdf获取对数正态分布的累积分布函数和密度函数。
    注解:已知变换后的数据的统计特征可以反过来推导出原始数据的统计特征,不存在数据信息的损失(对数转换后变量的均值可以直接由样本数据的均值得到,但不进行变化却需要由样本均值方法两方面去推断得到),参见: 机器学习小组知识点17 也可以发现对数正态分布实际上是对数据进行了对数变化,从而变成了正态分布,方便得到相关的统计学变量。

    局部期望

    随机变量 X 在阈值k上的局部期望定义为:

    g(k)=k(xk)f(x)dx

    其中 f(x) 是概率密度,对于对数正态概率密度,这个定义为:
    g(k)=exp(μ+σ2/2)Φ(ln(k)+μ+σ2σ)kΦ(ln(k)+μσ)

    其中 Φ 是标准正态分布的累积分布函数,对数正态分布的局部期望在经济领域应用广泛。

    相关分布

    这里指的是与高斯分布的关系
    如果 Y=ln(X) X LogN(μ,σ2) ,则 Y N(μ,σ2) 是正态分布.
    如果 Xm=LogN(μ,σ2m),m=1...n¯¯¯¯¯¯¯ 是有同样% μ 参数,而 σ 可能不同的统计独立对数正态分布变量,并且 Y=Nm=1Xm ,则 Y 也是正态分布变量:YLogN(nμ,nm=1σ2m),满足高斯分布求和性质。

    参数的最大似然估计

    为了确定对数正态分布参数 μ σ 最大似然估计,可以采用与正态分布参数最大似然估计同样的方法。

    fL(x;μ,σ)=1xfN(lnx;μ,σ)

    其中用 fL() 表示对数正态分布的概率密度函数,用 fN() 表示正态分布,因此,用与正态分布同样的指数,我们可以得到对数最大似然函数:
    lL(μ,σ|x1,x2,,xn)=klnxk+lN(μ,σ|lnx1,lnx2,,lnxn)=constant+lN(μ,σ|lnx1,lnx2,,lnxn)

    由于第一项相对于 μ sigma 来说是常数,两个对数最大似然函数 lL lN 在同样的 μ σ 处有最大值。因此,根据正态分布最大似然参数估计器的公式以及上面的方程,推导出对数正态分布参数最大似然估计为:
    μ^=klnxkn,σ^2=(lnxkμ^)2n

    更多相关内容
  • Lognormal Distribution对数正态分布

    千次阅读 2020-12-28 22:49:08
    对数正态分布(logarithmic normal distribution)是指一个随机变量的对数服从正态分布,则该随机变量服从对数正态分布对数正态分布从短期来看,与正态分布非常接近。但长期来看,对数正态分布向上分布的数值更多...

    对数正态分布(logarithmic normal distribution)是指一个随机变量的对数服从正态分布,则该随机变量服从对数正态分布。对数正态分布从短期来看,与正态分布非常接近。但长期来看,对数正态分布向上分布的数值更多一些。

    有些量本身就是不对称的。例如,试想,人们完成某项特定任务需要的时间:因为每个人都是不同的,我们会得到一个分布。然而,所有的值都必然是正数(因为时间不可能为负数)。而且,我们还能预测到该分布可能的形状:有一个无人可及的最小时间,然后是少数一些非常快的“冠军”,接下来就是普通人的最具代表性的完成时间形成一个高峰,最后是尾部一长串的“掉队者”。显然,高斯分布不会很好地描述这样的分布,因为高斯分布中x可以定义为正值,也可定义为负值,它是对称的且尾部很短。[1]

    在很多应用中,特别是在可靠性和维修性方面,数据可能不符合正态分布。可是,随机变量的对数可能符合正态分布,对此情况称为对数正态分布。如果应用对数正态分布,在对数正态图纸上数据的图形将是一条直线。绘图的过程与其他分布是相同的。其分析的过程包括计算对数值的平均值和标准差,以及对最终结果取反对数。[2]

    对数正态分布与正态分布很类似,除了它的概率分布向右进行了移动。对数正态分布从短期来看,与正态分布非常接近。但长期来看,对数正态分布向上分布的数值更多一些。更准确地说,对数正态分布中,有更大向上波动的可能,更小向下波动的可能。[3]

    对数正态分布用于半导体器件的可靠性分析和某些种类的机械零件的疲劳寿命。其主要用途是在维修性分析中对修理时间数据进行确切的分析。

    已知对数正态分布的密度函数,就可以根据可靠度与不可靠度函数的定义计算出该分布的可靠度函数和不可靠度函数的表达式

    性质

    对数正态分布具有如下性质:

    (1)正态分布经指数变换后即为对数正态分布;对数正态分布经对数变换后即为正态分布。

    (2)γ,t是正实数,X是参数为(μ,σ)的对数正态分布,则

    仍是对数正态分布,参数为

    (3)对数正态总是右偏的。

    (4)对数正态分布的均值和方差是其参数(μ,σ)的增函数。

    (5)对给定的参数μ,当σ趋于零时,对数正态分布的均值趋于exp(μ),方差趋于零

    应用:股票

    对数正态分布(logarithmic normal distribution):一个随机变量的对数服从正态分布,则该随机变量服从对数正态分布。

    在分析测试中,特别是在痕量分析中,在不少情况下,测定值不遵循正态分布,而是遵循对数正态分布。

    在概率论与统计学中,对数正态分布是对数为正态分布的任意随机变量的概率分布。如果 X 是服从正态分布的随机变量,则 exp(X) 服从对数正态分布;同样,如果 Y 服从对数正态分布,则 ln(Y) 服从正态分布。 如果一个变量可以看作是许多很小独立因子的乘积,则这个变量可以看作是对数正态分布。一个典型的例子是股票投资的长期收益率,它可以看作是每天收益率的乘积。

    Some common distributions which are not directly related to the normal distribution

    are described briefly in the following:

    • Lognormal distribution: A normal distribution, plotted on an exponential scale.

    A logarithmic transformation of the data is often used to convert a strongly

    skewed distribution into a normal one.

    Normal distributions are the easiest ones to work with. In some circumstances a set

    of data with a positively skewed distribution can be transformed into a symmetric,

    normal distribution by taking logarithms. Taking logs of data with a skewed

    distribution will often give a distribution that is near to normal

    展开全文
  • 应用对数正态分布函数描述了VFD寿命分布,利用最小二乘法(LSM)估计出均值和标准差,完成了恒定及步进应力温度试验数据的统计和分析,并自行开发了寿命预测软件。数值结果表明,该试验方案是正确可行的,VFD的寿命服从对数...
  • 我想使用Scipy拟合对数正态分布。我之前已经使用Matlab来完成它,但由于需要将应用程序扩展到统计分析之外,我正在试图在Scipy中重现拟合值。拟合对数正态分布使用Scipy与Matlab下面是Matlab代码我用适合我的数据:%...

    我想使用Scipy拟合对数正态分布。我之前已经使用Matlab来完成它,但由于需要将应用程序扩展到统计分析之外,我正在试图在Scipy中重现拟合值。拟合对数正态分布使用Scipy与Matlab

    下面是Matlab代码我用适合我的数据:

    % Read input data (one value per line)

    x = [];

    fid = fopen(file_path, 'r'); % reading is default action for fopen

    disp('Reading network degree data...');

    if fid == -1

    disp('[ERROR] Unable to open data file.')

    else

    while ~feof(fid)

    [x] = [x fscanf(fid, '%f', [1])];

    end

    c = fclose(fid);

    if c == 0

    disp('File closed successfully.');

    else

    disp('[ERROR] There was a problem with closing the file.');

    end

    end

    [f,xx] = ecdf(x);

    y = 1-f;

    parmhat = lognfit(x); % MLE estimate

    mu = parmhat(1);

    sigma = parmhat(2);

    而这里的拟合图:

    nFA9L.png

    现在,这里是我的Python代码实现同样的目的:

    import math

    from scipy import stats

    from statsmodels.distributions.empirical_distribution import ECDF

    # The same input is read as a list in Python

    ecdf_func = ECDF(degrees)

    x = ecdf_func.x

    ccdf = 1-ecdf_func.y

    # Fit data

    shape, loc, scale = stats.lognorm.fit(degrees, floc=0)

    # Parameters

    sigma = shape # standard deviation

    mu = math.log(scale) # meanlog of the distribution

    fit_ccdf = stats.lognorm.sf(x, [sigma], floc=1, scale=scale)

    下面是使用Python代码的配合。

    mDxHE.png

    正如你看到的,代码两套能够产生良好的配合,至少在视觉上来讲的。

    问题是估计参数mu和sigma存在巨大差异。

    来自Matlab:mu = 1.62 sigma = 1.29。 Python:mu = 2.78 sigma = 1.74。

    为什么会有这样的差异?

    注意:我已经仔细检查过两套数据都是正确的,一样。分数相同,分布相同。

    非常感谢您的帮助!提前致谢。

    其他信息:

    import scipy

    import numpy

    import statsmodels

    scipy.__version__

    '0.9.0'

    numpy.__version__

    '1.6.1'

    statsmodels.__version__

    '0.5.0.dev-1bbd4ca'

    Matlab的版本是R2011b。

    版:

    正如下面的回答证明,故障在于SciPy的0.9。我能够使用Scipy 11.0从Matlab重现mu和sigma结果。

    一个简单的方法来更新您的SciPy的是:

    pip install --upgrade Scipy

    如果你不具备PIP(你应该!):

    sudo apt-get install pip

    2013-03-26

    Mike

    +1

    看看这两组数据点,它们看起来相当不同(例如,比较右下角蓝色圆圈的位置)。如果数据不相同,则没有理由认为适合。 –

    2013-03-26 06:29:18

    +0

    两组数据*完全相同。我已经彻底检查过,以确保事实并非如此。这些图显示略有不同,因为我用来在Matlab中绘制的代码是非库代码。无论如何,要点是所拟合的数据完全相同,因此它们应该产生相同的平均值和标准偏差值。 –

    2013-03-26 06:40:59

    +0

    我很抱歉,但我不买这个(除非情节是关闭的)。只是直观地比较两个图上最右边的点的横坐标,看看它们是*非常*不同。如果您肯定数据是相同的,请将它与您用于将其读入Python和MATLAB的代码一起包含它。 –

    2013-03-26 06:44:34

    展开全文
  • 正态分布指数分布对数正态分布和威布尔分布函数和在工程分析中的应用.doc
  • 这一次我将使用简单的语言,使用实例的方式展示对数正态分布在数学建模比赛中的应用。 正态分布物理意义 我们先从正态分布的物理意义说起,虽然大家可能都知其公式,但是对其物理意义并没非常深刻的理解。简而言之...

    最近闲暇时间很多,正好也可以收集整理一些之前学习的资料,还有自己的一些经验供大家参考。这一次我将使用简单的语言,使用实例的方式展示对数正态分布在数学建模比赛中的应用。

    正态分布物理意义

    我们先从正态分布的物理意义说起,虽然大家可能都知其公式,但是对其物理意义并没非常深刻的理解。简而言之,正态分布的物理意义是——“正态分布是由大量的、由种种原因产生的元误差叠加而成的”。其中常常在书中拿来被举例的就是著名的高尔顿板:

    对于每一个下落的小球来说,每一次撞到钉子,都有0.5的概率去左边,0.5的概率去右边。而在下落时有会撞到很多钉子;钉子与钉子之间也没有任何关系。所以最后的下落的整体趋势呈现出正态分布。

    对数正态分布

    但是现实往往是复杂的,这体现在许多事情都有蛛丝马迹的联系。以国家的GDP为例,各个国家的GDP种类与许多因素(元误差)相关,比如人口数量、科技水平、平均受教育程度、拥有资源(自然资源与人文资源)、所处的地理位置等等因素。

    但是这些造成GDP差异的因素之间存在千丝万缕的关系。譬如说科技水平高的地区,相对更重视教育,所以平均人口素质较高;平均人口素质高了之后又可能会提升资源利用率,也可以创作出新的资源(这里只如文学作品,电影等等,可以参考文明6电影工厂加繁荣加旅游业绩);有了更多的资源又能进一步提升平均素质。总的来说这些因素间呈现相互促进的关系。

    而一旦这些元误差(因素)相互促进,那么最后的结果就会呈现对数正态分布,而且吊车尾越长说明元误差间的相互作用更大,下面以世界银行统计的各个国家2018年的GDP(这一年统计的相对比较全面)为例具体说明:

    可以看到有统计数据的244个国家与地区中,GDP较小的后220个国家几乎一直贴地,并看不出来符合何种统计分布

    可以看到有统计数据的244个国家与地区中,GDP较小的后220个国家几乎一直贴地,并看不出来符合何种统计分布。

    对GDP取对数后看,已经很符合正态分布了

    后面吊车尾太长了,画不下QRZ

    可以看出有正态分布的味了

    当然各个国家GDP的分布波动很厉害,这也是社会学统计的正常现象,如果用理想实验来说明最后的拟合效果会好很多。

    对数正态分布试用范围

    对数正态分布比较常见在社会学分析之中。判断应该使用正态分布还是对数正态分布只需把握最关键的一个标准,即:如果导致这个数据产生差异的元误差是相互独立或者近似独立的,那么使用正态分布;如果元误差之间是相互作用的,则使用对数正态分布。

     

     

     

    展开全文
  • 正态分布、指数分布、对数正态分布和威布尔分布函数及在工程分析中的应用.doc
  • 正态分布、指数分布、对数正态分布和威布尔分布函数及其在工程分析中的应用.doc
  • 正态分布、指数分布、对数正态分布和威布尔分布函数和在工程分析中的应用.doc
  • 拉丁超立方抽样-对数正态分布0、拉丁超立方抽样的理论基础1、导入库和基本准备2、生成(具有对数正态分布的随机变量)参数的随机数3、将生成的随机数输出到Excel中4、将生成的随机数输出到图像中5、代码肯定可以实现...
  • 首先,通过曲线拟合,建立了路段行程时间的概率分布模型,结果表明对数正态分布的拟合效果最佳;其次,利用统计学理论,分别考虑路段相关和路段独立两种情况,建立了基于对数正态和分布的路径行程时间可靠性评价模型;在此...
  • 正态分布、指数分布、对数正态分布和威布尔分布函数及其在工程施工分析中的应用.doc
  • 概率密度函数在概率论与统计学中,对数正态分布是对数为正态分布的任意随机变量的概率分布。如果 XX 是正态分布的随机变量,则 exp(X)exp(X) 为对数正态分布;同样,如果Y Y 是对数正态分布,则 ln(Y)ln(Y) 为正态...
  • 进一步研究具有对数正态分布的alpha序列过程中三个重要参数2,,的统计性质进而能更好地研究alpha序列过程中的一些统计推断问题,分别采用基于最小二乘估计法的非参数推断方法以及基于最大似然估计法的参数推断方法,...
  • 对于大小为n的随机样本,间隔中的预期样本数为(cdf(b) - cdf(a))*n其中cdf(x)是累积分布函数 . 要绘制预期的直方图,您将计算每个bin的值 .下面的脚本显示了在matplotlib直方图上绘制预期直方图的一种方法 . 它生成...
  • 本文研究了垄断卖方应如何为买方具有对数正态分布的支付意愿(WTP)的三级价格歧视应用程序确定最优的定价变量集(定价指标)。 在非常类似于线性回归和概率回归的设置中,本文表明,当垄断卖方被限制使用一种度量...
  • 已经开发了以下代码和过程,以提供一个简单且完整的工具,用于从xls表格数据开始,根据对数正态分布和幂律分布自动实现对象拟合频率数据的自动化。 该程序使用外部资源对幂律分布进行拟合代码,我们将给出参考。 ...
  • end %则在上面nlinfit函数调用如下,不要忘记那个@ nlinfit(x,y,@test ,a) 例子 3:(正态分布函数)问题:对于正态分布函数normcdf(x, μ, σ),我们现在已经有三组(x,y)的数据,我们要求最佳的μ, σ值 >> f = ...
  • 导出了对数正态分布场合下恒定应力加速寿命中含有缺失定数截尾样本的近似极大似然估计(AMLE),得到了分布参数和加速方程中未知参数的AMLE的显式解,便于实际计算和工程应用,数值模拟的结果表明本方法可行。
  • C#:实现蒙特卡罗(对数正态分布的随机数的产生)算法(附完整源码)
  • 文章目录正态分布 Normal distribution正态分布相关数据构造正态分布相关图像绘制正态分布概率密度函数图像绘制正态分布累计概率密度函数图像绘制正态分布检验直方图初略判断Shapiro-...-Darling 检验对数正态分布...
  • import numpy as np import pandas as pd import matplotlib.pyplot as plt from scipy import stats Norm = np.random.normal(size = 5)...print(stats.norm.pdf(Norm))#正态分布随机数密度值 print(stats.norm.cd...
  • 正态分布 高斯分布(数学)

    千次阅读 2020-04-26 20:57:49
    正态分布(Normal distribution),也称高斯分布(Gaussian distribution) ... 4正态分布应用 5数据正态分布检验 Q-Q图[1] 6参考文献 [编辑] 什么是正态分布  正态分布是一种概率分布...
  • 大千世界随机现象众多,其分布各异。按数据变量类型划分可以分为离散型与连续性两类:离散型变量根据名称很好理解,就是数据的取值是不连续的。例如掷硬币就是一个典型的离散数据,因为抛硬币的就2种结果。你可以把...
  • 对数正态分布(logarithmic normal distribution)是指一个随机变量的对数服从正态分布,则该随机变量服从对数正态分布对数正态分布从短期来看,与正态分布非常接近。但长期来看,对数正态分布向上分布的数值更...
  • 正态分布(Normal distribution)正态分布又称高斯分布,是一种很重要的连续型分布,应用甚广。在医学卫生领域中有许多变量的频数分布资料可绘制成直方图而且频数分布是中间(靠近均数处)频数多,两边频数少,且...
  • 与离散型随机变量相对,连续...正态分布可能是定量研究工作中应用最广泛的连续概率分布。它在现代投资组合理论和许多风险管理技术中发挥着关键作用。因为它有很多用途,所以是投资专业人士必备知识。正态分布在统...
  • 在本文关于如何在R中进行贝叶斯分析。我们介绍贝叶斯分析,这个例子是关于职业足球比赛...在这种情况下,我们想知道θ的后验分布是什么样子的,这个分布的平均值是什么。为了做到这一点,我们将在三种情况下分析: ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 9,348
精华内容 3,739
热门标签
关键字:

对数正态分布的应用