精华内容
下载资源
问答
  • 概率密度函数在概率论与统计学中,对数正态分布是对数为正态分布的任意随机变量的概率分布。如果 XX 是正态分布的随机变量,则 exp(X)exp(X) 为对数正态分布;同样,如果Y Y 是对数正态分布,则 ln(Y)ln(Y) 为正态...

    这块儿我是真的没听说过,所以直接抄了维基百科,维基万岁!

    概率密度函数

    在概率论与统计学中,对数正态分布是对数为正态分布的任意随机变量的概率分布。如果 X 是正态分布的随机变量,则 exp(X)为对数正态分布;同样,如果 Y 是对数正态分布,则 ln(Y) 为正态分布。 如果一个变量可以看作是许多很小独立因子的乘积,则这个变量可以看作是对数正态分布。一个典型的例子是股票投资的长期收益率,它可以看作是每天收益率的乘积。 对于 x>0 ,对数正态分布的概率密度函数为:

    f(x;μ,σ)=1xσ2πe(lnxμ)2/2σ2

    其中 μ σ 分别是变量对数的平均值与标准差。
    推导过程:概率微分不变性。
    一个正的随机变量 x 是对数正态分布,当且仅当 x 是正态分布。那么:
    N(lnx;μ,σ)=1σ2πexp[(lnxμ)22σ2].

    利用概率微分不变性,有
    N(lnx)dlnx=N(lnx)dlnxdxdx=N(lnx)dxx=lnN(x)dx,
    ,
    其中,
    lnN(x;μ,σ)=1xσ2πexp[(lnxμ)22σ2],  x>0

    是对数正态分布函数。

    期望和方差:

    期望为

    E(X)=eμ+σ2/2

    方差为
    var(X)=(eσ21)e2μ+σ2.

    给定期望值与方差,也可以用这个关系求 μ σ :
    μ=ln(E(X))12ln(1+var(X)E(X)2),

    σ2=ln(1+var(X)E(X)2).

    注意:已知变换后的数据的统计特征可以反过来推导出原始数据的统计特征,不存在数据信息的损失(可以看到对数转换后变量的均值可以直接由样本数据的均值得到,但不进行变化却需要由样本均值方差两方面去推断得到),也可以发现对数正态分布实际上是对数据进行了对数变化,从而变成了正态分布,这样更加方便的得到了相关的统计学变量。

    局部期望

    随机变量 X 在阈值 k 上的局部期望定义为

    g(k)=k(xk)f(x)dx

    其中 f(x) 是概率密度。对于对数正态概率密度,这个定义可以表示为
    g(k)=exp(μ+σ2/2)Φ(ln(k)+μ+σ2σ)kΦ(ln(k)+μσ)

    其中 Φ 是标准正态部分的累积分布函数。对数正态分布的局部期望在保险业及经济领域都有应用,著名的Black-Scholes期权定价公式便可由此推导出。

    相关分布(与高斯分布的关系)

    如果 Y=ln(X)Y=ln(X) XLog-N(μ,σ2) ,则 YN(μ,σ2) 是正态分布。
    如果 XmLog-N(μ,σ2m), m=1...n¯¯¯¯¯¯¯ 是有同样 μ 参数、而 σ 可能不同的统计独立对数正态分布变量 ,并且 Y=m=1nXm ,则 Y 也是对数正态分布变量: YLog-N(nμ,m=1nσ2m)

    这是因为在高斯分布求和的分布性质。

    在股票中的应用

    对数正态分布一般被用来描述增长率。比如股票指数,假设今天标普从2000点涨到了2020,相比于n年前的某一天它从100点涨到101点,虽然今天上涨了20点,远高于另一天上涨的1点,但这两天的上涨率是相同的(1%)。
    至于为什么要取对数log(x2/x1),而不是直接用x2/x1,看一眼对数曲线就明白了。(x1,x2分别表示第一天和第二天的股指)。
    它有几个很好的性质:
    1.假如增长率不变,那么log(1)=0,位于正态分布的中央
    2.log(1/a) = -log(a),也就是说股票在一段时间内涨到两倍和跌一半的概率是一样的
    3.x为正(股指永远不会为负值),y值能取正无穷到负无穷。

    展开全文
  • 拉丁超立方抽样-对数正态分布0、拉丁超立方抽样的理论基础1、导入库和基本准备2、生成(具有对数正态分布的随机变量)参数的随机数3、将生成的随机数输出到Excel中4、将生成的随机数输出到图像中5、代码肯定可以实现...

    0、拉丁超立方抽样的理论基础

    0.1、概况

    拉丁超立方体采样(LHS)最早由McKay等提出,并由Iman和Conover进一步发展,在很多领域中具有广泛的应用性。

    拉丁超立方抽样也是一种分层抽样,在蒙特∙卡罗抽样方法的基础上对采样策略进行了改进,从而做到在保持统计显著性的同时减小采样规模。根据对每个超立方体内样本点的确定方式不同,可将拉丁超立方抽样技术分为:

    • 中值拉丁超立方抽样法
    • 拉丁超立方重要抽样法
    • 含随机排序法的拉丁超立方抽样

    笔者重点介绍含随机排序法拉丁超立方抽样法的基本原理。

    0.2、基本原理

    拉丁超立方抽样的关键是对累积概率分布进行分层,累积概率在0到1之间,分成相等的间隔块后,根据间隔块的概率值得到样本区间。然后从每个样本区间中随机抽取样本,于是以抽样点代表每个区间的值。
    根据n个随机变量 x 1 x_1 x1, x 2 x_2 x2,∙∙∙, x k x_k xk,∙∙∙, x n x_n xn建立 n n n维向量空间,每个随机变量都遵循一定的概率分布, x k x_k xk的累积概率分布函数可以表示为
    y k = f ( x ) y_{k}=f\left ( x \right ) yk=f(x)

    0.3、基本步骤

    假设在每一维向量空间中抽取N个样本,得到拉丁超立方抽样模拟的步骤为:

    1. 将每一维向量空间分成N份,根据式上式的反函数求得对应区间,使得每个区间具有相同的概率;
    2. 在每一维的每个区间中随机选取一个点作为采样点;
    3. 对每一维空间选出的样本点进行随机排序组成各自向量;
    4. 将上面采集到的样本向量进行组合就得到一个 k × N k×N k×N的样本矩阵。

    如下图所示,累积概率分布函数曲线被分成三个区间,每个区间都抽取一个样本,每个区间都有样本取出,且一旦取出后,这个区间将不再被抽样。
    1
    避免了在抽样量较少时可能出现的“聚集”问题,样本可以更加准确反映输入概率分布,实际应用时具有高效性。

    1、导入库和基本准备

    如前正态分布的抽样博客。

    相对于生成生态分布随机变量的抽样方法及代码,仅仅需要改变生成部分即可,故本文仅仅展示了修改部分代码,其他部分请参见博文《对应于正态分布的拉丁超立方抽样

    2、生成(具有对数正态分布的随机变量)参数的随机数

    代码转第6条

    3、将生成的随机数输出到Excel中

    如前正态分布的抽样博客。

    注意参数个数-D的变化对代码的影响

    4、将生成的随机数输出到图像中

    如前正态分布的抽样博客。

    注意参数个数-D的变化对代码的影响

    5、代码肯定可以实现抽样,若需一步一步的更详尽解释,请“挪步”佐佑思维公众号→免费、有问必答!

    6、 ★佐佑思维二维码★

    佐佑思维

    展开全文
  • 导出了对数正态分布场合下恒定应力加速寿命中含有缺失定数截尾样本的近似极大似然估计(AMLE),得到了分布参数和加速方程中未知参数的AMLE的显式解,便于实际计算和工程应用,数值模拟的结果表明本方法可行。
  • 对数正态分布(Log-Normal Distribution)

    万次阅读 多人点赞 2017-11-01 16:02:07
    2017.11.1 人要有发耻心和羞耻心,突然想到了这么一句话,MARK一个博客困惑了...- 相关分布快捷键 加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl + Q 插入链接 Ctrl + L 插入代码 Ctrl + K 插入图片 Ctrl + G 提升标题 Ctrl

    2017.11.1 人要有发耻心和羞耻心,突然想到了这么一句话,MARK一个博客

    困惑了好久,还是写个博客Mark一下,方便以后查询使用

    • 概率密度函数
    • 局部期望

    - 相关分布

    概率密度函数

    对数正态分布是对数为正态分布的任意随机变量的概率分布。如果 Y 是正态分布的随机变量,则exp(Y)是对数正态分布;同样,如果 X 是对数正态分布,则ln(X)为正态分布,如果一个变量可以看成是许多很小独立因子的乘积,则这个变量可以看作是对数正态分布。 给定一个 x>0 ,对数正态分布的概率密度函数为:

    f(x;μ;σ)=12πxσe(lnxμ)22σ2

    其中, μ σ 分别是变量对数的平均值和标准差。期望值和方差分别为:
    E(X)=eμ+σ2/2

    var(X)=(eσ21)e2μ+σ2

    给定期望值与方差,也可以用这个关系求 μ σ 的大小
    μ=ln(E(X))12ln(1+var(X)E(X)2)
    σ2=ln(1+var(X)E(X)2)

    求解时,需要将 μ σ 计算出来带入到上面的 f(x;μ;σ) 中使用matlab带有的 logncdflognpdf获取对数正态分布的累积分布函数和密度函数。
    注解:已知变换后的数据的统计特征可以反过来推导出原始数据的统计特征,不存在数据信息的损失(对数转换后变量的均值可以直接由样本数据的均值得到,但不进行变化却需要由样本均值方法两方面去推断得到),参见: 机器学习小组知识点17 也可以发现对数正态分布实际上是对数据进行了对数变化,从而变成了正态分布,方便得到相关的统计学变量。

    局部期望

    随机变量 X 在阈值k上的局部期望定义为:

    g(k)=k(xk)f(x)dx

    其中 f(x) 是概率密度,对于对数正态概率密度,这个定义为:
    g(k)=exp(μ+σ2/2)Φ(ln(k)+μ+σ2σ)kΦ(ln(k)+μσ)

    其中 Φ 是标准正态分布的累积分布函数,对数正态分布的局部期望在经济领域应用广泛。

    相关分布

    这里指的是与高斯分布的关系
    如果 Y=ln(X) X LogN(μ,σ2) ,则 Y N(μ,σ2) 是正态分布.
    如果 Xm=LogN(μ,σ2m),m=1...n¯¯¯¯¯¯¯ 是有同样% μ 参数,而 σ 可能不同的统计独立对数正态分布变量,并且 Y=Nm=1Xm ,则 Y 也是正态分布变量:YLogN(nμ,nm=1σ2m),满足高斯分布求和性质。

    参数的最大似然估计

    为了确定对数正态分布参数 μ σ 最大似然估计,可以采用与正态分布参数最大似然估计同样的方法。

    fL(x;μ,σ)=1xfN(lnx;μ,σ)

    其中用 fL() 表示对数正态分布的概率密度函数,用 fN() 表示正态分布,因此,用与正态分布同样的指数,我们可以得到对数最大似然函数:
    lL(μ,σ|x1,x2,,xn)=klnxk+lN(μ,σ|lnx1,lnx2,,lnxn)=constant+lN(μ,σ|lnx1,lnx2,,lnxn)

    由于第一项相对于 μ sigma 来说是常数,两个对数最大似然函数 lL lN 在同样的 μ σ 处有最大值。因此,根据正态分布最大似然参数估计器的公式以及上面的方程,推导出对数正态分布参数最大似然估计为:
    μ^=klnxkn,σ^2=(lnxkμ^)2n

    展开全文
  • 最近由于项目需求,需要c#编程实现...1·确定参数的一个数据分布和决定模拟次数,在服从该分布的情况下产生N个随机数。 2·将每次产生的随机数,带入表达式中算出结果,这样可以得到N个结果。 3·用统计方法把N...

      最近由于项目需求,需要c#编程实现蒙特卡罗算法。在网上找了好几天的资料,都没找到自己想要的结果,最终还是得靠自己动手哦。

    关于蒙特卡罗算法的概念,意义及具体步骤介绍,可以查阅相关的资料,都有详细介绍。我这里大概分三步:

    1·确定参数的一个数据分布和决定模拟次数,在服从该分布的情况下产生N个随机数。

    2·将每次产生的随机数,带入表达式中算出结果,这样可以得到N个结果。

    3·用统计方法把N个结果的数字特征表示出来,比如,求出平均值,方差等。

    对于c#程序的实现我觉得难点在于第一步,也就是概率随机数的产生,我这里也主要讲的是随机数的产生,以服从对数正态分布的随机数为例。

    在Matlab和EXCEL中都有自带的库函数,可以直接产生。c#中则要自己编写,本来想自己是数学专业毕业的,对于这个问题应该不难,但是我错了,反反复复写了几次都不对,衡量的标准是公司一兄弟用excel中的loginv函数产生的随机数来比较。在两研究生同事的帮忙推数学公式的情况下,研究了excel中的loginv函数后,终于代码落成,由于代码中使用很多数学公式,而在代码中不方便注释,请读者查看对数正态分布和正态分布相关函数以及EXCEL的帮助文档。代码在visual studio 2010中测试通过,没问题。

     /// <summary>
    /// 产生对数正态分布随机数
    /// </summary>
    /// <param name="miu">平均值(实际应用中常需要将使用Math.Log(miu)作为参数)</param>
    /// <param name="sigma">方差(实际应用中常需要将使用0.5*Math.Log(sigma)作为参数)</param>
    /// <returns></returns>
    public static double Random_LogNorMal(double miu, double sigma)
    {
    var rand
    = new Random(Guid.NewGuid().GetHashCode());
    var x
    = rand.NextDouble();
    return Math.Exp(miu + sigma * NormalFun(x));
    }
    /// <summary>
    /// 误差函数估算
    /// </summary>
    /// <param name="x"></param>
    /// <returns></returns>
    private static double ErfFun(double x)
    {
    double d = 2.0 / Math.Sqrt(Math.PI);
    double t = x / Math.Sqrt(2);
    double dsum = 0;
    double dn = 0;
    for (int n = 0; ; n++)
    {
    if (n == 0)
    {
    dn
    = t;
    }
    else
    {
    dn = Math.Pow(-1, n) * (Math.Pow(t, 2 * n + 1) / ((2 * n + 1) * nby(n)));

    }
    if (Math.Abs(dn) < 0.00001)
    {
    break;
    }

    dsum
    += dn;

    }
    return 0.5 * (d * dsum + 1);
    }
    /// <summary>
    /// n阶乘算法
    /// </summary>
    /// <param name="n"></param>
    /// <returns></returns>
    private static double nby(int n)
    {
    double by = 1;
    for (int i = 1; i <= n; i++)
    {
    by
    = by * i;
    }
    return by;
    }
    /// <summary>
    /// 正态分布随机数产生(初次以1为迭代单位,尔后采用二分查找法搜索符合要求随机数)
    /// </summary>
    /// <param name="p"></param>
    /// <returns></returns>
    private static double NormalFun(double p)
    {
    double z = 0;
    double sumz = 0.5;
    if (p > 0.5)
    {
    do
    {
    z
    += 1;
    sumz
    = ErfFun(z);
    }
    while (sumz < p);
    if (sumz - p > 0.00001) //可根据需求自行确定精度。
                    {
    return SearchNum(z - 1, z, p);
    }
    else return z;
    }
    else
    if (p < 0.5)
    {
    do
    {
    z
    -= 1;
    sumz
    = ErfFun(z);
    }
    while (sumz > p);
    if (p - sumz > 0.00001)
    {
    return SearchNum(z, z + 1, p);
    }
    else return z;
    }
    return z;
    }
    /// <summary>
    /// 递归搜索随机数
    /// </summary>
    /// <param name="z1"></param>
    /// <param name="z2"></param>
    /// <param name="p"></param>
    /// <returns></returns>
    private static double SearchNum(double z1, double z2, double p)//z1>z2;
    {
    double z = (z1 + z2) / 2;
    double ef = ErfFun(z);
    if (ef < p && p - ef > 0.00001)
    {
    return SearchNum(z, z2, p);
    }
    else
    {
    if (ef > p && ef - p > 0.00001)
    {
    return SearchNum(z1, z, p);
    }

    }
    return z;
    }

    需要注意的是Random_LogNorMal(double miu, double sigma)中的miu和sigma并不是随机数的平均值和方差,而是随机数的对数平均值和方差,所以常用miu=Math.Log(平均值),sigma=0.5*Math.Log(方差)作为参数传递,如有不明处可以参照对数正态分布和正态分布相关介绍。

    调用一次Random_LogNorMal(double miu, double sigma)函数就产生一个服从对数正态分布的随机数,根据模拟次数,可以产生多次随机数。如有不妥的地方,欢迎朋友们指正,如有其他更好的方法,也期待共享。


     

    转载于:https://www.cnblogs.com/zhoushancai/archive/2011/08/11/2135225.html

    展开全文
  • 正态分布(高斯分布)

    万次阅读 多人点赞 2018-11-09 15:54:21
    正态分布 概要 历史 正态分布的定义 概率密度函数 累积分布函数 生成函数 性质 动差或矩(moment) 中心极限定理 无限可分性 稳定性 标准偏差 相关分布 参量估计 参数的极大似然估计 计量误差 参考...
  • 本文将阐述正态分布的概率,并解释它的应用为何如此的广泛,尤其是在数据科学和机器学习领域,它几乎无处不在。我将会从基础概念出发,解释有关正态分布的一切,并揭示它为何如此重要。▲1893 年人类身高分布图,...
  • 作者 | Farhad Malik译者 | Monanfei责编 | 夕颜出品 | AI科技大本营(ID: rgznai100)为什么正态分布如此特殊?为什么大量数据科学和机器学习的...本文将阐述正态分布的概率,并解释它的应用为何如此的广泛,尤其是在...
  • 作者 | Farhad Malik译者 | Monanfei责编 | 夕颜出品 | AI科技大本营(ID: rgznai100)为什么正态分布如此特殊?为什么大量数据科学和机器学习的...本文将阐述正态分布的概率,并解释它的应用为何如此的广泛,尤其是在...
  • 正态分布 高斯分布(数学)

    千次阅读 2020-04-26 20:57:49
    正态分布(Normal distribution),也称高斯分布(Gaussian distribution) ... 4正态分布应用 5数据正态分布检验 Q-Q图[1] 6参考文献 [编辑] 什么是正态分布  正态分布是一种概率分布...
  • 与离散型随机变量相对,连续...正态分布可能是定量研究工作中应用最广泛的连续概率分布。它在现代投资组合理论和许多风险管理技术中发挥着关键作用。因为它有很多用途,所以是投资专业人士必备知识。正态分布在统...
  • 大千世界随机现象众多,其分布各异。按数据变量类型划分可以分为离散型与连续性两类:离散型变量根据名称很好理解,就是数据的取值是不连续的。例如掷硬币就是一个典型的离散数据,因为抛硬币的就2种结果。你可以把...
  • 正态分布

    2014-12-16 16:41:00
    正态分布 绿线代表标准正态分布 概率密度函数 颜色与概率密度函数同 累积分布函数 参数 数学期望(实数)方差(实数) 支撑集 概率密度函數 累积分布函数 ...
  • 数据转化为正态分布的方法及优缺点 文章目录数据转化为正态分布的方法及优...如环境中某些污染物的分布,人体中某些微量元素的分布等,可用对数正态分布改善其正态性。 (2)使数据达到方差齐性,特别是各样本的标准
  • 作者 | Farhad Malik译者 | Monanfei责编 | 夕颜出品 | AI科技...为什么大量数据科学和机器学习的文章都围绕正态分布进行讨论?我决定写一篇文章,用一种简单易懂的方式来介绍正态分布。 在机器学习的世界中...
  • java正态分布的运用

    千次阅读 2019-07-19 10:26:29
    正态分布概念是由德国的数学家和天文学家Moivre(棣莫弗)于1733年受次提出的,但由于德国数学家Gauss(高斯)率先将其应用于天文学家研究,故正态分布又叫高斯分布。正态分布起源于误差分析,早期的天文学家通过...
  • 高斯分布 正态分布

    千次阅读 2010-11-30 21:21:00
    <br />正态分布(normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量X服从一个数学期望为...
  • 正态分布及抽样分布

    万次阅读 2015-12-19 14:28:13
    正态分布也称常态分布或常态分配,是连续随机变量概率分布的一种。人们把均值为μ、标准偏差为σ的正态分布记作N(μ,σ)。其公式如下所示: 其图形如下   ​ ​x是从此分布中
  • 正态分布(Normal distribution)正态分布又称高斯分布,是一种很重要的连续型分布,应用甚广。在医学卫生领域中有许多变量的频数分布资料可绘制成直方图而且频数分布是中间(靠近均数处)频数多,两边频数少,且...
  • 正态分布及matlab实现

    万次阅读 多人点赞 2014-06-03 09:58:48
    正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。 若随机变量X服从一个数学期望为μ、标准...
  • 正态分布中的贝叶斯分类方法

    千次阅读 2018-10-01 11:18:52
    但是,在实际工程应用中,类条件概率密度函数的获取是比较困难的。因此,常常假设类条件概率密度函数服从多元正态分布。 本文主要介绍多元正态分布中的贝叶斯分类方法。   对于c类问题,以最小错误率的决策标准...
  • 高斯分布(正态分布)

    千次阅读 2018-01-18 15:42:02
    转自:https://baike.baidu.com/item/%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A.棣莫弗在求二项分布的渐近公式中...
  • 连续型变量 如:正态分布 离散型变量 如:二项分布、泊松分布 三者之间的关系 二项分布(Binomial distribution) 二项分布(Binomial distribution)是n重伯努利试验成功次数的离散概率分布,记作。伯努利试验是...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 5,778
精华内容 2,311
关键字:

对数正态分布的实际应用