精华内容
下载资源
问答
  • 一个金矿矿化的对数正态分布及指数函数波动特征,李俊英,李培良,本文从数理统计、三度空间分布等诸方面,研究描述了新城金矿床的品位、线金属量等矿化丰度特征。发现新城金矿焦家式矿体矿化数据
  • 目录0引言1、函数名2、示例2.1正态分布随机数2.2偏正态分布2.3对数正态分布写在最后的话 0引言 最近在看偏正态分布相关的东西,偏正态分布的定义形式还是挺多样的,在偏态分布及其数字特征(R语言可视化)中我介绍的...

    0引言

    最近在看偏正态分布相关的东西,偏正态分布的定义形式还是挺多样的,在偏态分布及其数字特征(R语言可视化)中我介绍的最初的一种定义。在平时做模型做随机模拟的时候的需要产生随机数来检验自己模型估计的有效性,我们可以通过各种分层表示用已知的分布去近似,也可以通过筛法使用均匀分布去生成、也可以用MCMC去采样。但是最为一个专业的统计软件——R语言肯定是有内置函数或者内置包去做的。大家感兴趣原理的也可以自行打开R函数查看。
    本文的主要目的是介绍R语言内部的产生下面分布的随机数的函数。
    – 一元正态分布随机数
    – 一元偏正态分布随机数
    – 一元对数正态随机数
    – 多元正态分布随机数
    – 多元偏正态分布随机数
    – 多元对数正态随机数

    1、函数名

    对于熟悉R语言的人只有函数名字和包名即可,下面列出具体名字。

    维度分布函数
    一维度正态分布rnormstats
    一维度偏正态分布rsnsn
    一维度对数正态rlnormstats
    多维度正态分布mvrnormMASS
    多维度偏正态分布rmsnsn
    多维度对数正态mvlognormalMethylCapSig

    但是对于很多R小白的科研大佬来说只有一个名字是比较浪费时间的,下面给出具体案例。

    2、示例

    先把该安装的包岸上并且载入,后面有备注大家按需安装载入。

    install.packages("MethylCapSig")  # 多元对数正态包
    install.packages("MASS")  # 多元正态分布包
    install.packages("sn")  # 偏态数据包
    library(MASS)
    library(sn)
    library(MethylCapSig)
    

    2.1正态分布随机数

    这块介绍如何生成一元和多元的正态分布随机数。生成正态分布的随机数的函数是rnorm,多元正态随机数用mvrnorm

    #生成n个均值0标准差1的正态随机数
    > n = 10
    > rnorm(n, mean = 0, sd = 1)
     [1]  0.6035027 -0.9081701  1.5303255  0.3761588 -1.6406858 -1.5728766
     [7] -1.6586157  0.8287051  1.7688131  1.1472097
    
    mvrnorm(n = 1, mu, Sigma, tol = 1e-6, empirical = FALSE, EISPACK = FALSE)
    # 生成均值为mu,协方差矩阵为Sigma的10次观测的多元正态随机数
    > mu <- rep(0, 2)
    > mu
    [1] 0 0
    > Sigma <- matrix(c(5,1,1,2),2,2)
    > Sigma
         [,1] [,2]
    [1,]    5    1
    [2,]    1    2
    > mvrnorm(n, mu, Sigma)
                [,1]       [,2]
     [1,]  0.3458454  0.3552218
     [2,] -4.9145503 -2.2932391
     [3,]  2.3285543  1.7957570
     [4,]  2.6422543  1.4493042
     [5,] -2.0447422 -0.5195390
     [6,] -0.5682730 -0.1557601
     [7,] -0.0560933  0.6941458
     [8,]  3.5873361  2.1324344
     [9,] -0.3522617 -1.0535145
    [10,]  1.9490186 -1.7155158
    

    2.2偏正态分布

    这块介绍如何生成一元和多元的偏正态分布随机数。生成偏正态分布的随机数的函数是rsn,多元正态用rmsn

    rsn(n=1, xi=0, omega=1, alpha=0, tau=0,  dp=NULL)
    # 生成10个位置参数为5,标准差为2,偏度为5的一元偏正态分布
    > n = 10
    > rsn(n, 5, 2, 5)
     [1] 6.366628 4.622272 4.973537 5.716082 6.438601 7.489781 5.034990 5.762948
     [9] 9.547775 8.470482
    attr(,"family")
    [1] "SN"
    attr(,"parameters")
    [1] 5 2 5 0
    
    rmsn(n=1, xi=rep(0,length(alpha)), Omega, alpha,  tau=0, dp=NULL)
    # 生成多元偏态分布,均值向量xi,协方差矩阵,偏度向量 alpha
    > xi <- c(0, 0)
    > xi
    [1] 0 0
    > Omega <- matrix(c(5,1,1,2),2,2)
    > Omega
         [,1] [,2]
    [1,]    5    1
    [2,]    1    2
    > alpha <- c(2,-2)
    > alpha
    [1]  2 -2
    > rmsn(10, xi, Omega, alpha)
                 [,1]       [,2]
     [1,] -0.65320266  0.6861521
     [2,]  1.37481687 -0.1659318
     [3,]  3.14522100  0.4529551
     [4,] -0.07057607 -0.6608571
     [5,] -2.68493331 -2.9035422
     [6,]  2.19216656  0.7597699
     [7,]  1.50244323  0.7730602
     [8,] -1.81347772 -1.4717120
     [9,] -0.56875748 -0.8176260
    [10,]  0.88476306 -0.3663496
    attr(,"family")
    [1] "SN"
    attr(,"parameters")
    attr(,"parameters")$xi
    [1] 0 0
    
    attr(,"parameters")$Omega
         [,1] [,2]
    [1,]    5    1
    [2,]    1    2
    
    attr(,"parameters")$alpha
    [1]  2 -2
    
    attr(,"parameters")$tau
    [1] 0
    

    2.3对数正态分布

    这块介绍如何生成一元和多元的对数正态分布随机数。生成对数正态分布的随机数的函数是rlnorm,多元对数正态用mvlognormal

    生成10个对数均值为0,对数标准差为1的对数随机数。
    > n = 10
    > rlnorm(n, meanlog = 0, sdlog = 1)
     [1] 1.5638173 0.7085567 0.9552697 0.7990129 0.3913724 2.3829746 2.7009141
     [8] 2.3251721 4.7090633 0.5284348
    
    mvlognormal(n, Mu, Sigma, R)
    # 生成10个 5维度的多元对数正态分布
    > n = 10
    > p = 5
    > Mu = runif(p, 0, 1)
    > mvlognormal(n, Mu, Sigma = rep(2, p), R = toeplitz(0.5^(0:(p-1))))
                [,1]       [,2]       [,3]       [,4]       [,5]
     [1,] 0.19001058 1.03046394 0.96453695 0.82259809 0.15816013
     [2,] 0.17443047 0.06155735 0.37621382 0.33498919 0.27119953
     [3,] 0.34553546 0.28509934 0.29120016 0.04141813 0.22553617
     [4,] 0.11498941 0.35994614 0.23380755 0.15672124 0.04621199
     [5,] 0.32452033 0.11553876 0.55283657 0.26637357 0.11062302
     [6,] 0.04953786 0.16264098 1.75032911 6.34862167 1.38340544
     [7,] 0.32886451 0.30378793 0.02375825 0.02375620 0.89213319
     [8,] 0.16846539 0.03653899 0.11298382 0.22751003 0.09530435
     [9,] 0.07762988 0.31748557 0.05862739 0.03529833 0.12301490
    [10,] 0.18367711 2.58261427 0.03078996 0.01153906 0.07951331
    > 
    

    写在最后的话

    希望可以帮助大家学习R语言。水平有限发现错误还望及时评论区指正,您的意见和批评是我不断前进的动力。

    展开全文
  • 概率密度函数在概率论与统计学中,对数正态分布是对数为正态分布的任意随机变量的概率分布。如果 XX 是正态分布的随机变量,则 exp(X)exp(X) 为对数正态分布;同样,如果Y Y 是对数正态分布,则 ln(Y)ln(Y) 为正态...

    这块儿我是真的没听说过,所以直接抄了维基百科,维基万岁!

    概率密度函数

    在概率论与统计学中,对数正态分布是对数为正态分布的任意随机变量的概率分布。如果 X 是正态分布的随机变量,则 exp(X)为对数正态分布;同样,如果 Y 是对数正态分布,则 ln(Y) 为正态分布。 如果一个变量可以看作是许多很小独立因子的乘积,则这个变量可以看作是对数正态分布。一个典型的例子是股票投资的长期收益率,它可以看作是每天收益率的乘积。 对于 x>0 ,对数正态分布的概率密度函数为:

    f(x;μ,σ)=1xσ2πe(lnxμ)2/2σ2

    其中 μ σ 分别是变量对数的平均值与标准差。
    推导过程:概率微分不变性。
    一个正的随机变量 x 是对数正态分布,当且仅当 x 是正态分布。那么:
    N(lnx;μ,σ)=1σ2πexp[(lnxμ)22σ2].

    利用概率微分不变性,有
    N(lnx)dlnx=N(lnx)dlnxdxdx=N(lnx)dxx=lnN(x)dx,
    ,
    其中,
    lnN(x;μ,σ)=1xσ2πexp[(lnxμ)22σ2],  x>0

    是对数正态分布函数。

    期望和方差:

    期望为

    E(X)=eμ+σ2/2

    方差为
    var(X)=(eσ21)e2μ+σ2.

    给定期望值与方差,也可以用这个关系求 μ σ :
    μ=ln(E(X))12ln(1+var(X)E(X)2),

    σ2=ln(1+var(X)E(X)2).

    注意:已知变换后的数据的统计特征可以反过来推导出原始数据的统计特征,不存在数据信息的损失(可以看到对数转换后变量的均值可以直接由样本数据的均值得到,但不进行变化却需要由样本均值方差两方面去推断得到),也可以发现对数正态分布实际上是对数据进行了对数变化,从而变成了正态分布,这样更加方便的得到了相关的统计学变量。

    局部期望

    随机变量 X 在阈值 k 上的局部期望定义为

    g(k)=k(xk)f(x)dx

    其中 f(x) 是概率密度。对于对数正态概率密度,这个定义可以表示为
    g(k)=exp(μ+σ2/2)Φ(ln(k)+μ+σ2σ)kΦ(ln(k)+μσ)

    其中 Φ 是标准正态部分的累积分布函数。对数正态分布的局部期望在保险业及经济领域都有应用,著名的Black-Scholes期权定价公式便可由此推导出。

    相关分布(与高斯分布的关系)

    如果 Y=ln(X)Y=ln(X) XLog-N(μ,σ2) ,则 YN(μ,σ2) 是正态分布。
    如果 XmLog-N(μ,σ2m), m=1...n¯¯¯¯¯¯¯ 是有同样 μ 参数、而 σ 可能不同的统计独立对数正态分布变量 ,并且 Y=m=1nXm ,则 Y 也是对数正态分布变量: YLog-N(nμ,m=1nσ2m)

    这是因为在高斯分布求和的分布性质。

    在股票中的应用

    对数正态分布一般被用来描述增长率。比如股票指数,假设今天标普从2000点涨到了2020,相比于n年前的某一天它从100点涨到101点,虽然今天上涨了20点,远高于另一天上涨的1点,但这两天的上涨率是相同的(1%)。
    至于为什么要取对数log(x2/x1),而不是直接用x2/x1,看一眼对数曲线就明白了。(x1,x2分别表示第一天和第二天的股指)。
    它有几个很好的性质:
    1.假如增长率不变,那么log(1)=0,位于正态分布的中央
    2.log(1/a) = -log(a),也就是说股票在一段时间内涨到两倍和跌一半的概率是一样的
    3.x为正(股指永远不会为负值),y值能取正无穷到负无穷。

    展开全文
  • 以下代码和程序是为了提供一个简单而完整的工具,用于根据对数正态分布和幂律分布自动拟合对象的频率数据(从xls表格数据开始)。 The following code and procedure have been developed to provide an easy and ...

    在这里插入图片描述

    以下代码和程序是为了提供一个简单而完整的工具,用于根据对数正态分布和幂律分布自动拟合对象的频率数据(从xls表格数据开始)。

    The following code and procedure have been developed to provide an easy and complete tool for automatization of fitting frequency data of objects according to both log normal and powerlaw distributions, starting from xls tabular data.

    该程序利用外部资源对幂律分布进行拟合,以供参考。

    The procedure uses external resources for the fitting code on the power-law distribution, of which we will give the references.

    对数正态分布通常不足以解释尾部具有低频和高强度的数据分布,尽管这种事件可能比具有高频率特征的事件更相关。

    The lognormal distribution is often not sufficient to interpret data distributions that have low frequencies and high intensities in the tail, although this events could be more relevant than those characterized by high frequencies.

    例如,城市人口、地震强度、停电规模,都被认为遵循幂律分布。

    The populations of cities, the intensities of earthquakes, the sizes of power outages, for example, are all thought to follow power-law distributions.

    在食品科学中,面包面团中的气泡大小,或饼干表面的裂痕,在分布的尾部遵循这种模式。

    In food science, the bubble size in bread dough, or crackings in the surface of cookies, follow this pattern in the tail of the distribution.

    像这样的量并不能很好地用它们的典型值或平均值来描述。

    Quantities such as these are not well characterized by their typical or average values.

    根据克劳斯等人的解释,对离散参数幂律的估计更适合于经验数据。(2009年)

    Estimations on discrete parametric power law which better fits on the empirical data, is done as explained by Clauset et al. (2009).

    𝑥≥𝑚𝑖𝑛估计值的选择,是为了使𝑥≥𝑥𝑚𝑖𝑛 Clauset等人的经验概率分布得到最佳拟合。(2009年)

    The 𝑥≥𝑚𝑖𝑛 value estimated is chosen in way that the estimated power law model gets a best fit of the empirical probability distribution for 𝑥 ≥ 𝑥𝑚𝑖𝑛 Clauset et al. (2009.

    为了估计两个模型分布之间的距离,经验和理论幂律使用了Kolmogorov–Smirnov统计D。

    To estimate the distance between the two model distributions, the empirical and theoretical power-law uses the Kolmogorov – Smirnov statistic D.

    𝑥≥𝑥𝑚𝑖𝑛的估计由最小化D的值定义。

    Estimation for 𝑥 ≥ 𝑥𝑚𝑖𝑛 is defined by the value which minimizes D.

    假设我们的数据遵循𝑥≥𝑥𝑚𝑖𝑛的幂律,则α参数通过对数似然的数值优化进行估计。

    The supposition that our data follows a power law for 𝑥 ≥ 𝑥𝑚𝑖𝑛, the α parameter is estimated by a numeric optimization of the log–likelihood.

    更多精彩文章请关注公众号:在这里插入图片描述

    展开全文
  • 对数正态分布(Log-Normal Distribution)

    万次阅读 多人点赞 2017-11-01 16:02:07
    2017.11.1 人要有发耻心和羞耻心,突然想到了这么一句...概率密度函数 局部期望 - 相关分布快捷键 加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl + Q 插入链接 Ctrl + L 插入代码 Ctrl + K 插入图片 Ctrl + G 提升标题 Ctrl

    2017.11.1 人要有发耻心和羞耻心,突然想到了这么一句话,MARK一个博客

    困惑了好久,还是写个博客Mark一下,方便以后查询使用

    • 概率密度函数
    • 局部期望

    - 相关分布

    概率密度函数

    对数正态分布是对数为正态分布的任意随机变量的概率分布。如果 Y 是正态分布的随机变量,则exp(Y)是对数正态分布;同样,如果 X 是对数正态分布,则ln(X)为正态分布,如果一个变量可以看成是许多很小独立因子的乘积,则这个变量可以看作是对数正态分布。 给定一个 x>0 ,对数正态分布的概率密度函数为:

    f(x;μ;σ)=12πxσe(lnxμ)22σ2

    其中, μ σ 分别是变量对数的平均值和标准差。期望值和方差分别为:
    E(X)=eμ+σ2/2

    var(X)=(eσ21)e2μ+σ2

    给定期望值与方差,也可以用这个关系求 μ σ 的大小
    μ=ln(E(X))12ln(1+var(X)E(X)2)
    σ2=ln(1+var(X)E(X)2)

    求解时,需要将 μ σ 计算出来带入到上面的 f(x;μ;σ) 中使用matlab带有的 logncdflognpdf获取对数正态分布的累积分布函数和密度函数。
    注解:已知变换后的数据的统计特征可以反过来推导出原始数据的统计特征,不存在数据信息的损失(对数转换后变量的均值可以直接由样本数据的均值得到,但不进行变化却需要由样本均值方法两方面去推断得到),参见: 机器学习小组知识点17 也可以发现对数正态分布实际上是对数据进行了对数变化,从而变成了正态分布,方便得到相关的统计学变量。

    局部期望

    随机变量 X 在阈值k上的局部期望定义为:

    g(k)=k(xk)f(x)dx

    其中 f(x) 是概率密度,对于对数正态概率密度,这个定义为:
    g(k)=exp(μ+σ2/2)Φ(ln(k)+μ+σ2σ)kΦ(ln(k)+μσ)

    其中 Φ 是标准正态分布的累积分布函数,对数正态分布的局部期望在经济领域应用广泛。

    相关分布

    这里指的是与高斯分布的关系
    如果 Y=ln(X) X LogN(μ,σ2) ,则 Y N(μ,σ2) 是正态分布.
    如果 Xm=LogN(μ,σ2m),m=1...n¯¯¯¯¯¯¯ 是有同样% μ 参数,而 σ 可能不同的统计独立对数正态分布变量,并且 Y=Nm=1Xm ,则 Y 也是正态分布变量:YLogN(nμ,nm=1σ2m),满足高斯分布求和性质。

    参数的最大似然估计

    为了确定对数正态分布参数 μ σ 最大似然估计,可以采用与正态分布参数最大似然估计同样的方法。

    fL(x;μ,σ)=1xfN(lnx;μ,σ)

    其中用 fL() 表示对数正态分布的概率密度函数,用 fN() 表示正态分布,因此,用与正态分布同样的指数,我们可以得到对数最大似然函数:
    lL(μ,σ|x1,x2,,xn)=klnxk+lN(μ,σ|lnx1,lnx2,,lnxn)=constant+lN(μ,σ|lnx1,lnx2,,lnxn)

    由于第一项相对于 μ sigma 来说是常数,两个对数最大似然函数 lL lN 在同样的 μ σ 处有最大值。因此,根据正态分布最大似然参数估计器的公式以及上面的方程,推导出对数正态分布参数最大似然估计为:
    μ^=klnxkn,σ^2=(lnxkμ^)2n

    展开全文
  • 最近由于项目需求,需要c#编程实现...1·确定参数的一个数据分布和决定模拟次数,在服从该分布的情况下产生N个随机数。 2·将每次产生的随机数,带入表达式中算出结果,这样可以得到N个结果。 3·用统计方法把N...
  • 正态分布(高斯分布)

    万次阅读 多人点赞 2018-11-09 15:54:21
    正态分布 概要 历史 正态分布的定义 概率密度函数 累积分布函数 生成函数 性质 动差或矩(moment) 中心极限定理 无限可分性 稳定性 标准偏差 相关分布 参量估计 参数的极大似然估计 计量误差 参考...
  • 在机器学习的世界中,以概率分布为核心的研究大都聚焦于正态分布。本文将阐述正态分布的概率,并解释它的应用为何如此的广泛,尤其是在数据科学和机器学习领域,它几乎无处不在。我将会从基础概念出发,解释有关正态...
  • 作者 | Farhad Malik译者 | Monanfei责编 | 夕颜出品 | AI科技大本营(ID: rgznai100)为什么正态分布如此特殊?为什么大量数据科学和机器学习的文章都围绕正态分布进行讨论?我决定写一篇文章,用一种简单易懂的方式...
  • 机器学习算法中,一些算法要求数据符合正态分布,但是对于一些标签和特征来说,分布不一定符合正态分布, 我们可以用np.log1p(x),即取对数,这样可以使得数据在一定程度上符合正态分布特征。(正态分布(Normal ...
  • 作者 | Farhad Malik译者 | Monanfei责编 | 夕颜出品 | AI科技大本营(ID: rgznai100)为什么正态分布如此特殊?为什么大量数据科学和机器学习的文章都围绕正态分布进行讨论?我决定写一篇文章,用一种简单易懂的方式...
  • 正态分布

    2014-12-16 16:41:00
    正态分布 绿线代表标准正态分布 概率密度函数 颜色与概率密度函数同 累积分布函数 参数 数学期望(实数)方差(实数) 支撑集 概率密度函數 累积分布函数 ...
  • 正态分布 高斯分布(数学)

    千次阅读 2020-04-26 20:57:49
    正态分布(Normal distribution),也称高斯分布... 3正态分布的主要特征 4正态分布的应用 5数据正态分布检验 Q-Q图[1] 6参考文献 [编辑] 什么是正态分布  正态分布是一种概率分布...
  • -在前面的文章中讲过,很多模型的假设条件都是数据是服从正态分布的。这篇文章主要讲讲如何判断数据是否符合正态分布。主要分为两种方法:描述统计方法和统计检验方法。描述统计方法描述统计就是用描述的数字或图表...
  • 与离散型随机变量相对,连续...正态分布可能是定量研究工作中应用最广泛的连续概率分布。它在现代投资组合理论和许多风险管理技术中发挥着关键作用。因为它有很多用途,所以是投资专业人士必备知识。正态分布在统...
  • 概率论:高斯/正态分布

    万次阅读 多人点赞 2015-10-30 20:31:21
    正态分布(高斯分布) 若随机变量X服从一个数学期望为μ、方差为σ...其概率密度函数正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。 正态随机变量概率密度函数 [正态分布- 维基百科] 皮皮blog
  • 前言 在机器学习和深度学习中...然而无论做归一化还是BN处理,虽然将数据的均值变为0,方差变为1,但是数据的整体分布并不一定服从标准的正态分布(实际数据大部分时候都不会是),做归一化和BN时,我们求出来的均值...
  • 作者 | Farhad Malik译者 | Monanfei责编 | 夕颜出品 | AI科技...为什么大量数据科学和机器学习的文章都围绕正态分布进行讨论?我决定写一篇文章,用一种简单易懂的方式来介绍正态分布。 在机器学习的世界中...
  • 为了研究最佳贝叶斯分类器,此时相关概率密度函数ρ(x∣wi),i=1,2,...,M\rho(x|w_i),i=1,2,...,Mρ(x∣wi​),i=1,2,...,M描述每一类的数据分布,都是多元正态分布N(μ,Σi),i=1,2,...,MN(\mu,\Sigma_i),i=1,2,...,MN...
  • java正态分布的运用

    千次阅读 2019-07-19 10:26:29
    1正态分布描述 正态分布是最重要的一种概率分布。正态分布概念是由德国的数学家和天文学家Moivre(棣莫弗)于1733年受次提出的,但由于德国数学家Gauss(高斯)率先将其应用于天文学家研究,故正态分布又叫高斯分布...
  • 高斯分布 正态分布

    千次阅读 2010-11-30 21:21:00
    若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:则其概率密度函数正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说...
  • 正态分布及matlab实现

    万次阅读 多人点赞 2014-06-03 09:58:48
    正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。 若随机变量X服从一个数学期望为μ、标准...
  • 几张图帮助快速了解内容 ... 特征处理之使数据分布逼近正态分布 在机器学习和深度学习中,我们经常要对输入的数据做归一化或者在隐藏层使用Batch-Normlization...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 7,622
精华内容 3,048
关键字:

对数正态分布的特征函数