精华内容
下载资源
问答
  • Matlab多维正态分布中随机抽取样本函数

    原帖地址:http://blog.sina.com.cn/s/blog_955cedd8010130m8.html


    R = mvnrnd(MU,SIGMA)——从均值为MU,协方差为SIGMA的正态分布中抽取n*d的矩阵R(n代表抽取的个数,d代表分布的维数)。


    MU为n*d的矩阵,R中的每一行为以MU中对应的行为均值的正态分布中抽取的一个样本。

    SIGMA为d*d的对称半正定矩阵,或者为d*d*n的array。若SIGMA为array,R中的每一行对应的分布的协方差矩阵为该array对应的一个page。也就是说:R(i,:)由MU(i,:)和SIGMA(:,:,i)产生。
    如果协方差矩阵为对角阵,sigma也可用1*d向量或1*d*n的array表示,如果MU是一个1*d的向量,则SIGMA中的n个协方差矩阵共用这个MU。R的行数n由MU的行数n或者SIGMA的page数n决定。

    r = mvnrnd(MU,SIGMA,cases)——从均值为MU(1*d),协方差矩阵为SIGMA(d*d)的正态分布中随机抽取cases个样本,返回cases*d的矩阵r。

     

    不使用现成的函数,可以通过一个线性变换来实现:

    我们知道,matlab产生的n维正态样本中的每个分量都是相互独立的,或者说,它的协方差矩阵是一个数量矩阵mI,如:X = randn(10000,4);产生10000个4维分布的正态分布样本,协方差矩阵就是单位矩阵I

    定理 n维随机变量X服从正态分布N(u,B),若m维随机变量YX的线性变换,即Y=XC,其中C是n×m阶矩阵,则Y服从m维正态分布N(uC,C'BC)。

    根据这条定理,我们可以通过一个线性变换C把协方差矩阵为I的n维正态样本变为协方差矩阵为C'C的n维正态样本。如果我们要产生协方差矩阵为R的n维正态样本,由于R为对称正定矩阵,所以有Cholesky分解: R=C'C


    附:matlab程序

    function Y = multivrandn(u,R,M)
    % this function draws M samples from N(u,R)
    % where u is the mean vector(row) and R is the covariance matrix which must be positive definite

    n = length(u);              % get the dimension
    C = chol(R);                % perform cholesky decomp R = C'C
    X = randn(M,n);             % draw M samples from N(0,I)

    Y = X*C + ones(M,1)*u;

    展开全文
  • R = mvnrnd(MU,SIGMA)——均值为MU,协方差为SIGMA的正态分布中抽取n*d的矩阵R(n代表抽取的个数,d代表分布的维数)。 MU为n*d的矩阵,R中的每一行为以MU中对应的行为均值的正态分布中抽取的一个样本。...
    R = mvnrnd(MU,SIGMA)——从均值为MU,协方差为SIGMA的正态分布中抽取n*d的矩阵R(n代表抽取的个数,d代表分布的维数)。
    MU为n*d的矩阵,R中的每一行为以MU中对应的行为均值的正态分布中抽取的一个样本。
    SIGMA为d*d的对称半正定矩阵,或者为d*d*n的array。若SIGMA为array,R中的每一行对应的分布的协方差矩阵为该array对应的一个page。也就是说:R(i,:)由MU(i,:)和SIGMA(:,:,i)产生。
    如果协方差矩阵为对角阵,sigma也可用1*d向量或1*d*n的array表示,如果MU是一个1*d的向量,则SIGMA中的n个协方差矩阵共用这个MU。
    R的行数n由MU的行数n或者SIGMA的page数n决定。


    r = mvnrnd(MU,SIGMA,cases)——从均值为MU(1*d),协方差矩阵为SIGMA(d*d)的正态分布中随机抽取cases个样本,返回cases*d的矩阵r。
    展开全文
  • 在PCL的VoxelGridCovariance类的getDisplayCloud方法采用了Cholesky分解采样的方法。 1 template<typename PointT> void 2 pcl::VoxelGridCovariance<PointT>::getDisplayCloud...

    在PCL的VoxelGridCovariance类的getDisplayCloud方法中采用了Cholesky分解采样的方法。

     1 template<typename PointT> void
     2 pcl::VoxelGridCovariance<PointT>::getDisplayCloud (pcl::PointCloud<PointXYZ>& cell_cloud)
     3 {
     4   cell_cloud.clear ();
     5 
     6   int pnt_per_cell = 1000;
     7   boost::mt19937 rng;
     8   boost::normal_distribution<> nd (0.0, leaf_size_.head (3).norm ());
     9   boost::variate_generator<boost::mt19937&, boost::normal_distribution<> > var_nor (rng, nd);
    10 
    11   Eigen::LLT<Eigen::Matrix3d> llt_of_cov;
    12   Eigen::Matrix3d cholesky_decomp;
    13   Eigen::Vector3d cell_mean;
    14   Eigen::Vector3d rand_point;
    15   Eigen::Vector3d dist_point;
    16 
    17   // Generate points for each occupied voxel with sufficient points.
    18   for (typename std::map<size_t, Leaf>::iterator it = leaves_.begin (); it != leaves_.end (); ++it)
    19   {
    20     Leaf& leaf = it->second;
    21 
    22     if (leaf.nr_points >= min_points_per_voxel_)
    23     {
    24       cell_mean = leaf.mean_;
    25       llt_of_cov.compute (leaf.cov_);
    26       cholesky_decomp = llt_of_cov.matrixL ();
    27 
    28       // Random points generated by sampling the normal distribution given by voxel mean and covariance matrix
    29       for (int i = 0; i < pnt_per_cell; i++)
    30       {
    31         rand_point = Eigen::Vector3d (var_nor (), var_nor (), var_nor ());
    32         dist_point = cell_mean + cholesky_decomp * rand_point;
    33         cell_cloud.push_back (PointXYZ (static_cast<float> (dist_point (0)), static_cast<float> (dist_point (1)), static_cast<float> (dist_point (2))));
    34       }
    35     }
    36   }
    37 }

     


    原文链接: http://blog.sina.com.cn/s/blog_955cedd8010130m8.html

     

    R = mvnrnd(MU,SIGMA)——从均值为MU,协方差为SIGMA的正态分布中抽取n*d的矩阵R(n代表抽取的个数,d代表分布的维数)。


    MU为n*d的矩阵,R中的每一行为以MU中对应的行为均值的正态分布中抽取的一个样本。

    SIGMA为d*d的对称半正定矩阵,或者为d*d*n的array。若SIGMA为array,R中的每一行对应的分布的协方差矩阵为该array对应的一个page。也就是说:R(i,:)由MU(i,:)和SIGMA(:,:,i)产生。
    如果协方差矩阵为对角阵,sigma也可用1*d向量或1*d*n的array表示,如果MU是一个1*d的向量,则SIGMA中的n个协方差矩阵共用这个MU。R的行数n由MU的行数n或者SIGMA的page数n决定。

    r = mvnrnd(MU,SIGMA,cases)——从均值为MU(1*d),协方差矩阵为SIGMA(d*d)的正态分布中随机抽取cases个样本,返回cases*d的矩阵r。

     

    不使用现成的函数,可以通过一个线性变换来实现:

    我们知道,matlab产生的n维正态样本中的每个分量都是相互独立的,或者说,它的协方差矩阵是一个数量矩阵mI,如:X = randn(10000,4);产生10000个4维分布的正态分布样本,协方差矩阵就是单位矩阵I

    定理 n维随机变量X服从正态分布N(u,B),若m维随机变量YX的线性变换,即Y=XC,其中C是n×m阶矩阵,则Y服从m维正态分布N(uC,C'BC)。

    根据这条定理,我们可以通过一个线性变换C把协方差矩阵为I的n维正态样本变为协方差矩阵为C'C的n维正态样本。如果我们要产生协方差矩阵为R的n维正态样本,由于R为对称正定矩阵,所以有Cholesky分解: R=C'C

    附:matlab程序

    function Y = multivrandn(u,R,M)
    % this function draws M samples from N(u,R)
    % where u is the mean vector(row) and R is the covariance matrix which must be positive definite

    n = length(u);              % get the dimension
    C = chol(R);                % perform cholesky decomp R = C'C
    X = randn(M,n);             % draw M samples from N(0,I)

    Y = X*C + ones(M,1)*u;  

    展开全文
  • X = rmvnrnd(MU,SIG,N,A,B) 在 N×P 矩阵 X a 中返回 P 维多元正态中抽取的随机样本均值 MU 和协方差 SIG 截断为 a 的分布由不等式 Ax<=B 定义的超平面界定的区域。 [X,RHO,NAR,NGIBBS] = rmvnrnd(MU,SIG,N,A,B...
  • 正态分布与幂律分布

    千次阅读 2020-03-09 15:22:33
    该定理的内容是,假设我们任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n 的一个钟型的正态分布正态分布的特点是大部分数据集中在中间,少部分分散在...

    为什么金融市场总是出现让人意料不到的“黑天鹅”?也许是我们用错了分布假设!

    正态分布是金融交易中经常用到的一个统计分布假设。这个分布假设是建立在“中心极限定理”基础上的。该定理的内容是,假设我们从任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n 的一个钟型的正态分布。

    正态分布的特点是大部分数据集中在中间,少部分分散在两边。但是上述结果的实现有一个隐含条件,就是这些抽样结果彼此之间应该是相互独立的。

    相互独立的意思,是前一次抽样的结果不应该影响下一次抽样的结果。最具代表性的独立抽样过程就是丢硬币,无论上一次丢硬币的结果是正面还是负面,都不会影响下一次丢硬币的可能性。因此只要丢硬币的结果够多,我们可以看到一个近似正态分布的结果。

    在现实生活中,如果不涉及时间序列的某个横截面大样本,我们都可以认为是符合正态分布的“独立”条件的。比如我们测量某日收市的全部A股收盘价,就会发现他们的分布也是基本符合正态分布:大部分股票的价格集中在10-30元附近,小部分位于较低的2-3元或者较高的100元以上范围。

    但是,如果我们测量的变量是彼此不独立的话,上述的正态分布就不会成立,而是会变成指数分布或者幂律分布。这两种分布都是一个内凹的月牙形:前半段的变动幅度较高但是样本较少,后半段的变动幅度低但是样本较多。

    幂律分布区别于指数分布的特点是它的前后分布更为平均,数值下降速度更为“缓慢”。

    现实生活中,但凡和人类活动相关的变量在时间序列上都存在一定的相关性。例如一个股票前一天的上涨往往和后一天的上涨存在很强的相关性。因此,股票的价格变动大致上是符合幂律分布的。

    幂律分布的特点,一言概之就是20/80定律。一个股票在一个时间段里面的股价表现,往往是在20%的区间内完成的大涨或者大跌。剩余80%的时间段里面,它往往只是在做随机的横盘整理。

    除了股票,幂律分布还广泛地分布在语言使用(20%的单词占据了80%的出现频率),财富分配(20%人群掌握80%财富)以及网络流量(20%网站占有80%点击率)等方面。

    幂律分布的存在,使得我们在预测时间序列分布的变量变动时,必须要有更加大的容错区间。这是因为幂律分布的“肥尾”现象更加显著:由于存在变量之间相互影响的情况,导致极端情况更加容易发生。高涨的股价会继续上升,而超跌的股票则继续下跌。

    如果我们遵循正态分布的估计来预测,那么95%的股价变动可能集中在均值加减1.64个标准差的范围内。但是因为实际上股价变动是遵循幂律分布的的,95%的股价变动可能要扩展到均值加减2-3个标准差的范围。因此建立在正态分布基础上的均值加减1.64个标准差设定的“标准预测”,实际上可能导致投资者过低卖出或者过高买入,承担了额外的交易风险。

    这里面最为讽刺的一个原因,可能就是因为越来越多的人使用了“交易事件彼此间是独立性分布的”这个假设来指导交易,导致不同品种之间的独立性随着交易逻辑的趋同性而消失了!这也解释了,为什么近年来金融市场上会出现越来越多历史上从未发生过的“小概率”事件,例如价格闪崩30%、回购利率飙升10倍等。这是因为如果我们用幂律分布假设来分析波动的话,这些事件本来就属于正常概率的分布范围。导致预测出错的,不是市场,而是使用假设的交易者本身。或者说,出于贪婪而无止境追求利润和忽视风险的,人性。

    来源:量化投资俱乐部

    拓展阅读:

    1.一个量化策略师的自白(好文强烈推荐)

    2.市面上经典的量化交易策略都在这里了!(源码)

    3.期货/股票数据大全查询(历史/实时/Tick/财务等)

    4.干货| 量化金融经典理论、重要模型、发展简史大全

    5.从量化到高频交易,不可不读的五本书

    6.高频交易四大派系大揭秘

    展开全文
  • MVG 是一种多元高斯(正态)随机数... 通过对这些样本应用线性变换,输出是一个矩阵,其列是从分布 N(mu,Sigma) 中抽取样本,其中 mu 是指定的均值向量,Sigma 是 SPD 协方差矩阵。 输入 help mvg 以了解更多信息。
  • 某些分布没有封闭形式的密度,但是它们中抽取样本很简单。 对于这种分布,模拟最小Hellinger距离(SMHD)估计似乎很有用。 由于该方法是基于距离的,因此它自然很健壮。 本文是对以前的论文的后续,在先前的论文中...
  • 曲波matlab代码Optimization_partition_ising_...normal_distribution_approach.m:尝试通过从正态分布中抽取样本来寻找最优解,并将 SDP 解作为其协方差 normal_distribution_greedy_approach.m:将正态分布方法与贪心
  • 然后我们总体中抽取出的这些样本所构成的统计量所服从的分布,就是我们今天需要学习的。本节难度较大,主要难在那几种分布(x2x^2x2, t 分布、F分布之间的拼凑) 一、需要用到的定理或性质准备 【1】就是 x2x^2...
  • 参数检验受制于数据属性的假设。例如,学生t检验是众所周知的参数检验,假设样本均值具有正态分布。...对于每个样本大小,我们几个分布中抽取样本。然后,计算样本的平均值,并将正态分布拟合到平均值的分布...
  • Wishart分布

    千次阅读 2019-11-18 14:11:33
    Wishart分布是χ2\chi^2χ2​​ 分布在多元上的推广。...假设XXX是一个n×pn\times pn×p的矩阵,每一行都是均值为0的ppp维正态分布中抽取的独立样本,即: X(i)=(xi1,⋯ ,xip)∼Np(0,Σ) X_{(i)} = (x_i^1,\c...
  • 多元正态分布中抽取随机样本。 多元正态分布,多正态分布或高斯分布是一维正态分布向更高维度的推广。这种分布由其均值和协方差矩阵来确定。这些参数类似于一维正态分布的平均值(平均值或“中心”)和方差(标准...
  • 数据分布

    千次阅读 2019-08-04 20:11:17
    中心极限定理就是不论总体服从什么分布,只要总体中抽取样本容量足够大,这些样本组成的样本均值的抽样分布都近似于正态分布。 1,Z分布 z统计量 将转换成标准正态分布的均值抽样分布称为Z分布,Z分布的变量称为...
  • 多元正态分布中抽取随机样本。 多元正态分布,多元正态分布或高斯分布是将一维正态分布推广到更高维度的方法。 这种分布由其均值和协方差矩阵指定。 这些参数类似于一维正态分布的均值(平均值或“中心”)和...
  • 样本数量:总体中抽取了几个样本 样本大小:这个样本中包含了多少个数据 1. 用样本来估计总体平均值 中心极限定理: 任何样本的平均值约等于总体的平均值。(前提是样本大小达到30%) 无论总体是什么分布,...
  • numpy.random.multivariate_normal 的用法

    千次阅读 2018-06-27 12:37:11
    多元正态分布中抽取随机样本。多元正态分布,多正态分布或高斯分布是一维正态分布向更高维度的推广。这种分布由其均值和协方差矩阵来确定。这些参数类似于一维正态分布的平均值(平均值或“中心”)和方差(标准差...
  • 独立性两个样本相互独立,即一总体中抽取一批样本另一总体中抽取一批样本没有任何影响,两组样本个案数可以不同。 正态性 样本来自的两个总体服从正态分布样本的总体不满足正态条件时,如果两个样本的...
  • 异常值检测剔除

    千次阅读 2019-01-22 17:30:54
    对于正态分布(高斯分布):3 σ\sigmaσ 原则。...但是并不是所有的从正态分布中抽取的小样本都满足正态分布。 这种情况下 四分位距法就可以进行一定程度上的异常值剔除。 IQR = Q3 − Q1 [Q1 - kIQR, Q3 + ...
  • matlab mvnrnd 函数用法

    2019-12-13 22:02:55
    R = mvnrnd(MU,SIGMA)——均值为MU,协方差为SIGMA的正态分布中抽取n*d的矩阵R(n代表抽取的个数,d代表分布的维数)。 MU为n*d的矩阵,R中的每一行为以MU中对应的行为均值的正态分布中抽取的一个样本。 SIGMA为dd...
  • 鄙人学习笔记 文章目录统计量及其抽样分布统计量常用统计量次序统计量充分统计量关于分布的几个概念由...推断统计学的重要作用就是,通过总体中抽取样本构造适当的统计量,由样本性质去推断关于总体的性质。 统...
  • numpy.random.normal详解

    千次阅读 2020-01-02 17:15:44
    从正态(高斯)分布中抽取随机样本。 棣莫佛第一次提出正态分布的概率密度函数(由于其外形形似铃铛,亦称为钟形曲线),在其后200年,高斯和拉普拉斯也分别发现了正态分布的概率密度函数。自然界中有许多符合正态...
  • 农场的20万个苹果抽样一次,抽取36个苹果作为样本样本中苹果重量的均值是112克,标准差是40克。问20万个苹果的重量均值处在100到124克之间的概率。 首先介绍样本均值的抽样分布(中心极限定理) 设总体有N个...
  • 统计量与抽样分布

    2020-07-07 20:35:25
    随机样本总体随机地抽取 n个个体,称为一个随机样本 简单随机样本:独立同分布的随机样本 统计量:样本的不含任何未知参数的函数(即仅含样本信息的函数) 常用统计量:样本均值,样本方差
  • A随机抽取n个样本组成B 抽取m次,得到m组B 所有B的平均值的分布接近正态分布 注意: 总体数据不要求正态分布 样本每组足够大,但也不需要太大 额:所有B的平均值的平均值能够反映A的平均值 ...
  • numpy.random.normal()官方文档翻译

    千次阅读 2019-01-01 08:12:23
    从正态分布(高斯分布)中抽取随机样本。 正态分布的概率密度函数,是De Moivre首次推导得出,并于200年后Gauss和Laplace分别独立推导出。由于它特殊的形状,常被称为钟形曲线。 正态分布在自然界中很常见。比如,它...
  • 多元正态分布中抽取随机样本,组成一个N维的数组。并返回该数组。 参数 mean : 1-D array_like, of length N n维分布的平均值 cov : 2-D array_like, of shape (N, N) 分布的协方差矩阵 协方差矩阵必须是对称...
  • SPSS数据分析教程 SPSS数据分析教程 SPSS数据分析教程 第4章概率论初步 目录 4.1 离散型随机变量的...4.3 经验分布 4.4 抽样分布 4.5 置信区间 本章学习目标 用仿真方法总体中抽取随机样本生成服从 某种分布的随机
  • SPSS数据分析教程 SPSS数据分析教程 第4章 概率论初步 目录 4.1 离散型随机...4.3 经验分布 4.4 抽样分布 4.5 置信区间 本章学习目标 用仿真方法总体中抽取随机样本生成服从某种分布的随机数 得到观测值的理论分布

空空如也

空空如也

1 2 3 4 5 6
收藏数 108
精华内容 43
关键字:

从正态分布中抽取样本