精华内容
下载资源
问答
  • 二维随机变量的分布的解法最核心的莫过于分布函数定义法,但根据二维随机变量的类型,又有列表法、线段法、公式法(卷积公式)、面积法、全概率公式法!列表法、线段法:适用于两个离散型的二维随机变量分布的求解...

    37b3766d41236bef062f243797d15210.png

    二维随机变量的分布的解法最核心的莫过于分布函数定义法,但根据二维随机变量的类型,又有列表法、线段法、公式法(卷积公式)、面积法、全概率公式法

    列表法、线段法:适用于两个离散型的二维随机变量分布的求解问题;

    公式法(卷积公式)、面积法:适用于两个连续型的二维随机变量分布的求解问题;

    全概率公式法:适用于一个离散型随机变量和一个连续性随机变量分布的求解问题;

    分布函数定义法:这种方法是二维随机变量分布问题的最后保障!(以上方法,我们会在后续章节中逐一分享。)

    每年的概率论与数理统计的第一道大题必然是二维随机变量分布的题目,近几年尤其注重考察离散型与连续型结合的二位随机变量的分布,显然,这种类型即是难点也是考点!本文以此为重点进行讨论!


    首先按给出三道题目如下:

    1.设

    的概率分布为离散型随机变量,有
    是连续型随机变量,其概率密度函数为
    ,且
    相互独立,则随机变量
    的分布函及概率密度函数为?

    2.设随机变量

    的概率分布为
    ,在给定
    的条件下,随机变量
    服从均匀分布
    .求
    的分布函数。

    3.设随机变量

    相互独立,其中
    均服从标准正态分布,
    的概率分布为
    ,求二维随机变量
    的分布函数,结果用标准正态分布函数表示,并证明随即变量
    服从标准正态分布。

    1.设

    的概率分布为离散型随机变量,有
    是连续型随机变量,其概率密度函数为
    ,且
    相互独立,则随机变量
    的分布函数及概率密度函数为?
    • 直接给出分布函数的定义!(这一步不用考虑!)

    ,则
    • 使用全概率公式

    • 使用独立性性质
    对于事件
    ,有
    ;
    如果
    相互独立,则
    ,显然,当
    时,有

    根据

    ,可得
    ,假设此为
    单调递增函数,(需要注意的是,这里一定要具体函数具体分析,非单射的时候更需要分类讨论!),于是

    • 分布函数及概率密度函数

    结合式(1)、(2)、(3)和(4),有分布函数

    则概率密度函数为

    此推导过程有两个需要注意的地方:其一是随机变量具有独立性,其二是随机变量的分布增减性不同对结果有很大影响!!!


    既如此,那么如果不独立呢?其实,这种考察较少,不过我们仍举一个例子!

    2.设随机变量

    的概率分布为
    ,在给定
    的条件下,随机变量
    服从均匀分布
    .求
    的分布函数。

    显然,

    并不独立!

    但是根据全概率公式,有

    显然有

    当不独立时,难度很大,但是为了适用于考研层次难度,又不得不降低题目难度,这就会让这类题成为简单题,所以,笔者认为,以独立性为条件的此类题目将是主要出题点!


    那么,就让我们拿2020年数一的一道大题来做示例!

    3.设随机变量

    相互独立,其中
    均服从标准正态分布,
    的概率分布为
    ,求二维随机变量
    的分布函数,结果用标准正态分布函数表示。

    解题思路:写出分布函数定义——使用全概率公式——使用独立性性质——求出分布函数

    对于

    ,当
    时,有

    时,有

    于是,

    同理,可证随机变量

    服从标准正态分布!

    你可以不会其他方法,但是分布函数定义法,一定要掌握熟练,这是解决此类问题的万能解法,你只要自己独立的做上几道,体悟其中的细节,那么,概率论的第一道大题,就是送分题!

    展开全文
  • 一元正态分布回顾如果随机变量 服从均值为 方差为 的正态分布 (Univariate normal distribution), ,则其概率密度函数为:整个分布可以仅用均值及...若 维随机变量 服从均值向量为 和协方差矩阵为 的多元正态分布 ...

    equation?tex=%E5%A4%9A%E5%85%83%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83%5C%5C

    一元正态分布回顾

    如果随机变量

    equation?tex=Y 服从均值为

    equation?tex=u 方差为

    equation?tex=%5Csigma%5E2 的正态分布 (Univariate normal distribution),

    equation?tex=Y%5Csim+N%28%5Cmu%2C%5Csigma%5E2%29 ,则其概率密度函数为:

    equation?tex=f%28y%29%3D%5Cfrac%7B1%7D%7B%5Csqrt%7B2+%5Cpi%7D+%5Csigma%7D+e%5E%7B-%5Cfrac%7B%28y-%5Cmu%29%5E%7B2%7D%7D%7B2+%5Csigma%5E%7B2%7D%7D%7D%2C+%5Cquad-%5Cinfty%3Cy%3C%5Cinfty%5C%5C整个分布可以仅用均值及方差来刻画

    如果变量之间不相关,则它们相互独立

    经典统计检验通常基于正态分布假设

    正态分布可以模拟大量自然现象

    多元正态分布

    多元正态分布密度函数

    类比于一元情况,若

    equation?tex=p 维随机变量

    equation?tex=%5Cmathrm%7By%7D%3D%5Cleft%28Y_%7B1%7D%2C+%5Cldots%2C+Y_%7Bp%7D%5Cright%29%5E%7B%5Cprime%7D 服从均值向量为

    equation?tex=%5Cmu 和协方差矩阵为

    equation?tex=%5Csum_%7B%7D%5E%7B%7D%7B%7D 的多元正态分布 (Multivariate normal distribution), 记为

    equation?tex=Y%5Csim+N_p%28%5Cmu%2C%5CSigma%29 ,则密度函数为

    equation?tex=f%28y%29%3D%5Cfrac%7B1%7D%7B%7B%282+%5Cpi%29%7D%5E%7Bp%2F2%7D%7C%5CSigma%7C%5E%7B1%2F2%7D+%7D++e%5E%7B-%7B%28y-%5Cmu%29%27%5CSigma%5E%7B-1%7D%7D%28y-%5Cmu%29%2F2%7D%5C%5C

    equation?tex=p%3D2 时,

    equation?tex=%5Cboldsymbol%7B%5Cmu%7D%3D%5Cleft%28%5Cbegin%7Barray%7D%7Bc%7D+%5Cmu_%7B1%7D+%5C%5C+%5Cmu_%7B2%7D+%5Cend%7Barray%7D%5Cright%29%2C+%5Cmathbf%7B%5CSigma%7D%3D%5Cleft%28%5Cbegin%7Barray%7D%7Bcc%7D+%5Csigma_%7B1%7D%5E%7B2%7D+%26+%5Crho_%7B12%7D+%5Csigma_%7B1%7D+%5Csigma_%7B2%7D+%5C%5C+%5Crho_%7B12%7D+%5Csigma_%7B1%7D+%5Csigma_%7B2%7D+%26+%5Csigma_%7B2%7D%5E%7B2%7D+%5Cend%7Barray%7D%5Cright%29%5C%5C

    equation?tex=+

    所以随机向量

    equation?tex=y%3D%5Cleft%28Y_%7B1%7D%2C+Y_%7B2%7D%5Cright%29%5E%7B%5Cprime%7D 服从二元正态分布 (Bivariate normal distribution):

    equation?tex=+%5Cmathbf%7By%7D+%5Csim+B+N%5Cleft%28%5Cmu_%7B1%7D%2C+%5Cmu_%7B2%7D%2C+%5Csigma_%7B1%7D%5E%7B2%7D%2C+%5Csigma_%7B2%7D%5E%7B2%7D%2C+%5Crho_%7B12%7D%5Cright%29 ,其密度函数为:

    equation?tex=%5Cbegin%7Baligned%7D+f%5Cleft%28y_%7B1%7D%2C+y_%7B2%7D%5Cright%29%3D%26+%5Cfrac%7B1%7D%7B2+%5Cpi+%5Csigma_%7B1%7D+%5Csigma_%7B2%7D+%5Csqrt%7B%5Cleft%281-%5Crho_%7B12%7D%5E%7B2%7D%5Cright%29%7D%7D+%5Ctimes+%5C%5C+%26+%5Cexp+%5Cleft%5C%7B-%5Cfrac%7B%5Cleft%28%5Cfrac%7By_%7B1%7D-%5Cmu_%7B1%7D%7D%7B%5Csigma_%7B1%7D%7D%5Cright%29%5E%7B2%7D%2B%5Cleft%28%5Cfrac%7By_%7B2%7D-%5Cmu_%7B2%7D%7D%7B%5Csigma_%7B2%7D%7D%5Cright%29%5E%7B2%7D-2+%5Crho_%7B12%7D%5Cleft%28%5Cfrac%7By_%7B1%7D-%5Cmu_%7B1%7D%7D%7B%5Csigma_%7B1%7D%7D%5Cright%29%5Cleft%28%5Cfrac%7By_%7B2%7D-%5Cmu_%7B2%7D%7D%7B%5Csigma_%7B2%7D%7D%5Cright%29%7D%7B2%5Cleft%281-%5Crho_%7B12%7D%5E%7B2%7D%5Cright%29%7D%5Cright%5C%7D+%5Cend%7Baligned%7D

    概率密度等高线

    由于多元正态分布的密度函数为

    equation?tex=f%28y%29%3D%5Cfrac%7B1%7D%7B%7B%282+%5Cpi%29%7D%5E%7Bp%2F2%7D%7C%5CSigma%7C%5E%7B1%2F2%7D+%7D++e%5E%7B-%7B%28y-%5Cmu%29%27%5CSigma%5E%7B-1%7D%7D%28y-%5Cmu%29%2F2%7D%5C%5C

    其概率密度等高线可表示为:

    equation?tex=%7B%28y-%5Cmu%29%27%5CSigma%5E%7B-1%7D%7D%28y-%5Cmu%29%3Dc%5E2

    equation?tex=c 为一常数。

    根据矩阵谱分解(Spectral decomposition):

    equation?tex=%5Cboldsymbol%7B%5CSigma%7D%3D%5Csum_%7Bj%3D1%7D%5E%7Bp%7D+%5Clambda_%7Bj%7D+%5Cmathbf%7Be%7D_%7Bj%7D+%5Cmathbf%7Be%7D_%7Bj%7D%5E%7B%5Cprime%7D%5C%5C

    这里的

    equation?tex=%28%5Clambda_%7Bj%7D+%5Cmathbf%7Be%7D_%7Bj%7D+%29%2Cj+%3D+1%2C...%2C+p 是协方差矩阵

    equation?tex=%5CSigma 的(正交)特征值-特征向量对。从而

    equation?tex=%5Cboldsymbol%7B%5CSigma%7D%5E%7B-1%7D%3D%5Csum_%7Bj%3D1%7D%5E%7Bp%7D%5Cfrac%7B1%7D%7B+%5Clambda_%7Bj%7D%7D++%5Cmathbf%7Be%7D_%7Bj%7D+%5Cmathbf%7Be%7D_%7Bj%7D%5E%7B%5Cprime%7D%5C%5C

    概率密度等高线:

    equation?tex=%7B%28y-%5Cmu%29%27%5CSigma%5E%7B-1%7D%7D%28y-%5Cmu%29%3Dc%5E2 ,可写为:

    equation?tex=%5Csum_%7Bj%3D1%7D%5E%7Bp%7D%5Cfrac%7B%5Cleft%5C%7B+e_j%27%28y-%5Cmu%29+%5Cright%5C%7D%5E2%7D%7B+c%5E2%5Clambda_%7Bj%7D%7D+%3D1%5C%5C

    每条等高线都是以

    equation?tex=%5Cmu+ 为中心、以

    equation?tex=%5Cpm+c+%5Csqrt%7B%5Clambda_j%7De_j 为轴长的椭球。 这里的

    equation?tex=%28%5Clambda_j%2Ce_j%29%2Cj%3D1%2C...%2Cp , 是协方差矩阵

    equation?tex=%5CSigma 的特征值-特征向量。

    二元正态分布概率密度等高线

    同理,二元正态分布的概率密度等高线可以简化为 :

    equation?tex=%7B%5Cleft%28%5Cfrac%7By_%7B1%7D-%5Cmu_%7B1%7D%7D%7B%5Csigma_%7B1%7D%7D%5Cright%29%5E%7B2%7D%2B%5Cleft%28%5Cfrac%7By_%7B2%7D-%5Cmu_%7B2%7D%7D%7B%5Csigma_%7B2%7D%7D%5Cright%29%5E%7B2%7D-2+%5Crho_%7B12%7D%5Cleft%28%5Cfrac%7By_%7B1%7D-%5Cmu_%7B1%7D%7D%7B%5Csigma_%7B1%7D%7D%5Cright%29%5Cleft%28%5Cfrac%7By_%7B2%7D-%5Cmu_%7B2%7D%7D%7B%5Csigma_%7B2%7D%7D%5Cright%29%7D%3Dc_1%5E2%5C%5C

    考虑

    equation?tex=%5Crho_%7B12%7D%3D0 时的情况:

    equation?tex=%5Cleft%28%5Cfrac%7By_%7B1%7D-%5Cmu_%7B1%7D%7D%7Bc_1%5Csigma_%7B1%7D%7D%5Cright%29%5E%7B2%7D%2B%5Cleft%28%5Cfrac%7By_%7B2%7D-%5Cmu_%7B2%7D%7D%7Bc_1%5Csigma_%7B2%7D%7D%5Cright%29%5E%7B2%7D%3D1

    equation?tex=%E5%A4%9A%E5%85%83%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83%E7%9A%84%E6%80%A7%E8%B4%A8%5C%5C

    线性组合

    向量

    equation?tex=y 的线性组合的正态性:

    • 假设

    equation?tex=a%3D%28a_1%2C...%2Ca_p%29%27 是一个常数向量,

    equation?tex=%E5%A6%82%E6%9E%9C+%5Cmathbf%7By%7D+%5Csim+N_%7Bp%7D%28%5Cboldsymbol%7B%5Cmu%7D%2C+%5Cmathbf%7B%5CSigma%7D%29%2C+%E5%88%99+%5Cmathbf%7Ba%7D%5E%7B%5Cprime%7D+%5Cmathbf%7By%7D+%5Csim+N%5Cleft%28%5Cmathbf%7Ba%7D%5E%7B%5Cprime%7D+%5Cboldsymbol%7B%5Cmu%7D%2C+%5Cmathbf%7Ba%7D%5E%7B%5Cprime%7D+%5Cboldsymbol%7B%5CSigma%7D+%5Cmathbf%7Ba%7D%5Cright%29%5C%5C

    相反地,如果所有的

    equation?tex=y 的线性组合都服从一元正态分布,则

    equation?tex=y 一定 是多元正态分布。即:

    如果对于所有的

    equation?tex=a ,有

    equation?tex=%5Cmathbf%7Ba%7D%5E%7B%5Cprime%7D+%5Cmathbf%7By%7D+%5Csim+N%5Cleft%28%5Cmathbf%7Ba%7D%5E%7B%5Cprime%7D+%5Cboldsymbol%7B%5Cmu%7D%2C+%5Cmathbf%7Ba%7D%5E%7B%5Cprime%7D+%5Cboldsymbol%7B%5CSigma%7D+%5Cmathbf%7Ba%7D%5Cright%29 ,则

    equation?tex=%5Cmathbf%7By%7D+%5Csim+N_%7Bp%7D%28%5Cboldsymbol%7B%5Cmu%7D%2C+%5Cmathbf%7B%5CSigma%7D%29

    • 假设

    equation?tex=A 是一个

    equation?tex=q%5Ctimes+p 且秩为

    equation?tex=q%28%5Cleq+p%29 的常数矩阵,

    equation?tex=d

    equation?tex=q 维常数向 量,如果

    equation?tex=%5Cmathbf%7By%7D+%5Csim+N_%7Bp%7D%28%5Cboldsymbol%7B%5Cmu%7D%2C+%5Cmathbf%7B%5CSigma%7D%29

    equation?tex=+%5Cmathbf%7BA%7D+%5Cmathbf%7By%7D%2B%5Cmathbf%7Bd%7D+%5Csim+N%5Cleft%28%5Cmathbf%7BA%7D+%5Cboldsymbol%7B%5Cmu%7D%2B%5Cmathbf%7Bd%7D%2C+%5Cmathbf%7BA%7D+%5CSigma+%5Cmathbf%7BA%7D%5E%7B%5Cprime%7D%5Cright%29.%5C%5C

    equation?tex=+ 分割

    变量

    equation?tex=y的分割的正态性:

    假设

    equation?tex=y%E3%80%81%5Cmu%E3%80%81%5CSigma 以第

    equation?tex=r 个元素为界进行分割如下:

    equation?tex=%5Cmathbf%7By%7D%3D%5Cleft%28%5Cbegin%7Barray%7D%7Bc%7D+%5Cmathbf%7By%7D_%7B1%7D+%5C%5C+%5Cmathbf%7By%7D_%7B2%7D+%5Cend%7Barray%7D%5Cright%29%2C+%5Cquad+%5Cboldsymbol%7B%5Cmu%7D%3D%5Cleft%28%5Cbegin%7Barray%7D%7Bc%7D+%5Cboldsymbol%7B%5Cmu%7D_%7B1%7D+%5C%5C+%5Cboldsymbol%7B%5Cmu%7D_%7B2%7D+%5Cend%7Barray%7D%5Cright%29%2C+%5Cquad+%5Cboldsymbol%7B%5CSigma%7D%3D%5Cleft%28%5Cbegin%7Barray%7D%7Bcc%7D+%5Cboldsymbol%7B%5CSigma%7D_%7B11%7D+%26+%5Cboldsymbol%7B%5CSigma%7D_%7B12%7D+%5C%5C+%5Cboldsymbol%7B%5CSigma%7D_%7B21%7D+%26+%5Cboldsymbol%7B%5CSigma%7D_%7B22%7D+%5Cend%7Barray%7D%5Cright%29%5C%5C

    这里

    equation?tex=%5Cmu_1

    equation?tex=y_1

    equation?tex=r%5Ctimes1 的,

    equation?tex=%5CSigma_%7B11%7D

    equation?tex=r%5Ctimes+r 的如果

    equation?tex=%5Cmathbf%7By%7D+%5Csim+N_%7Bp%7D%28%5Cboldsymbol%7B%5Cmu%7D%2C+%5Cboldsymbol%7B%5CSigma%7D%29 , 则

    equation?tex=%5Cquad+%5Cmathbf%7By%7D_%7B1%7D+%5Csim+N_%7Br%7D%5Cleft%28%5Cboldsymbol%7B%5Cmu%7D_%7B1%7D%2C+%5Cboldsymbol%7B%5CSigma%7D_%7B11%7D%5Cright%29%2C+%5Cquad+%5Cmathbf%7By%7D_%7B2%7D+%5Csim+N_%7Bp-r%7D%5Cleft%28%5Cboldsymbol%7B%5Cmu%7D_%7B2%7D%2C+%5Cboldsymbol%7B%5CSigma%7D_%7B22%7D%5Cright%29

    特别地,

    equation?tex=%5Cmathrm%7By%7D%3D%5Cleft%28Y_%7B1%7D%2C+%5Cldots%2C+Y_%7Bp%7D%5Cright%29%5E%7B%5Cprime%7D 的第

    equation?tex=j 个元素 服从一元正态分布:

    equation?tex=Y_%7Bj%7D+%5Csim+N%5Cleft%28%5Cmu_%7Bj%7D%2C+%5Csigma_%7Bj+j%7D%5Cright%29%2C+j%3D1%2C+%5Cldots%2C+p%5C%5C

    正态向量 y的子向量的分布

    假设

    equation?tex=y+%5Csim+N_p%28%CE%BC%2C+%5CSigma%29 并且

    equation?tex=%7C%5CSigma_%7B22%7D%7C%3E0 。则对于其子向量y1和y2,

    equation?tex=%5Cmathbf%7By%7D_%7B1%7D+%7C+%5Cmathbf%7By%7D_%7B2%7D+%5Csim+N_%7Br%7D%5Cleft%28%5Cboldsymbol%7B%5Cmu%7D_%7B1%7D%2B%5Cmathbf%7B%5CSigma%7D_%7B12%7D+%5Cmathbf%7B%5CSigma%7D_%7B22%7D%5E%7B-1%7D%5Cleft%28%5Cmathbf%7By%7D_%7B2%7D-%5Cboldsymbol%7B%5Cmu%7D_%7B2%7D%5Cright%29%2C+%5Cmathbf%7B%5CSigma%7D_%7B11%7D-%5Cmathbf%7B%5CSigma%7D_%7B12%7D+%5Cmathbf%7B%5CSigma%7D_%7B22%7D%5E%7B-1%7D+%5Cmathbf%7B%5CSigma%7D_%7B21%7D%5Cright%29%5C%5C

    equation?tex=%5Cmathbf%7B%5CSigma%7D_%7B12%7D+%5Cmathbf%7B%5CSigma%7D_%7B22%7D%5E%7B-1%7D :回归系数矩阵

    equation?tex=E%5Cleft%28%5Cmathbf%7By%7D_%7B1%7D+%7C+%5Cmathbf%7By%7D_%7B2%7D%5Cright%29 是关于

    equation?tex=y_2 的线性方程,同时

    equation?tex=COV%28y_1%7Cy_2%29 不依赖

    equation?tex=y_2

    独立性

    equation?tex=y 的子向量的独立性:

    现考虑先前对

    equation?tex=y%E3%80%81%5Cmu%E3%80%81%5CSigma 的分割,

    1、假设

    equation?tex=%5Cmathbf%7By%7D+%5Csim+N_%7Bp%7D%28%5Cboldsymbol%7B%5Cmu%7D%2C+%5Cboldsymbol%7B%5CSigma%7D%29 ,则

    equation?tex=y_1

    equation?tex=y_2独立,当且仅当

    equation?tex=%5Cboldsymbol%7B%5CSigma%7D_%7B12%7D%3DO

    2、假设

    equation?tex=%5Cmathbf%7By%7D+%5Csim+N_%7Bp%7D%28%5Cboldsymbol%7B%5Cmu%7D%2C+%5Cboldsymbol%7B%5CSigma%7D%29, 则

    equation?tex=Y_j

    equation?tex=Y_k 独立,当且仅当

    equation?tex=%5Csigma_%7Bjk%7D%3D0

    3、如果

    equation?tex=%5Cmathbf%7By%7D_1+%5Csim+N_%7Br%7D%28%5Cboldsymbol%7B%5Cmu%7D_1%2C+%5Cboldsymbol%7B%5CSigma%7D_%7B11%7D%29%2C%5Cmathbf%7By%7D_2+%5Csim+N_%7Bq%7D%28%5Cboldsymbol%7B%5Cmu%7D_2%2C+%5Cboldsymbol%7B%5CSigma%7D_%7B22%7D%29, 且

    equation?tex=y_1

    equation?tex=y_2 相互独立,

    equation?tex=%5Cleft%28%5Cbegin%7Barray%7D%7Bl%7D+%5Cmathbf%7By%7D_%7B1%7D+%5C%5C+%5Cmathbf%7By%7D_%7B2%7D+%5Cend%7Barray%7D%5Cright%29+%5Csim+N_%7Bp%2Bq%7D%5Cleft%5B%5Cleft%28%5Cbegin%7Barray%7D%7Bc%7D+%5Cboldsymbol%7B%5Cmu%7D_%7B1%7D+%5C%5C+%5Cboldsymbol%7B%5Cmu%7D_%7B2%7D+%5Cend%7Barray%7D%5Cright%29%2C%5Cleft%28%5Cbegin%7Barray%7D%7Bcc%7D+%5Cboldsymbol%7B%5CSigma%7D_%7B11%7D+%26+%5Cmathbf%7BO%7D+%5C%5C+%5Cmathbf%7BO%7D+%26+%5Cboldsymbol%7B%5CSigma%7D_%7B22%7D+%5Cend%7Barray%7D%5Cright%29%5Cright%5D%5C%5C

    求和与差

    两个多元正态向量的和与差:

    现考虑两个

    equation?tex=p 维多元向量

    equation?tex=y

    equation?tex=x

    如果

    equation?tex=%5Cmathbf%7By%7D_1+%5Csim+N_%7Bp%7D%28%5Cboldsymbol%7B%5Cmu%7D_1%2C+%5Cboldsymbol%7B%5CSigma%7D_%7B11%7D%29%2C%5Cmathbf%7By%7D_2+%5Csim+N_%7Bp%7D%28%5Cboldsymbol%7B%5Cmu%7D_2%2C+%5Cboldsymbol%7B%5CSigma%7D_%7B22%7D%29 并且

    equation?tex=y_1

    equation?tex=y_2 相互独立,

    则:

    equation?tex=y_1%5Cpm+y_2%5Csim+N_%7Bp%7D%28%5Cboldsymbol%7B%5Cmu%7D_1%2B%5Cmu_2%2C+%5Cboldsymbol%7B%5CSigma%7D_%7B11%7D%2B%5Cboldsymbol%7B%5CSigma%7D_%7B22%7D%29%2C

    标准化向量

    标准化多元正态向量:

    对于任意以

    equation?tex=%5Cmu 为均值、

    equation?tex=%5CSigma 为协方差矩阵的向量

    equation?tex=y ,我们可得到其标准化的向量

    equation?tex=z,以

    equation?tex=0 为均值向量,以

    equation?tex=I 为协方差矩阵.

    对于任意以

    equation?tex=%5Cmu 为均值、

    equation?tex=%5CSigma 为协方差矩阵的向量

    equation?tex=y ,其标准化的向量

    equation?tex=z,可以通过以下两个途径获得:

    1、

    equation?tex=z%3D%28T%27%29%5E%7B-1%7D%28y-%5Cmu%29

    这里

    equation?tex=T

    equation?tex=%5CSigma 矩阵的 Cholesky 分解中的非奇异上三角阵,即:

    equation?tex=%5CSigma%3DT%27T .

    equation?tex=%5Cboldsymbol%7B%5CSigma%5E%7B1%2F2%7D%7D%3DT%27

    2、

    equation?tex=z%3D%28%5CSigma%5E%7B1%2F2%7D%29%5E%7B-1%7D%28y-%5Cmu%29

    这里的

    equation?tex=%5CSigma%5E%7B1%2F2%7D

    equation?tex=%5CSigma%5E%7B%7D 的 谱分解 (Spectral decomposition) 中的对称平方根矩阵,即:

    equation?tex=%5CSigma%5E%7B%7D%3D%5CSigma%5E%7B1%2F2%7D%5CSigma%5E%7B1%2F2%7D

    根据矩阵谱分解:

    equation?tex=%5Cboldsymbol%7B%5CSigma%7D%3D%5Csum_%7Bj%3D1%7D%5E%7Bp%7D+%5Clambda_%7Bj%7D+%5Cmathbf%7Be%7D_%7Bj%7D+%5Cmathbf%7Be%7D_%7Bj%7D%5E%7B%5Cprime%7D%5CRightarrow%5Cboldsymbol%7B%5CSigma%5E%7B1%2F2%7D%7D%3D+%5Csum_%7Bj%3D1%7D%5E%7Bp%7D%5Csqrt%7B%5Clambda_%7Bj%7D%7D+++%5Cmathbf%7Be%7D_%7Bj%7D+%5Cmathbf%7Be%7D_%7Bj%7D%5E%7B%5Cprime%7D

    经过标准化之后,

    equation?tex=z

    equation?tex=0 为均值向量,以

    equation?tex=I 为协方差矩阵; 如果

    equation?tex=%5Cmathbf%7By%7D%5Csim+N_%7Bp%7D%28%5Cboldsymbol%7B%5Cmu%7D%2C+%5Cboldsymbol%7B%5CSigma%7D_%7B%7D%29 ,则

    equation?tex=%5Cmathbf%7Bz%7D%5Csim+N_%7Bp%7D%28%5Cboldsymbol%7B0%7D%2C+%5Cboldsymbol%7BI%7D_%7B%7D%29 .

    二次型

    多元正态向量的二次型:

    考虑前文所说的标准正态向量

    equation?tex=z

    equation?tex=%2C%5Cmathbf%7Bz%7D%5Csim+N_%7Bp%7D%28%5Cboldsymbol%7B0%7D%2C+%5Cboldsymbol%7BI%7D_%7B%7D%29 。根据卡方分布的定义,

    equation?tex=z%27z%3D%5Csum_%7Bj%3D1%7D%5E%7Bp%7D%7BZ_j%5E2%7D就构成了一个

    equation?tex=%5Cchi%5E2%28p%29 随机变量。

    由于

    equation?tex=z%3D%28%5CSigma%5E%7B1%2F2%7D%29%5E%7B-1%7D%28y-%5Cmu%29 因此:

    equation?tex=z%27z%3D%28y-%5Cmu%29%27%5CSigma%5E%7B-1%7D%28y-%5Cmu%29

    如果

    equation?tex=%5Cmathbf%7By%7D%5Csim+N_%7Bp%7D%28%5Cboldsymbol%7B%5Cmu%7D%2C+%5Cboldsymbol%7B%5CSigma%7D_%7B%7D%29

    equation?tex=%28y-%5Cmu%29%27%5CSigma%5E%7B-1%7D%28y-%5Cmu%29%5Csim%5Cchi%5E2%28p%29

    equation?tex=%E5%A4%9A%E5%85%83%E6%AD%A3%E6%80%81%E7%9A%84%E4%BC%B0%E8%AE%A1%5C%5C

    多元正态极大似然函数

    当总体服从多元正态分布时,对

    equation?tex=%5Cmu

    equation?tex=%5CSigma 的估计通常基于已观测向量

    equation?tex=y_1%2C...y_n 来最大化似然函数的方法:

    给定独立同分布的n个样本

    equation?tex=y_1....%2Cy_n%5Csim+N_p%28%5Cmu%2C%5CSigma%29 ,其似然函数为:

    equation?tex=%5Cbegin%7Baligned%7D+L%5Cleft%28%5Cmathbf%7By%7D_%7B1%7D%2C+%5Cmathbf%7By%7D_%7B2%7D%2C+%5Cldots%2C+%5Cmathbf%7By%7D_%7Bn%7D%2C+%5Cboldsymbol%7B%5Cmu%7D%2C+%5Cmathbf%7B%5CSigma%7D%5Cright%29+%26%3D%5Cprod_%7Bi%3D1%7D%5E%7Bn%7D+f%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D%2C+%5Cboldsymbol%7B%5Cmu%7D%2C+%5Cmathbf%7B%5CSigma%7D%5Cright%29+%5C%5C+%26%3D%5Cprod_%7Bi%3D1%7D%5E%7Bn%7D+%5Cfrac%7B1%7D%7B%28%5Csqrt%7B2+%5Cpi%7D%29%5E%7Bp%7D%7C%5Cmathbf%7B%5CSigma%7D%7C%5E%7B1+%2F+2%7D%7D+e%5E%7B-%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Cboldsymbol%7B%5Cmu%7D%5Cright%29%5E%7B%5Cprime%7D+%5Cmathbf%7B%5CSigma%7D%5E%7B-1%7D%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Cboldsymbol%7B%5Cmu%7D%5Cright%29+%2F+2%7D+%5C%5C+%26%3D%5Cfrac%7B1%7D%7B%28%5Csqrt%7B2+%5Cpi%7D%29%5E%7Bn+p%7D%7C%5Cmathbf%7B%5CSigma%7D%7C%5E%7Bn+%2F+2%7D%7D+e%5E%7B-%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Cboldsymbol%7B%5Cmu%7D%5Cright%29%5E%7B%5Cprime%7D+%5Cmathbf%7B%5CSigma%7D%5E%7B-1%7D%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Cboldsymbol%7B%5Cmu%7D%5Cright%29+%2F+2%7D+%5Cend%7Baligned%7D

    最大化似然函数L来得到

    equation?tex=%5Cmu

    equation?tex=%5Csum_%7B%7D%5E%7B%7D%7B%7D的极大似然估计

    首先考虑μ的极大似然估计。对数似然函数为:

    equation?tex=+logL%5Cleft%28%5Cmathbf%7By%7D_%7B1%7D%2C+%5Cmathbf%7By%7D_%7B2%7D%2C+%5Cldots%2C+%5Cmathbf%7By%7D_%7Bn%7D%2C+%5Cboldsymbol%7B%5Cmu%7D%2C+%5Cmathbf%7B%5CSigma%7D%5Cright%29+%3D-%5Cfrac%7Bn%7D%7B2%7Dlog%7C%5CSigma%7C-++%5Cfrac%7B1%7D%7B2%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Cboldsymbol%7B%5Cmu%7D%5Cright%29%5E%7B%5Cprime%7D+%5Cmathbf%7B%5CSigma%7D%5E%7B-1%7D%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Cboldsymbol%7B%5Cmu%7D%5Cright%29

    equation?tex=%5Cbegin%7Barray%7D%7Bc%7D+%5Cfrac%7B%5Cpartial+%5Clog+L%7D%7B%5Cpartial+%5Cboldsymbol%7B%5Cmu%7D%7D%3D%5Cmathbf%7B0%7D+%5CRightarrow+%5Csum_%7Bi%3D1%7D%5E%7Bn%7D+%5Cboldsymbol%7B%5CSigma%7D%5E%7B-1%7D%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Cboldsymbol%7B%5Cmu%7D%5Cright%29%3D%5Cmathbf%7B0%7D+%5C%5C++%5Cend%7Barray%7D

    得到:

    equation?tex=%5Chat%7B%5Cboldsymbol%7B%5Cmu%7D%7D%3D%5Cfrac%7B1%7D%7Bn%7D+%5Csum_%7Bi%3D1%7D%5E%7Bn%7D+%5Cmathbf%7By%7D_%7Bi%7D%3D%5Coverline%7B%5Cmathbf%7By%7D%7D

    考虑

    equation?tex=%5Csum_%7B%7D%5E%7B%7D%7B%7D的极大似然估计。代入

    equation?tex=%5Chat%7B%5Cboldsymbol%7B%5Cmu%7D%7D%3D%5Coverline%7B%5Cmathbf%7By%7D%7D对数似然函数为:

    equation?tex=%5Cbegin%7Barray%7D+++llogL%5Cleft%28%5Cmathbf%7By%7D_%7B1%7D%2C+%5Cmathbf%7By%7D_%7B2%7D%2C+%5Cldots%2C+%5Cmathbf%7By%7D_%7Bn%7D%2C+%5Cboldsymbol%7B%5Cmu%7D%2C+%5Cmathbf%7B%5CSigma%7D%5Cright%29%26+%3D-%5Cfrac%7Bn%7D%7B2%7Dlog%7C%5CSigma%7C-++%5Cfrac%7B1%7D%7B2%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Cboldsymbol%7B%5Cmu%7D%5Cright%29%5E%7B%5Cprime%7D+%5Cmathbf%7B%5CSigma%7D%5E%7B-1%7D%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Cboldsymbol%7B%5Cmu%7D%5Cright%29%5C%5C++tr%28AB%29%3Dtr%28BA%29%5Crightarrow+%26%3D-%5Cfrac%7Bn%7D%7B2%7D+%5Clog+%7C%5Cmathbf%7B%5CSigma%7D%7C-%5Cfrac%7B1%7D%7B2%7D+%5Csum_%7Bi%3D1%7D%5E%7Bn%7D+%5Coperatorname%7Btr%7D%5Cleft%5C%7B%7B%5Cmathbf%7B%5CSigma%7D%5E%7B-1%7D%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Coverline%7B%5Cmathbf%7By%7D%7D%5Cright%29%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Coverline%7B%5Cmathbf%7By%7D%7D%5Cright%29%5E%7B%5Cprime%7D%7D%7B%7D%5Cright%5C%7D%5C%5C++%26%3D-%5Cfrac%7Bn%7D%7B2%7D+%5Clog+%7C%5Cmathbf%7B%5CSigma%7D%7C-%5Cfrac%7B1%7D%7B2%7D+%5Coperatorname%7Btr%7D%5Cleft%5C%7B%5Cmathbf%7B%5CSigma%7D%5E%7B-1%7D+%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Coverline%7B%5Cmathbf%7By%7D%7D%5Cright%29%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Coverline%7B%5Cmathbf%7By%7D%7D%5Cright%29%5E%7B%5Cprime%7D%5Cright%5C%7D%5C%5C++%5Cmathbf%7BS%7D_%7B0%7D%5Cequiv%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Coverline%7B%5Cmathbf%7By%7D%7D%5Cright%29%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Coverline%7B%5Cmathbf%7By%7D%7D%5Cright%29%5E%7B%5Cprime%7D+%5Crightarrow+%26%3D-%5Cfrac%7Bn%7D%7B2%7D+%5Clog+%7C%5Cmathbf%7B%5CSigma%7D%7C-%5Cfrac%7B1%7D%7B2%7D+%5Coperatorname%7Btr%7D%5Cleft%28%5Cmathbf%7B%5CSigma%7D%5E%7B-1%7D+%5Cmathbf%7BS%7D_%7B0%7D%5Cright%29%5C%5C+++%5Cmathbf%7B%5COmega%7D+%5Cequiv+%5Cmathbf%7B%5CSigma%7D%5E%7B-1%7D+%5Crightarrow+%26%3D%5Cfrac%7Bn%7D%7B2%7D+%5Clog+%7C%5Cmathbf%7B%5COmega%7D%7C-%5Cfrac%7B1%7D%7B2%7D+%5Coperatorname%7Btr%7D%5Cleft%28%5COmega+%5Cmathbf%7BS%7D_%7B0%7D%5Cright%29+%5Cend%7Barray%7D

    对多元正态分布

    equation?tex=%5Cmu

    equation?tex=%5Csum_%7B%7D%5E%7B%7D%7B%7D 的极大似然估计为:

    equation?tex=%5Chat%7B%5Cboldsymbol%7B%5Cmu%7D%7D%3D%5Coverline%7B%5Cmathbf%7By%7D%7D%2C+%5Cquad+%5Chat%7B%5Cmathbf%7B%5CSigma%7D%7D%3D%5Cfrac%7B1%7D%7Bn%7D+%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Coverline%7B%5Cmathbf%7By%7D%7D%5Cright%29%5Cleft%28%5Cmathbf%7By%7D_%7Bi%7D-%5Coverline%7B%5Cmathbf%7By%7D%7D%5Cright%29%5E%7B%5Cprime%7D%3D%5Cfrac%7Bn-1%7D%7Bn%7D+%5Cmathbf%7BS%7D

    equation?tex=S 作为

    equation?tex=%5Csum_%7B%7D%5E%7B%7D%7B%7D 的估计量是无偏的,而

    equation?tex=%5Chat%5Csum_%7B%7D%5E%7B%7D%7B%7D是有偏的

    一元情形的回顾

    基于服从正态分布

    equation?tex=N%28%5Cmu%2C%5Csigma%5E2%29 的总体的独立同分布样本

    equation?tex=%5Cmathbf%7By%7D_%7B1%7D%2C+%5Cmathbf%7By%7D_%7B2%7D%2C+%5Cldots%2C+%5Cmathbf%7By%7D_%7Bn%7D

    样本均值

    equation?tex=%5Cbar%7By%7D%3D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D+y_%7Bi%7D+%2F+n 服从:

    equation?tex=%5Cbar%7By%7D+%5Csim+N%5Cleft%28%5Cmu%2C+%5Csigma%5E%7B2%7D+%2F+n%5Cright%29%5C%5C 样本方差

    equation?tex=%7BS%7D%5E%7B2%7D%3D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%5Cleft%28y_%7Bi%7D-%5Cbar%7By%7D%5Cright%29%5E%7B2%7D+%2F%28n-1%29+ 服从:

    equation?tex=%5Cfrac%7B%28n-1%29+S%5E%7B2%7D%7D%7B%5Csigma%5E%7B2%7D%7D+%5Csim+%5Cchi%5E%7B2%7D%28n-1%29%5C%5C

    equation?tex=%5Cbar%7By%7D+

    equation?tex=S%5E2 相互独立

    非正态总体(多元中心极限定理)

    设x1,x2,⋯,xn是来自总体x的一个样本,μ和Σ存在,则当n很大且n相对于p也很大时,

    equation?tex=+ 多元情形

    类似于一元的情形,基于服从正态分布

    equation?tex=N_p%28%5Cmu%2C%5CSigma%29 总体的独立同分布样本

    equation?tex=%5Cmathbf%7By%7D_%7B1%7D%2C+%5Cmathbf%7By%7D_%7B2%7D%2C+%5Cldots%2C+%5Cmathbf%7By%7D_%7Bn%7D

    样本均值

    equation?tex=%5Cbar%7By%7D%3D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D+y_%7Bi%7D+%2F+n 服从:

    equation?tex=%5Cbar%7By%7D+%5Csim+N%5Cleft%28%5Cmu%2C+%5CSigma+%2F+n%5Cright%29%5C%5C

    样本方差

    equation?tex=%7BS%7D%5E%7B2%7D%3D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%5Cleft%28y_%7Bi%7D-%5Cbar%7By%7D%5Cright%29%5Cleft%28y_%7Bi%7D-%5Cbar%7By%7D%5Cright%29%27+%2F%28n-1%29+ 服从:

    equation?tex=%7B%28n-1%29+S%5E%7B%7D%7D%7B%7D+%5Csim+W_p%7B%7D%28n-1%2C%5Csum%29%5C%5C

    这里的

    equation?tex=W_p%7B%7D%28n-1%2C%5Csum%29 表示

    equation?tex=n-1 个自由度的Wishart分布

    equation?tex=%5Cbar%7By%7D+

    equation?tex=S 相互独立

    Wishart分布

    Wishart 分布的定义:

    假设

    equation?tex=p 维向量

    equation?tex=z_i%2Ci%3D1%2C...%2Cq 独立同分布且服从

    equation?tex=N_p%280%2C%5CSigma%29 ,则:

    equation?tex=%5Csum_%7Bi%3D1%7D%5E%7Bq%7D+%5Cmathbf%7Bz%7D_%7Bi%7D+%5Cmathbf%7Bz%7D_%7Bi%7D%5E%7B%5Cprime%7D+%5Csim+W_%7Bp%7D%28q%2C+%5Cmathbf%7B%5CSigma%7D%29%2C%E8%87%AA%E7%94%B1%E5%BA%A6%E4%B8%BAq%EF%BC%88p%E9%98%B6%EF%BC%89%5C%5C

    服从自由度为n的p维非中心Wishart分布,记为

    equation?tex=W+%5Csim+W_p%28n%2C%5CSigma%2CZ%29 ,其中

    equation?tex=Z%3D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D+%5Cmathbf%7Bu%7D_%7Bi%7D+%5Cmathbf%7Bu%7D_%7Bi%7D%5E%7B%5Cprime%7D

    equation?tex=%CE%BC_i%3D0%2Ci%3D+1%2C2%2C..%2Cn%2C 则称W为中心化的Wishart分布,记

    equation?tex=W+%5Csim+W_p%28n%2C%5CSigma%29

    假设两个

    equation?tex=p%5Ctimes+p 的随机矩阵

    equation?tex=W_1

    equation?tex=W_2 分别服从分布

    equation?tex=W_%7Bp%7D%28q_1%2C+%5Cmathbf%7B%5CSigma%7D%29%2CW_%7Bp%7D%28q_2%2C+%5Cmathbf%7B%5CSigma%7D%29

    且彼此独立,则:

    equation?tex=%5Cmathbf%7BW%7D_%7B1%7D%2B%5Cmathbf%7BW%7D_%7B2%7D+%5Csim+W_%7Bp%7D%5Cleft%28q_%7B1%7D%2Bq_%7B2%7D%2C+%5Cmathbf%7B%5CSigma%7D%5Cright%29%5C%5C

    如果

    equation?tex=%5Cmathbf%7BW%7D+%5Csim+W_%7Bp%7D%28q%2C+%5Cmathbf%7B%5CSigma%7D%29

    equation?tex=C%E4%B8%BAk%5Ctimes+p 的常数矩阵,则有:

    equation?tex=%5Ctext+%7B+CWC%27+%7D+%5Csim+W_%7Bk%7D%5Cleft%28q%2C+%5Cmathbf%7BC+%5CSigma+C%7D%5E%7B%5Cprime%7D%5Cright%29%5C%5C

    equation?tex=+

    equation?tex=%E8%AF%84%E4%BC%B0%E6%AD%A3%E6%80%81%E6%80%A7%5C%5C

    评估一元正态性

    图像方法:直方图、QQ图

    偏度和峰度

    统计检验:

    • Shapiro-Wilks 检验

    • Kolmogorov-Smirnov 检验

    • Cramer-von Mises 检验

    • Anderson-Darling 检验

    • ……

    直方图

    QQ图

    根据QQ图的形状来判断正态性:

    equation?tex=%E7%9B%B4%E7%BA%BF%EF%BC%88%E5%85%AC%E5%BC%8F%E7%AE%AD%E5%A4%B4%EF%BC%89+%5CRightarrow+%E6%AD%A3%E6%80%81+%5C%5C+%E5%8F%8D%E2%80%9CS%E2%80%9D%E5%BD%A2+%5CRightarrow%E6%AF%94%E6%AD%A3%E6%80%81%E5%8E%9A%E5%B0%BE+%5C%5C+%E2%80%9CS%E2%80%9D%E5%BD%A2++%5CRightarrow%E6%AF%94%E6%AD%A3%E6%80%81%E8%96%84%E5%B0%BE+%5C%5C+%E5%87%B8%E5%BC%AF%E6%9B%B2+%5CRightarrow+%E5%8F%B3%E5%81%8F+%5C%5C+%E5%87%B9%E5%BC%AF%E6%9B%B2+%5CRightarrow+%E5%B7%A6%E5%81%8F%5C%5C

    偏度和峰度

    我们可以用偏度和峰度对正态性进行粗略的判断,它们应该在(0,3)左右

    统计检验

    图像方法的缺点:

    • 图像方法对于小样本并不适用

    • 图像方法以及偏度峰度法只提供了一个粗糙而不正式的检验方法,没 有一个明确的决定准则。

    因此我们需要正式的统计检验,他们基于以下假设:

    equation?tex=H_0 :数据来自正态分布

    equation?tex=H_1 :数据不来自正态分布

    Shapiro-Wilks 检验

    Shapiro-Wilks 检验统计量为:

    equation?tex=W%3D%5Cfrac%7B%5Cleft%28%5Csum_%7Bi%3D1%7D%5E%7Bn%7D+a_%7B%28i%29%7D+y_%7B%28i%29%7D%5Cright%29%5E%7B2%7D%7D%7B%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%5Cleft%28y_%7Bi%7D-%5Cbar%7By%7D%5Cright%29%5E%7B2%7D%7D%5C%5C

    这里

    equation?tex=+y_%7B%28i%29%7D 是第

    equation?tex=i 个样本次序统计量

    equation?tex=a_%7B%28i%29%7D 是标准正态分布中第

    equation?tex=i 个次序统计量标准化的期望值

    equation?tex=%5Csqrt%7BW%7D%5Capprox 实际数据与正态得分之间的相关系数

    equation?tex=W%3D1 时,数据恰好完全是正态分布

    equation?tex=W 显著小于1”则表明数据非正态

    Kolmogorov-Smirnov 检验

    Kolmogorov-Smirnov 检验的统计量为:

    equation?tex=D%3D%5Csqrt%7Bn%7D+%5Csup+_%7By%7D%5Cleft%7CF_%7Bn%7D%28y%29-F_%7B0%7D%28y%29%5Cright%7C%5C%5C

    这里的

    equation?tex=F_%7Bn%7D%28y%29 是数据的经验累积分布函数(cdf)

    equation?tex=F_%7B0%7D%28y%29 是与数据同均值、同方差的正态分布的累积分布函数

    equation?tex=D 值很大,则拒绝原假设

    equation?tex=H_0 .

    Cramer-von Mises 检验的统计量为:

    equation?tex=C%3D%5Cint_%7B%7D%5E%7B%7D%5Cleft%5BF_%7Bn%7D%28y%29-F_%7B0%7D%28y%29%5Cright%5D%5E2dF_0%28y%29%5C%5C

    Anderson-Darling 检验的统计量为:

    equation?tex=A%3D%5Cint_%7B%7D%5E%7B%7D%5Cfrac%7B%5Cleft%5BF_%7Bn%7D%28y%29-F_%7B0%7D%28y%29%5Cright%5D%7D%7BF_0%28y%29%281-F_0%28y%29%29%7D%5E2dF_0%28y%29%5C%5C

    评估多元正态性

    有三种方法来检验一个

    equation?tex=p 维总体

    equation?tex=y 的随机样本

    equation?tex=%5Cmathbf%7By%7D_%7B1%7D%2C+%5Cmathbf%7By%7D_%7B2%7D%2C+%5Cldots%2C+%5Cmathbf%7By%7D_%7Bn%7D 是否来自于

    多元正态分布:

    1、检验向量的每一维是否都是一元正态分布

    2、检验是否每一组二维散点图都没有线性趋势

    3、根据QQ图,检验统计距离

    equation?tex=%5C%7B%5Cmathbf%7Bd%7D_%7B1%7D%2C+%5Cmathbf%7Bd%7D_%7B2%7D%2C+%5Cldots%2C+%5Cmathbf%7Bd%7D_%7Bn%7D%5C%7D 是否距离

    equation?tex=%5Cchi%5E2%28p%29 很远,其中统计距离定义为:

    equation?tex=d_i%3D%28y_i-%5Cbar%7By%7D%29%27S%5E%7B-1%7D%28y_i-%5Cbar%7By%7D%29%5C%5C 注意,这只是一种近似的方法。

    例:在美国城市空气污染研究中,获取了关于美国41个城市的以下变量:

    • SO2:空气中的二氧化硫含量(微克/立方米)

    • temp:全年均温(华氏度)

    • manu:拥有20名以上工人的制造企业数

    • popul:1970年的人口规模(千人)

    • wind:年度平均风速(英里/小时)

    • precip:年均降水(英寸)

    • predays:年平均降水天数

    首先我们检查每一个变量的QQ图:

    二氧化硫分布比较集中,降水以及降水天数背离了正态性;制造企业数和人口数存在很多异常值.绘制两两散点图矩阵

    非线性部分显示了数据与多元 正态分布的偏离

    进一步地,我们绘制整体QQ图

    该图除了检验正态性这一用处外, 也可以用来发现可能的异常值

    如果正态性不成立,可以采用一 些变量变换方法来获取正态性, 如Box-Cox 变换

    思考

    什么是多元正态分布?

    怎样用几何的方式描绘密度函数?

    多元正态向量有哪些性质?

    equation?tex=%5Cmu

    equation?tex=%5Csum_%7B%7D%5E%7B%7D%7B%7D 的极大似然估计是什么?

    样本均值向量和样本协方差矩阵的分布是什么?

    怎样检验多元正态性?

    展开全文
  • 主要内容二维随机变量分布函数定义更多系列视频概率微课:第二章(1) 随机变量的定义概率微课:第二章(2) 离散型随机变量概率微课:第二章(3) 两点分布及伯努利试验概率微课:第二章(4) 二项分布1概率微课:第二章...

    a54a7d788250b1e0093bc50b33afa1c1.png

    主要内容

    二维随机变量及分布函数定义

    bdd1268ee76d9080f5a6c93d282ff453.png

    更多系列视频
    • 概率微课:第二章(1)   随机变量的定义

    • 概率微课:第二章(2) 离散型随机变量

    • 概率微课:第二章(3) 两点分布及伯努利试验

    • 概率微课:第二章(4) 二项分布1

    • 概率微课:第二章(5) 二项分布2_例题讲解

    • 概率微课:第二章(6) 泊松分布

    • 概率微课:第二章(7) 分布函数定义

    • 概率微课:第二章(8) 分布函数例题解析

    • 第二章(9) 离散型随机变量分布函数的求法

    • 第二章(10) 连续型随机变量及概率密度函数

    • 第二章(11) 概率密度函数的理解和习题讲解

    • 概率微课:第二章(12) 均匀分布

    • 概率微课:第二章(13) 指数分布

    • 概率微课:第二章(13) 指数分布的几个例题

    • 概率微课:第二章(14) 正态分布定义

    • 概率微课:第二章(15) 正态分布的曲线形态

    • 概率微课:第二章(16) 标准正态分布及其概率求法

    • 概率微课:第二章(17) 一般正态分布概率求法

    展开全文
  • 二维正态随机变量是最常见一种二维随机变量分布。其联合概率密度函数为: p(x,y)=12πσXσY1−r2⋅exp{−12(1−r2)[(x−mX2)σX2−2r(x−mX)(y−mY)σXσY+(y−mY2)σY2]} p(x,y)=\frac{1}{2\pi \sigma _X\sigma ...

    二维正态随机变量概率密度函数三维图的matlab实现

    1.二维正态随机变量

    二维正态随机变量是最常见的一种二维随机变量分布。其联合概率密度函数为:
    p(x,y)=12πσXσY1r2exp{12(1r2)[(xmX2)σX22r(xmX)(ymY)σXσY+(ymY2)σY2]} p(x,y)=\frac{1}{2\pi \sigma _X\sigma _Y\sqrt{1-r^2}}\cdot exp\{ -\frac{1}{2(1-r^2)}[\frac{(x-m_X^2)}{\sigma_X ^2}-\frac{2r(x-m_X)(y-m_Y)}{\sigma_X\sigma_Y}+\frac{(y-m_Y^2)}{\sigma_Y^2}]\}

    变量 含义
    σX\sigma_X 随机变量X的方差
    σY\sigma_Y 随机变量Y的方差
    mXm_X 随机变量X的方差
    mYm_Y 随机变量Y的方差
    r 随机变量X、Y相关系数

    2.Mtalab画联合概率密度三维图

    σX=σY=1,mX=mY=5,r=0\sigma_X=\sigma_Y=1,m_X=m_Y=5,r=0,画联合概率密度的三维曲面如下:

    • 三维视图

    在这里插入图片描述

    • X-Z视图:
      在这里插入图片描述
    • Y-Z视图:
      在这里插入图片描述
    • 任意视图(体验视觉冲击力)
      在这里插入图片描述

    3.matlab代码

    clc
    close all
    clearvars
    Dx=1;%方差
    Dy=1;%方差
    mx=5;
    my=5;
    r=0;
    x=0:0.05:10;
    y=0:0.05:10;
    [X,Y]=meshgrid(x,y);
    p2=(1/(2*pi*Dx*Dy*sqrt(1-r^2)))*exp((-1/(2*(1-r^2)))*((X-mx).^2/Dx^2)-(2*r*(X-mx).*(Y-my)/(Dx*Dy)+(Y-my).^2/Dy^2));
    mesh(X,Y,p2)
    title('随机变量X、Y的联合概率密度')
    xlabel('X')
    ylabel('Y')
    zlabel('联合概率密度')
    
    展开全文
  • 二维连续型随机变量分布、分布函数法卷积例1例2 正态分布的变量和,推广正态分布的变量和分布函数法例 卷积 例1 例2 正态分布的变量和,推广 正态分布的变量和 分布函数法 例 ...
  • 文章目录1. 多维随机变量及其分布2. 二维离散型随机变量的分布及独立性3.... 二维标准正态分布联合概率密度5. 两个随机变量的函数分布6. 考点分布 1. 多维随机变量及其分布 2. 二维离散型随机变量的分布及独...
  • 文章目录必须知道概率论知识一变量离散随机变量def常见分布几何分布期望方差分布——b(n,p)期望方差泊松分布—— P(λ)P(\lambda)P(λ)期望方差超几何分布——h(n,N,M)期望方差连续型随机变量def常见分布...
  • 连续型概率分布——正态分布二维

    万次阅读 多人点赞 2018-05-24 21:04:27
    1. 定义:设二维连续型随机变量(X,Y)联合概率密度为 其中μ1,μ2,σ1,σ2,ρ均为常数,且σ1>0, σ2>0, |ρ|<1则称(X,Y)服从参数为μ1,μ2,σ1,σ2,ρ的二维正态分布。 记作(X,Y)~N...
  • 一元正态分布回顾如果随机变量 服从均值为 方差为 的正态分布 (Univariate normal ...正态分布可以模拟大量自然现象多元正态分布多元正态分布密度函数类比于一元情况,若 维随机变量 服从均值向量为 和协方差矩阵为 ...
  • 二维随机变量

    千次阅读 2019-05-24 17:48:03
    1.离散型 2.连续型 3.联合概率密度性质 4.例题: 5.常用分布 1.均匀分布 2.二维正态分布
  • 正态分布

    千次阅读 2016-11-25 16:38:15
     则这个随机变量就称为正态随机变量,正态随机变量服从分布就称为正态分布,记作   2. N维空间正太分布   N维空间正太分布方程为:    r为模糊半径。  于是,二维高斯模板上距离中
  • 证明二维正态分布参数ρ为相关系数

    千次阅读 多人点赞 2020-04-28 18:43:03
    二维正态分布中,参数ρ\rhoρ被定义为随机变量X,YX,YX,Y相关系数,即ρ=r(x,y)\rho=r(x,y)ρ=r(x,y)。由 r(x,y)=Cov(x,y)Var[x]Var[y]Cov(x,y)=E[XY]−E[X]E[Y] r(x,y)=\frac{Cov(x,y)}{\sqrt{Var[x]Var[y]}} \...
  • 维随机变量及其分布,主要包括:分布函数定义、两类随机变量及其常见分布类型,包括0-1分布,项分布,几何分布,泊松分布,超几何分布,均匀分布,指数分布以及正态分布
  • 章、多元正态分布及参数估计这一讲主要是给出概率论中若干概念向高维推广2.1随机向量一、随机向量联合分布、边缘分布和条件分布1、多元数据 维随机向量: ,其中每个 都是随机变量随机矩阵: ,其中每个 都...
  • 数学期望离散型随机变量的数学期望1. 两点分布2. 项分布3. 泊松分布4. 几何分布5. 超几何分布6. 其他连续性随机变量的数学期望1. 均匀分布2. 指数分布3. 正态分布 离散型随机变量的数学期望 1. 两点分布 2. 项...
  • 这一章是上一章深化,一个是一维空间,一个是多维空间。 联合分布函数 联合分布率 ...二维连续型随机变量 (X,Y)概率密度性质 (X,Y)在G上符合均匀分布 二维正态分布 在这里插入图片描述 ...
  • 本片博文介绍多元正态分布,我们以nn维随机变量为主,但给出n=2n=2时二元情况一些实例。与上篇文章一样,我们首先介绍标准情况然后扩展到一般情况,当然这里会用到向量与矩阵符号。考虑随机向量Z=(Z1,…,Zn)′\...
  • ,设为p维随机向量 ,则X服从p元正态分布的充要条件是:存在一个p元标准正态分布,向量以及一个m*n矩阵A,满足 (这是根据定义给出性质,X由相互独立标准随机向量线性组合所构成) 三,由特.
  • R语言:求二维随机变量数学期望

    千次阅读 2013-05-10 16:05:41
    想做一个二维变量数学期望实验, 查看若干资料终于找到方法 先看这篇文章熟悉一下R函数 http://www.cyclismo.org/tutorial/R/tables.html 构造数据 通过下面函数构造了,正态分布和泊松分布两列数据 A > A (a...
  • 如果服从多变量正态分布,必须满足下面三个等价条件: 任何线性组合 服 从正态分布。 存在随机向量 ( 它每个元素服从独立标准正态分布),向量 及 矩阵A满足 存在 和一个对称半正定阵 满足X特征函数 如果 ...
  • 概率笔记12——多维正态分布的最大似然估计

    万次阅读 多人点赞 2019-08-19 19:33:18
    我们在前面章节中见识过二维正态分布,(X,Y)服从参数为μ1, μ2, σ1, σ2, ρ的二维正态分布,记作(X, Y)~N(μ1, μ2, σ1, σ2, ρ),它密度函数:  其中μ1是第1维度均值,σ12是第1维度方差,ρ是将...
  • 二维正态边缘一定正态 不是二维正态边缘可能正态 边缘条件=联合 联合->边缘 and 条件 边缘 or 条件->/联合(条件nm矩阵,边缘迹矩阵,调制)(相互独立就可以推出) ...随机变量函数的分布(书) ...
  • (概率论基础1)一维随机变量

    千次阅读 2019-09-18 18:08:53
    文章目录1.随机变量概念2.离散型随机变量的分布2.1 概率函数与分布函数定义2.2 分布... 连续型随机变量的分布4.1 密度函数定义及解释1、正态分布,记为$X \sim N(\mu, \sigma^{2})$。2、指数分布3、均匀分布,记为...
  • 知识点:五种重要分布(项、泊松、均匀、指数、正态分布) 基础:下面前三篇链接地址: 概率论基础(1)古典和几何概型及事件运算 概率论基础(2)条件概率、全概率公式和贝叶斯公式 概率论基础(3)一维随机...
  • 本章重点掌握分布函数的性质、离散型随机变量的分布律与分布函数及连续型随机变量的密度函数与分布函数、常见离散型及连续型随机变量的分布、一维随机变量函数的分布。1、本章的重点内容随机变量及其分布函数的概念...
  • 基本知识结构 一:二维(n维)随机变量 1.概念 2.联合分布函数 ...二:二维离散型随机变量 ...三:二维连续型随机变量...5.二维正态分布 四:独立性 1.概念 2.相互独立充要条件 3.性质 五:函数...
  • 一、随机变量的数学期望 1、定义 ① ② 2、常见分布的期望 ①、两点分布 ②、泊松分布 ③、均匀分布 ...⑤、正态分布 ...2、二维随机变量z=g(X,Y) ①、离散 ②、连续 三、数学期望的性质 ...

空空如也

空空如也

1 2 3 4 5
收藏数 96
精华内容 38
关键字:

二维随机变量的正态分布