精华内容
下载资源
问答
  • 对应矩阵标准化
    万次阅读
    2019-09-20 21:22:43

    已知矩阵A,在MATLAB界面输入[x,y]=eig(A),可以得到特征值以及特征向量。其中y为对角阵,每个元素为特征值;x的每一列为特征值所对应的特征向量。

    需要进行特征向量标准化时,可以输入x(:,1)/norm(x(:,1))将特征向量进行标准化,标准化的特征向量各个元素平方之和为1。

    更多相关内容
  • 空间权重矩阵,地级市、省级四种空间权重矩阵都有哦,都是本人制作的,准确可靠哦!!结合了excel、stata、matlab联合制作!!!
  • 矩阵论】矩阵的相似标准型(1)

    千次阅读 2020-10-26 11:10:27
    线性变换的特征量↔矩阵的特征量;运用零多项式求解特征量。

    矩阵的相似标准型之“特征值与特征向量”

    本章目的:

    • 对于给定的矩阵,找一个最简单的矩阵与之相似
    • 对于给定的线性空间上的线性变换,找线性空间的一组基,使得线性变换的矩阵最简单。

      p.s. 在《【矩阵论】线性空间与线性变换(5)》这篇博文中我们对线性映射(变换)进行了十分详细的讨论,其中就提到一条定理如下图所示:
      在这里插入图片描述
      所以,当用线性变换的角度来看待矩阵时,找一个最简单的相似矩阵实质上就是找到一组基,使得该基下的矩阵表示尽可能的简单。

    一. 线性代数回顾

    1. 矩阵的相似对角化问题

    矩阵的相似对角化是说,对于一个矩阵A,如果存在一个可逆矩阵P,用这个可逆矩阵对A进行初等变换——P-1AP之后,即可以把矩阵A化成一个对角阵的形式,那么就说矩阵A可以进行相似对角化。

    在这里插入图片描述
    如果把矩阵P进行列分块表示成[p1,p2,p3,…,pn]的形式,那么对上式进行一个等价变换为AP = PΛ的形式,根据分块矩阵和对角矩阵运算的特点,就能得到APj = λj·Pj的形式。

    也就是说,A矩阵相似对角化之后得到的矩阵对角线上的每一个元素都是A的特征值,而变换矩阵P的每一列就是相对应的特征向量。

    p.s. 这里再推荐一篇“线性代数本质”系列的博文,是我看3Blue1Brown的同名系列视频所做的随课笔记,有一节《【线性代数的本质|笔记】基变换、特征向量和特征值》就是从几何上的观点来讲解矩阵的特征值和特征向量,对于建立线性代数中概念的直观印象很有帮助。

    2. 矩阵特征值、特征向量的计算

    (1)特征值、特征向量的定义

    对于一个矩阵A,若存在一个数λ0和一个非零向量η,使得Aη = λ0η成立,那么就称λ0是矩阵A的一个特征值,而η就是矩阵A关于特征值λ0的一个特征向量

    (2)特征值、特征向量的计算

    根据Aη = λ0η这个等式,可以将矩阵方程转化成(λ0I-A)η = θ的形式,因此我们要求解的特征向量就是齐次方程组(λ0I-A)η = θ的非零解

    一个齐次线性方程组具有非零解的充要条件就是这个系数矩阵的行列式(也就是|λ0I-A|,被称作是特征多项式)应该为零(系数矩阵不是一个满秩矩阵)。
    令|λ0I-A| = 0,求解这个特征方程,得到相应的特征值,将特征值回代入齐次方程中就能得到相应的特征向量。

    以下的这一节的主体内容,我们就是要用线性变换的语言和角度来思考“特征值和特征向量”这些概念


    二. 线性变换的特征值和特征向量

    1. 定义

    线性变换角度的特征量定义与线性代数中的十分类似,读者可以进行类比理解,毕竟我们本身就可以用线性变换的角度来看待矩阵。

    讨论线性变换的特征量的意义也就在于对线性变换的矩阵表示进行简化

    对于一个线性变换f∈Hom(V,V),λ0∈F,η∈V(且η≠0),若f(η) = λ0η,则称——
    λ0是线性变换f的特征值
    η是线性变换f的特征向量

    2. 数学求解

    (1)【例1】对于给定的线性变换,求解其特征值和特征向量
    在这里插入图片描述

    【方法论】

    当线性变换f可以写成对于空间中任意一个向量x进行形如f(x)= Ax的变换形式时,线性变换f的特征值与特征向量实质上就是矩阵A的特征值和特征向量

    求解:根据题意,上述线性变换f可以很容易地转换成矩阵的表示形式,所以问题就转换成求矩阵A的特征值与特征向量了,此处详细计算过程不再列写。

    在这里插入图片描述

    (2)【例2】一般的线性变换的特征量求解

    【结论推广】

    在上一个例子中给出的变换矩阵是很具体的,但其实“线性变换的特征量↔线性变换对应的矩阵的特征量”这个结论是可以在一般线性变换中进行拓展的。

    在这里插入图片描述
    根据上图,在指定的一组基下,原像的坐标为X,那么根据线性变换的矩阵表示,变换后的像的坐标可以写成AX,如果一个向量η是线性变换A的特征向量,那么就有f(η) = λη的等式成立,此处像与原像之间的关系就可以直接转换成像的坐标与原像的坐标之间的关系——AX = λX,从而得证。

    p.s. 要注意像(和原像)所在的线性空间与像的坐标(原像的坐标)所在的线性空间并不一致。

    (3)【例3】任意一个线性空间中给定的线性变换的特征量的求解
    在这里插入图片描述

    【方法论】
    ①首先找到该线性空间的一组基,把这个空间内定义的线性变换用矩阵的形式表示出来。
    p.s. 这里要注意一下,给定的线性空间可能是各式各样的,但是找到基之后给出的矩阵,其一定是在最一般的矩阵空间Rmxn之中(m,n的数值取决于变换前后的向量维度)

    ②对第一步找到的矩阵A进行特征量的求解

    ③特征值的求解一般不会出问题,但是我们找出来的矩阵A的特征向量往往是在Rn空间中的,还需要根据题意中定义的X所处的空间形式,将特征向量变换成其原来的形式。

    在这里插入图片描述
    Tip1:为了简化计算(后面得到的矩阵A是分块对角的形式,进行行列式等运算时会更加方便),老师选择的一组基并不是我们通常取的顺序E11,E12,E21,E22,;而是进行了小小的调整。

    Tip2:因为取的基的顺序发生了变化,所以在写向量坐标,以及求方程解还有将特征向量还原成原来空间形式的时候都要注意顺序,不要惯性思维。

    Tip3:如果只是对矩阵A进行求解,那么a[1,-1,0,0]T+b[0,0,1,-1]T的形式就已经是矩阵A的特征向量形式了,但是原来的向量X是在C2x2空间中,所以我们还要根据选取的基E11,E21,E12,E22将特征向量还原成[[a,b],[-a,-b]]的形式。

    Tip4:这一部分,涉及到很多线性空间的转换,如果理解的不是很好,我建议还是戳下方的原视频听听老师讲解,老师讲的思路很清晰。

    【东南大学】研究生课程 工程矩阵理论 课程22讲+习题6讲

    3. 相关定理

    (1)相似矩阵具有相同的特征量
    在这里插入图片描述

    简要证明:
    在这里插入图片描述
    注:
    ①上述定理的逆命题并不成立;e.g. A = [[0,0],[0,0]],B = [[0,1],[0,0]]

    ②可以由此定理定义线性变换的特征多项式
    “在之前,如果线性变换在某一组基下的矩阵为A,那么我们就可以用A的特征多项式来代表线性变换的特征多项式;但是我们也知道一个线性变换在不同的基下会有不同的矩阵表示,难免会产生困扰——那么一个线性变换是否会有不同的特征多项式与之对应?经过这个定理,我们就知道只要是同一个线性变换,其不同的矩阵对应的特征多项式都是一样的,这就定义了线性变换的特征多项式的唯一性。

    (2)特征多项式的计算

    一个矩阵A的特征多项式是形如|λI-A|这样的多项式,其中λ为多项式中的未知参数,I是单位矩阵,||是取行列式运算。

    我们知道如果将行列式展开应该能得到一个关于λ的n次多项式(n为矩阵A的阶数),而各个阶的项前的系数也应该和矩阵A的某些项相关,我们希望能够找到系数的规律,从而可以简化特征多项式的求解。

    在这里插入图片描述
    通俗地来说,矩阵的k阶主子式,就是沿着主对角线方向连续取的一个k阶子矩阵的行列式。

    (3)矩阵的迹

    在上面的定理中,与求子式相比,求解对角线元素的和,求解原矩阵的行列式会更加简单,所以这里要把这两个特别的项b1和b2得到结论记住。

    在这里插入图片描述
    矩阵A的迹(对角线上元素之和)等于矩阵A的特征值之和

    矩阵A的行列式等于特征值元素的乘积

    因为已知了矩阵A的各个特征值,所以可以把特征多项式|λI-A|写成(λ-λ1)·(λ-λ2)·…·(λ-λn)的形式,再对照左右等式两边项的系数,就能证明上述结论。

    在这里插入图片描述

    关于推论,前面已经讨论过【两个相似的矩阵具有相同的特征多项式】,结合此处的结论,可以得到【两个相似的矩阵具有相同的特征量(特征多项式,迹,矩阵行列式等等)】

    (4)例题求解

    【例】利用相关定理求解矩阵的特征量
    在这里插入图片描述

    OS:看完这一段老师的讲解视频之后,内心的想法就是老师真的有很多很多奇妙但是又好用的小结论,可以很大程度上减少计算量。而老师能够达到这样的境界,我觉得跟熟悉程度以及对线代、线性空间等概念的建立了直观印象是分不开的。

    以下会对证明过程完整列述(老师的证明真的十分通透清楚!!),如果想看视频的也可以直接点进原视频48份27秒处。
    《第三章 矩阵的相似标准型(1)》

    要求解A的特征值,最通用的想法就是求解矩阵A的特征方程,然后得到各个特征值的解。
    因为α和β都是列向量,所以可以分析出来矩阵A是一个n阶方阵,由此得到A的特征多项式的一般形式。

    【奇奇妙妙小结论1】
    行向量乘以列向量形式的矩阵的秩不会大于1

    这是由矩阵的秩的相关性质得到的,两个矩阵A和B的乘积的秩不会大于每一个因子矩阵的秩。

    因此可得到A的特征多项式中,k阶子式(k>1)都为0,所以特征多项式中只含有n阶项和n-1阶项。
    前面已经得到了结论,n-1阶项的系数就是矩阵A的迹,问题就转化成求矩阵A的迹。
    在这里插入图片描述

    【奇奇妙妙小结论2】
    tr(A·B) = tr(B·A)

    虽然矩阵的乘法是不具有交换性的,且只要AB和BA运算能够成立(不需要二者结果相同)就有上述结论成立

    因为矩阵A的迹就转换成求βH·α的迹,而βH·α的结果就是1阶矩阵,它的迹也就是它本身。
    在这里插入图片描述
    如上图求解出来一个n-1重根0还有一个根<α,β>
    但是这里的讨论并不完全,如果向量α和β本身就是正交的话,那么求解出来的特征值只有0(n重根)。


    三. 化零多项式

    根据前文,我们讨论了特征量(特征值、特征向量、特征多项式、特征方程等)的定义以及性质定理,并且也通过例题求解感受到了,如果要求解一个矩阵的特征值,最基本的方法就是把矩阵的特征多项式写出来,然后进行方程求解。

    但是同时我们也在思考,是不是存在一个方法,我们不需要计算特征多项式,可以只通过线性变换(或其他)等手段,就可以求解出一个矩阵的特征值呢?

    基于此,我们提出了化零多项式的概念

    1. 定义

    设f(x)是一个多项式,对于一个矩阵A,如果有f(A) = O,那么就称f(x)是矩阵A的化零多项式

    性质:如果一个矩阵A的化零多项式为f(x),那么A的特征值就是化零多项式构成的方程f(x) = 0的根

    证明:
    按照特征值和特征向量的定义,对于矩阵A,存在一个数λ还有一个非零向量η,如果有Aη = λη成立,那么就说λ是矩阵A的一个特征值,而η是矩阵A关于特征值λ的一个特征向量。

    并且上述关系还可以延伸定义成Akη = λkη的形式,也就是说对于任意一个多项式φ(x),一定有φ(A)η = φ(λ)η成立。

    用f(A)来整体替换φ(A),故可以得到f(A)η = f(λ)η;又因为f(A) = O,所以等式左边得到一个零向量θ,且已知η≠θ的前提下,只有f(λ) = 0.
    证毕

    注意:
    ①利用上述定义和定理,当我们不知道矩阵A的特征多项式的情况下,可以通过求解矩阵A的化零多项式来得到矩阵A可能的特征值。

    ②A的特征值都是f(x) = 0的根,但是f(x) = 0的根并不一定都是矩阵A的特征值。

    2. 例题练习

    【例】根据化零多项式进行特征量的有关求解。
    在这里插入图片描述

    【幂等矩阵】
    满足An = A 形式的矩阵称为幂等矩阵

    通过题意给出的幂等矩阵的形式,可以很容易地构造出一个化零多项式。
    在这里插入图片描述

    同样地,要注意这里的文字表述。矩阵A的特征值只可能是0或是1,并不意味着这0和1都是矩阵A的特征值。

    e.g. 比如说单位阵I和零矩阵O都是满足上述条件的幂等矩阵,其特征值分别只有0和1.

    而且通过化零多项式求解出来的候选特征值,也是无法确定其重数的。

    展开全文
  • 1.初始两个矩阵import numpy as npa=np.array([11,22,33,44,55,66])b=np.arange(6)print(a)print(b)#输出[11 22 33 44 55 66][0 1 2 3 4 5]上述代码中的 a 和 b 是两个属性为 array 也就是矩阵的变量,而且二者都...

    1.初始化两个矩阵

    import numpy as np

    a=np.array([11,22,33,44,55,66])

    b=np.arange(6)

    print(a)

    print(b)

    #输出

    [11 22 33 44 55 66]

    [0 1 2 3 4 5]

    上述代码中的 a 和 b 是两个属性为 array 也就是矩阵的变量,而且二者都是1行6列的矩阵, 其中b矩阵中的元素分别是从0到5。

    2.矩阵加法

    c = a + b

    print(c)

    #输出

    [11 23 35 47 59 71]

    3.矩阵减法

    d = a - b

    print(d)

    #输出

    [11 21 31 41 51 61]

    4.矩阵乘法

    e = a * b

    print(e)

    #输出

    [ 0 22 66 132 220 330]

    5.矩阵的乘方

    f = a**2

    print(f)

    #输出

    [ 121 484 1089 1936 3025 4356]

    6.矩阵的三角函数

    g = 2*np.sin(a)

    print(g)

    h = 2*np.cos(a)

    print(h)

    #输出

    [-1.99998041 -0.01770262 1.99982372 0.03540385 -1.99951035 -0.05310231]

    [ 0.0088514 -1.99992165 -0.02655349 1.99968662 0.04425351 -1.99929491]

    7.矩阵的逻辑运算

    print(a < 50)

    print(a == 44)

    #输出

    [ True True True True False False]

    [False False False True False False]

    8.二维矩阵计算

    上述运算均是建立在一维矩阵,即只有一行的矩阵上面的计算,如果我们想要对多行多维度的矩阵进行操作,可以在上面做一些改动。

    a = np.array([[11,22,33],[44,55,66]])

    b = np.arange(6).reshape((3,2))

    print(a)

    print(b)

    #输出

    [[11 22 33]

    [44 55 66]]

    [[0 1]

    [2 3]

    [4 5]]

    此时构造出来的矩阵a和b便是2行3列的,其中 reshape 操作是对矩阵的形状进行重构, 其重构的形状便是括号中给出的数字。 稍显不同的是,Numpy中的矩阵乘法分为两种, 其一是前文中的对应元素相乘,其二是标准的矩阵乘法运算,即对应行乘对应列得到相应元素

    c_dot = np.dot(a,b)

    print(c_dot)

    d_dot = a.dot(b)

    print(d_dot)

    #输出

    [[176 242]

    [374 539]]

    [[176 242]

    [374 539]]

    9.sum(), min(), max()的使用

    import numpy as np

    a=np.random.random((3,5))

    print(a)

    #输出

    [[0.94004266 0.06821417 0.53298969 0.37368218 0.98274263]

    [0.22059055 0.9521291 0.12160635 0.50142968 0.08024663]

    [0.6041042 0.41411029 0.84898433 0.73680101 0.92060592]]

    上面是随机生成数字, 所以你的结果可能会不一样. 在第二行中对a的操作是令a中生成一个3行5列的矩阵,且每一元素均是来自从0到1的随机数

    sum = np.sum(a)

    print(sum)

    min = np.min(a)

    print(min)

    max = np.max(a)

    print(max)

    #输出

    8.298279370480403

    0.06821416737474717

    0.982742627864798

    对应的便是对矩阵中所有元素进行求和,寻找最小值,寻找最大值的操作。 可以通过print()函数对相应值进行打印检验

    10.行和列的查找运算

    如果你需要对行或者列进行查找运算,就需要在上述代码中为 axis 进行赋值。 当axis的值为0的时候,将会以列作为查找单元, 当axis的值为1的时候,将会以行作为查找单元。

    sum_hang = np.sum(a, axis = 1)

    print(sum_hang)

    min_lie = np.min(a, axis = 0)

    print(min_lie)

    max_hang = np.max(a, axis = 1)

    print(max_hang)

    #输出

    [2.89767132 1.87600231 3.52460575]

    [0.22059055 0.06821417 0.12160635 0.37368218 0.08024663]

    [0.98274263 0.9521291 0.92060592]

    11.最大值、最小值的索引

    日常使用中,对应元素的索引也是非常重要的.其中的 argmin() 和 argmax() 两个函数分别对应着求矩阵中最小元素和最大元素的索引

    A = np.array([[11,22,33,44,55],[55,44,33,22,11],[0,22,44,66,88],[11,33,55,77,99]])

    print(A)

    print(np.argmin(A))

    print(np.argmax(A))

    12.均值、平均值、中位数

    A = np.array([[11,22,33,44,55],[55,44,33,22,11],[0,22,44,66,88],[11,33,55,77,99]])

    print(A)

    print(np.mean(A))

    print(np.average(A))

    print(A.mean()) #这种方法也可以,同理内积

    print(np.median(A))

    13.累加、累差

    和matlab中的cumsum()累加函数类似,Numpy中也具有cumsum()函数,

    在cumsum()函数中:生成的每一项矩阵元素均是从原矩阵首项累加到对应项的元素之和。

    【注】diff()函数计算的便是每一行中后一项与前一项之差。故一个4行5列矩阵通过函数计算得到的矩阵便是4行4列的矩阵。

    A = np.array([[11,22,33,44,55],[55,44,33,22,11],[0,22,44,66,88],[11,33,55,77,99]])

    print(A)

    print(np.cumsum(A))

    print(np.diff(A))

    14.排序

    我们可以对所有元素进行仿照列表一样的排序操作,但这里的排序函数仍然仅针对每一行进行从小到大排序操作

    A = np.array([[11,22,33,44,55],[55,44,33,22,11],[0,22,44,66,88],[11,33,55,77,99]])

    print(A)

    print(np.sort(A))

    15.转置

    矩阵的转置有两种表示方法:

    A = np.array([[11,22,33,44,55],[55,44,33,22,11],[0,22,44,66,88],[11,33,55,77,99]])

    print(A)

    print(np.transpose(A))

    print(A.T)

    16.clip()函数

    这个函数的格式是clip(Array,Array_min,Array_max),顾名思义,Array指的是将要被执行用的矩阵,而后面的最小值最大值则用于让函数判断矩阵中元素是否有比最小值小的或者比最大值大的元素,并将这些指定的元素转换为最小值或者最大值。

    A = np.array([[11,22,33,44,55],[55,44,33,22,11],[0,22,44,66,88],[11,33,55,77,99]])

    print(A)

    print(np.clip(A,44,77)) #小于44的都为44,大于77的都为77,其它照写

    展开全文
  • 矩阵论】矩阵的相似标准型(2)

    千次阅读 2020-10-28 11:03:31
    从Hamilton-Cayley定理引出最小多项式、零多项式以及特征多项式之间的关系及性质。

    矩阵的相似标准型之Hamilton-Cayley定理

    在该系列第一篇文章中的末尾我们讲到可以利用矩阵的化零多项式来求解矩阵的候选特征解,这一篇文章我们就要讨论矩阵的化零多项式是否一直存在的问题。

    一. Hamilton-Cayley定理

    1. 矩阵表述

    在这里插入图片描述

    将矩阵A代入A的特征多项式中,得到的应该是一个零矩阵O

    此处老师未给出详细证明,可以借助等下要讲的Schur引理进行证明。
    但是这里要规避一个错误的证明思路

    C(A) = |A·I-A| = |A-A| = |O| = 0
    其一,C(λ)是一个多项式,对一个矩阵进行多项式运算,最终得到也应该是一个矩阵,而不是行列式

    其二,定理中的结论最终的结果应该是一个零矩阵,但是上述证明过程中得到的结果是数值0.

    以上证明思路是错误的!!!

    2. 线性变换表述

    在这里插入图片描述

    前几节花了很大篇幅讨论了线性变换 f 和矩阵A之间是具有某种等价关系的,那么恶意很自然地把矩阵A的这个关系定理延伸到线性变换f上。

    3. Schur引理

    在这里插入图片描述
    再回顾一遍,酉矩阵U是满足UH·U = I(也就是UH = U-1)关系的矩阵

    证明采用数学归纳法的思想,对A所属的内积空间Cnxn的维度进行归纳.

    step 1:当k = 1时,A就是一个数域为C中的一个数,自然可以看成是一个上三角矩阵(U = I即可)

    step 2:假设当k = n-1时结论成立,即对于任意一个A∈Cn-1xn-1,存在酉矩阵U使得UH·A·U 是上三角矩阵

    step 3:现在考虑当k = n时,上述结论是否成立

    内心OS:老师的证明真的是特别出彩,每次听老师讲证明的时候都会梦回小学奥数题现场,因为老师总会有一些巧妙的好用的但是你自己就是想不出来的奇妙思路突破口。

    【奇奇妙妙小结论】
    对于Cnxn空间中的任意一个矩阵,其一定存在特征值。

    因为该矩阵的特征多项式|λI-A|是复数范围内的一个多项式,根据代数知识,在复数域求解多项式方程式一定有解的。

    不妨设λ0是A的一个特征值,ω是A相应于特征值λ0的一个单位特征向量

    【奇奇妙妙小结论】
    对应于某一特征值的特征向量都可以进行单位化。

    按照特征量的定义,对于矩阵A,如果满足Aω = λω,就可以说λ是A的特征值,而ω是A相应于λ的一个特征向量。
    且我们也知道,矩阵对应于一个特征值的特征向量是不唯一的。

    我们可以对上述等式两边同时除以向量ω的模长,即:Aω·(1/||ω||) = λω·(1/||ω||)

    既然ω是一个Cn中的一个单位向量,那么我们可以把该向量进行扩充成(ω,ω2,…,ωn),形成Cn空间中的一组标准正交基,构成矩阵Q = (ω,ω2,…,ωn)。

    接下来我们需要考察QH·A·Q的矩阵形态是什么样的,先只看该矩阵的第一列,也就是构造一个列向量e1 = (1,0,0…,0),计算QH·A·Q·e1即能得到结果矩阵的第一列

    矩阵的乘法运算满足结合律,则上式可以按照QH·A·(Q·e1)的顺序进行运算,Q·e1运算得到的就是矩阵Q的第一列,也就是ω向量,所以QH·A·Q·e1 = QH·A·ω

    又因为ω是矩阵A的特征向量,按照Aω = λ0ω,则有QH·A·Q·e1 = QH·A·ω = λ0QH·ω
    QH这个矩阵可以进行分块拆解成[ωH2H,…,ωnH]T的形式,按照分块矩阵的运算规则,计算出了矩阵第一列的形式
    在这里插入图片描述

    在第一行要进行ωH·ω的运算,第二行要进行ω2Hω的运算,以下以此类推。

    又因为这些向量都是定义在Cn空间中的,所以形如ωH·ω的运算式实质是在计算两向量之间的标准内积

    根据以上的计算,可以把QHAQ写成一个2x2的分块矩阵[[λ0],[θ,B]]的形式,其中表示含有若干元素,θ表示全零元素,B表示一个n-1阶的矩阵。

    因为B是n-1阶的矩阵,所以存在一个酉矩阵Q1,使得Q1HBQ1 = T,其中T是一个上三角矩阵(step2中的假设)

    在这里插入图片描述
    根据上图的计算,就会发现如果令U = Q·Q2,那么U是一个酉矩阵,且能够上述分块矩阵的运算得到UH·A·U是一个上三角矩阵,故证毕。

    Q是一个酉矩阵,是因为Q就是由Cn中的一组标准正交基构成的。

    Q2是一个酉矩阵,是因为按照上图,Q2是由两个酉矩阵构成的分块对角矩阵。

    计算到这里,可以自己总结一些小结论:

    • 有限个酉矩阵构成的分块对角阵也是酉矩阵
    • 酉矩阵的乘积也是酉矩阵

      p.s. 按照酉矩阵的定义很容易可以证明~

    【Schur定理那些事】
    前面说过了Schur引理对于证明Hamilton-Cayley定理以及后续的一些应用很有用,它对于求解特征量也同样有用。

    因为酉矩阵U满足UH = U-1,所以UHAU是一个上三角矩阵,也就等价于U-1AU是一个上三角矩阵,也就是说对于任意一个A都可以相似于一个上三角阵。

    上三角阵的特征值很显然就是矩阵的主对角线元素。


    二. 在矩阵计算上的应用

    1. 求解矩阵高次幂

    在线性代数中,碰到要求一个矩阵的高次幂,我们通常采用相似对角化,因为对角阵的运算有规律可循。
    在这里插入图片描述
    问题的关键就是找到相似变换矩阵P和对角阵Λ

    【例】-1
    在这里插入图片描述

    但是并不是每一个矩阵都能够进行相似对角化,以下就讲解利用Hamilton-Cayley定理求解高次幂的方法

    在这里插入图片描述

    [1]:把矩阵A的特征多项式先写出来并且化成两点式,为后续求解参数做准备。

    [2]:因为我们要求的是A1000,本质就是要对矩阵A进行多项式运算,也即构造一个多项式f(λ) = λ1000,代入A计算f(A)即可。
    因为我们有一个二次多项式C(λ),所以我们想要把λ1000用C(λ)以及余项进行表示

    用C(λ)进行表示,就是想要利用Hamilton-Cayley定理中C(A) = O的特点。

    上图2号框中,q(λ)就是进行多项式除法的商,aλ+b就是除法的余项

    因为除数C(λ)是一个二次多项式,所以余项最高次也只有1次。

    代入A之后,上式第一项为0,因此我们只关注a和b两个未知参数的值。

    [3]:这个时候1处进行的运算就派上用场了,利用C(λ)的两个零点来求解a和b两个未知参数,计算量减少了很多!!!

    [4]:最后将A代入,a和b用计算出来的值替代,就得到A1000的结果。


    【例】-2
    在这里插入图片描述

    因为具体的求解思路和例一是完全一致的,所以下面只简单列写计算过程,不对原理进行讲解,计算结果也不再写出。

    在这里插入图片描述
    因为求解特征方程C(λ) = 0只能得到两个根,-1和1,其中λ = -1是二重根。
    但是我们在对λ100进行多项式分解的时候,因为C(λ)是三次多项式,所以余项是形如aλ2+bλ+c的二次式,需要确定三个未知参数;但仅有的两个特征根只能写出两个方程,是无法确定三个未知参数。

    这时候就要利用到重根的性质。
    λ = -1是二重根,也就是(λ+1)项在C(λ)中出现了两次,那么自然在λ100中的C(λ)q(λ)中也出现了两次,如果式子两边关于λ求一次导,那么(λ+1)2求导后变成2(λ+1),依然含有一次(λ+1),所以求导后代入-1,依然可以使得C(λ)q(λ)这一项为零,从而得到第三个方程。

    如果特征方程求解出来后存在k重特征根,那么就对多项式求解k-1次导。


    2. 最小多项式

    我们讨论 Hamilton-Cayley定理,是因为该定理能够保证一个矩阵的化零多项式一定存在。

    除去存在性问题,我们还希望化零多项式的形式能够尽可能地简单,次数能够尽可能地低
    e.g. 比如在求矩阵高阶项的时候,特征多项式C(λ)就是矩阵的化零多项式,而我们是借助C(λ)对高阶多项式进行分解,如果C(λ)是k次幂的多项式,那么我们最后实质上只需要确定一个k-1阶的多项式,就能完全求出矩阵的高次幂。

    至此,最小多项式的概念应运而生。

    (1)定义

    矩阵A的次数最低的、最高次项系数为一化零多项式称为A的最小多项式

    (2)性质

    ①矩阵的最小多项式一定可以整除其化零多项式。
    在这里插入图片描述

    【证明】
    假设m(x)不能整除φ(x),那么就能得到等式【φ(x) = m(x)q(x)+r(x)】,其中q(x)是多项式的商,r(x)是多项式的余数,且如果r(x)≠0,那么一定有r(x)的次数比m(x)的次数低。

    接下来把矩阵A代入到上述等式中去,左边有φ(A) = O——化零多项式的定义

    右边有m(A)q(A)+r(A) = O+r(A) ——最小多项式也是化零多项式
    左边 = 右边,即得到r(A)= O,就说明r(x)也应该是一个化零多项式,且r(x)的次数比m(x)小

    这一点题干中所说的m(x)是最小多项式产生矛盾,不符合最小多项式中“次数最低”的定义。

    ②最小多项式的唯一性

    在这里插入图片描述

    Tip 1:一般给出一个数学定义,确定了其存在性之后,都会考虑一下它的唯一性。

    Tip 2:唯一性在证明的时候一般都是采用反证法。

    【证明】

    假设对于一个矩阵A,存在两个最小多项式,分别记为m1(x)和m2(x),其二者既然是最小多项式,那么肯定也是化零多项式,那么其二者就可以相互整除。
    p.s. 这里我觉得“相互整除”就已经可以推断出m1(x)=m2(x)了,因为如果m1(x)能被m2(x)整除,就应该有m1(x) = km2(x);反之,m2(x)能被m1(x)整除,就应该有m2(x) = tm1(x);根据运算关系,k和t应该是互为倒数且均为整数,那么只可能是k = t = 1的情况。

    按照老师的证明,其二者可以相互整数,那么就说明它们之间存在倍数关系m1(x) = k*m2(x),又因为最小多项式要求最高次项系数为1,所以这里k只能为1.

    p.s. 可以认为上面两种思路都共同约束了倍数系数只能为1的事实。

    于是,我们常把某一矩阵A对应的最小多项式记作mA(x)

    ③两个相似矩阵具有相同的最小多项式(化零多项式)

    在这里插入图片描述

    【证明】
    在这里插入图片描述
    [1]:两个矩阵相似所具有的对应关系
    [2]:如果存在一个多项式,那么两个矩阵的多项式运算也具有某种对应关系,其中P是一个可逆矩阵。
    [3]:该多项式是A的化零多项式的充要条件就是该多项式同样也是B的化零多项式。

    两个矩阵既然具有相同的化零多项式,那么进行同样的降幂、最高阶项化为1的操作之后,得到的夜视相同的最小多项式。


    (3)定理——最小多项式和特征多项式之间的代数关系

    在这里插入图片描述
    其一,m(x)|C(x),最小多项式能够整除特征多项式,显而易见。因为根据Hamilton定理,C(A) = O,特征多项式就是矩阵A的一个化零多项式,根据上面的性质,可以得到最小多项式是可以整除化零多项式的。

    其二,最小多项式和特征多项式具有相同的零点。

    【证明】
    在这里插入图片描述
    必要性,因为m(λ0) = 0,也因为m(x)和C(x)之间具有整除关系,所以C(x)可以写成关于m(x)的因式乘积,故m(x)的零点必要也是C(x)的零点。

    充分性,若有C(λ0) = 0,那么说明λ0是矩阵A的一个特征值,根据化零多项式的定理,矩阵A的特征值都是化零多项式的零点,但化零多项式的零点不一定都是特征值。
    p.s. 有关化零多项式的详细讨论请见《【矩阵论】矩阵的相似标准型(1)》中有关化零多项式的部分。

    该充要条件实质上是告诉我们,不考虑根的重数时,最小多项式和特征多项式具有相同的零点。

    在这里插入图片描述
    上图中的1≤tj≤cj这个关系式就体现了定理的两个方面:
    tj≥1,因为它们具有相同的根;
    tj≤cj,因为最小多项式可以整除特征多项式。

    虽然最小多项式是化零多项式中次数最低的,但并不意味着t1-ts就一定只能取1.

    【例】最小多项式的求解 - 1

    通过例一,我们需要明白:
    虽然特征多项式可以把最小多项式确定到某个范围之内,但是最小多项式并不能由特征多项式唯一地确定,还需要考虑实际矩阵情况。

    在这里插入图片描述
    上述矩阵是上三角阵,因此其三者的特征多项式都是C(λ) = (λ-a)3;但是其三者的最小多项式全不相同。

    这里关于最小多项式怎么求解,弹幕中看到了一句【假设-验证】我觉得目前来说是可用的。

    我们知道最小多项式一定是特征多项式的因子式,那就说明最小多项式只可能是(λ-a)i,其中i = 1,2,3,找到各个矩阵所能取到的最低次幂就得到了最小多项式。
    p.s. 当然也是因为这个例题比较简单,特征多项式只有一个因子,所以可以蛮力验证。

    【例】最小多项式的求解 - 2

    这个例题似乎比较考察分类讨论的能力,当然在求解过程中,对于化零多项式、最小多项式以及特征多项式之间的关系也会有更深刻的把握。

    在这里插入图片描述
    首先,回顾一下在《【矩阵论】矩阵的相似标准型(1)》中我们求解过的这个矩阵的特征多项式C(λ) = λn-1(λ-<α,β>),涉及到λ = 0是多少重根的问题,我们需要对α和β是否正交进行讨论。

    其一,当α与β不正交时:
    我们能够想到的最低阶的最小多项式可能的形式就是 λ(λ-<α,β>),接下来我们只需要验证该多项式是否为化零多项式。
    在这里插入图片描述
    上图中对A2进行计算,根据矩阵乘法的结合律,能够得到A2 = <α,β>·A的等式,从而就说明了λ(λ-<α,β>)是化零多项式,也就是我们所要求的最小多项式

    其二,当α与β正交时:
    特征多项式C(λ) = λn,那么可能的最小多项式的形式就是λi,其中i=1,2,3…n。
    我们依然从最低阶i =1开始验证其是否可以化零。

    在这里插入图片描述

    对于λ这个项是否可以化零取决于A是否为零矩阵,因此需要进行进一步分类讨论。

    当α或β中存在一个零向量时,那么A就是零矩阵,从而mA(x) = x;
    当α和β都不为零向量时,那么A就不是零矩阵,从而根据A2 = <α,β>·A的等式可以确定A2 = O,mA(x) = x2

    【补充】-“当α和β都不为零向量时,那么A就不是零矩阵”的理解

    1. 考虑αβH中的(i,j)元素,应该为αi·bjH,如果α和β都是非零向量,那么至少能够找到一个这样的非零元,使得矩阵为非零阵;
    2. 从矩阵的秩来说,r(αβH)≥r(α)+r(βH)-1 = 1,所以一定是非零矩阵。
      p.s. 减去1是因为α的列数和βH的行数均为1,这是矩阵秩的性质。

    在这一节我们只是来认识一下最小多项式是一个怎么样的多项式,后续最小多项式对于矩阵的线性变换以及性质讨论都有很大作用,读者需要熟悉这一概念。

    展开全文
  • 突然感觉R语言,有些地方比matble还简洁,但是我还是更喜欢matble,更直接些# Normalize a matrix# Args:# m: the matix# L: by rows (L=1) or columns (L=2)# Returns:# The normalized matrix#标准化矩阵##参数...
  • 求若当标准型的变换矩阵

    千次阅读 多人点赞 2020-11-19 14:52:29
    J = \begin{bmatrix} 2 & 0 &0 \\ 1 & 2 & 0\\ 0 & 0 & 4 \end{bmatrix} J=⎣⎡​210​020​004​⎦⎤​ 注意:若当标准型的标准求法需要用到 λ \lambda λ-多项式(或 λ \lambda λ-矩阵),参见高等代数教材。...
  • 求过渡矩阵的方法 求-个由基a, a,., a,到B, .,… β.的过渡矩阵P, 一般采用下列方法: (1)定义法.将βi,i=1,2…,n, 在基ai下的坐标逐个求出,按列写成一一个n阶矩阵,即为过渡矩阵P: 函数R[x]_5旧基为B1={1,x, x2, ...
  • matlab特征向量标准化

    千次阅读 2021-04-18 17:06:13
    % S1: S2: S3: S4: AHP 的 ...函数作用 (4) ——用总和标准化标准化矩阵——计算相关系数矩阵;计算特征值和特征向量;对主成分进行排序;计算 各特征值贡献率;挑选主成分(累计贡献率大于 85%......特征多项式的根...
  • 矩阵化为约当标准型.doc

    千次阅读 2020-12-31 13:53:44
    经过线性变换后,系统矩阵成为对角线矩阵形式的状态空间表达式,特别指出,如果维矩阵A由下式给出并且其特征值互异,作非奇异线性变换,则A 为对角线标准矩阵其中,P为范德蒙德(Vandermond)矩阵。即补充:设约当...
  • Jordan形矩阵的定义以及唯一性证明;利用矩阵的特征、最小多项式以及秩的信息确定Jordan形的形式。
  • 矩阵对角(Diagonalizing a Matrix)

    千次阅读 2022-01-22 11:09:43
    矩阵对角1.矩阵对角(Diagonalizing a Matrix)1.1 对角矩阵的优点1.2 求解一般矩阵的特征值和特征向量1.3 矩阵...我们观察到对角矩阵只是对标准基进行了缩放,而没有进行旋转(这里的性质和特征向量有些类似!!!
  • 矩阵论】矩阵的相似标准型(3)

    千次阅读 2020-10-30 15:11:21
    矩阵对角引入探讨线性变换的对角问题。(定义、等价命题和定理)
  • 首先是平移变换的矩阵,这个很简单,设 ,我们只需要移动 即可将摄像机移动到原点,对应矩阵(设为 )即为: 移动到原点后,我们要通过旋转,使 变为 (0,0,-1) , 变为 (0,1,0)。这一步我们有点无从下手,...
  • 矩阵归一的处理原理和方法

    万次阅读 2019-12-05 22:37:53
    这里说的矩阵归一是两个层面的应用及其对应的处理方法,原理不同,公式不同,应用场景也不同。 在数据处理中的归一 原理 数据处理的归一就是将矩阵的数据以列为单元,按照一定比例,映射到某一区间,当然这里...
  • 标准化和归一化 超全详解

    万次阅读 多人点赞 2020-09-03 21:48:21
    一、标准化 / 归一化定义 归一化和标准化经常被搞混,程度还比较严重,非常干扰大家的理解。为了方便后续的讨论,必须先明确二者的定义。 首先定义常见的结构化数据表格,第一行的表头是表示各种特征,而后每一列...
  • λ-矩阵矩阵的Jordan标准
  • 求一个矩阵的Jordan矩阵,先要求其特征值,一般情况...比如一个二重根对应的特征向量只有一个,则该重根对应的Jordan块就是一个二阶矩阵;若该二重根对应的特征向量有两个,则该重根对应的Jordan块就是两个一阶的矩阵
  • 第三章: 矩阵标准矩阵的相似对角形 n阶矩阵A能够相似于对角形矩阵 的充要条件 是什么? 若矩阵A能与对角形矩阵相似, 那么 该对角形矩阵的 对角线元素 是A的n个特征值 而且 可逆矩阵p的列向量 就是 对应于...
  • 在数学上,特别是线性代数中, A为n阶矩阵,若数λ和n维非0列向量v,满足Av=λv,那么数λ称为A的特征值,v称为A的对应于特征值λ的特征向量。在多元统计中,特征值和特征向量主要在PCA主成分分析及FA因子分析中发挥...
  • 矩阵A、B相似==A、B特征值相同且A、B均可相似标准化(特征对角阵化)——1 矩阵A、B合同==A、B有相同正负惯性指数——2 矩阵A、B均以正交变换进行相似对角化,即A、B均与各自相似标准型合同==A、B与各自对应的二次型...
  • 首先将一个矩阵和一个多项式对应起来(矩阵的多项式,矩阵的零多项式,相似的矩阵对应多项式有相同的最小多项式[https://zhidao.baidu.com/question/273308991.html]) 两个相似的矩阵就是同一个线性映射在...
  • 矩阵论(二)——Jordan标准

    万次阅读 多人点赞 2019-10-11 17:33:09
    线性变换的对角矩阵表示特征值与特征向量特征子空间概念性质例题线性变换矩阵的对角概念例题Jordan矩阵Jordan标准形计算步骤推导过程例题 1. 线性变换的对角矩阵表示 特征值与特征向量 1.  ∃ϵ∈Vn(F)且λ∈F,...
  • 相似矩阵矩阵的相似对角

    万次阅读 多人点赞 2016-10-19 19:12:47
    特殊的,如果A∼Λ,Λ是对角矩阵A \sim \Lambda, \Lambda 是对角矩阵, 则称A可以相似对角。Λ\Lambda是相似标准形。矩阵可相似对角的充要条件 n阶矩阵A可对角 ⟺\Longleftrightarrow A有n个线性无关的特征向
  • 以鸢尾花数据为例: from sklearn import metrics ...def NMI_matrix(df): # 计算标准化互信息矩阵 number = df.columns.size # 获取df的列数 List = [] Name = [] for n in range(number): Name
  • 浅谈利用numpy对矩阵进行归一处理的方法本文不讲归一原理,只介绍实现(事实上看了代码就会懂原理),代码如下:def Normalize(data):m = np.mean(data)mx = max(data)mn = min(data)return [(float(i) - m) / (mx...
  • 实例1:创建一个矩阵并计算矩阵每列元素的标准差 实例2:创建一个矩阵并计算矩阵每行元素的标准差 实例3:创建一个三维数组并计算沿第一维度元素的标准差 实例4:创建一个矩阵并根据权重向量计算矩阵每列元素的...
  • R语言实现GEO数据的RMA标准化

    千次阅读 2021-11-03 20:31:52
    相较于GEO便捷转换器可能存在标方法不一致的问题,RMA则可以通过编程实现,保证了多个数据集联用时,数据的标方法相同。但是该方法只适用于GPL570和GPL96平台的GEO数据。 GEO数据的一个常见的标方法是使用...
  • 标准化、归一化、中心化

    千次阅读 多人点赞 2018-10-01 23:22:52
    标准化、归一化、中心化 数据分析及挖掘中常提到的几个概念(数据的 标准化、归一化、中心化),虽然经常在用,但可能还是有一些比较生僻的知识容易搞混淆,所以在十月国庆大家都出门上高速堵车的时候抽了点时间对...
  • 前言之前介绍过几种矩阵分解方法,都可以有效的提升矩阵方程的数值求解问题,其中LU分解尤其适合于中小型、稠密矩阵的求解问题。...一、Schur标准型定义给定一个矩阵A,可以通过相似正交变换成一个上...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 96,535
精华内容 38,614
热门标签
关键字:

对应矩阵标准化