精华内容
下载资源
问答
  • 基于MATLAB的对称矩阵对角化.pdf
  • 线性代数笔记8:矩阵对角化

    万次阅读 多人点赞 2018-04-02 21:33:36
    本文主要讲矩阵对角化的证明及应用。 矩阵对角化条件 定义一:若存在可逆矩阵SSS,使得S−1ASS−1ASS^{-1}AS为矩阵,则称为矩阵AAA是可对角化的(diagonalized)。 设n×nn×nn\times n矩阵有nnn个线性...

    本文主要讲矩阵对角化的证明及应用。

    矩阵对角化条件

    • 定义一:若存在可逆矩阵 S S ,使得S1AS为对角矩阵,则称为矩阵 A A 是可对角化的(diagonalized)。

      • n×n矩阵有 n n 个线性无关的特征向量x1,...,xn,令 S=(x1,...,xn) S = ( x 1 , . . . , x n ) ,则:

      AS=A(x1,...,xn)=(λ1x1,...,λnxn)=(x1,...,xn)λ1...λn A S = A ( x 1 , . . . , x n ) = ( λ 1 x 1 , . . . , λ n x n ) = ( x 1 , . . . , x n ) ( λ 1 . . . λ n )

      AS=SΛS1AS=Λ A S = S Λ ⇒ S − 1 A S = Λ

      • 定义二: n×n n × n 矩阵 A A 可对角化的充要条件是A n n 个线性无关的特征向量。

        那么什么样的方阵有线性无关的特征向量呢?

      • 定义三:λ1,..,λn是矩阵 A A 的互异特征值,x1,...,xn是相应的特征向量,则 x1,...,xn x 1 , . . . , x n 线性无关。

        • 可利用vandermonde行列式证明
        • 可用反证法证明
        • 同一个特征值对应的特征向量不一定都线性无关。
      • 定义四: n×n n × n 矩阵有 n n 个互异的特征值,则矩阵可以对角化。

        • 但若矩阵有相同的特征值,也可能可以对角化。

      相似矩阵性质

      1. n阶矩阵 A A B相似,则 AB A 与 B 特征多项式相同。

      2. 相似矩阵特征值相同。
      3. 相似矩阵行列式相同。
      4. 具有相同的可逆性。
      5. 几何重数与代数重数

        1. 定义: det(AλI)=(λ1λ)n1...(λkλ)nk d e t ( A − λ I ) = ( λ 1 − λ ) n 1 . . . ( λ k − λ ) n k ,称 ni n i 为特征值 λi λ i 的代数重数(algebraic multiplicity),记做 AM(λi)=ni A M ( λ i ) = n i ,称 dimN(AλiI) d i m N ( A − λ i I ) 为特征值 λi λ i 的几何重数(geometric multiplicity),记做 GM(λi)=dimN(Aλ+iI) G M ( λ i ) = d i m N ( A − λ + i I )

          从直观上看,代数重数就是对应的特征值的次数,几何重数是特征向量的维数,探究的就是特征值和特征向量之间的关系。

        2. 任意复方阵相似于上三角阵,且对角元为上三角矩阵的特征值。

        3. GM(λ)AM(λ) G M ( λ ) ≤ A M ( λ )

          由定理2, A A 相似于上三角矩阵T,则 A A T有相同的特征值,且对于任意特征值 λi λ i GMA(λi)=GMT(λi) G M A ( λ i ) = G M T ( λ i )

          因此,不妨设 A A 是上三角阵,即A=(a11...ann)

          因此 AλiI A − λ i I 为对角线上对应的特征值为0,但这一行不一定为0(最多矩阵的特征值少1),因此新的矩阵 r(AλiI)nAM(λi) r ( A − λ i I ) ≥ n − A M ( λ i )

          所以 GM(λi)=nr(AλiI)AM(λi) G M ( λ i ) = n − r ( A − λ i I ) ≤ A M ( λ i )

        4. 若复方阵 A A 可对角化对任意特征值 λi λ i GM(λi)=AM(λi) G M ( λ i ) = A M ( λ i )

          因为若 GM(λi)=AM(λi) G M ( λ i ) = A M ( λ i ) ,则矩阵有 n n 个线性无关的特征向量。

        矩阵对角化判断

        1. 求出矩阵的所有特征值。
        2. 对于每个特征值,计算特征向量,并检查r(AλiI)=nAM(λi)是否成立。

        3. 若都成立,则计算特征向量(基础解系)。
        4. 最后将特征向量与特征值对应起来,就可以写出 P1AP=Λ P − 1 A P = Λ

        注意:使矩阵对角化的特征向量不是唯一的(可以乘上常数倍)。

        矩阵对角化的应用

        1. 可快速计算 Ak A k

        2. 可计算Markov过程中的平稳分布 π π

          可得到方程: πP=ππ1=1 π P = π π 1 = 1

        3. 计算Fibonacci数列。

        4. 差分方程 uk+1=Auk u k + 1 = A u k 描述的离散动力系统的长期行为

          A A 可对角化,即存在可逆矩阵S=(x1,...,xn),使得 S1AS=Λ S − 1 A S = Λ

          S1u0=(c1,...,cn)T S − 1 u 0 = ( c 1 , . . . , c n ) T ,即 u0=c1x1+...+cnxn u 0 = c 1 x 1 + . . . + c n x n

          uk=Aku0=SΛkS1u0=c1λk1x1+...+cnλknxn u k = A k u 0 = S Λ k S − 1 u 0 = c 1 λ 1 k x 1 + . . . + c n λ n k x n

          可以看出, uk u k 的增长因子 λki λ i k 支配,因此系统的稳定性依赖于 A A 的特征值。

          当所有特征值|λi|<1时,是稳定的;

          当所有特征值 |λi|1 | λ i | ≤ 1 时,是中性稳定的;

          当至少有一个特征值 |λi|>1 | λ i | > 1 时,是不稳定的;

        同时对角化

        1. 定理: AB A 、 B 有相同的特征向量矩阵 P P ,使得P1AP=Λ1,P1BP=Λ2,则 AB=BA A B = B A
        2. 逆命题也成立:若 AB A 、 B 都可对角化,并且 AB=BA A B = B A ,则 AB A 、 B 可同时对角化。

        欢迎关注我的个人博客

    展开全文
  • 矩阵对角化,SVD分解

    千次阅读 2019-09-20 12:18:39
    - [矩阵对角化](#矩阵对角化) - [SVD分解](#svd分解) - [参考链接](#参考链接) 矩阵对角化 矩阵的相似 设 A\boldsymbol{A}A、 B\boldsymbol{B}B 为两个nnn阶矩阵,若存在可逆矩阵 P\boldsymbol{P}P,使得...

    矩阵对角化

    矩阵的相似

    A \boldsymbol{A} A B \boldsymbol{B} B 为两个 n n n阶矩阵,若存在可逆矩阵 P \boldsymbol{P} P,使得
    P − 1 A P = B \boldsymbol{P}^{^{-1}}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{B} P1AP=B
    则称 A \boldsymbol{A} A B \boldsymbol{B} B 相似。特别的,如果 B \boldsymbol{B} B 为对角形矩阵,则称 A \boldsymbol{A} A 可(相似)对角化

    n n n阶矩阵 A A A可对角化的充要条件: A \boldsymbol{A} A n n n个线性无关的特征向量 X 1 , X 2 , . . . X n \boldsymbol{X_{1}},\boldsymbol{X_{2}},...\boldsymbol{X_{n}} X1,X2,...Xn。具体的证明我们不在此展开,只做几点说明:

    1. n n n 阶矩阵 A \boldsymbol{A} A m m m 个不同特征值(方程 ∣ λ E − A ∣ = 0 \left | \lambda \boldsymbol{E} -\boldsymbol{A}\right |=0 λEA=0 m m m 个不同实根),则不同特征值对应的特征向量线性无关
    2. 存在 A \boldsymbol{A} A 属于某个特征值的线性无关特征向量
    3. P − 1 A P = d i a g ( λ 1 , λ 2 , . . . λ n ) \boldsymbol{P}^{^{-1}}\boldsymbol{A}\boldsymbol{P}=diag(\lambda _{1},\lambda _{2},...\lambda _{n}) P1AP=diag(λ1λ2...λn) 时, d i a g ( λ 1 , λ 2 , . . . λ n ) diag(\lambda _{1},\lambda _{2},...\lambda _{n}) diag(λ1λ2...λn) n n n个主对角元是 A \boldsymbol{A} A n n n个特征值(含重根); A \boldsymbol{A} A 分别属于 λ 1 , λ 2 , . . . λ n \lambda _{1},\lambda _{2},...\lambda _{n} λ1λ2...λn 的线性无关特征向量 X 1 , X 2 , . . . X n \boldsymbol{X_{1}},\boldsymbol{X_{2}},...\boldsymbol{X_{n}} X1,X2,...Xn 构成了可逆矩阵 P \boldsymbol{P} P 的列向量

    实对称矩阵的对角化

    考虑实对称矩阵的对角化,有如下结论:

    1. n n n阶实对称矩阵 A \boldsymbol{A} A 的特征值都是实数(证明思路:对表达式 A X = λ X \mathbf{AX=\lambda X} AX=λX 左乘复特征向量的共轭转置 X ˉ T \mathbf{\bar{X}^{T}} XˉT,推出 λ \lambda λ 为实数)
    2. 实对称矩阵 A \boldsymbol{A} A 不同特征值对应的特征向量正交(证明思路:列出 A \boldsymbol{A} A 两组不同的特征方程,分别左乘另一个复特征向量的共轭转置,两端取转置后方程相减)
    3. 属于 A \boldsymbol{A} A 的同一个特征值的一组线性无关特征向量不一定正交,但可用施密特正交方法将其正交化
    4. 一定存在正交矩阵 Q \mathbf{Q} Q (满足 Q − 1 = Q T \mathbf{Q}^{-1}=\mathbf{Q}^{T} Q1=QT),使得 Q − 1 A Q \boldsymbol{Q}^{^{-1}}\boldsymbol{A}\boldsymbol{Q} Q1AQ 为对角形矩阵
    5. n n n阶实对称矩阵 A \boldsymbol{A} A 存在 n n n个正交的单位特征向量

    SVD分解

    特征值分解只能用于可逆方阵,奇异值分解(SVD)适用于任意 m × n \mathit{m}\times\mathit{n} m×n 矩阵,定义如下:

    A \boldsymbol{A} A 是一个 m × n \mathit{m}\times\mathit{n} m×n 矩阵,则存在一个分解,使得
    A = U Σ V ∗ \boldsymbol{A}=\boldsymbol{U}\Sigma\boldsymbol{V}^{*} A=UΣV
    其中 U \boldsymbol{U} U m × m m\times m m×m 酉矩阵(满足 U − 1 = U ∗ \boldsymbol{U^{-1}}=\boldsymbol{U}^{*} U1=U), Σ \Sigma Σ m × n m\times n m×n 非负实对称矩阵, V ∗ \boldsymbol{V}^{*} V V \boldsymbol{V} V 的共轭转置,是 n × n n\times n n×n 酉矩阵.

    求解 U \boldsymbol{U} U, Σ \Sigma Σ, V \boldsymbol{V} V 矩阵

    给定一个 A m × n \boldsymbol{A_{m\times n}} Am×n 的奇异值分解,有:
    A ∗ A = V Σ ∗ U ∗ U Σ V ∗ = V ( Σ ∗ Σ ) V ∗ \boldsymbol{A^{*}A}=\boldsymbol{V}\Sigma^{*}\boldsymbol{U}^{*}\boldsymbol{U}\Sigma\boldsymbol{V}^{*}=\boldsymbol{V}(\Sigma^{*}\Sigma)\boldsymbol{V}^{*} AA=VΣUUΣV=V(ΣΣ)V
    A A ∗ = U Σ V ∗ V Σ ∗ U ∗ = U ( Σ Σ ∗ ) U ∗ \boldsymbol{AA^{*}}=\boldsymbol{U}\Sigma\boldsymbol{V}^{*}\boldsymbol{V}\Sigma^{*}\boldsymbol{U}^{*}=\boldsymbol{U}(\Sigma\Sigma^{*})\boldsymbol{U}^{*} AA=UΣVVΣU=U(ΣΣ)U
    关系式右边描述了关系式左边的特征值分解,于是:

    • A ∗ A \boldsymbol{A^{*}A} AA n n n个特征向量(右奇异向量)组成了 V \boldsymbol{V} V 的列向量
    • A A ∗ \boldsymbol{AA^{*}} AA m m m个特征向量(左奇异值向量)组成了 U \boldsymbol{U} U 的列向量
    • Σ \Sigma Σ 的非零对角元(非零奇异值)是 A ∗ A \boldsymbol{A^{*}A} AA A A ∗ \boldsymbol{AA^{*}} AA 的非零特征值(为啥相同?)的平方根,即 Σ = [ σ 1 0 0 0 0 σ 2 ⋯ 0 0 0 ⋱ σ r ⋮ ⋮ ⋮ ⋮ ] m × n \Sigma=\begin{bmatrix} \sigma_{1}& 0& 0& 0 \\ 0& \sigma_{2}& \cdots& 0 \\ 0& 0& \ddots& \sigma_{r} \\ \vdots& \vdots& \vdots& \vdots \end{bmatrix}_{m\times n} Σ=σ1000σ20000σrm×n,其中 r = r a n k ( A ) r=rank(\boldsymbol{A}) r=rank(A)(思考为什么?)且 m > r \mathit{m}>\mathit{r} m>r σ i = λ i ( i = 1 , 2 ⋯ r ) \sigma _{i}=\sqrt{\lambda _{i}}(i=1,2\cdots r) σi=λi (i=1,2r)

    补充1: A A T \boldsymbol{AA^{T}} AAT 性质

    • 对称性: ( A T A ) T = A A T (\boldsymbol{A^{T}A})^{T}=\boldsymbol{AA^{T}} (ATA)T=AAT
    • 半正定性:对任意非零向量 x n × 1 x_{n\times1} xn×1 ,有 x T ( A T A ) x = ( A x ) T ( A x ) ⩾ 0 \boldsymbol{x^{T}}(\boldsymbol{A^{T}A})\boldsymbol{x}=(\boldsymbol{Ax})^{T}(\boldsymbol{Ax})\geqslant 0 xT(ATA)x=(Ax)T(Ax)0

    补充2:奇异值分解 Vs.特征值分解
    SVD_EigenDecomposition

    补充3:正定和半正定矩阵的性质

    • 正定矩阵的行列式恒为正;
    • 实对称矩阵 A A A正定当且仅当 A A A与单位矩阵合同;
    • 对于 n n n阶实对称矩阵 A A A,下列条件是等价的:正定矩阵=一切主子式均为正=一切顺序主子式均为正=特征值均为正;
    • 对于 n n n阶实对称矩阵 A A A,下列条件是等价的:半正定矩阵=所有的主子式非负(顺序主子式非负并不能推出矩阵是半正定的)

    SVD分解的应用
    SVD-application

    参考链接

    1. 中文维基 奇异值分解
    2. 中文维基 可对角化矩阵
    3. 博客园 奇异值分解(SVD)原理与在降维中的应用
    4. 知乎 矩阵对角化与奇异值分解
    5. Markdown语言教程
      Markdown 插入链接
      Markdown 编辑器语法指南
      MarkDown 插入数学公式实验大集合
      如何在Markdown中写公式
    展开全文
  • 基于MATLAB的对称矩阵对角化.rar
  • 特征向量对角化一个矩阵:3、假设n×nn\times n矩阵有nn个线性无关的特征向量,如果这些向量是矩阵SS的列,那么S−1ASS^{-1}AS是一个矩阵Λ\Lambda,AA的特征值在Λ\Lambda的角线上: S−1AS=Λ=⎡⎣⎢⎢⎢⎢...

    现在我们开始实质性的计算,它非常简单并且在随后的几篇文章里都会用到。特征向量对角化一个矩阵:

    3、假设 n×n 矩阵有 n 个线性无关的特征向量,如果这些向量是矩阵S的列,那么 S1AS 是一个对角矩阵 Λ A 的特征值在Λ的对角线上:

    S1AS=Λ=λ1λ2λn(1)

    我们将 S 称作特征向量矩阵,Λ是特征值矩阵——这里使用大写的表示,因为小写的表示对角线上的特征值。

    证明:将特征向量 xi 放在 S 的列上,按列计算AS的:

    AS=A|x1||x2||xn||λ1x1||λ2x2||λnxn|

    然后技巧就是将最后一个矩阵分成两个矩阵的乘积 SΛ

    λ1x1λ2x2λnxn=x1x2xnλ1λ2λn

    这里关键的一点是矩阵要写在右侧,如果 Λ 写在 S 前面,那么λ1将和第一行进行乘积,但我们想 λ1 出现在第一列,鉴于此, SΛ 是正确的,所以

    AS=SΛ,orS1AS=Λ,orA=SΛS1(2)

    其中 S 是可逆的,因为假设它的列(特征向量)是无关的。

    在给出实例和应用之前,我们给出四点说明。

    注解1:如果矩阵A没有虫多特征值- λ1,,λn 是不同的,那么它的 n 个特征值自然是无关的,因此任何特征值不同的矩阵可以被对角化。

    注解2:对角化矩阵S不是唯一的。因为特征向量 x 乘以一个常数后依然是特征向量,于是用任何非零常数乘以S的列的到一个新的对角化矩阵 S ,多重特征值有更大的自由度。对于平凡的例子A=I,任何可逆矩阵 S 都能是S1IS是对角矩阵( λ 就是 I ),所有向量就是单位矩阵的特征向量。

    注解3:其他矩阵S不会得出对角矩阵 Λ 。假设 S 的第一列是y,那么 SΛ 的第一列是 λ1y ,如果它和 AS 的第一列相同,根据矩阵乘法它的第一列是 Ay ,那么 y 一定是特征向量,Ay=λ1y S 中特征向量的顺序和Λ中特征值的顺序自然是一样的。

    注解4:并非所有的矩阵都有 n 个线性无关的特征向量,所以并非所有的矩阵都可以对角化。考虑病态矩阵的一个标准例子

    A=[0010]

    特的特征值是 λ1=λ2=0 ,因为它是三角矩阵,并且对角元素为零:

    det(AλI)=det[λ01λ]=λ2

    A 的所有特征向量是向量(1,0)的倍数:

    [0010]x=[00],orx=[c0]

    λ=0 是二重特征值——它的代数重数是2,但是几何重数是1——只有一个无关的特征向量,所以我们不能构建 S

    对于A不能对角化,这里还有一个更直接的证明。因为 λ1=λ2=0 Λ 肯定是一个零矩阵,但是如果 S1AS=0 ,那么我们左乘 S ,右乘S1,便得到 A=0 。但是 A 不等于0,所以S不可逆。

    无法对角化的原因不是因为 λ=0 ,而是 λ1=λ2

    A=[3013]andA=[2110]

    他们的特征值是3,3和1,1,但是是奇异的!问题在于特征向量不完备,这里再强调一下:

    A 的对角化依赖于充分的特征向量。
    A的逆依赖于非零特征值。

    对角化和逆没有联系,由特征值给出的唯一信息是:只有在特征值重复的时候,对角化才会失败。但是不总是会失败, A=I 的特征值就是重复的1,1, ,1,但是它已经是对角矩阵!这时候特征向量是完备的。

    在特征值出现 p 次重复的时候,需要检验是否有p个无关的特征向量——也就是说,检验 AλI 的秩为 np ,为了完成所有的想法,我们必须说明特征值不同的情况。

    4、如果特征向量 x1,,xk 对应不同的特征值 λ1,,λk ,那么这些特征向量就是线性无关的。

    首先假设 k=2 ,并且 x1,x2 的组合是零: c1x1+c2x2=0 ,用 A 进行相乘,可以得到c1λ1x1+c2λ2x2=0,用此方程减去前面方程的 λ2 倍,可以消去向量 x2

    c1(λ1λ2)x1=0

    因为 λ1λ2 并且 x10 ,我们得出 c1=0 ,同样我们可以得到 c2=0 ,所以两个向量是无关的;因为只有平凡组合才能得出零。

    这个论证可以扩展到任意个特征向量的情况:如果某个组合产生零,那么用 A 去乘然后减去原组合的λk倍, xk 消失了,只留下 x1,,xk1 为零的组合。重复相同的步骤(这就是数学归纳法),最终我们会得到 x1 的倍数等于零,所以 c1=0 ,从而每个 ci=0 ,于是来自不同特征值的特征向量自然线性无关。

    n 个不同特征值的矩阵可以被对角化,下面给出一个典型的例子。

    对角化实例

    这部分主要是S1AS=A,特征向量矩阵 S A变成特征值矩阵 Λ (对角的),现在我们来看一下投影和旋转矩阵。

    例1:投影矩阵

    12121212

    特征值矩阵为

    Λ=[1000]

    将特征向量放入 S 的列中得:

    S=[1111]andAS=SΛ=[1100]

    因此 S1AS=Λ

    例2:对于旋转而言,特征值不是很明显:

    90K=[0110]

    可以得出 det(KλI)=λ2+1 。一个向量旋转后怎样才会保持方向不变呢?很显然,除了零向量外(然而它是没用的)不可能有向量如此,但是必须由特征值,我们必须求解 du/dt=Ku ,特征多项式 λ2+1 依然有两个根—— 但是这些根不是实值而已。

    基于上面的提示,我们找到了出路, K 的特征值是虚数,λ1=i,λ2=i,从而看出特征值可以是非实的。这似乎很神奇,旋转九十度后他们乘以 i 或者i

    (Kλ1I)x1=[i11i][yz]=[00]andx1=[1i](Kλ2I)x2=[i11i][yz]=[00]andx1=[1i]

    即便特征值是虚数,但他们是不同的并且特征值是无关的。将他们放到 S 中:

    S=[1i1i]andS1KS=[i00i]

    我们面临着一个不可避免的事实,即使是实数矩阵,依然需要复数。如果实特征值很少,那么总是存在 n 个复特征值。(当虚部为零时,复数包括实数)如果R3,Rn中实特征向量很少时,我们就考虑 C3,Cn Cn 空间包含有复元素的所有列向量并且长度,内积与正交有新的定义,但是确比 Rn 简单。

    幂和乘 : Ak,AB

    这里将解一个计算比较简单的情况。 A2 的特征值是 λ21,,λ2n ,并且 A 的特征向量也是A2的特征向量,我们先从 Ax=λx 开始,然后乘以 A

    A2x=Aλx=λAx=λ2x(3)

    因此 λ2 A2 的特征值,并且有相同的特征向量 x 。如果第一次乘以A后留下的 x 方向未变,那么第二次同样如此。

    利用对角化可以得到相同的结论,将S1AS=Λ平方:

    (S1AS)(S1AS)=Λ2orS1A2S=Λ2

    矩阵 A2 被相同的 S 对角化,所以特征向量不变。特征值是原来的进行平方,这个结论对任意A的幂次都成立:

    5、 Ak 的特征值是 λk1,,λkn 并且 A 的每个特征向量依然是Ak的特征向量。当 S 对角化A时,它也对角化 Ak

    λk=(S1AS)(S1AS)(S1AS)=S1AkS(4)

    除了第一个 S1 和最后一个 S 外,每一个S1都消掉一个 S

    如果A是可逆的,这个规则也可以应用到它的逆上(幂 k=1 ), A1 的特征值是 1/λi ,这个结果即使未对角化也能看出来:

    Ax=λxx=λA1x1λx=A1x

    例3:如果 K 表示旋转90,那么 K2 表示旋转 180 (也就是 I )并且 K1 表示旋转 90

    K=[0110],K2=[1001],K1=[0110]

    K 的特征值是i,i;他们的平方是-1和-1;他们的倒数是 1/i=i,1/(i)=i ,那么 K4 就是旋转 360 :

    K4=[1001],Λ4=[i400(i)4]=[1001]

    对于两个矩阵的乘积,我们可能希望它与 AB 的特征值有关—— 但是事与愿违,尝试用同样的推理似乎非常诱人,可是一般情况下这不是真的。如果 λ A 的特征值,μ B 的特征值,这里给出一个AB等于 μλ 的错误证明:

    ABx=Aμx=μAx=μλx

    错误的原因在于认为 A,B 有相同的特征向量 x ,一般情况下,他们是不相等的,这里我们给出两个特征值为0的矩阵:

    AB=[0010][0100]=[1000]

    A,B 的特征向量完全不同。同理, A+B 的特征值和 λ+μ 也没有关系。

    上面错误的表明了哪些是对的,如果 A,B 的特征向量一样,那么特征值就是他们的乘积 μλ 。但是还有更重要的,这提供了一种识别 A,B 是否共享同一特征向量集合的方法,这在量子力学中是非常关键的问题。

    6、当且仅当 AB=BA 时,对角化矩阵有相同的特征向量矩阵 S

    证明:如果同样的S对角化得 A=SΛ1S1,B=SΛ2S1 ,那么我们用两种顺序相乘得:

    AB=SΛ1S1SΛ2S1=SΛ1Λ2S1, BA=SΛ2S1SΛ1S1=SΛ2Λ1S1

    因为 Λ1Λ2=Λ2Λ1 (对角矩阵满足交换律),所以我们有 AB=BA

    反过来,假设 AB=BA ,从 Ax=λx 开始,我们有

    ABx=BAx=Bλx=λBx

    所以 x,Bx 都是 A 的特征向量,他们共享λ。为了方便如果我们假设 A 的特征值是不同的——特征空间总是一维的——那么Bx肯定是 x 的倍数,换句或说x B,A 的特征向量。对于有相同特征值得证明有点长,这里从略。

    海森伯格不确定性原则来非交换矩阵,像位置 P 和动量Q。 位置是对称的,动量是斜对称的并且他们都满足 QPPQ=I ,不确定性原则直接来此施瓦兹不等式 (Qx)T(Px)QxPx :

    x2=xTx=xT(QPPQ)x2QxPx

    Qx/x Px/x 的乘积——动量和位置误差(当波函数是 x 时)——最小是12,我们无法让两者误差都变小,因为当我们试着度量粒子的位置时我们已经改变了它的动量。

    最后我们回到 A=SΛS1 ,这个分解非常适合取 A 的幂,我们用最简单的例子A2进行说明,在平方的情况下 LU 分解完全没办法,但是 SΛS1 确非常完美,它的平方是 SΛ2S1 并且特征向量不变。利用这些特征向量,我们将解决微分方程与差分方程。

    展开全文
  • 实对称矩阵对角化

    千次阅读 2019-09-04 18:09:33
    原来,实对称矩阵对角化是为解决解析几何中二次曲面是何类型而提出的,因为二次曲面的方程可以写成(x,y,z)A(xyz)(x,y,z)A\begin{pmatrix}x\\y\\z\end{pmatrix}(x,y,z)A⎝⎛​xyz​⎠⎞​的形式,而这里的A就是一个实...


    原来,实对称矩阵对角化是为解决解析几何中二次曲面是何类型而提出的,因为二次曲面的方程可以写成 ( x , y , z ) A ( x y z ) (x,y,z)A\begin{pmatrix}x\\y\\z\end{pmatrix} (x,y,z)Axyz的形式,而这里的A就是一个实对称矩阵,为了更好的看出曲线的类型,需要把二次项给消掉,使得变成 ( x ∗ , y ∗ , z ∗ ) T − 1 A T ( x ∗ y ∗ z ∗ ) (x^*,y^*,z^*)T^{-1}AT\begin{pmatrix}x^*\\y^*\\z^*\end{pmatrix} (x,y,z)T1ATxyz的形式,而 T − 1 A T T^{-1}AT T1AT是一个对角矩阵。 不过为什么这里的T一定是正交矩阵?虽然后面证明了能将实对称矩阵对角化的可逆矩阵一定是正交矩阵,不过这里好像还有一个从几何上证明的定理??

    实对称矩阵是指:实数域上的对称矩阵

    正交相似

    • 大概就是对于矩阵 A , B A,B A,B,若存在一正交矩阵 T T T使得 T − 1 A T = B T^{-1}AT=B T1AT=B就说 A A A正交相似于 B B B
    • 正交相似是 n n n级实矩阵组成的集合的一个等价关系,拥有以下三个性质
      • 反身性
      • 对称性
      • 传递性

    定理1

    实对称矩阵的特征多项式的每一个复根都是实数,从而它们都是特征值。

    证明

    • λ 0 \lambda_0 λ0 n n n级实对称矩阵A的任一复根,只需证明 λ 0 ˉ = λ 0 \bar{\lambda_0}=\lambda_0 λ0ˉ=λ0,便能证明其为实数
    • 把A看成复矩阵,从而 ∃ α ∈ C n , 且 α ≠ 0 \exist\alpha\in C^n,且\alpha\ne 0 αCnα̸=0,有 (1) A α = λ 0 α A\alpha=\lambda_0\alpha\tag{1} Aα=λ0α(1)
    • 由于A是实矩阵,所以 λ 0 ˉ \bar{\lambda_0} λ0ˉ也是A的一个特征值, α ˉ \bar{\alpha} αˉ λ 0 ˉ \bar{\lambda_0} λ0ˉ的一个特征向量 P 273 例 2 P_{273}例2 P2732 A A A是复数域上的n级实矩阵,若虚数 λ 0 \lambda_0 λ0是A的属于 λ 0 \lambda_0 λ0的一个特征向量,那么 λ 0 ˉ \bar{\lambda_0} λ0ˉ也是A的一个特征值,且特征向量为 α ˉ \bar{\alpha} αˉ
    • 所以就有 A α ˉ = λ 0 ˉ α ˉ A\bar{\alpha}=\bar{\lambda_0}\bar{\alpha} Aαˉ=λ0ˉαˉ对其转置有 α ˉ ′ A ′ = λ 0 ˉ α ˉ ′ \bar{\alpha}&#x27;A&#x27;=\bar{\lambda_0}\bar{\alpha}&#x27; αˉA=λ0ˉαˉ在上式右乘 α \alpha α,得 (2) α ˉ ′ A ′ α = λ 0 ˉ α ˉ ′ α \bar{\alpha}&#x27;A&#x27;\alpha=\bar{\lambda_0}\bar{\alpha}&#x27;\alpha\tag{2} αˉAα=λ0ˉαˉα(2)
    • 在(1)式左边乘上 α ˉ ′ \bar{\alpha}&#x27; αˉ,得 (3) α ˉ ′ A α = λ 0 α ˉ ′ α \bar{\alpha}&#x27;A\alpha=\lambda_0\bar{\alpha}&#x27;\alpha\tag{3} αˉAα=λ0αˉα(3)
    • (2)=(3) ⇒ \Rightarrow ( λ 0 ˉ − λ 0 ) α ˉ ′ α = 0 (\bar{\lambda_0}-\lambda_0)\bar{\alpha}&#x27;\alpha=0 (λ0ˉλ0)αˉα=0 α ˉ ′ α ≠ 0 \bar{\alpha}&#x27;\alpha\ne0 αˉα̸=0,So, λ 0 ˉ = λ 0 \bar{\lambda_0}=\lambda_0 λ0ˉ=λ0

    定理2

    实对称矩阵的不同特征值的特征向量是正交的

    证明

    • λ 1 , λ 2 \lambda_1,\lambda_2 λ1,λ2分别是A的两个不同的特征值, α , β \alpha,\beta α,β分别是它们 的一个特征向量 (1) A α = λ 1 α A\alpha=\lambda_1\alpha\tag{1} Aα=λ1α(1) (2) A β = λ 2 β A\beta=\lambda_2\beta\tag{2} Aβ=λ2β(2)要证 α ′ β = 0 \alpha&#x27;\beta=0 αβ=0
    • 让(1)转置,得 α ′ A = λ 1 α ′ \alpha&#x27;A=\lambda_1\alpha&#x27; αA=λ1α右乘 β \beta β,得 α ′ A β = λ 2 α ′ β = λ 1 α ′ β \alpha&#x27;A\beta=\lambda_2\alpha&#x27;\beta=\lambda_1\alpha&#x27;\beta αAβ=λ2αβ=λ1αβ ⇒ \Rightarrow α ′ β = 0 \alpha&#x27;\beta=0 αβ=0
      是不是觉得哪里有点奇怪, α ′ A β = λ 2 α ′ β \alpha&#x27;A\beta=\lambda_2\alpha&#x27;\beta αAβ=λ2αβ这样可以吗,不是矩阵相乘才有结合律吗?
      啧啧啧,一看就是矩阵运算没有学好,刚刚翻到 P 143 P_{143} P143矩阵的运算,第一个性质就是说的矩阵的结合律!
    • A = ( a i j ) s × n , B = ( b i j ) n × m , C = ( c i j ) m × r A=(a_{ij})_{s×n},B=(b_{ij})_{n×m},C=(c_{ij})_{m×r} A=(aij)s×n,B=(bij)n×m,C=(cij)m×r,则满足 ( A B ) C = A ( B C ) (AB)C=A(BC) (AB)C=A(BC)

    定理3

    实对称矩阵一定正交相似于对角矩阵
    这表明 ⇒ \Rightarrow 实对称矩阵一定可对角化(真是上帝的宠儿,一出生就自带可对角化的光环)

    证明

    这个证明有难度了,从一开始就意想不到

    • 首先,这里用的是数学归纳法
    • n = 1 n=1 n=1时, ( 1 ) − 1 ( a ) ( 1 ) = ( a ) (1)^{-1}(a)(1)=(a) (1)1(a)(1)=(a),命题真
    • 假设对 n − 1 n-1 n1级矩阵都满足以上命题,现在看 n n n级实对称矩阵A
      • 由定理1得,实对称矩阵必有特征值,故取A的一个特征值 λ 1 \lambda_1 λ1,再取 λ 1 \lambda_1 λ1的一个特征向量 η 1 \eta_1 η1,取的 η 1 \eta_1 η1要满足 ∣ η 1 ∣ = 1 |\eta_1|=1 η1=1
      • 然后!!把 η 1 \eta_1 η1扩充为 R n R^n Rn的一个基,经过施密特正交化和标准化,得到 R n R^n Rn的一组标准正交鸡 η 1 , η 2 , . . . , η n \eta_1,\eta_2,...,\eta_n η1,η2,...,ηn,令 T 1 = ( η 1 , η 2 , . . . , η n ) T_1=(\eta_1,\eta_2,...,\eta_n) T1=(η1,η2,...,ηn) T 1 T_1 T1是正交矩阵
      • 于是 T 1 − 1 A T 1 = T 1 − 1 ( A η 1 , A η 2 , . . . , A η n ) T_1^{-1}AT_1=T_1^{-1}(A\eta_1,A\eta_2,...,A\eta_n) T11AT1=T11(Aη1,Aη2,...,Aηn) = ( λ 1 T 1 − 1 η 1 , T 1 − 1 A η 2 , . . . , T 1 − 1 A η n ) =(\lambda_1T_1^{-1}\eta_1,T_1^{-1}A\eta_2,...,T_1^{-1}A\eta_n) =(λ1T11η1,T11Aη2,...,T11Aηn)由于正交矩阵有 T ′ = T − 1 T&#x27;=T^{-1} T=T1,所以 T 1 − 1 = T 1 ′ = ( η 1 ′ η 2 ′ . . . η n ′ ) T_1^{-1}=T_1&#x27;=\begin{pmatrix}\eta_1&#x27;\\\eta_2&#x27;\\...\\\eta_n&#x27;\end{pmatrix} T11=T1=η1η2...ηn 所以 T 1 − 1 η 1 = ( 1 0 . . . 0 ) = ε 1 T_1^{-1}\eta_1=\begin{pmatrix}1\\0\\...\\0\end{pmatrix}=\varepsilon_1 T11η1=10...0=ε1
      • 所以 T 1 − 1 A T 1 = ( λ 1 α 0 B ) T_1^{-1}AT_1=\begin{pmatrix}\lambda_1&amp;\alpha\\0&amp;B\end{pmatrix} T11AT1=(λ10αB)由于A是实对称,则 T 1 − 1 A T 1 T_1^{-1}AT_1 T11AT1也是实对称(正交矩阵节 P 218 P_{218} P218第一题就证明的是这个!!) ⇒ α = 0 \Rightarrow \alpha=0 α=0所以 T 1 − 1 A T 1 = ( λ 1 0 0 B ) T_1^{-1}AT_1=\begin{pmatrix}\lambda_1&amp;0\\0&amp;B\end{pmatrix} T11AT1=(