> 技术文档 > 矩阵谱分解的证明及计算示例

矩阵谱分解的证明及计算示例


1. 矩阵分解的条件

        矩阵的谱分解(也称为特征分解)是将一个矩阵分解为一系列由其特征向量和特征值构成的矩阵乘积的过程。进行谱分解的前提条件包括:

        矩阵是可对角化的(Diagonalizable),即矩阵存在一组线性无关的特征向量,可以构成一个可逆矩阵

        矩阵是正规矩阵(Normal Matrix),对于复矩阵,如果矩阵 \\mathbf{A} 满足 \\mathbf{AA^* = A^*A}(其中 \\mathbf{A^*} 是 \\mathbf{A} 的共轭转置),则称 \\mathbf{A} 为正规矩阵正规矩阵可以被酉对角化。实对称矩阵是正规矩阵的特例。

具体来说:

    对于一般的方阵,如果它有 n 个线性无关的特征向量(即几何重数等于代数重数),则是可以谱分解。

    对于条件更强的正规矩阵(如 Hermitian 矩阵、实对称矩阵),谱分解总是可行的,且特征向量可以选为正交的。

2. 谱分解的方式

假设 \\mathbf{A} 是一个 n \\times n 的可对角化矩阵,其谱分解的形式为:

        \\mathbf{A = P \\Lambda P^{-1}}
其中:

    \\Lambda 是一个对角矩阵,其对角线元素是 \\mathbf{A} 的特征值   \\lambda_1, \\lambda_2, \\dots, \\lambda_n  。

    \\mathbf{P} 是一个可逆矩阵,其列是 \\mathbf{A} 的对应特征向量  \\mathbf{v}_1, \\mathbf{v}_2, \\dots, \\mathbf{v}_n  。

如果 A 是正规矩阵(如 Hermitian 矩阵),则 P  可以是酉矩阵(即 \\mathbf{P^{-1} = P^*}  ),此时谱分解为:

       \\mathbf{A = U \\Lambda U^*}

3. 谱分解的证明

    以下做一个简单的证明,为什么可对角化的矩阵可以做谱分解。

3.1 一般可对角化矩阵 \\mathbf{A}

        设 A 有 n 个线性无关的特征向量\\mathbf{v}_1, \\mathbf{v}_2, \\dots, \\mathbf{v}_n ,对应的特征值为 \\lambda_1, \\lambda_2, \\dots, \\lambda_n 。

构造矩阵 P = [\\mathbf{v}_1, \\mathbf{v}_2, \\dots, \\mathbf{v}_n] ,则 P 是可逆的。

根据特征向量的定义,有  A \\mathbf{v}_i = \\lambda_i \\mathbf{v}_i ,可以写成矩阵形式:

        A P = A [\\mathbf{v}_1, \\mathbf{v}_2, \\dots, \\mathbf{v}_n] = [\\lambda_1 \\mathbf{v}_1, \\lambda_2 \\mathbf{v}_2, \\dots, \\lambda_n \\mathbf{v}_n] = P \\Lambda

其中  \\Lambda = \\text{diag}(\\lambda_1, \\lambda_2, \\dots, \\lambda_n)  。

两边右乘 P^{-1} ,得到:

        A = P \\Lambda P^{-1}
这就是谱分解。

3.2 正规矩阵的特殊情况

如果 A 是正规矩阵(如 Hermitian 矩阵),则存在酉矩阵 U(满足 U^{^*} U = I )使得:

       A = U \\Lambda U^*
 
这是因为正规矩阵的特征向量可以选为两两正交的(即可以正交对角化)

4. 计算示例

4.1. 一般可对角化矩阵的谱分解示例

现有一般可对角化矩阵:

        A = \\begin{bmatrix} 4 & 1 \\\\ 2 & 3 \\end{bmatrix}

特征值为:

       \\lambda_1 = 5

       \\lambda_2 = 2

对应的特征向量为:

       \\mathbf{v}_1 = \\begin{bmatrix} 1 \\\\ 1 \\end{bmatrix}

       \\mathbf{v}_2 = \\begin{bmatrix} -1 \\\\ 2 \\end{bmatrix}

现在构造:

       P = \\begin{bmatrix} 1 & -1 \\\\ 1 & 2 \\end{bmatrix}

       P^{-1} = \\frac{1}{3} \\begin{bmatrix} 2 & 1 \\\\ -1 & 1 \\end{bmatrix}

A 的谱分解为:

       A = P \\Lambda P^{-1} = \\begin{bmatrix} 1 & -1 \\\\ 1 & 2 \\end{bmatrix} \\begin{bmatrix} 5 & 0 \\\\ 0 & 2 \\end{bmatrix} \\frac{1}{3} \\begin{bmatrix} 2 & 1 \\\\ -1 & 1 \\end{bmatrix}

4.2. 实对称矩阵的谱分解

现有实对称矩阵:

       A = \\begin{bmatrix} 2 & 1 \\\\ 1 & 2 \\end{bmatrix}

特征值为:

       \\lambda_1 = 3 
       \\lambda_2 = 1 
 

对应的特征向量为:

       \\mathbf{v}_1 = \\begin{bmatrix} 1 \\\\ 1 \\end{bmatrix}

       \\mathbf{v}_2 = \\begin{bmatrix} -1 \\\\ 1 \\end{bmatrix}

归一化后得到正交矩阵:

       U = \\frac{1}{\\sqrt{2}} \\begin{bmatrix} 1 & -1 \\\\ 1 & 1 \\end{bmatrix}

谱分解为:

A = U \\Lambda U^T = \\frac{1}{\\sqrt{2}} \\begin{bmatrix} 1 & -1 \\\\ 1 & 1 \\end{bmatrix} \\begin{bmatrix} 3 & 0 \\\\ 0 & 1 \\end{bmatrix} \\frac{1}{\\sqrt{2}} \\begin{bmatrix} 1 & 1 \\\\ -1 & 1 \\end{bmatrix}

5. 小结

前提:矩阵可对角化(有 n 个线性无关的特征向量)或为条件更强的正规矩阵,对应的分解方式有点差异。

       一般可对角化矩阵:A = P \\Lambda P^{-1}  

       正规矩阵:A = U \\Lambda U^* (其中,U 是酉矩阵)

证明谱分解的整体思路是基于特征值和特征向量的定义,并通过构造 P 和 \\Lambda 来实现分解。