相似矩阵与矩阵的对角化

将一个方阵对角化,在很多情形下会使得矩阵的计算大大简化,特别是在计算方阵的高次幂的时候。

1,相似矩阵:若存在可逆矩阵 \(P\),使得 \(AP=PB\) 或者 \(P^{-1}AP=B\),则称 \(A\) 与 \(B\) 相似。记为 \(A\sim B\)。

2,定理:相似矩阵有相同的特征多项式与特征值。

证明:设 \(P^{-1}AP=B\),则

\[\begin{align*}|B-\lambda I|&=|P^{-1}AP-\lambda I|=|P^{-1}AP-\lambda P^{-1}P|\\ &=|P^{-1}AP-P^{-1}\lambda P|=|P^{-1}(A-\lambda I)P|\\ =|P^{-1}||A-\lambda I||P|=|A-\lambda I|\end{align*} \]最后一个等式是因为 \(|P^{-1}||P|=1\)。

3,可对角化矩阵:若 \(A\) 与对角矩阵相似,我们称 \(A\) 可对角化。

矩阵可对角化可以大大简化求矩阵的幂运算。设 \(A\) 可对角化,\(A=PDP^{-1}\),则 \(A^k=PD^kP^{-1}\)。

4,定理(可对角化的条件):矩阵 \(A\) 可对角化的充分必要条件是 \(A\) 有 \(n\) 个线性无关的特征向量。并且 \[P=(\vec{x}_1, \vec{x}_2, \cdots, \vec{x}_n), D=\text{diag}(\lambda_1, \lambda_2,\cdots,\lambda_n), P^{-1}AP=D\] 其中 \(\vec{x}_i\) 是对应于 \(\lambda_i\) 的特征向量。

这个定理给出了矩阵可对角化的条件,而且还给出了可逆矩阵 \(P\) 和对角矩阵 \(D\)。

证明:“\(\Rightarrow\)” 设\(A\) 可对角化 \(\Rightarrow AP=PD\),假设 \[P=(\vec{v}_1,\vec{v}_2,\cdots,\vec{v}_n ), D=\text{diag}(a_1, a_2,\cdots,a_n)\]则 \[AP=A(\vec{v}_1,\vec{v}_2,\cdots,\vec{v}_n)=(A\vec{v}_1,A\vec{v}_2,\cdots,A\vec{v}_n)\]

\[ PD=(\vec{v}_1,\vec{v}_2,\cdots,\vec{v}_n)\text{diag}(a_1, a_2,\cdots,a_n)=(a_1\vec{v}_1,a_2\vec{v}_2,\cdots,a_n\vec{v}_n)\]

所以 \(AP=PD\) 给出

\[A\vec{v}_1=a_1\vec{v}_1,A\vec{v}_2=a_2\vec{v}_1,\cdots,A\vec{v}_n=a_n\vec{v}_n\]

因为 \(P\) 可逆,\(\vec{v}_i\ne 0, 1\le i\le n\),且 \(\vec{v}_1,\vec{v}_2,\cdots,\vec{v}_n\) 线性无关。由上式,我们知道,\(\vec{v}_1,\vec{v}_2,\cdots,\vec{v}_n\) 是 \(A\) 的 \(n\) 个线性无关的特征向量,对应的特征值为 \(a_1, a_2,\cdots,a_n\)。

“\(\Leftarrow\)” 假设 \(A\) 有 \(n\) 个线性无关的特征向量。则取 \(P=(\vec{x}_1,\vec{x}_2,\cdots,\vec{x}_n)\),那么

\[\begin{align*}AP&=A(\vec{x}_1,\vec{x}_2,\cdots,\vec{x}_n)=(A\vec{x}_1,A\vec{x}_2,A\cdots,A\vec{x}_n)\\ &=(\lambda_1\vec{x}_1,\lambda_2\vec{x}_2,A\cdots,\lambda_n\vec{x}_n)\\ &=(\vec{x}_1,\vec{x}_2,\cdots,\vec{x}_n)\begin{pmatrix}\lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n\end{pmatrix}\end{align*}\]

所以 \(A\) 可对角化。

例1,\(A=\begin{pmatrix}1&3&3\\ -3&-5&-3\\ 3&3&1\end{pmatrix}\),问 \(A\) 是否可对角化?如可对角化,求 \(P\) 与 \(D\)。

解:(1)先求特征值。

\[\begin{align*}|A-\lambda I|&=\begin{vmatrix}1-\lambda&3&3\\ -3&-5-\lambda&-3\\ 3&3&1-\lambda\end{vmatrix}=\begin{vmatrix}1-\lambda&1-\lambda&1-\lambda\\ -3&-5-\lambda&-3\\ 3&3&1-\lambda\end{vmatrix}\\ &=(1-\lambda)\begin{vmatrix}1&1&1\\ -3&-5-\lambda&-3\\ 3&3&1-\lambda\end{vmatrix}=(1-\lambda)\begin{vmatrix}1&1&1\\ 0&-2-\lambda&0\\ 0&0&-2-\lambda\end{vmatrix}\\ &=(1-\lambda)(-2-\lambda)^2=0\end{align*} \]所以得到 \(\lambda_{1,2}=-2, \lambda_3=1\)

(2)求特征向量:

当 \(\lambda=-2\) 时,

\[\begin{align*}A-\lambda I&=\begin{pmatrix}3&3&3\\ -3&-3&-3\\ 3&3&3\end{pmatrix}\sim \begin{pmatrix}1&1&1\\ 0&0&0\\ 0&0&0\end{pmatrix}\end{align*}\]

特征向量为 \(\vec{x}_1=\begin{pmatrix}-1\\1\\0\end{pmatrix}, \vec{x}_1=\begin{pmatrix}-1\\0\\1\end{pmatrix}\)。

当 \(\lambda=1\) 时,

\[\begin{align*}A-\lambda I&=\begin{vmatrix}0&3&3\\ -3&-6&-3\\ 3&3&0\end{vmatrix}\sim \begin{vmatrix}0&3&3\\ -3&-6&-3\\ 0&0&0\end{vmatrix}\\ &\sim\begin{vmatrix}1&2&1\\ 0&1&1\\ 0&0&0\end{vmatrix}\sim \begin{vmatrix}1&0&-1\\ 0&1&1\\ 0&0&0\end{vmatrix}\end{align*}\]特征向量为 \(\vec{x}_3=\begin{pmatrix}1\\-1\\1\end{pmatrix}\)

所以矩阵 \(A\) 有三个线性无关的特征向量,它可以对角化。

(3)对角化。令 \[P=(\vec{x}_1,\vec{x}_2,\vec{x}_3)=\begin{pmatrix}-1&-1&1\\ 1&0&-1\\0&1&1\end{pmatrix}, D=\begin{pmatrix}-2&&\\ &-2&\\ &&1\end{pmatrix}\]

则 \(P^{-1}AP=D\)。