特征值与特征向量的性质

上一节我们讲述了特征值与特征向量的定义以及计算,这一节我们讲述特征值与特征向量的性质。

1,特征值与特征向量:若 \(A\vec{x}=\lambda \vec{x}\),我们称 \(\lambda\) 为方阵 \(A\) 的特征值,\(\vec{x}\ne 0\) 为方阵 \(A\) 对应特征值 \(\lambda\) 的特征向量。

2,定理1:若 \(\vec{x}_1\) 和 \(\vec{x}_1\) 都是方阵 \(A\) 对应特征值 \(\lambda\) 的特征向量,则对任意的常数 \(k_1,k_2\) \(k_1\vec{x}_1+k_2\vec{x}_2\) 也是方阵 \(A\) 对应特征值 \(\lambda\) 的特征向量。

证明:\[\begin{align*}A(k_1\vec{x}_1+k_2\vec{x}_2)&= k_1A\vec{x}_1+k_2A\vec{x}_2\\ &=k_1\lambda \vec{x}_1+k_2\lambda\vec{x}_2\\&=\lambda(k_1\vec{x}_1+k_2\vec{x}_2)\end{align*}\]

3,定理2:若 \(\lambda\) 是 \(A\) 的特征值, \(\vec{x}\) 是对应的特征向量,则

  • \(k\lambda\) 是 \(kA\) 的特征值,\(\vec{x}\) 是对应的特征向量;
  • \(\lambda^n\) 是 \(A^n\) 的特征值,\(\vec{x}\) 是对应的特征向量;
  • 若 \(A\) 可逆,则 \(\lambda^{-1}\) 是 \(A^{-1}\) 的特征值,\(\vec{x}\) 是对应的特征向量;
  • \(\lambda +k\) 是 \(A+kI\) 的特征值,\(\vec{x}\) 是对应的特征向量。

证明:设 \(A\vec{x}=\lambda \vec{x}, \vec{x}\ne 0\),则

(1)\(kA\vec{x}=k\lambda \vec{x}\),所以\(k\lambda\) 是 \(kA\) 的特征值,\(\vec{x}\) 是对应的特征向量;

(2)\(A\vec{x}=\lambda \vec{x}\),则 \[A(A\vec{x})=A(\lambda \vec{x})\quad\Rightarrow\quad A^2\vec{x}=\lambda A\vec{x}\quad\Rightarrow\quad A^2\vec{x}=\lambda^2\vec{x}\] 由归纳法,就可以知道 \(\lambda^n\) 是 \(A^n\) 的特征值,\(\vec{x}\) 是对应的特征向量;

(3)\(A\) 可逆,\(A\vec{x}=\lambda \vec{x}\),则\(A^{-1}A\vec{x}=A^{-1}\lambda \vec{x}\) 即 \[\vec{x}=A^{-1}\lambda\vec{x}\quad\Rightarrow\quad \lambda^{-1}\vec{x}=A^{-1}\vec{x}\] 即\(\lambda^{-1}\) 是 \(A^{-1}\) 的特征值,\(\vec{x}\) 是对应的特征向量;

(4)\(A\vec{x}+kI\vec{x}=\lambda\vec{x}+k\vec{x}=(\lambda+k)\vec{x}\)。

4,定理3:\(A^T\) 与 \(A\) 具有相同的特征值与特征多项式。

证明: \(A^T-\lambda I=(A-\lambda I)^t\),所以 \(|A^T-\lambda I|=|(A-\lambda I)^T|=|(A-\lambda I)|\)

5,定理:矩阵的行列式等于特征值之积,有几重算几个;矩阵的迹(主对角线元素之和)等于特征值之和,有几重算几个。即

\[\begin{align*}|A|&=\prod_{i=1}^n\lambda_i\\ \sum_{i=1}^n{a_{ii}}=\sum_{i=1}^n\lambda_i\end{align*}\]

证明:我们在矩阵的特征多项式每一列提出因子 \(-1\),

\[\begin{align*}|A-\lambda I|&=\begin{vmatrix}a_11-\lambda&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}-\lambda&\cdots&a_{2n}\\ \vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn}-\lambda\end{vmatrix}\\& =(-1)^n\begin{vmatrix}\lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\cdots&-a_{2n}\\ \vdots&\vdots&&\vdots\\ -a_{n1}&-a_{n2}&\cdots&\lambda-a_{nn}\end{vmatrix}\\ &=(-1)^n(\lambda^n+a_{n-1}\lambda^{n-1}+\cdots+a_1\lambda+a_0)=(-1)^nP(\lambda)\end{align*}\]

(1)设矩阵的特征值为 \(\lambda_1,\lambda_2,\cdots,\lambda_n\),则矩阵的特征多项式可以写成 \(P(\lambda)=(\lambda-\lambda_1)\cdot(\lambda-\lambda_2)\cdots(\lambda-\lambda_n)\),从我们上面的推导,\[|A|=(-1)^nP(0)=(-1)^n(-1)^n\lambda_1\cdot\lambda_2\cdots\lambda_n=\lambda_1\cdot\lambda_2\cdots\lambda_n\]

(2)\(P(\lambda)\) 中有一项 \((\lambda-a_{11})\cdot(\lambda-a_22)\cdots(\lambda-a_nn)\),其余的项最多只有 \(\lambda\) 的 \(n-2\) 阶。我们将这一项拆开,得到 \((n-1)\) 阶的项为 \(-(a_{11}+a_{22}+\cdots+a_{nn})\lambda^{n-1}\),根据多项式根与系数 之间的关系 (韦达定理),\((\lambda_1+\lambda_2+\cdots+\lambda_n=-\frac{a_{n-1}}{a_n})\),因为这里 \(a_n=1, a_{n-1}=a_{11}+a_{22}+\cdots+a_{nn}\),所以我们得到

\[a_{11}+a_{22}+\cdots+a_{nn}=\lambda_1+\lambda_2+\cdots+\lambda_n\]

由这个定理,我们可以直接得到一个结论:

推论:可逆矩阵的特征值都不等于 \(0\)。

6,定理:\(A\) 的对应于不同的特征值的特征向量是线性无关的。

证明:这里我们给出与视频不一样的证明方式。

用反证法。假设 \(\vec{x}_1, \vec{x}_2,\cdots,\vec{x}_r\) 是对应于不同特征值 \(\lambda_1, \lambda_2,\cdots,\lambda_r\) 的特征向量。若 \(\vec{x}_1, \vec{x}_2,\cdots,\vec{x}_r\) 线性相关,则至少其中一个向量可用其它向量线性表示。

设 \(p\) 是使得 \(\vec{x}_1, \vec{x}_2,\cdots,\vec{x}_p\) 线性无关,但 \(\vec{x}_1, \vec{x}_2,\cdots,\vec{x}_p,\vec{x}_{p+1}\) 线性相关的最小指标。那么存在 \(k_1,k_2\cdots, k_p\),使得 \[\vec{x}_{p+1}=k_1\vec{x}_1+k_2 \vec{x}_2+\cdots+k_p\vec{x}_p, \qquad (1)\]

将此方程两边左乘矩阵 \(A\),我们得到

\[\begin{align*}&A\vec{x}_{p+1}=k_1A\vec{x}_1+k_2 A\vec{x}_2+\cdots+k_pA\vec{x}_p\\ &\Rightarrow\quad \lambda_{p+1}\vec{x}_{p+1}=\lambda_1\vec{x}_{p+1}=k_1\lambda_2\vec{x}_1+k_2 A\vec{x}_2+\cdots+k_p\lambda_p\vec{x}_p\quad (2)\end{align*}\]

把第 (1) 式乘以 \(\lambda_{p+1}\),再减去第 (2) 式,我们得到

\[0=k_1(\lambda_{p+1}-\lambda_1)\vec{x}_1+k_2(\lambda_{p+1}-\lambda_2)\vec{x}_2+\cdots+k_p(\lambda_{p+1}-\lambda_p)\vec{x}_p\]

又因为 \(\vec{x}_1, \vec{x}_2,\cdots,\vec{x}_p\) 线性无关,所以只能系数都等于 \(0\),而 \(\lambda_{p+1}-\lambda_i\ne 0, 1\le i\le p\),所以只能 \(k_i=0, 1\le i\le p\) ,但是这样的话,(1) 式告诉我们, \(\vec{x}_{p+1}=0\),这与 \(\vec{x}_{p+1}\ne 0\) 矛盾。所以 \(\vec{x}_1, \vec{x}_2,\cdots,\vec{x}_p,\vec{x}_{p+1}\) 线性无关。