特征值和特征向量
1.定义
若存在非零向量 𝑣和标量 𝜆,使:Av=λvAv= \lambda vAv=λv
则 𝜆 称为矩阵的 特征值 (eigenvalue),𝑣 称为对应的 特征向量 (eigenvector)。
意思是:矩阵 𝐴 作用在 𝑣 上时,只改变大小(放大/缩小 𝜆 倍),方向不变。
什么叫做矩阵A作用在向量v上?
矩阵可以看作一种 线性变换,它会把空间里的点或向量进行旋转、拉伸、压缩、反射等操作。
在二维空间:
如果A=[2002]A=\left[ \begin{matrix} 2 & 0 \\ 0 & 2 \end{matrix} \right]A=[2002],那么作用在向量vvv上,就是把它放大2倍(各方向等比放大)。
如果A=[0−110]A=\left[ \begin{matrix} 0 & -1 \\ 1 & 0 \end{matrix} \right]A=[01−10],那么作用在vvv上,就是把它旋转90∘90^\circ90∘
如果A=[100−1]A=\left[ \begin{matrix} 1 & 0 \\ 0 & -1 \end{matrix} \right]A=[100−1],就是把vvv沿着xxx轴镜像翻转。
在三维空间:
矩阵可以表示绕某个轴的旋转、对某个平面的投影、或者非均匀缩放(比如 xxx 方向缩小 0.5 倍,yyy 方向放大 2 倍)。
一般情况下,矩阵会把 𝑣 的方向和大小都改掉;
但如果 𝑣 是某个特征向量,那么矩阵作用后,它的方向保持不变,只是被拉伸/压缩了 𝜆 倍:Av=λvAv=\lambda vAv=λv
这就是“矩阵作用”的特别之处:大多数向量方向都会变,唯独特征向量的方向保持不变。
A⋅BA \cdot BA⋅B是指矩阵AAA作用在矩阵BBB上,本质上就是矩阵AAA作用在矩阵BBB的每一列上,就是把BBB的每一列做相同的变换。
2.几何意义
- 特征向量:矩阵作用下“不转向”的方向。
- 特征值:该方向上被拉伸/压缩的倍数。
- 如果特征值为负,还会反转方向。
3.特征值和特征向量的计算
Av=λvAv−λv=0(A−λI)v=0
Av=\lambda v \\
Av-\lambda v =0 \\
(A-\lambda I)v =0 Av=λvAv−λv=0(A−λI)v=0
III是单位矩阵。
若v≠0v \neq 0v=0,要有非零解,必须满足:det(A−λI)=0det(A-\lambda I) =0det(A−λI)=0这就是特征方程。
解出特征方程 det(A−λI)=0\det(A - \lambda I)=0det(A−λI)=0 得到的根,就是 AAA 的 特征值。
把某个特征值 λ\lambdaλ 代入 (A−λI)v=0(A - \lambda I)v=0(A−λI)v=0,解出非零向量 vvv,就是对应的 特征向量。
举例
示例矩阵为 A=[2112]A=\left[ \begin{matrix} 2 & 1 \\ 1 & 2\end{matrix} \right]A=[2112]
列特征方程:
det(A−λI)=det[2−λ112−λ]=(2−λ)2−1=λ2−4λ+3=0解得λ1=1,λ2=3
det(A-\lambda I)=det \left[ \begin{matrix} 2-\lambda & 1 \\ 1 & 2-\lambda \end{matrix} \right]=(2-\lambda)^2-1=\lambda^2-4\lambda+3=0 \\
解得\lambda_1=1,\lambda_2=3
det(A−λI)=det[2−λ112−λ]=(2−λ)2−1=λ2−4λ+3=0解得λ1=1,λ2=3
求特征向量:
λ=1\lambda=1λ=1时:
(A−I)v=[1111][xy]=0{x+y=0x+y=0解得x=1,y=−1,v=[1−1](任意倍数都可以)
(A-I)v=\left[ \begin{matrix} 1 & 1 \\ 1 & 1 \end{matrix} \right] \left[ \begin{matrix} x \\ y \end{matrix} \right]=0 \\
\left \{ \begin{aligned} &x+y=0 \\ &x+y=0 \end{aligned} \right.\\
解得x=1,y=-1,v=\left[ \begin{matrix} 1 \\ -1 \end{matrix}\right](任意倍数都可以)
(A−I)v=[1111][xy]=0{x+y=0x+y=0解得x=1,y=−1,v=[1−1](任意倍数都可以)
λ=3\lambda=3λ=3时:
(A−I)v=[−111−1][xy]=0{−x+y=0x−y=0解得x=1,y=1,v=[11](任意倍数都可以)
(A-I)v=\left[ \begin{matrix} -1 & 1 \\ 1 & -1 \end{matrix} \right] \left[ \begin{matrix} x \\ y \end{matrix} \right]=0 \\
\left \{ \begin{aligned} &-x+y=0 \\ &x-y=0 \end{aligned} \right.\\
解得x=1,y=1,v=\left[ \begin{matrix} 1 \\ 1 \end{matrix}\right](任意倍数都可以)
(A−I)v=[−111−1][xy]=0{−x+y=0x−y=0解得x=1,y=1,v=[11](任意倍数都可以)
4.特征值与行列式、迹
1.行列式与特征值的关系
det(A)=∏i=1nλidet(A)=\prod_{i=1}^n \lambda_idet(A)=∏i=1nλi
行列式等于所有特征值的乘积。
几何解释:体积缩放因子可以看作各个特征方向上的拉伸系数相乘。
2.迹与特征值的关系
tr(A)=∑i=1nλitr(A)=\sum_{i=1}^n \lambda_itr(A)=∑i=1nλi
矩阵的迹(主对角线和)等于所有特征值之和。