【矩阵分析与应用】【第8章 特征分析】【8.3 凯莱-哈密顿定理证明(伴随矩阵法)】
【矩阵分析与应用】【第8章 特征分析】【8.3 凯莱-哈密顿定理证明(伴随矩阵法)】
- 定理 (凯莱-哈密顿)
- 证明:利用伴随矩阵
- 步骤 1: 伴随矩阵的性质
- 步骤 2: 应用于特征矩阵
- 步骤 3: 伴随矩阵的结构分析
- 步骤 4: 代入恒等式
- 步骤 5: 展开并匹配系数
- 步骤 6: 构造 p(A)p(A)p(A)并证明其为零
定理 (凯莱-哈密顿)
- AAA 是一个 n×nn \times nn×n 的方阵
- p(λ)=det(λI−A)p(\lambda) = \det(\lambda I - A)p(λ)=det(λI−A) 是矩阵 AAA 的特征多项式
将特征多项式展开为:
p(λ)=λn+cn−1λn−1+⋯+c1λ+c0p(\lambda) = \lambda^n + c_{n-1}\lambda^{n-1} + \dots + c_1 \lambda + c_0p(λ)=λn+cn−1λn−1+⋯+c1λ+c0
由凯莱-哈密顿定理指出:
p(A)=An+cn−1An−1+⋯+c1A+c0I=0p(A) = A^n + c_{n-1}A^{n-1} + \dots + c_1 A + c_0 I = \mathbf{0}p(A)=An+cn−1An−1+⋯+c1A+c0I=0
其中 0\mathbf{0}0 是 n×nn \times nn×n 的零矩阵,III 是 n×nn \times nn×n 的单位矩阵。
证明:利用伴随矩阵
步骤 1: 伴随矩阵的性质
对于任意 n×nn\times nn×n矩阵 BBB,其伴随矩阵 adj(B)\operatorname{adj}(B)adj(B)满足:
B⋅adj(B)=adj(B)⋅B=det(B)IB \cdot \operatorname{adj}(B) = \operatorname{adj}(B) \cdot B = \det(B) I B⋅adj(B)=adj(B)⋅B=det(B)I
步骤 2: 应用于特征矩阵
令 B=λI−AB=\lambda I- AB=λI−A其代入公式
(λI−A)⋅adj(λI−A)=det(λI−A)I(\lambda I - A) \cdot \operatorname{adj}(\lambda I - A) = \det(\lambda I - A) I (λI−A)⋅adj(λI−A)=det(λI−A)I
由于 p(λ)=det(λI−A)p(\lambda) = \det(\lambda I - A)p(λ)=det(λI−A),上式可写为:
(λI−A)⋅adj(λI−A)=p(λ)I(\lambda I - A) \cdot \operatorname{adj}(\lambda I - A) = p(\lambda) I (λI−A)⋅adj(λI−A)=p(λ)I
步骤 3: 伴随矩阵的结构分析
对于n×nn\times nn×n的矩阵矩阵adj(λI−A)\operatorname{adj}(\lambda I - A)adj(λI−A)的每一项,都是λI−A\lambda I - AλI−A的(n−1)×(n−1)(n-1)\times (n-1)(n−1)×(n−1)的代数余子式。因此是次数不超过 n−1n-1n−1的λ\lambdaλ的多项式。故可将其表示为矩阵多项式:
adj(λI−A)=Bn−1λn−1+Bn−2λn−2+⋯+B1λ+B0\operatorname{adj}(\lambda I - A) = B_{n-1} \lambda^{n-1} + B_{n-2} \lambda^{n-2} + \cdots + B_1 \lambda + B_0 adj(λI−A)=Bn−1λn−1+Bn−2λn−2+⋯+B1λ+B0
其中B0,B1,...,Bn−1B_0,B_1,...,B_{n-1}B0,B1,...,Bn−1是n×nn\times nn×n的常数矩阵。
步骤 4: 代入恒等式
将特征多项式 p(λ)p(\lambda)p(λ)和展开式 adj(λI−A)\operatorname{adj}(\lambda I - A)adj(λI−A) 代入恒等式:B⋅adj(B)=adj(B)⋅B=det(B)IB \cdot \operatorname{adj}(B) = \operatorname{adj}(B) \cdot B = \det(B) IB⋅adj(B)=adj(B)⋅B=det(B)I
(λI−A)⋅(Bn−1λn−1+Bn−2λn−2+⋯+B1λ+B0)=det(λn+cn−1λn−1+⋯+c1λ+c0)I(\lambda I - A) \cdot (B_{n-1} \lambda^{n-1} + B_{n-2} \lambda^{n-2} + \cdots + B_1 \lambda + B_0) = \det(\lambda^n + c_{n-1}\lambda^{n-1} + \dots + c_1 \lambda + c_0) I(λI−A)⋅(Bn−1λn−1+Bn−2λn−2+⋯+B1λ+B0)=det(λn+cn−1λn−1+⋯+c1λ+c0)I
步骤 5: 展开并匹配系数
-
左边:
λI⋅(Bn−1λn−1+Bn−2λn−2+⋯+B0)−A⋅(Bn−1λn−1+Bn−2λn−2+⋯+B0)=Bn−1λn+Bn−2λn−1+⋯+B0λ−ABn−1λn−1−ABn−2λn−2−⋯−AB0=Bn−1λn+(Bn−2−ABn−1)λn−1+(Bn−3−ABn−2)λn−2+⋯+(B0−AB1)λ−AB0\begin{align*} &\lambda I \cdot (B_{n-1} \lambda^{n-1} + B_{n-2} \lambda^{n-2} + \cdots + B_0) - A \cdot (B_{n-1} \lambda^{n-1} + B_{n-2} \lambda^{n-2} + \cdots + B_0) \\ &= B_{n-1} \lambda^n + B_{n-2} \lambda^{n-1} + \cdots + B_0 \lambda - A B_{n-1} \lambda^{n-1} - A B_{n-2} \lambda^{n-2} - \cdots - A B_0 \\ &= B_{n-1} \lambda^n + (B_{n-2} - A B_{n-1}) \lambda^{n-1} + (B_{n-3} - A B_{n-2}) \lambda^{n-2} + \cdots + (B_0 - A B_1) \lambda - A B_0 \end{align*}λI⋅(Bn−1λn−1+Bn−2λn−2+⋯+B0)−A⋅(Bn−1λn−1+Bn−2λn−2+⋯+B0)=Bn−1λn+Bn−2λn−1+⋯+B0λ−ABn−1λn−1−ABn−2λn−2−⋯−AB0=Bn−1λn+(Bn−2−ABn−1)λn−1+(Bn−3−ABn−2)λn−2+⋯+(B0−AB1)λ−AB0 -
右边:
Iλn+cn−1Iλn−1+⋯+c1Iλ+c0II\lambda^n + c_{n-1}I\lambda^{n-1} + \dots + c_1I \lambda + c_0IIλn+cn−1Iλn−1+⋯+c1Iλ+c0I -
此为关于 λ\lambdaλ的矩阵恒等式,两边同次幂系数必须相等,得到方程组:
λn:Bn−1=Iλn−1:Bn−2−ABn−1=cn−1Iλn−2:Bn−3−ABn−2=cn−2I⋮λ1:B0−AB1=c1Iλ0:−AB0=c0I\begin{aligned} \lambda^n &: & B_{n-1} &= I \\ \lambda^{n-1} &: & B_{n-2} - A B_{n-1} &= c_{n-1} I \\ \lambda^{n-2} &: & B_{n-3} - A B_{n-2} &= c_{n-2} I \\ &\vdots & & \\ \lambda^1 &: & B_0 - A B_1 &= c_1 I \\ \lambda^0 &: & - A B_0 &= c_0 I \end{aligned} λnλn−1λn−2λ1λ0:::⋮::Bn−1Bn−2−ABn−1Bn−3−ABn−2B0−AB1−AB0=I=cn−1I=cn−2I=c1I=c0I
步骤 6: 构造 p(A)p(A)p(A)并证明其为零
考虑矩阵多项式p(A)=An+cn−1An−1+⋯+c1A+c0Ip(A) = A^n + c_{n-1}A^{n-1} + \dots + c_1 A + c_0 Ip(A)=An+cn−1An−1+⋯+c1A+c0I
将方程组中的等式依次左乘 An,An−1,…,A,IA^n , A^{n-1} , \dots ,A ,IAn,An−1,…,A,I后相加:
(AnBn−1)+(An−1Bn−2−AnBn−1)+(An−2Bn−3−An−1Bn−2)+⋯+(AB0−A2B1)+(−AB0)\begin{align*} &\quad (A^n B_{n-1}) \\ &+\ (A^{n-1}B_{n-2} - A^n B_{n-1}) \\ &+\ (A^{n-2}B_{n-3} - A^{n-1} B_{n-2}) \\ &+\ \cdots \\ &+\ (A B_0 - A^2 B_1) \\ &+\ (- A B_0) \end{align*} (AnBn−1)+ (An−1Bn−2−AnBn−1)+ (An−2Bn−3−An−1Bn−2)+ ⋯+ (AB0−A2B1)+ (−AB0)
观察可知,左边所有中间项相互抵消,最终结果为零矩阵。
右边相加结果为:An+cn−1An−1+⋯+c1A+c0I=p(A)A^n + c_{n-1}A^{n-1} + \dots + c_1 A + c_0 I =p(A)An+cn−1An−1+⋯+c1A+c0I=p(A),因此:p(A)=0p(A)=0p(A)=0
