讨论矩阵等价、相似的几何含义
1.矩阵A和矩阵B等价(A和B同型,PAQ=B,其中P、Q是初等矩阵),则A和B对空间的压缩/变换能力完全一样,只是操作的起点姿势不同。
比如你站在正面看A把空间压成平面,B可能是站在侧面看同一个压平过程——虽然你看到的“操作画面”不一样(A和B的矩阵数字不同),但最终空间被压成的形状、大小、方向,完全没区别,本质是同一种空间变换的“不同视角呈现”。
用矩阵变空间时,“秩”就像“有效变形能力”——秩是2,就说明能保留2个方向的独立信息,只压掉1个方向;秩是3,就说明完全不压缩,能保留空间原本的3个方向。A和B等价,本质是它们的“有效变形能力”相同(秩相等):比如A的秩是2,B的秩也一定是2,不会出现A压成平面、B却压成直线的情况。
2.矩阵A和矩阵B相似(A和B是n阶矩阵,存在可逆阵P使得P⁻¹AP=B),A和B是同一线性变换在不同基下的矩阵表示,本质是换坐标系描述同一个变换。坐标系1到坐标系2的变换是P,X最初在坐标系1,经过P变换到坐标系2,在坐标系2中经过A变换,然后再经过P⁻¹变换回到坐标系1,这个过程的变换和直接在坐标系1下经过B变换是相同的。
既然是同一个变换,那么它们的特征多项式相同,特征值相同:有相同向量αᵢ在变换后伸缩的倍数都是λᵢ。
更进一步地,什么是相似对角化?当n阶矩阵A和对角阵/\相似时,称A可相似对角化(存在可逆矩阵P,使得P⁻¹AP=/\)。
对角矩阵/\变换就是基向量方向上的伸缩变换。而特征值就是矩阵变换过程中,空间中方向不变的向量(称为特征向量)被伸缩的倍数,所以对角矩阵中元素λ₁,λ₂,...,λₙ就是对角矩阵的特征值。
矩阵可以看作“空间变换”(比如旋转+缩放),但很多矩阵的变换效果很“绕”(比如旋转后又拉伸,方向混乱)。
相似对角化就是找到一组“特殊的坐标轴”(即矩阵的特征向量构成的基),在这个新坐标系下,原本复杂的变换会“拆解”成简单的“沿新坐标轴的拉伸/压缩”——而描述这种简单变换的矩阵,就是对角矩阵(对角线上的数是“拉伸倍数”,即特征值)。
不是所有矩阵都能相似对角化,核心要求是:矩阵必须有足够多的线性无关特征向量(n阶矩阵需要n个线性无关的特征向量)。只有当这种“不被掰歪”的向量足够多(能撑起整个空间的坐标系),才能通过换坐标系把矩阵简化成对角矩阵;如果不够多,就找不到这样的“舒服视角”,无法对角化。
相似对角化的最大价值是“降维打击”计算。比如求矩阵的高次幂(A¹⁰⁰):
直接算A×A×…×A(100次)会非常繁琐;
但如果A能相似对角化(即A = P⁻¹DP,D是对角矩阵,P是特征向量矩阵),那么A¹⁰⁰ = P⁻¹D¹⁰⁰P。
而对角矩阵的高次幂很好算(只需把对角线上的数各自乘100次),整个计算量会大幅降低。这就像解一道复杂的数学题,直接硬算很难,但找到一个“解题技巧”(对应相似变换)后,就能用简单步骤算出结果。
简洁地说,A可相似对角化的话就是说,n阶矩阵A和对角阵相似,所谓相似就是同一种线性变换在两种基坐标下的表示。那么n阶阵A和对角阵相似,就是说A的变换和对角阵的变换是一样的。而对角阵的变化就是原先垂直的向量还是垂直的,只不过发生了伸缩,A的变换也是这样。
讨论实对称矩阵的结论:实对称矩阵A的不同特征值对应的特征向量必正交。
(补充正交矩阵的含义:方阵A满足AᵀA=AAᵀ=E,则称A是正交矩阵,正交阵的行列式的值是1或者-1,正交阵的行或者列向量组是单位正交向量,即两两正交且为单位向量。正交矩阵变换就是保持向量的长度和夹角不变,相当于对空间中的向量进行旋转、反射等操作,而不改变向量的几何形状和相对位置关系。标准正交化就是根据空间中的一组基写出两两正交的一组基。正交矩阵A还有一些有趣的性质:A⁻¹,Aᵀ,-A,A*都是正交阵,两个正交阵的乘积也是正交阵。)
实对称矩阵A必能相似对角化,且总存在正交矩阵Q使Q⁻¹AQ=QᵀAQ=diag(λ₁,λ₂,...,λₙ)。其中λ₁,λ₂,...,λₙ是A的特征值。
