【线性代数】其他
上一节:【线性代数】线性方程组与矩阵——(3)线性方程组解的结构
总目录:【线性代数】目录
文章目录
- 11. 向量的内积、长度及正交性
- 12. 方阵的特征值与特征向量
- 13. 相似矩阵
- 14. 对称矩阵的对角化
- 15. 二次型及其标准形
11. 向量的内积、长度及正交性
- 设有 nnn 维向量 x=(x1x2⋮xn),y=(y1y2⋮yn)\mathrm{x}=\begin{pmatrix}x_1\\x_2\\\vdots\\x_n\end{pmatrix}, \mathrm{y}=\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}x=x1x2⋮xn,y=y1y2⋮yn,令 [x,y]=x1y1+x2y2+⋯+xnyn=xTy\mathrm{[x,y]=x_1y_1+x_2y_2+\dots+x_ny_n}=\mathrm{x^Ty}[x,y]=x1y1+x2y2+⋯+xnyn=xTy,则 [x,y]\mathrm{[x,y]}[x,y] 称为向量 x\mathrm{x}x 与 y\mathrm{y}y 的内积。
- 内积的性质
- [x,y]=[y,x]\mathrm{[x,y]=\mathrm{[y,x]}}[x,y]=[y,x]
- [λx,y]=λ[x,y]\mathrm{[\lambda x,y]=\lambda\mathrm{[x,y]}}[λx,y]=λ[x,y]
- [x+y,z]=[x,z]+[y,z]\mathrm{[x+y,z]=\mathrm{[x,z]}+\mathrm{[y,z]}}[x+y,z]=[x,z]+[y,z]
- [x,x]≥0\mathrm{[x,x]\geq 0}[x,x]≥0,且 [x,x]=0\mathrm{[x,x]=0}[x,x]=0 当且仅当 x=0\mathrm{x=0}x=0。
- 施瓦茨不等式:[x,y]2≤[x,x][y,y]\mathrm{[x,y]^2\leq [x,x][y,y]}[x,y]2≤[x,x][y,y]
- 令 ∣∣x∣∣=[x,x]\mathrm{||x||=\sqrt{[x,x]}}∣∣x∣∣=[x,x],则 ∣∣x∣∣\mathrm{||x||}∣∣x∣∣ 称为向量 x\mathrm{x}x 的长度或范数。
- 向量长度的性质
- 非负性:∣∣x∣∣≥0\mathrm{||x||\geq 0}∣∣x∣∣≥0,且 ∣∣x∣∣=0\mathrm{||x||=0}∣∣x∣∣=0 当且仅当 x=0\mathrm{x=0}x=0。
- 齐次性:∣∣λx∣∣=∣λ∣∣∣x∣∣\mathrm{||\lambda x||=|\lambda|\mathrm{||x||}}∣∣λx∣∣=∣λ∣∣∣x∣∣
- 当 ∣∣x∣∣=1\mathrm{||x||}=1∣∣x∣∣=1 时,称 x\mathrm{x}x 为单位向量,若 a≠0\mathrm{a\ne 0}a=0,取 x=a∣∣a∣∣\mathrm{x=\dfrac{a}{||a||}}x=∣∣a∣∣a,则 x\mathrm{x}x 是一个单位向量,由向量 a\mathrm{a}a 得到 x\mathrm{x}x 的过程称为把向量 a\mathrm{a}a 单位化。
- 由施瓦茨不等式,有 −1≤[x,y]∣∣x∣∣⋅∣∣y∣∣≤1-1\le \mathrm{\dfrac{[x,y]}{||x||\cdot||y||}}\le 1−1≤∣∣x∣∣⋅∣∣y∣∣[x,y]≤1(当 ∥x∥∥y∥≠0\mathrm{\|x\|\|y\|}\ne 0∥x∥∥y∥=0 时)。当 x≠0,y≠0\mathrm{x\ne 0,y\ne 0}x=0,y=0 时,令 θ=arccos[x,y]∣∣x∣∣⋅∣∣y∣∣\mathrm{\theta=\arccos\dfrac{[x,y]}{||x||\cdot||y||}}θ=arccos∣∣x∣∣⋅∣∣y∣∣[x,y],则 θ\mathrm{\theta}θ 称为向量 x\mathrm{x}x 与 y\mathrm{y}y 的夹角。当 [x,y]=0\mathrm{[x,y]}=0[x,y]=0 时,称 x\mathrm{x}x 与 y\mathrm{y}y 正交;若 x=0\mathrm{x=0}x=0,则 x\mathrm{x}x 与任何向量都正交。
- 向量 a\mathrm{a}a 与 b1,…,bn\mathrm{b_1,\dots,b_n}b1,…,bn 正交,则 a\mathrm{a}a 与 b1,…,bn\mathrm{b_1,\dots,b_n}b1,…,bn 的线性组合也正交。
- 向量 x\mathrm{x}x 在 y\mathrm{y}y 方向上的投影向量为 [x,y∥y∥]y∥y∥=[x,y][y,y]y\mathrm{[x,\dfrac{y}{\|y\|}]\dfrac{y}{\|y\|}=\dfrac{[x,y]}{[y,y]}y}[x,∥y∥y]∥y∥y=[y,y][x,y]y。
- 若 nnn 维向量 a1,a2,…,an\mathrm{a_1,a_2,\dots,a_n}a1,a2,…,an 是一组两两正交的非零向量,则 a1,a2,…,an\mathrm{a_1,a_2,\dots,a_n}a1,a2,…,an 线性无关。
- 假设有 k1,k2,…,knk_1,k_2,\dots,k_nk1,k2,…,kn,使 k1a1+⋯+knan=0k_1\mathrm{a_1}+\dots+k_n\mathrm{a_n=0}k1a1+⋯+knan=0
- 将 a1\mathrm{a_1}a1 与上式两端作内积,得 k1[a1,a1]=0\mathrm{k_1[a_1,a_1]=0}k1[a1,a1]=0,即 k1=0\mathrm{k_1=0}k1=0,同理可得 k2=⋯=kn=0\mathrm{k_2=\dots=k_n=0}k2=⋯=kn=0,即 a1,a2,…,an\mathrm{a_1,a_2,\dots,a_n}a1,a2,…,an 线性无关。
- 设 nnn 维向量 e1,…,er\mathrm{e_1,\dots,e_r}e1,…,er 是向量空间 V⊆RnV\subseteq\mathbb{R}^nV⊆Rn 的一个基,若 e1,…,er\mathrm{e_1,\dots,e_r}e1,…,er 两两正交,且都是单位向量,则称 e1,…,er\mathrm{e_1,\dots,e_r}e1,…,er 是 VVV 的一个标准正交基。a=λ1e1+⋯+λrer\mathrm{a=\lambda_1e_1+\dots+\lambda_re_r}a=λ1e1+⋯+λrer,为求 λ1,…,λr\mathrm{\lambda_1,\dots,\lambda_r}λ1,…,λr,只需将 a\mathrm{a}a 与 e1,…,er\mathrm{e_1,\dots,e_r}e1,…,er 分别作内积,即 λi=[ei,a]\lambda_i=[\mathrm{e_i, a}]λi=[ei,a]。
- 设 a1,…,ar\mathrm{a_1,\dots,a_r}a1,…,ar 是向量空间 VVV 的一个基,要求 VVV 的一个标准正交基,这个问题称为把基 a1,…,ar\mathrm{a_1,\dots,a_r}a1,…,ar 标准正交化。
- 施密特正交化:
- 取 b1=a1,b2=a2−[b1,a2][b1,b1]b1,…,br=ar−[b1,ar][b1,b1]b1−[b2,ar][b2,b2]b2−⋯−[br−1,ar][br−1,br−1]br−1\mathrm{b_1=a_1},\mathrm{b_2=a_2-\dfrac{[b_1,a_2]}{[b_1,b_1]}b_1},\dots,\mathrm{b_r=a_r-\dfrac{[b_1,a_r]}{[b_1,b_1]}b_1-\dfrac{[b_2,a_r]}{[b_2,b_2]}b_2-\dots-\dfrac{[b_{r-1},a_r]}{[b_{r-1},b_{r-1}]}b_{r-1}}b1=a1,b2=a2−[b1,b1][b1,a2]b1,…,br=ar−[b1,b1][b1,ar]b1−[b2,b2][b2,ar]b2−⋯−[br−1,br−1][br−1,ar]br−1,容易验证 b1,…,br\mathrm{b_1,\dots,b_r}b1,…,br 两两正交,且 b1,…,br\mathrm{b_1,\dots,b_r}b1,…,br 与 a1,…,ar\mathrm{a_1,\dots,a_r}a1,…,ar 等价。
- 然后将 b1,…,br\mathrm{b_1,\dots,b_r}b1,…,br 单位化,得到标准正交基 e1,…,er,ei=bi∣∣bi∣∣\mathrm{e_1,\dots,e_r},\mathrm{e_i=\dfrac{b_i}{||b_i||}}e1,…,er,ei=∣∣bi∣∣bi。
- 施密特正交化不仅满足 b1,…,br\mathrm{b_1,\dots,b_r}b1,…,br 与 a1,…,ar\mathrm{a_1,\dots,a_r}a1,…,ar 等价,还满足 b1,…,bk\mathrm{b_1,\dots,b_k}b1,…,bk 与 a1,…,ak\mathrm{a_1,\dots,a_k}a1,…,ak 等价,其中 1≤k≤r\mathrm{1\le k\le r}1≤k≤r。
- 施密特正交化的几何意义是将旧基迭代式地投影到正交基上。
- 如果 nnn 阶矩阵 A\mathrm{A}A 满足 ATA=E\mathrm{A^TA=E}ATA=E,则称 A\mathrm{A}A 是正交矩阵。
- 将 A\mathrm{A}A 按列分块,AT\mathrm{A^T}AT 按行分块,(a1T⋮anT)(a1,…,an)=E\begin{pmatrix}\mathrm{a_1}^T\\\vdots\\\mathrm{a_n}^T\end{pmatrix}(\mathrm{a_1,\dots,a_n})=\mathrm{E}a1T⋮anT(a1,…,an)=E,即 aiTaj={1,当i=j0,当i≠j\mathrm{a_i^Ta_j}=\begin{cases}1,当i=j\\0,当i\ne j\end{cases}aiTaj={1,当i=j0,当i=j
- 方阵 A\mathrm{A}A 为正交矩阵的充分必要条件是 A\mathrm{A}A 的列向量 a1,…,an\mathrm{a_1,\dots,a_n}a1,…,an 是一组标准正交基。
- ATA=AAT=E\mathrm{A^TA=AA^T=E}ATA=AAT=E,即行向量同理。
- 正交矩阵的性质
- 若 A\mathrm{A}A 是正交矩阵,则 A−1=AT\mathrm{A^{-1}=A^T}A−1=AT 也是正交矩阵,且 ∣A∣=1或−1|\mathrm{A}|=1或-1∣A∣=1或−1。
- 若 A,B\mathrm{A,B}A,B 是正交矩阵,则 AB\mathrm{AB}AB 也是正交矩阵。
- 若 P\mathrm{P}P 是正交矩阵,则线性变换 y=Px\mathrm{y=Px}y=Px 称为正交变换。∥y∥=∥Px∥=∥x∥\mathrm{\|y\|=\|Px\|=\|x\|}∥y∥=∥Px∥=∥x∥,即正交变换不改变向量的长度。
12. 方阵的特征值与特征向量
- 设 A\mathrm{A}A 是 nnn 阶方阵,若存在数 λ\lambdaλ 和非零向量 x\mathrm{x}x,使得 Ax=λx\mathrm{Ax=\lambda x}Ax=λx,则称 λ\lambdaλ 是方阵 A\mathrm{A}A 的特征值,x\mathrm{x}x 是对应于特征值 λ\lambdaλ 的特征向量。
- (A−λE)x=0(\mathrm{A-\lambda E})\mathrm{x}=0(A−λE)x=0 有非零解的充分必要条件是系数行列式 ∣A−λE∣=0\mathrm{|A-\lambda E|=0}∣A−λE∣=0,即 ∣a11−λa12…a1na21a22−λ…a2n⋮⋮⋮an1an2…ann−λ∣=0\begin{vmatrix}a_{11}-\lambda & a_{12} & \dots & a_{1n}\\ a_{21} & a_{22} - \lambda & \dots & a_{2n}\\ \vdots & \vdots & &\vdots\\a_{n1} & a_{n2} & \dots & a_{nn}-\lambda\end{vmatrix}=0a11−λa21⋮an1a12a22−λ⋮an2………a1na2n⋮ann−λ=0,该方程是以 λ\lambdaλ 为未知数的一元 nnn 次方程,称为方阵 A\mathrm{A}A 的特征方程,其左端是 λ\lambdaλ 的 nnn 次多项式,记作 f(λ)f(\mathrm{\lambda})f(λ),称为矩阵 A\mathrm{A}A 的特征多项式。显然特征值是特征方程的解,根据代数学基本定理,特征方程在复数范围有 nnn 个解,即 A\mathrm{A}A 在复数范围内有 nnn 个特征值。
- 特征值的性质
- λ1+⋯+λn=a11+a22+⋯+ann\lambda_1+\dots+\lambda_n=a_{11}+a_{22}+\dots+a_{nn}λ1+⋯+λn=a11+a22+⋯+ann
- 特征多项式可写为 f(λ)=(λ1−λ)(λ2−λ)…(λn−λ)f(\mathrm{\lambda})=(\lambda_1-\lambda)(\lambda_2-\lambda)\dots(\lambda_n-\lambda)f(λ)=(λ1−λ)(λ2−λ)…(λn−λ)。
- 分析特征多项式中 λn−1\lambda^{n-1}λn−1 项的系数,可以发现其等于由选择 n−1n-1n−1 项中的 −λ-\lambda−λ 和 λi\lambda_iλi 的乘积之和 (−1)n−1(λ1+λ2+⋯+λn)(-1)^{n-1}(\lambda_1+\lambda_2+\dots+\lambda_n)(−1)n−1(λ1+λ2+⋯+λn)
- 特征方程左端主对角线上乘积展开后 λn−1\lambda^{n-1}λn−1 项的系数同理等于 (−1)n−1(a11+a22+⋯+ann)(-1)^{n-1}(a_{11}+a_{22}+\dots+a_{nn})(−1)n−1(a11+a22+⋯+ann),行列式组成的其他项对 λn−1\lambda^{n-1}λn−1 项的系数没有贡献。
- λ1λ2…λn=∣A∣\lambda_1\lambda_2\dots\lambda_n=|\mathrm{A}|λ1λ2…λn=∣A∣
- 令 λ=0\lambda=0λ=0
- A\mathrm{A}A 是可逆矩阵的充分必要条件是它的 nnn 个特征值全都不为0
- λ1+⋯+λn=a11+a22+⋯+ann\lambda_1+\dots+\lambda_n=a_{11}+a_{22}+\dots+a_{nn}λ1+⋯+λn=a11+a22+⋯+ann
- 设 λ=λi\lambda=\lambda_iλ=λi 是矩阵 A\mathrm{A}A 的一个特征值,则由方程 (A−λiE)x=0\mathrm{(A-\lambda_i E)x=0}(A−λiE)x=0 可求得非零解 x=pi\mathrm{x=p_i}x=pi,称 pi\mathrm{p_i}pi 是 A\mathrm{A}A 的对应于特征值 λi\lambda_iλi 的特征向量。显然若 pip_ipi 是矩阵 A\mathrm{A}A 对应于特征值 λi\lambda_iλi 的特征向量,则 kpi(k≠0)kp_i(k\ne 0)kpi(k=0) 也是矩阵 A\mathrm{A}A 对应于特征值 λi\lambda_iλi 的特征向量。
- 设 λ\lambdaλ 是方阵 A\mathrm{A}A 的特征值
- 存在 p≠0\mathrm{p\ne 0}p=0,使 Ap=λp\mathrm{Ap=\lambda p}Ap=λp
- λ2\lambda^2λ2 是 A2\mathrm{A^2}A2 的特征值
- 当 A\mathrm{A}A 可逆时,1λ\dfrac{1}{\lambda}λ1 是 A−1\mathrm{A^{-1}}A−1 的特征值
- λk\lambda^kλk 是 Ak\mathrm{A^k}Ak 的特征值
- φ(λ)\varphi(\lambda)φ(λ) 是 φ(A)\varphi(\mathrm{A})φ(A) 的特征值
- 设 λ1,…,λm\lambda_1,\dots,\lambda_mλ1,…,λm 是方阵 A\mathrm{A}A 的 mmm 个特征值,p1,…,pm\mathrm{p_1,\dots,p_m}p1,…,pm 依次是与之对应的特征向量,如果 λ1,…,λm\lambda_1,\dots,\lambda_mλ1,…,λm 各不相同,则 p1,…,pm\mathrm{p_1,\dots,p_m}p1,…,pm 线性无关。
- 设 λ1\lambda_1λ1 和 λ2\lambda_2λ2 是方阵 A\mathrm{A}A 的两个不同的特征值,ξ1,…,ξs\mathrm{\xi_1,\dots,\xi_s}ξ1,…,ξs 和 η1,…,ηt\mathrm{\eta_1,\dots,\eta_t}η1,…,ηt 分别是与之对应的线性无关的特征向量,则 ξ1,…,ξs,η1,…,ηt\mathrm{\xi_1,\dots,\xi_s,\eta_1,\dots,\eta_t}ξ1,…,ξs,η1,…,ηt 线性无关。
13. 相似矩阵
- 设 A,B\mathrm{A,B}A,B 是两个 nnn 阶矩阵,若存在可逆矩阵 P\mathrm{P}P,使得 B=P−1AP\mathrm{B=P^{-1}AP}B=P−1AP,则称矩阵 A\mathrm{A}A 与 B\mathrm{B}B 相似,对 A\mathrm{A}A 进行运算 P−1AP\mathrm{P^{-1}AP}P−1AP 称为对 A\mathrm{A}A 进行相似变换,可逆矩阵 P\mathrm{P}P 称为把 A\mathrm{A}A 变成 B\mathrm{B}B 的相似变换矩阵。
- 若 nnn 阶矩阵 A\mathrm{A}A 与 B\mathrm{B}B 相似,则 A\mathrm{A}A 与 B\mathrm{B}B 的特征多项式相同,从而 A\mathrm{A}A 与 B\mathrm{B}B 的特征值也相同。
- 若 nnn 阶矩阵 A\mathrm{A}A 与对角矩阵 Λ=diag(λ1,…,λn)\Lambda=\mathrm{diag}(\lambda_1,\dots,\lambda_n)Λ=diag(λ1,…,λn) 相似,则 λ1,…,λn\lambda_1,\dots,\lambda_nλ1,…,λn 是 A\mathrm{A}A 的 nnn 个特征值。
- 利用相似变换,可以把一个矩阵化为对角矩阵,由此可以方便地计算矩阵多项式,为此寻求相似变换矩阵 P\mathrm{P}P,使得矩阵 P−1AP=Λ\mathrm{P^{-1}AP=\Lambda}P−1AP=Λ 为对角矩阵,这称为把矩阵 A\mathrm{A}A 对角化。
- 将相似变换矩阵 P\mathrm{P}P 按列分块,由 P−1AP=Λ\mathrm{P^{-1}AP=\Lambda}P−1AP=Λ,得 AP=PΛ\mathrm{AP=P\Lambda}AP=PΛ,即 A(p1,…,pn)=(p1,…,pn)diag(λ1,…,λn)\mathrm{A(p_1,\dots,p_n)=(p_1,\dots,p_n)\mathrm{diag}(\lambda_1,\dots,\lambda_n)}A(p1,…,pn)=(p1,…,pn)diag(λ1,…,λn),从而 Api=λipi\mathrm{Ap_i=\lambda_ip_i}Api=λipi,即 pi\mathrm{p_i}pi 是 A\mathrm{A}A 的对应于特征值 λi\lambda_iλi 的特征向量。
- nnn 阶矩阵 A\mathrm{A}A 与对角矩阵相似(即 A\mathrm{A}A 能对角化)的充分必要条件是 A\mathrm{A}A 有 nnn 个线性无关的特征向量。
- 若 A\mathrm{A}A 有 nnn 个线性无关的特征向量,则相似变换矩阵是可逆矩阵
- 如果 nnn 阶矩阵 A\mathrm{A}A 的 nnn 个特征值互不相等,则 A\mathrm{A}A 能对角化。
14. 对称矩阵的对角化
- 一个 nnn 阶矩阵具备什么条件才能对角化?这是一个复杂的问题,但对称矩阵可以很方便地证明其能对角化。
- 对称矩阵的特征值和特征向量的性质
- 对称矩阵的特征值都是实数。特征向量可以取实向量。
- 设 λ1,λ2\lambda_1,\lambda_2λ1,λ2 是对称矩阵 A\mathrm{A}A 的两个特征值,p1,p2\mathrm{p_1,p_2}p1,p2 是对应的特征向量,若 λ1≠λ2\lambda_1\ne \lambda_2λ1=λ2 则 p1,p2\mathrm{p_1,p_2}p1,p2 正交。
- 设 A\mathrm{A}A 为 nnn 阶对称矩阵,则必有正交矩阵 P\mathrm{P}P,使 P−1AP=PTAP=Λ\mathrm{P^{-1}AP=P^TAP=\Lambda}P−1AP=PTAP=Λ,其中 Λ\LambdaΛ 是以 A\mathrm{A}A 的 nnn 个特征值为对角元的对角矩阵。
- 设 A\mathrm{A}A 为 nnn 阶对称矩阵,λ\lambdaλ 是 A\mathrm{A}A 特征方程的 kkk 重根,则矩阵 A−λE\mathrm{A-\lambda E}A−λE 的秩为 n−kn-kn−k,从而对应特征值 λ\lambdaλ 恰有 kkk 个线性无关的特征向量。
- 对称矩阵 A\mathrm{A}A 与对角矩阵 Λ=diag(λ1,…,λn)\Lambda=\mathrm{diag}(\lambda_1,\dots,\lambda_n)Λ=diag(λ1,…,λn) 相似,即 A=PΛP−1\mathrm{A=P\Lambda P^{-1}}A=PΛP−1,则 A−λE\mathrm{A-\lambda E}A−λE 与 Λ−λE\Lambda - \lambda EΛ−λE 相似,即 A−λE=P(Λ−λE)P−1\mathrm{A-\lambda E=P(\Lambda-\lambda E)P^{-1}}A−λE=P(Λ−λE)P−1,从而 A−λE\mathrm{A-\lambda E}A−λE 的秩等于 Λ−λE\Lambda - \lambda EΛ−λE 的秩,即 n−kn-kn−k。
- 对称矩阵对角化的步骤:
- 求出 A\mathrm{A}A 的特征值 λ1,…,λs\lambda_1,\dots,\lambda_sλ1,…,λs 与其对应重数 k1,…,ks(k1+⋯+ks=n)k_1,\dots,k_s(k_1+\dots+k_s=n)k1,…,ks(k1+⋯+ks=n)。
- 对每个 kik_iki 重特征值 λi\lambda_iλi,求方程 (A−λiE)x=0(\mathrm{A-\lambda_i E})x=0(A−λiE)x=0 的基础解系,得 kik_iki 个线性无关的向量,再把它们正交化、单位化。
- 然后将这些两两正交的单位特征向量按对角元顺序排成正交矩阵 P\mathrm{P}P,则 P−1AP=PTAP=Λ\mathrm{P^{-1}AP=P^TAP=\Lambda}P−1AP=PTAP=Λ
15. 二次型及其标准形
- 含有 nnn 个变量的二次齐次函数 f(x1,…,xn)=a11x12+⋯+annxn2+2a12x1x2+2a13x1x3+⋯+2an−1,nxn−1xn=∑i,j=1naijxixjf(x_1,\dots,x_n)=a_{11}x_1^2+\dots+a_{nn}x_n^2+2a_{12}x_1x_2+2a_{13}x_1x_3+\dots+2a_{n-1,n}x_{n-1}x_n=\sum\limits_{i,j=1}^na_{ij}x_ix_jf(x1,…,xn)=a11x12+⋯+annxn2+2a12x1x2+2a13x1x3+⋯+2an−1,nxn−1xn=i,j=1∑naijxixj 称为二次型。
- 通过可逆的线性变换 x=Cy\mathrm{x=Cy}x=Cy,二次型 f(x)f(\mathrm{x})f(x) 可以变为只含平方项的标准形 ∑i=1nλiyi2\mathrm{\sum\limits_{i=1}^n\lambda_iy_i^2}i=1∑nλiyi2。如果标准形的系数只从 1,−1,01,-1,01,−1,0 中取值,则称该二次型为规范形。当 aija_{ij}aij 为复数时,二次型 f(x)f(\mathrm{x})f(x) 称为复二次型;当 aija_{ij}aij 为实数时,二次型 f(x)f(\mathrm{x})f(x) 称为实二次型。
- 二次型 f(x)=xTAxf(\mathrm{x})=\mathrm{x^TAx}f(x)=xTAx,其中对称矩阵 A\mathrm{A}A 称为二次型 fff 的矩阵,对称矩阵 A\mathrm{A}A 的秩称为二次型 fff 的秩。
- 设 A\mathrm{A}A 和 B\mathrm{B}B 是 nnn 阶矩阵,若有可逆矩阵 C\mathrm{C}C,使得 B=CTAP\mathrm{B=C^TAP}B=CTAP,则称 A\mathrm{A}A 与 B\mathrm{B}B 合同。
- 若 A\mathrm{A}A 为对称矩阵,则 B\mathrm{B}B 也为对称矩阵,且 R(A)=R(B)R(\mathrm{A})=R(\mathrm{B})R(A)=R(B)。
- 经可逆变换 x=Cy\mathrm{x=Cy}x=Cy 后,二次型 fff 的矩阵 A\mathrm{A}A 变为与 A\mathrm{A}A 合同的矩阵 CTAC\mathrm{C^TAC}CTAC,且二次型的秩不变。
- 要使二次型 fff 变为标准形,就是要使 CTAC\mathrm{C^TAC}CTAC 成为对角矩阵,即对称矩阵 A\mathrm{A}A 合同对角化。
- 任给二次型 fff,总有正交变换 x=Py\mathrm{x=Py}x=Py,使 fff 化为标准形 ∑i=1nλiyi2\mathrm{\sum\limits_{i=1}^n\lambda_iy_i^2}i=1∑nλiyi2,其中 λ1,…,λn\lambda_1,\dots,\lambda_nλ1,…,λn 是二次型 fff 的矩阵 A\mathrm{A}A 的特征值。
- 任给二次型 fff,总有可逆变换 x=Cz\mathrm{x=Cz}x=Cz,使 f(Cz)f(\mathrm{Cz})f(Cz) 为规范形。
- 使用正交变换化二次型为标准形,具有保持几何形状不变的优点,如果不限于正交变换,那么还可以使用拉格朗日配方法。如果 fff 中含有平方项,可以尽可能进行配方,然后通过平方差换元消去交叉项,最后得到全为平方的式子,最后换元可以得到标准形或规范形。
- 设二次型 f=xTAxf=\mathrm{x^TAx}f=xTAx 的秩为 rrr,且有两个可逆变换 x=Cy\mathrm{x=Cy}x=Cy 和 y=Pz\mathrm{y=Pz}y=Pz,使 f=∑i=1rkiyi2(ki≠0)f=\sum\limits_{i=1}^r k_iy_i^2(k_i\ne0)f=i=1∑rkiyi2(ki=0) 和 f=∑i=1rλiyi2(λi≠0)f=\sum\limits_{i=1}^r\lambda_iy_i^2(\lambda_i\ne0)f=i=1∑rλiyi2(λi=0),则 k1,…,krk_1,\dots,k_rk1,…,kr 与 λ1,…,λr\lambda_1,\dots,\lambda_rλ1,…,λr 中正数的个数相等,这个定理称为惯性定理。二次型的标准形中正系数的个数称为正惯性指数,负系数的个数称为负惯性指数。
- 设二次型 f(x)=xTAxf(\mathrm{x})=\mathrm{x^TAx}f(x)=xTAx,如果对任何 x≠0\mathrm{x\ne0}x=0,都有 f(x)>0f\mathrm{(x)>0}f(x)>0,则称 fff 为正定二次型,并称对称矩阵 A\mathrm{A}A 是正定的;如果对任何 x≠0\mathrm{x\ne0}x=0,都有 f(x)<0f\mathrm{(x)<0}f(x)<0,则称 fff 为负定二次型,并称对称矩阵 A\mathrm{A}A 是负定的。
- nnn 元二次型 f(x)=xTAxf(\mathrm{x})=\mathrm{x^TAx}f(x)=xTAx 是正定的充分必要条件是它的标准形的 nnn 个系数全为正,即它的规范形的 nnn 个系数全为1,亦即它的正惯性指数为 nnn。
- 对称矩阵 A\mathrm{A}A 是正定的充分必要条件是 A\mathrm{A}A 的所有特征值都是正的。
- 对称矩阵 A\mathrm{A}A 是正定的充分必要条件是 A\mathrm{A}A 的各阶主子式都是正的,即 a11>0,∣a11a12a21a22∣>0,…,∣a11…a1n⋮⋮an1…ann∣>0a_{11}>0,\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}>0,\dots,\begin{vmatrix}a_{11}&\dots&a_{1n}\\\vdots&&\vdots\\a_{n1}&\dots&a_{nn}\end{vmatrix}>0a11>0,a11a21a12a22>0,…,a11⋮an1……a1n⋮ann>0。对称矩阵 A\mathrm{A}A 是负定的充分必要条件是 A\mathrm{A}A 的奇数阶主子式都是负的,偶数阶主子式都是正的。这个定理称为赫尔维茨定理。
下一节:无
总目录:【线性代数】目录