当前位置：首页 > news >正文

【课堂笔记】LU分解，Cholesky分解

news 2025/10/15 11:20:18

文章目录

- 回顾
- $LU$ 分解
- - 高斯消元法(Gaussian Elimination)
  - 转动LU分解(pivoting LU)
  - 稳定性分析
- Cholesky 分解

回顾

我们已经有了三种矩阵分解的方法：

$QR$ 分解， $A = QR$ ，其中 $Q$ 是正交矩阵， $R$ 是上三角矩阵
特征值分解， $A = VDV^{-1}$ ，其中 $A$ 是可对角化的， $V$ 是奇异的， $D$ 是对角的
$S V D$ 奇异值分解， $A=U\sum V^*$ ，其中 $U, V$ 是正交的， $\sum$ 是对角的

而这篇将介绍另外两种分解方法。

$LU$ 分解

令 $\in \mathbb{C}^{m \times m}$ ，最简单的形式为 $A = LU$ ，其中 $L$ 是单位下三角矩阵， $U$ 是上三角矩阵。更一般的可以写成 $P A = LU$ ，其中 $P$ 是置换矩阵(permutation)

高斯消元法(Gaussian Elimination)

在解线性方程组 $A x = b$ 时，我们会先利用高斯消元将 $A$ 转化为上三角矩阵。

例如 $\left\{\begin{matrix} 2x+4y-2z=2 \\ 4x+9y-3z=8 \\ -2x-3y+7z=10 \end{matrix}\right.$
$\left[ \begin{array}{ccc|c} 2 & 4 & -2 & 2 \\ 4 & 9 & -3 & 8 \\ -2 & -3 & 7 & 10 \\ \end{array} \right] \xrightarrow{L_1} \left[ \begin{array}{ccc|c} 2 & 4 & -2 & 2 \\ 0 & 1 & 1 & 4 \\ 0 & 1 & 5 & 12 \\ \end{array} \right] \xrightarrow{L_2} \left[ \begin{array}{ccc|c} 2 & 4 & -2 & 2 \\ 0 & 1 & 1 & 4 \\ 0 & 0 & 4 & 8 \\ \end{array} \right]$

我们记 $L_k = \begin{bmatrix} 1 & & & & & \\ & 1 & & & & \\ & & 1 & & & \\ & & -l_{k+1, k} & & & \\ & & \vdots & \ddots & & \\ & & -l_{m, k} & & & 1 \end{bmatrix}$ ，其中 $l_{jk} = x_{jk}/x_{kk}$ ，我们有 $L_kx_k = \begin{bmatrix} x_{1k} \\ \vdots \\ x_{kk} \\ 0 \\ \vdots \\ 0 \end{bmatrix}$

令 $\vec{l_k}$ 为 $L_k$ 的第 $k$ 列，则 $L_k = I - l_k \cdot e_k^*$
若 $j > k$ ，则 $L_kL_j = (I - l_ke_k^*)(I-l_je^*_j)=I-l_ke_k^*-l_je_j^*$

我们由上面的变化可知， $L_{m-1}\cdots L_2L_1A=U$ ， $(L_1^{-1}L_2^{-1}\cdots L_{m-1}^{-1})\cdot U$ 。
令 $L_1^{-1}L_2^{-1}\cdots L_{m-1}^{-1}$ ，则 $A = LU$ 。可验证 $\begin{bmatrix} 1 & & & & \\ l_{21} & 1 & & & \\ l_{31} & l_{32} & 1 & & \\ \vdots & \vdots & & \ddots & \\ l_{m1} & l_{m2} & \cdots & \cdots & 1 \end{bmatrix}$

下面是实现算法的伪代码，精度为 $\frac{2}{3}m^3$ flops

'''
Algorithm for A=LU
Input A
'''
U, L = A, I
for k=1: m-1for j=k+1 : mL[j, k] = U[j, k] / U[k, k]U[j, k:m] = U[j, k:m] - L[j,k]U[k, k:m]

转动LU分解(pivoting LU)

上述伪代码中有除以 $U [k, k]$ 的操作，当它很小或者为 $0$ 时就会出一些问题。

对矩阵 $A$ 有性质上的要求，例如 $\begin{bmatrix} 0 & 1\\ 1 & 0 \end{bmatrix}$ 就没有 $LU$ 分解。
会产生数值不稳定问题，例如 $\begin{bmatrix} \epsilon & 1\\ 1 & 0 \end{bmatrix}=\begin{bmatrix} 1 & 0\\ 1/\epsilon & 1 \end{bmatrix}\begin{bmatrix} \epsilon & 1\\ 0 & -1/\epsilon \end{bmatrix}$ ，数值溢出达到 $O(\epsilon^{-2})$

我们引入置换矩阵 $P$ ，通过换主元的方式让所有非奇异的矩阵都能写为 $P A = LU$ 。
在第 $k$ 步中，我们找出第 $k$ 列从第 $k$ 行的最大元素，将它与第 $k$ 行交换，然后再进行消元。
将交换步骤写成矩阵 $P_i$ ，则 $L_{m-1}P_{m-1}...L_2P_2L_1P_1A = U$ 。
记 $L_{m-1}' = L_{m-1}, L_{j}' = P_{m-1}P_{m-2}...P_{j+1}L_jP_{j+1}^{-1}...P_{m-2}^{-1}P_{m-1}^{-1}$ ，就可以写成：
$L_{m-1}'L_{m-2}'...L_1' \cdot (P_{m-1}P_{m-2}...P_1)A = U$

稳定性分析

设 $\in \mathbb{R}^{m \times m}$ ，计算的 $\tilde{L}, \tilde{U}$ 满足 $\tilde{L}\tilde{U} = A + E$ ，则有：
$\le 2(m-1)\epsilon_{\text{math}}(|A|+|L||U|)$

设 $\in \mathbb{R}^{m \times m}$ ，计算的 $\tilde{P}, \tilde{L}, \tilde{U}$ 满足
$\tilde{L}\tilde{U} = \tilde{P}A + \delta A \\ \frac{\|\delta A\|}{\|A\|} = O(\rho \epsilon_{\text{math}}) \\ \rho = \frac{\max_{ij}|u_{ij}|}{\max_{ij}|a_{ij}|}$
其中 $\rho$ 是增长因子(growth factor)

Cholesky 分解

若 $\in \mathbb{C}^{m\times m}$ 是Hermitian的，即 $a_{ij} = \overline{a_{ji}}$ ，且 $A$ 是正定的，则 $A$ 可以分解为 $A=R^*R$

$\left[ \begin{array}{c|c} a_{11} & w^* \\ \hline w & k \end{array} \right] = \begin{bmatrix} \alpha & \\ w/\alpha & I \end{bmatrix} \begin{bmatrix} 1 & \\ & k-ww^*/a_{11} \end{bmatrix} \begin{bmatrix} \alpha & w^*/\alpha\\ & I \end{bmatrix}$
其中 $\alpha = \sqrt{a_{11}}$ ， $k - ww^*/a_{11}$ 是半正定的，
$x^*\begin{bmatrix} 1 & \\ & k-ww^*/a_{11} \end{bmatrix}x = \underbrace{ x^* \begin{bmatrix} \alpha & \\ w/\alpha & I \end{bmatrix}^{-1} }_{y^*} A \underbrace{ \begin{bmatrix} \alpha & w^*/\alpha \\ & I \end{bmatrix}^{-1} x }_{y}$
重复上述过程直到中间变成 $I$

'''
Algorithm for Cholesky factorization
Input A
'''
R=A
for k=1:mfor j=k+1:mR[j, j:m] = R[j, j:m] - R[k, j:m] * conj(R[k, j]) / R[k, k]R[k, k:m] = R[k, k:m] / sqrt(R[k, k])