向量外积与秩1矩阵的关系
向量外积与秩1矩阵的关系
flyfish
- 向量外积是构造秩1矩阵的基本工具,其本质是用两组向量的线性组合刻画矩阵的行和列相关性;
- 任意秩1矩阵必可表示为外积,而低秩矩阵(秩 k k k)可分解为 k k k 个外积矩阵的和,这正是低秩分解通过“基向量组合”压缩矩阵信息的核心原理。
- 从代数角度,秩1矩阵必为两个向量的外积 u v T \boldsymbol{u}\boldsymbol{v}^T uvT,其结构由两个向量唯一确定;
- 从几何角度,秩1矩阵对应“将任意向量投影到 u \boldsymbol{u} u方向的线性变换”,其变换效果仅由 u \boldsymbol{u} u(像空间方向)和 v \boldsymbol{v} v(投影系数)决定。
- 这种分解是低秩分解的基础,例如矩阵的奇异值分解(SVD)中,秩1矩阵是构成任意矩阵的“原子单元”。
一、向量外积的定义与几何意义
1. 向量外积的定义
设两个列向量 u ∈ R m \mathbf{u} \in \mathbb{R}^m u∈Rm 和 v ∈ R n \mathbf{v} \in \mathbb{R}^n v∈Rn,其外积(Outer Product)定义为矩阵乘法:
u v T = ( u 1 u 2 ⋮ u m ) ( v 1 v 2 ⋯ v n ) = ( u 1 v 1 u 1 v 2 ⋯ u 1 v n u 2 v 1 u 2 v 2 ⋯ u 2 v n ⋮ ⋮ ⋱ ⋮ u m v 1 u m v 2 ⋯ u m v n ) \mathbf{u} \mathbf{v}^T = \begin{pmatrix} u_1 \\ u_2 \\ \vdots \\ u_m \end{pmatrix} \begin{pmatrix} v_1 & v_2 & \cdots & v_n \end{pmatrix} = \begin{pmatrix} u_1v_1 & u_1v_2 & \cdots & u_1v_n \\ u_2v_1 & u_2v_2 & \cdots & u_2v_n \\ \vdots & \vdots & \ddots & \vdots \\ u_mv_1 & u_mv_2 & \cdots & u_mv_n \end{pmatrix} uvT= u1u2⋮um (v1v2⋯vn)= u1v1u2v1⋮umv1u1v2u2v2⋮umv2⋯⋯⋱⋯u1vnu2vn⋮umvn
- 外积的结果是一个 m × n m \times n m×n 的矩阵,其每个元素为 u \mathbf{u} u 和 v \mathbf{v} v 对应元素的乘积。
- 对比内积(点积): u ⋅ v = u T v = ∑ i = 1 m u i v i \mathbf{u} \cdot \mathbf{v} = \mathbf{u}^T\mathbf{v} = \sum_{i=1}^m u_i v_i u⋅v=uTv=∑i=1muivi,结果是一个标量;而外积结果是矩阵。
2. 外积矩阵的关键性质
以二维向量为例,设 u = ( a b ) \mathbf{u} = \begin{pmatrix} a \\ b \end{pmatrix} u=(ab), v = ( c d ) \mathbf{v} = \begin{pmatrix} c \\ d \end{pmatrix} v=(cd),则外积为:
u v T = ( a b ) ( c d ) = ( a c a d b c b d ) \mathbf{u}\mathbf{v}^T = \begin{pmatrix} a \\ b \end{pmatrix} \begin{pmatrix} c & d \end{pmatrix} = \begin{pmatrix} ac & ad \\ bc & bd \end{pmatrix} uvT=(ab)(cd)=(acbcadbd)
- 观察矩阵结构:每一行都是 v T \mathbf{v}^T vT 的倍数(第一行是 a v T a\mathbf{v}^T avT,第二行是 b v T b\mathbf{v}^T bvT),即行向量线性相关;
- 每一列都是 u \mathbf{u} u 的倍数(第一列是 c u c\mathbf{u} cu,第二列是 d u d\mathbf{u} du),即列向量线性相关。
二、秩1矩阵的定义与性质
1. 矩阵秩的定义
矩阵的秩是其线性无关的行向量(或列向量)的最大数量。若一个 m × n m \times n m×n 矩阵 A \mathbf{A} A 的秩为 1,则:
- 所有行向量都是某一非零行向量的标量倍数;
- 所有列向量都是某一非零列向量的标量倍数。
2. 秩1矩阵的核心特征
设 A \mathbf{A} A 是秩1的 m × n m \times n m×n 矩阵,则存在非零向量 u ∈ R m \mathbf{u} \in \mathbb{R}^m u∈Rm 和 v ∈ R n \mathbf{v} \in \mathbb{R}^n v∈Rn,使得 A = u v T \mathbf{A} = \mathbf{u}\mathbf{v}^T A=uvT。
三、原理证明:任意秩1矩阵可表示为外积
步骤1:利用秩1矩阵的行向量线性相关
设 A \mathbf{A} A 的秩为 1,且其第一行 r 1 ≠ 0 \mathbf{r}_1 \neq \mathbf{0} r1=0,则其他行 r i \mathbf{r}_i ri 可表示为 r i = k i r 1 \mathbf{r}_i = k_i \mathbf{r}_1 ri=kir1( k i k_i ki 为标量)。
令 u = ( 1 k 2 ⋮ k m ) \mathbf{u} = \begin{pmatrix} 1 \\ k_2 \\ \vdots \\ k_m \end{pmatrix} u= 1k2⋮km , v T = r 1 \mathbf{v}^T = \mathbf{r}_1 vT=r1,则:
u v T = ( 1 k 2 ⋮ k m ) r 1 = ( r 1 k 2 r 1 ⋮ k m r 1 ) = ( r 1 r 2 ⋮ r m ) = A \mathbf{u}\mathbf{v}^T = \begin{pmatrix} 1 \\ k_2 \\ \vdots \\ k_m \end{pmatrix} \mathbf{r}_1 = \begin{pmatrix} \mathbf{r}_1 \\ k_2\mathbf{r}_1 \\ \vdots \\ k_m\mathbf{r}_1 \end{pmatrix} = \begin{pmatrix} \mathbf{r}_1 \\ \mathbf{r}_2 \\ \vdots \\ \mathbf{r}_m \end{pmatrix} = \mathbf{A} uvT= 1k2⋮km r1= r1k2r1⋮kmr1 = r1r2⋮rm =A
步骤2:示例验证
设秩1矩阵 A = ( 2 4 6 − 1 − 2 − 3 3 6 9 ) \mathbf{A} = \begin{pmatrix} 2 & 4 & 6 \\ -1 & -2 & -3 \\ 3 & 6 & 9 \end{pmatrix} A= 2−134−266−39 ,观察行向量:
- 第二行是第一行的 − 1 2 -\frac{1}{2} −21 倍,第三行是第一行的 3 2 \frac{3}{2} 23 倍。
取第一行作为 v T = ( 2 4 6 ) \mathbf{v}^T = \begin{pmatrix} 2 & 4 & 6 \end{pmatrix} vT=(246),系数向量 u = ( 1 − 1 2 3 2 ) \mathbf{u} = \begin{pmatrix} 1 \\ -\frac{1}{2} \\ \frac{3}{2} \end{pmatrix} u= 1−2123 ,则:
u v T = ( 1 − 1 2 3 2 ) ( 2 4 6 ) = ( 2 4 6 − 1 − 2 − 3 3 6 9 ) = A \mathbf{u}\mathbf{v}^T = \begin{pmatrix} 1 \\ -\frac{1}{2} \\ \frac{3}{2} \end{pmatrix} \begin{pmatrix} 2 & 4 & 6 \end{pmatrix} = \begin{pmatrix} 2 & 4 & 6 \\ -1 & -2 & -3 \\ 3 & 6 & 9 \end{pmatrix} = \mathbf{A} uvT= 1−2123 (246)= 2−134−266−39 =A
四、从外积到低秩分解的本质理解
1. 秩1矩阵的“基向量”意义
外积 u v T \mathbf{u}\mathbf{v}^T uvT 可理解为:
- 列向量 u \mathbf{u} u 定义了矩阵的“方向”(所有列都是 u \mathbf{u} u 的线性组合);
- 行向量 v T \mathbf{v}^T vT 定义了矩阵的“权重”(所有行都是 v T \mathbf{v}^T vT 的线性组合)。
因此,秩1矩阵本质上是用两个向量的外积来“压缩”矩阵信息,仅保留一组基向量的线性组合。
2. 低秩分解的推广(以秩k矩阵为例)
任意秩 k k k 的矩阵 A \mathbf{A} A 可分解为 k k k 个秩1矩阵的和:
A = ∑ i = 1 k u i v i T \mathbf{A} = \sum_{i=1}^k \mathbf{u}_i\mathbf{v}_i^T A=i=1∑kuiviT
其中 { u i } \{\mathbf{u}_i\} {ui} 和 { v i } \{\mathbf{v}_i\} {vi} 分别为列向量和行向量组。这等价于用 k k k 组外积矩阵的线性组合近似表示 A \mathbf{A} A,而原始矩阵的秩为 k k k,即其信息可由 k k k 组基向量刻画。
五、简单示例:秩2矩阵的外积分解
设矩阵 B = ( 1 2 3 2 4 6 1 3 5 ) \mathbf{B} = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 1 & 3 & 5 \end{pmatrix} B= 121243365 ,先求其秩:
- 前两行线性相关(第二行是第一行的2倍),第三行与前两行线性无关,故 rank ( B ) = 2 \text{rank}(\mathbf{B}) = 2 rank(B)=2。
分解步骤:
- 取前两行构成秩1矩阵 B 1 = ( 1 2 3 2 4 6 0 0 0 ) = u 1 v 1 T \mathbf{B}_1 = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 0 & 0 & 0 \end{pmatrix} = \mathbf{u}_1\mathbf{v}_1^T B1= 120240360 =u1v1T,其中 u 1 = ( 1 2 0 ) \mathbf{u}_1 = \begin{pmatrix} 1 \\ 2 \\ 0 \end{pmatrix} u1= 120 , v 1 T = ( 1 2 3 ) \mathbf{v}_1^T = \begin{pmatrix} 1 & 2 & 3 \end{pmatrix} v1T=(123);
- 剩余部分为 B − B 1 = ( 0 0 0 0 0 0 1 3 5 ) = u 2 v 2 T \mathbf{B} - \mathbf{B}_1 = \begin{pmatrix} 0 & 0 & 0 \\ 0 & 0 & 0 \\ 1 & 3 & 5 \end{pmatrix} = \mathbf{u}_2\mathbf{v}_2^T B−B1= 001003005 =u2v2T,其中 u 2 = ( 0 0 1 ) \mathbf{u}_2 = \begin{pmatrix} 0 \\ 0 \\ 1 \end{pmatrix} u2= 001 , v 2 T = ( 1 3 5 ) \mathbf{v}_2^T = \begin{pmatrix} 1 & 3 & 5 \end{pmatrix} v2T=(135);
- 最终分解: B = u 1 v 1 T + u 2 v 2 T \mathbf{B} = \mathbf{u}_1\mathbf{v}_1^T + \mathbf{u}_2\mathbf{v}_2^T B=u1v1T+u2v2T。