当前位置：首页 > news >正文

LoRA（Low-Rank Adaptation，低秩适应）

news 2025/9/28 17:02:57

LoRA（Low-Rank Adaptation，低秩适应）是一种高效微调大模型的技术，主要用于在不显著增加计算资源的情况下，对预训练模型（如Stable Diffusion）进行轻量级适配。它的核心思想是通过低秩矩阵分解来减少可训练参数数量，从而实现对特定任务或风格的快速适配。

低秩分解：
对原始权重矩阵 $\in \mathbb{R}^{d \times k}$ （例如Attention层的 $Q / K / V$ 矩阵），LoRA将其更新量 $\Delta W$ 分解为两个小矩阵的乘积：
$\Delta W = BA \quad \text{其中} \quad B \in \mathbb{R}^{d \times r}, \ A \in \mathbb{R}^{r \times k}, \ r \ll \min(d,k)$
- ( r ) 是秩（rank），通常取 4~64，远小于原矩阵维度。
- 训练时只更新 $A$ 和 $B$ ，冻结原始权重 $W$ 。
前向计算：
实际计算时，将原始输出加上低秩适配项：
$\Delta W x = Wx + BAx$

通常注入到UNet的交叉注意力层（Cross-Attention）和文本编码器中，例如：

在Stable Diffusion Pipeline中，LoRA相关逻辑主要通过：

场景	说明
风格微调	让模型学习特定艺术风格（如动漫、水彩）
主题适配	适配特定对象（如特定角色、品牌logo）
可控生成	增强对某些属性的控制（如光照、姿势）
多任务切换	通过加载不同LoRA快速切换任务，无需存储多个完整模型