当前位置: 首页 > news >正文

游戏AI研究所-Stable Diffusion中LoRA(Low-Rank Adaptation)的定义及权重的作用机制

Ⅰ.定义:
LoRA(Low-Rank Adaptation)是一种高效的微调技术,最初由微软研究人员提出,旨在通过引入可训练的低秩矩阵,冻结大模型的大部分参数,从而实现低资源消耗下的高效微调。在图像生成领域,LoRA被广泛应用于Stable Diffusion等模型中,用于快速定制特定风格、角色或材质的图像生成。

Ⅱ.Stable Diffusion 1.5(SD1.5)、Stable Diffusion XL(SDXL) 和 FLUX 三种模型中 LoRA(Low-Rank Adaptation)微调技术的对比分析
SD1.5 LoRA:适合算力资源有限的用户进行快速微调和实验,拥有大量现成的 LoRA 模型,适合风格迁移和角色定制。
SDXL LoRA:适合追求高质量图像生成的用户,图像质量和细节表现更佳,但训练过程复杂,需高性能 GPU 支持。
FLUX LoRA:在细节表现上具有优势,生成图像逼真度高,适合追求高精度图像生成的专业用户,训练过程灵活,可调整参数以适应不同任务。
例如:下图

Ⅲ. LoRA 的权重含义


LoRA 权重(strength):
这是指在使用 LoRA 模型时,用户可以设置的一个参数,通常在 0 到 1 之间,表示 LoRA 对原始模型影响的程度。
例如,设置为 0.8 表示 LoRA 模型对生成结果的影响程度为 80%。
较高的权重会使 LoRA 的特征更明显,较低的权重则使其影响减弱。

CLIP 权重(strength_clip):
CLIP 模块负责将文本提示词编码为向量,以指导图像生成。
LoRA 可以对 CLIP 模块进行微调,以更好地理解特定的提示词或风格。
CLIP 权重控制 LoRA 在 CLIP 模块中的影响程度,调整该值可以改变模型对提示词的理解和响应。

Ⅳ.LoRA 权重的作用机制
比如:你有一台功能强大的咖啡机(预训练模型),它可以制作多种咖啡。现在,你想让它制作一种新的特色咖啡,但不想更换整台机器。于是,你添加了一个小型的附件(LoRA 模块),这个附件可以调整咖啡的风味,使其符合你的新需求。

LoRA 权重(strength): 控制 LoRA 模块对模型输出的整体影响程度。
mingchao.wang
CLIP 权重(strength_clip): 在图像生成任务中,CLIP 模块用于理解文本提示。CLIP 权重控制 LoRA 对文本编码部分的影响程度。

具体机制:
冻结原始模型参数: 在微调过程中,原始模型的参数保持不变,避免了对整个模型的重新训练。
引入低秩矩阵: 在模型的特定位置(如 Transformer 的注意力层),添加两个小型的可训练矩阵 A 和 B。
调整输出: 这两个矩阵的乘积(A × B)会生成一个调整值,添加到原始模型的输出中,从而改变模型的行为。
权重控制影响程度: LoRA 的权重参数决定了这些调整对模型输出的影响程度。较高的权重意味着更大的影响,较低的权重则表示影响较小。


 

http://www.dtcms.com/a/193950.html

相关文章:

  • 【流程控制结构】
  • ReinboT:通过强化学习增强机器人视觉-语言操控能力
  • Mac上安装运行SynthTIGER
  • C++跨平台开发:突破不同平台的技术密码
  • uniapp-商城-60-后台 新增商品(属性的选中和页面显示)
  • 架构选择、区别
  • 学习51单片机02
  • 麒麟服务器操作系统安装 MySQL 8 实战指南
  • 掌握 Kotlin Android 单元测试:MockK 框架深度实践指南
  • 【AI】用Dify实现一个模拟面试的功能
  • require/exports 或 import/export的联系和区别,各自的使用场景
  • skywalking使用教程
  • 基于51单片机和8X8点阵屏、矩阵按键的匹对消除类小游戏
  • Flask 是否使用类似 Spring Boot 的核心注解机制
  • MyBatis—动态 SQL
  • Mysql存储过程(附案例)
  • Gitee DevOps:中国企业数字化转型的加速引擎
  • Gitee DevOps:中国企业数字化转型的“本土化加速器“
  • 【Pandas】pandas DataFrame kurt
  • 深度剖析:Dify+Sanic+Vue+ECharts 搭建 Text2SQL 项目 sanic-web 的 Debug 实战
  • 【Unity】用事件广播的方式实现游戏暂停,简单且实用!
  • 单元化架构
  • <PLC><视觉><机器人>基于海康威视视觉检测和UR机械臂,如何实现N点标定?
  • IEEE 列表会议第五届机器人、自动化与智能控制国际会议
  • 软件架构风格系列(4):事件驱动架构
  • Python打卡 DAY 27
  • 大模型在数据分析领域的研究综述
  • CSS:颜色的三种表示方式
  • 学习以任务为中心的潜动作,随地采取行动
  • Servlet 深度解析:生命周期、请求响应与状态管理