当前位置: 首页 > news >正文

【极速版 -- 大模型入门到进阶】LORA:大模型轻量级微调

文章目录


论文指路:LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS

🌊 有没有低成本的方法微调大模型?

  • 2021年微软提出 LORA :LOW-RANK ADAPTATION 低秩适配
    • 【什么是秩?】一个矩阵的秩是指矩阵中线性独立的行或列的最大数目;也就是说 一个矩阵的秩越大,它包含的有效信息就越多

🌊 LoRA 的核心思想

  • LoRA通过优化在适应过程中 FC 层权重变化 ( Δ w ∈ R m × n \Delta w \in \mathbb{R}^{m\times n} ΔwRm×n) 的秩分解矩阵 ( A ∈ R m × r × B ∈ R r × n A \in \mathbb{R}^{m\times r} \times B\in \mathbb{R}^{r\times n} ARm×r×BRr×n),来间接调整神经网络中部分层的权重 ( w w w) 。不修改预先训练好的权重,而是通过引入一个低秩的矩阵来实现对这些层的适应调整
    • r < < min ⁡ ( m , n ) r << \min(m,n) r<<min(m,n)
  • 用更小的参数空间存储 模型参数变化量 Δ w \Delta w Δw
    • Δ w \Delta w Δw: 模型参数变化量,也就是对原参数 w w w 变化 Δ w \Delta w Δw 可以适配新任务。LoRA 用 A 和 B 计算获得模型参数变化量 Δ w \Delta w Δw,叠加到原参数 w w w

🌊 LoRA 的初始化和 r r r 的值设定

  • 用随机高斯分布初始化 A A A ,用 0 矩阵初始化 B B B, 保证训练的开始此旁路矩阵依然是 0 矩阵
  • 对于一般的任务, r = 1 , 2 , 4 , . . . r = 1,2,4, ... r=1,2,4,... 就足够了。而一些领域差距比较大的任务可能需要更大的 r r r

🌊 LoRA 实战:LoraConfig参数详解

目前 LORA 已经被 HuggingFace 集成在了 PEFT(Parameter-Efficient Fine-Tuning) 代码库里
所以,使用也非常简单

from peft import get_peft_config, get_peft_model, LoraConfig, TaskType

# preModel = ....from_pretrained(".. bert-base-uncased ..")  # 加载你的预训练模型

peft_config = LoraConfig(
    r=4,  # LoRA 维数
    lora_alpha=8,  # ΔW 按 α / r 缩放
	target_modules=["", "", ...],  # 对哪些模块进行微调
    lora_dropout=0.1  # 默认值为 0
)
model = get_peft_model(preModel, peft_config)  # 预训练模型 -> 加好了 LoRA 之后的模型

参考资料: 【LoRA&CN全解析】, 【知乎高赞-大模型轻量级微调】

相关文章:

  • vsCode项目创建python虚拟环境
  • ECharts折线图源码合集1(共18个自定义图表),附视频讲解与代码下载
  • 深入理解 Hook 系统函数技术
  • Vala 编程语言教程-继承
  • 利用c#书写调用MVS书写的图片处理文件.sol
  • [C++开发经验总结]何时用push?/何时用emplace?
  • Flask项目部署:Flask + uWSGI + Nginx
  • 维智 Harmony NEXT 定位 SDK:鸿蒙生态下的空间智能应用实践
  • 软件兼容性测试的矩阵爆炸问题有哪些解决方案
  • Unity UGUI - 六大基础组件
  • GNSS数据说明-RTCM
  • 简单谈谈很火的MCP( Model Context Protocol,模型上下文协议)
  • 【Sql Server】在SQL Server中生成雪花ID(Snowflake ID)
  • HarmonyOS NEXT状态管理实践
  • Yolo_v8的安装测试
  • 以太坊主网 PoS 节点搭建指南
  • 天锐蓝盾终端安全防护——企业终端设备安全管控
  • 如何让 history 记录命令执行时间?Linux/macOS 终端时间戳设置指南
  • 嵌入式linux系统中对应的文件锁详细实现方法
  • AI-人工智能-实现将静态图片和视频合成为类似iPhone的Live Photo(动态照片)效果
  • 微信公众平台微网站开发/化工网站关键词优化
  • 媒体查询做响应式网站有哪些/恢复2345网址导航
  • 做动态网站用哪个程序软件比较简单/怎么在百度上推广产品
  • 网站路径改版如何做301重定向/黑帽seo优化
  • 手机网站开发怎么收费/优秀的营销策划案例
  • 武汉微网站/宣传推广计划怎么写