当前位置: 首页 > news >正文

pytorch 52 基于SVD从全量训练模型中提取lora模型

从全量训练模型中提取 LoRA(Low-Rank Adaptation)模型,核心是分离全量模型中 “预训练基础参数” 与 “LoRA 新增的低秩适配参数”—— 本质是逆向还原 LoRA 的训练逻辑(即全量模型参数 = 预训练基础参数 + LoRA 低秩矩阵乘积)。实现该操作有两个目的:
1、lora训练的效果是不如全参数训练的,但全参数训练的模型在部署热切换时比较耗时,故需要针对全量微调后的模型,在基模的基准上,提取出lora模型;
2、在AIGC领域,大家都基于lora模型实现模型能力切换,但有些库只发布了全量模型,没有提供lora模型,这不利于部署测试。

本博文以wan1.3b t2v self_forcing_dmd模型为全量训练的模型
在这里插入图片描述
以 Wan2_1-T2V-1_3B_bf16 为原始模型,进行lora模型提取
在这里插入图片描述

<

http://www.dtcms.com/a/438364.html

相关文章:

  • Process Monitor 学习笔记(5.7):长时间运行追踪与日志体积控制
  • 深入解析需求变更:从本质认知到实践指南
  • 商城网站建设的步骤网络设计教程
  • Day 30 - 错误、异常与 JSON 数据 - Python学习笔记
  • 吴恩达机器学习笔记(10)—支持向量机
  • 电商网站建设与运行xd网页设计教程
  • 基于websocket的多用户网页五子棋(四)
  • 深入浅出 C++20 协程
  • 想做个小网站怎么做主机壳 安装wordpress
  • 永兴县网站建设专业山东省城乡建设厅官网
  • ip prefix-list(IP前缀列表)概念及题目
  • [工作流节点9] 删除记录节点的风险与使用规范 —— 明道云工作流数据清理实战指南
  • 做网站推广的销售怎么打电话如何做网站发产品销售
  • MongoDB GEO 项目场景 ms-scope 实战
  • 医美三方网站怎么做网站外链建设可以提升网站
  • 在算法比赛中高效处理多行输入
  • MySQL 管理与配置详解:从安装到架构解析
  • 构建工具webpack
  • 深入理解 Rust 的内存模型:变量、值与指针
  • 单位网站备案要等多久湖南住建云网站
  • 浦口区网站建设售后服务有没有做卡商的网站
  • 可达鸭模拟赛1
  • LINUX复习资料(一)
  • 专业做酒的网站有哪些互联网营销培训班 考证
  • 串扰09-Er与串扰
  • HarmonyOS应用开发深度解析:ArkTS语法与组件化开发实践
  • 免费的简历制作网站100大看免费行情的软件
  • seo站内优化站外优化vs做网站如何输出
  • 【学习K230-例程43】GT6700-AI视觉-人体关键点检测
  • 网站域名所有权wordpress文章截断