当前位置: 首页 > news >正文

LoRA至今历程回顾(74)

LoRA至今历程回顾

    • 使用模型已有的模板
    • LoRA至今历程
    • PEFT 模型

使用模型已有的模板

如果某个模型是使用特定模板训练或微调的,那么若你想在该模型上进行推理,就必须使用完全相同的模板。

若你正在进行微调,在绝对必要的情况下,或许可以使用不同的模板,但通常而言,继续使用模型已熟悉的模板会是更优选择。无需重复造轮子。

LoRA至今历程

在上一课中,我们为已完成量化的模型添加了低秩适配器(Low-rank adapters)。通常情况下,模型会以 FP16(16 位浮点数)精度加载非量化层,但为便于后续训练,最好将层归一化(layer norms)等层转换为 FP32(32 位浮点数)精度(此操作由prepare_model_for_kbit_training()函数完成)。

适配器本身的秩(rank)配置为 8 到 32 之间的不同数值,且 alpha 值(缩放系数)设定为秩的两倍。

在最终的 PEFT 模型中,默认仅适配器可参与训练;除非在配置中通过modules_to_save参数指定其他可训练模块。

PEFT 模型

以下是我们的 PEFT 模型:

 # From Session 2
2 supported = torch
http://www.dtcms.com/a/363868.html

相关文章:

  • 9.2C++——匿名对象、友元、常成员函数和常对象、运算符重载
  • 【72页PPT】企业供应链计划管理APS及运输管理OTM一体化解决方案(附下载方式)
  • 急招 MySQL / PG DBA,欢迎自荐或推荐朋友!推荐有奖!
  • GAN 网络的核心功能与深度解析
  • C语言:归并排序和计数排序
  • 从面试实战看Java技术栈深度:一个程序员的进阶之路
  • [邮件服务器core] doc www | 安装与构建
  • 前端开发中经常提到的iframe、DOM是什么?
  • 【ComfyUI】SDXL Turbo一步完成高速高效的图像生成
  • Linux - 进程切换
  • 前端sdk相关技术汇总
  • ZabbixWatch运维监控大屏
  • spring boot 整合AI教程
  • vscode无法复制terminal信息
  • 【论文阅读】Neuro-Symbolic Integration Brings Causal and Reliable Reasoning Proofs
  • 进程优先级(Process Priority)
  • Android的USB通信 (AOA Android开放配件协议)
  • 深度优先 一直往一个方向走,可用递归或者栈实现
  • 电子电子技术知识------MOSFET管
  • 【Kubernetes】知识点2
  • 深入解析Linux进程概念与操作系统核心
  • 嵌入式系统与51单片机全解析
  • 3.ImGui-窗体
  • 大模型推理加速深度对比:vLLM vs TensorRT-LLM vs ONNX Runtime,谁是生产环境最优解?
  • 【智能体开发】怎样提升AI智能体的运行速度?
  • 重新审视信任基石:公网IP证书对网络安全生态的影响
  • 多态——面向对象编程的 “灵活密码”
  • p049基于Flask的医疗预约与诊断系统
  • Linux 安装docker-compose安装方法(安装docker compose安装)
  • Android Activity 任务栈详解