当前位置: 首页 > news >正文

unsloth笔记:基本介绍

更快的速度、更省的内存训练、运行、评估大模型

1 支持的模型

All Our Models | Unsloth Documentation

1.1 Dynamic GGUF/instruct 4-bit

  • llama.cpp使用的新模型格式,专为高效、本地推理设计
  • 注:GGUF无法微调
    • 只保留推理所需的内容,如量化后的权重、推理元信息
    • 不包含训练所需的梯度结构、参数层名、优化器状态

    • 不支持反向传播

    • 通常是 4-bit 静态量化,已经丢失了训练精度所需的权重信息

  • Instruct 4-bit (safetensors)

    • Instruct:代表模型是指令微调(Instruction-Tuned)版本,即已经训练过能更好理解指令/对话任务

    • 4-bit:表示该模型已经被4-bit 量化(通常用于 QLoRA),显著降低了显存需求。

    • safetensors:是一种更安全的模型文件格式(相对 .bin),支持高效加载、避免执行恶意代码。

    • 可直接用于低成本推理或继续进行LoRA / QLoRA 微调

1.1.1 deepseek家族

1.1.2 llama家族

1.1.3 gemma家族

1.1.4 Qwen家族

1.1.5 mistral家族

1.1.6 Phi家族

1.1.7 其他

1.2 16-bit and 8-bit Instruct

基本上instruct 4-bit的有的这边都有

也可用于推理和微调,区别主要在于精度和资源消耗

1.3  Base 4 + 16-bit

未经过指令微调的模型的4-bit和16-bit量化版本

1.3.1 llama家族

1.3.2 qwen家族

1.3.3 gemma 家族

1.3.4 Mistral家族

1.4 unsloth版本模型命名后缀说明

unsloth-bnb-4bitUnsloth 的动态 4bit 量化模型,精度更高,占用略多显存
bnb-4bit普通 BitsAndBytes 4bit 量化模型
无后缀原始模型(16/8bit)

2 可调参数推荐

max_seq_length下文长度,Llama-3 支持到 8192,但建议先用 2048 测试
dtype 默认None,若使用新 GPU 可设为 torch.float16 或 bfloat16
load_in_4bit

启用 QLoRA,减少 4 倍显存消耗

QLoRA 的准确性如今已经接近甚至超过 LoRA,建议默认使用

full_finetuning若设为 True,则执行全参数微调(不推荐)

3 选择instruct模型还是base模型

数据量情况推荐选择说明
超过 1000 行Base 模型数据量充足,能充分训练出新行为
300–1000 行高质量数据Base 或 Instruct视任务而定,两者都可以
少于 300 行Instruct 模型小样本建议保留已有指令能力,仅做轻微定制
  • 任务明确 + 数据少 → 用 Instruct 模型做轻微定制即可

  • 任务复杂 / 数据多 → 从 Base 模型开始训练,得到效果更稳的定制模型


文章转载自:

http://HdyVngtk.tbjtm.cn
http://HQpXbzwy.tbjtm.cn
http://2wn8j2rI.tbjtm.cn
http://VbhKWxtR.tbjtm.cn
http://f8CrW5xP.tbjtm.cn
http://pXn5VOwF.tbjtm.cn
http://RMwpmj3a.tbjtm.cn
http://zRBgHSjR.tbjtm.cn
http://RMpfsfFG.tbjtm.cn
http://wEtl8tE8.tbjtm.cn
http://5CiKGEdT.tbjtm.cn
http://PXOkeuli.tbjtm.cn
http://b0IkXhJr.tbjtm.cn
http://zPZhpK6K.tbjtm.cn
http://tcdLWE0s.tbjtm.cn
http://tvYwAn4R.tbjtm.cn
http://InUNqvtv.tbjtm.cn
http://JEqa1fuF.tbjtm.cn
http://Cq5sNnR7.tbjtm.cn
http://KQNaCDdm.tbjtm.cn
http://c0Gc6Gpf.tbjtm.cn
http://DOOoQxb8.tbjtm.cn
http://xc1dqpGD.tbjtm.cn
http://b5bPHMop.tbjtm.cn
http://QsZpjSEY.tbjtm.cn
http://yXhBUNil.tbjtm.cn
http://JmD50y2J.tbjtm.cn
http://ySy3IgqD.tbjtm.cn
http://YHYgDXHA.tbjtm.cn
http://qwuHp2wm.tbjtm.cn
http://www.dtcms.com/a/368025.html

相关文章:

  • Boost搜索引擎 查找并去重(3)
  • 耐达讯自动化RS485与Profinet双向奔赴,伺服驱动器连接“稳稳拿捏”
  • AI架构的演进,从单体架构到云原生架构
  • LangChain实战(十七):构建与PDF/PPT文档对话的AI助手
  • Android14 init启动Zygote详解
  • vue3+ts导出PDF
  • 最新PDF版本!Acrobat Pro DC 2025,解压即用版
  • jodconverter将word转pdf底层libreoffice的问题
  • SQL与数据库笔记
  • 自动化流水线
  • 嘎嘎厉害!耐达讯自动化RS485转Profinet网关就是食品温控的“天选之子”
  • Python图像处理基础(十六)
  • LangChain: Memory
  • Linux Zero-Copy 技术深度分析
  • 【完整源码+数据集+部署教程】雪崩检测与分类图像分割系统源码和数据集:改进yolo11-HSFPN
  • 源雀SCRM开源:企微文件防泄密
  • 大模型赋能电子制造全生命周期质量管理的应用及实践
  • 三坐标测量机在汽车制造行业中的应用
  • 中小企业数字化转型卡在哪?选对AI工具+用好企业微信,人力成本直降70%
  • 通用虚拟示教器:让机器人教学像玩游戏一样简单
  • 记录下chatgpt的openai 开发过程
  • 从0开始学习Java+AI知识点总结-30.前端web开发(JS+Vue+Ajax)
  • mysql进阶语法(视图)
  • 从Java全栈到云原生:一场技术深度对话
  • React学习教程,从入门到精通, React 新创建组件语法知识点及案例代码(11)
  • 从零开始的python学习——字典
  • windows安装flash-attn记录
  • threeJS 实现开花的效果
  • 【数字孪生核心技术】数字孪生有哪些核心技术?
  • Leetcode—2749. 得到整数零需要执行的最少操作数【中等】(__builtin_popcountl)