当前位置：首页 > news >正文

unsloth笔记：基本介绍

news 2025/9/6 5:51:55

更快的速度、更省的内存训练、运行、评估大模型

1 支持的模型

All Our Models | Unsloth Documentation

1.1 Dynamic GGUF/instruct 4-bit

llama.cpp使用的新模型格式，专为高效、本地推理设计
注：GGUF无法微调
- 只保留推理所需的内容，如量化后的权重、推理元信息
- 不包含训练所需的梯度结构、参数层名、优化器状态
- 不支持反向传播
- 通常是 4-bit 静态量化，已经丢失了训练精度所需的权重信息
Instruct 4-bit (safetensors)
- Instruct：代表模型是指令微调（Instruction-Tuned）版本，即已经训练过能更好理解指令/对话任务
- 4-bit：表示该模型已经被4-bit 量化（通常用于 QLoRA），显著降低了显存需求。
- safetensors：是一种更安全的模型文件格式（相对 .bin），支持高效加载、避免执行恶意代码。
- 可直接用于低成本推理或继续进行LoRA / QLoRA 微调

1.1.1 deepseek家族

1.1.2 llama家族

1.1.3 gemma家族

1.1.4 Qwen家族

1.1.5 mistral家族

1.1.6 Phi家族

1.1.7 其他

1.2 16-bit and 8-bit Instruct

基本上instruct 4-bit的有的这边都有

也可用于推理和微调，区别主要在于精度和资源消耗

1.3 Base 4 + 16-bit

未经过指令微调的模型的4-bit和16-bit量化版本

1.3.1 llama家族

1.3.2 qwen家族

1.3.3 gemma 家族

1.3.4 Mistral家族

1.4 unsloth版本模型命名后缀说明

unsloth-bnb-4bit	Unsloth 的动态 4bit 量化模型，精度更高，占用略多显存
bnb-4bit	普通 BitsAndBytes 4bit 量化模型
无后缀	原始模型（16/8bit）

2 可调参数推荐

max_seq_length	下文长度，Llama-3 支持到 8192，但建议先用 2048 测试
dtype	默认None，若使用新 GPU 可设为 torch.float16 或 bfloat16
load_in_4bit	启用 QLoRA，减少 4 倍显存消耗 QLoRA 的准确性如今已经接近甚至超过 LoRA，建议默认使用
full_finetuning	若设为 True，则执行全参数微调（不推荐）

3 选择instruct模型还是base模型

数据量情况	推荐选择	说明
超过 1000 行	Base 模型	数据量充足，能充分训练出新行为
300–1000 行高质量数据	Base 或 Instruct	视任务而定，两者都可以
少于 300 行	Instruct 模型	小样本建议保留已有指令能力，仅做轻微定制

任务明确 + 数据少 → 用 Instruct 模型做轻微定制即可
任务复杂 / 数据多 → 从 Base 模型开始训练，得到效果更稳的定制模型

文章转载自：

http://HdyVngtk.tbjtm.cn
http://HQpXbzwy.tbjtm.cn
http://2wn8j2rI.tbjtm.cn
http://VbhKWxtR.tbjtm.cn
http://f8CrW5xP.tbjtm.cn
http://pXn5VOwF.tbjtm.cn
http://RMwpmj3a.tbjtm.cn
http://zRBgHSjR.tbjtm.cn
http://RMpfsfFG.tbjtm.cn
http://wEtl8tE8.tbjtm.cn
http://5CiKGEdT.tbjtm.cn
http://PXOkeuli.tbjtm.cn
http://b0IkXhJr.tbjtm.cn
http://zPZhpK6K.tbjtm.cn
http://tcdLWE0s.tbjtm.cn
http://tvYwAn4R.tbjtm.cn
http://InUNqvtv.tbjtm.cn
http://JEqa1fuF.tbjtm.cn
http://Cq5sNnR7.tbjtm.cn
http://KQNaCDdm.tbjtm.cn
http://c0Gc6Gpf.tbjtm.cn
http://DOOoQxb8.tbjtm.cn
http://xc1dqpGD.tbjtm.cn
http://b5bPHMop.tbjtm.cn
http://QsZpjSEY.tbjtm.cn
http://yXhBUNil.tbjtm.cn
http://JmD50y2J.tbjtm.cn
http://ySy3IgqD.tbjtm.cn
http://YHYgDXHA.tbjtm.cn
http://qwuHp2wm.tbjtm.cn

http://www.dtcms.com/a/368025.html

相关文章：

Boost搜索引擎查找并去重(3)

耐达讯自动化RS485与Profinet双向奔赴，伺服驱动器连接“稳稳拿捏”

AI架构的演进，从单体架构到云原生架构

LangChain实战（十七）：构建与PDF/PPT文档对话的AI助手

Android14 init启动Zygote详解

vue3+ts导出PDF

最新PDF版本！Acrobat Pro DC 2025，解压即用版

jodconverter将word转pdf底层libreoffice的问题

SQL与数据库笔记

自动化流水线

嘎嘎厉害！耐达讯自动化RS485转Profinet网关就是食品温控的“天选之子”

Python图像处理基础（十六）

LangChain: Memory

Linux Zero-Copy 技术深度分析

【完整源码+数据集+部署教程】雪崩检测与分类图像分割系统源码和数据集：改进yolo11-HSFPN

源雀SCRM开源：企微文件防泄密

大模型赋能电子制造全生命周期质量管理的应用及实践

三坐标测量机在汽车制造行业中的应用

中小企业数字化转型卡在哪？选对AI工具+用好企业微信，人力成本直降70%

通用虚拟示教器：让机器人教学像玩游戏一样简单

记录下chatgpt的openai 开发过程

从0开始学习Java+AI知识点总结-30.前端web开发(JS+Vue+Ajax)

mysql进阶语法（视图）

从Java全栈到云原生：一场技术深度对话

React学习教程，从入门到精通， React 新创建组件语法知识点及案例代码(11）

从零开始的python学习——字典

windows安装flash-attn记录

threeJS 实现开花的效果

【数字孪生核心技术】数字孪生有哪些核心技术？

Leetcode—2749. 得到整数零需要执行的最少操作数【中等】（__builtin_popcountl）