当前位置：首页 > news >正文

【自然语言处理与大模型】使用Xtuner进行QLoRA微调实操

news 2025/7/3 8:52:51

本文首先对Xtuner这一微调框架进行简单的介绍。手把手演示如何使用Xtuner对模型进行微调训练，包括数据准备、训练命令执行及训练过程中的监控技巧。最后，在完成微调之后，本文还将介绍如何对微调结果进行简单对话测试。

一、Xtuner微调框架

XTuner 是一个功能强大、易于使用的大模型微调工具，其特点在于低成本、高效率和硬件友好性。通过支持分布式训练，支持LoRA与QLoRA和众多开源模型，XTuner 为开发者提供了灵活的微调解决方案，适用于广泛的实际应用场景。

【注】关于它和llamafactory的对比我认为没必要只用一个框架，如果这个解决不了就用另一个。

二、QLoRA微调实操

（1）快速安装

方法一：通过pip安装

# 先创建一个专属的conda虚拟环境
conda create -n xtuner python=3.10
# 激活进入
conda activate xtuner
# 安装xtuner库
pip install xtuner

【注】如果activate进入不了，就先执行conda init然后关掉终端，重新打开就行了。

方法二：从源码可编辑模式安装

# 先创建一个专属的conda虚拟环境
conda create -n xtuner python=3.10
# 激活进入
conda activate xtuner
# 再去github上面下载源码
git clone https://github.com/InternLM/xtuner.git
# 必须进入源码路径
cd xtuner
# 再执行安装命令
pip install -e .

测试是否安装成功：xtuner list-cfg

xtuner list-cfg

（2）准备大模型

这里我们使用书生浦语2.5的1.8b模型，魔塔社区的链接给大家放在这里了：书生·浦语2.5-1.8B-对话

我们使用魔塔的SDK来下载模型，代码如下：

from modelscope import snapshot_download# 我一般会创建一个本地模型文件夹来存
model_dir = snapshot_download('Shanghai_AI_Laboratory/internlm2_5-1_8b-chat', cache_dir='./local_models')

如果报错找不到库，No module named 'modelscope'就去pip一下，很简单：

pip install modelscope

（3）准备数据集

在成功安装 XTuner 和下载好大模型后，便可以开始进行模型的微调。演示如何使用 XTuner，应用 QLoRA 算法在 Colorist 数据集上微调 internlm2_5-1_8b-chat。魔塔上的数据集链接我放在这里了：该数据集为，颜色建议-16进制，颜色数据集

使用git来下载数据集，命令如下：

git clone https://www.modelscope.cn/datasets/fanqiNO1/colors.git

（4）修改微调配置文件

XTuner 提供了多个开箱即用的配置文件，可以通过xtuner list-cfg查看，其实我建议可编辑模式安装就可以直接在文件夹里面看到这些配置文件了。微调配置文件是重点，我后续补充细节！先写到这里。马上回来~

查看全文

http://www.dtcms.com/a/168405.html

【AI面试准备】AI误判案例知识库优化方案

MySQL基础关键_005_DQL（四）

微信小程序

string--OJ1

[ Qt ] | 第一个Qt程序

安装深度环境anaconda+cuda+cudnn+pycharm＋qt＋MVS

kaggle人工智能竞赛：通过声纹识别生物种类

双链表详解

LeetCode[102]二叉树的层序遍历

铸铁平台厂家：确保测试环境的高稳定性是试验铁地板的使命

手机的数据楚门世界是如何推送的

数据结构与算法：图论——最短路径

经典算法石子合并问题

觅知解析计费系统重构版在线支付卡密充值多解析接口免授权无后门源码扶风二开

Android Framework学习二：Activity创建及View绘制流程

MyBatis 参数处理全解析

北极花生物调查：在探索自然的旅程中，让每一次观察都更具意义

Linux工作台文件操作命令全流程解析

基于Springboot+Vue3.0的前后端分离的个人旅游足迹可视化平台

如何打造液态金属终結者 T-1000：多代理系统的未来构想

【凑修电脑的小记录】vscode打不开

Mybatis中的一级二级缓存扫盲

一个读写excel的简单程序(golang)

IP 互联网协议

数字智慧方案5867丨智慧建造(BIM技术智慧工地)在施工阶段的实践与应用方案（90页PPT）（文末有下载方式）

GoFrame框架深度解析：grpool的优势、最佳实践与踩坑经验

html：table表格

十分钟用Docker搭建功能齐全的Poste.io邮件服务器

全感官交互革命：当 AI 大模型学会 “看、听、说、创”

lib和dll介绍和VS2019生成实例