当前位置：首页 > news >正文

LLaMA Factory微调大模型

news 2025/11/12 9:32:12

本文使用的环境：linux、无网离线环境

一、环境配置

1. 代码下载

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

2. 依赖安装

cd LLaMA-Factory
pip install -e ".[torch,metrics]" 
# pip install -e .

.[torch,metrics]是可选依赖包，如果环境中包含了这些依赖包，就不用安装
setup.py中可以查看有哪些依赖选项
requirements.txt是必须要安装的依赖
离线环境中可以pip download xxx下载编译好的whl包进行离线安装

3.验证

llamafactory-cli version

安装成功后会输出版本号

二、运行

LLaMA Factory有web页面，也可以命令行运行。web页面的本质是图形化设置各项训练参数，生成训练命令进行执行。

1. 启动web页面

llamafactory-cli webui

如果是多卡环境，要注意之间的通信内存是多大，如果内存很小，多卡训练是会报错的
指定一张卡进行训练用该命令启动webui：FORCE_TORCHRUN=2 CUDA_VISIBLE_DEVICES=0，1 llamafactory-cli webui

2.设置预训练模型

在这里插入图片描述

模型名称：预训练模型名称，会从指定的模型下载源下载该模型。
如果是本地的预训练模型，将模型名称设置为Custom，然后在模型路径处设置本地模型的相对路径。

3.设置数据集

使用自己的数据集需要现在dataset_info.json中添加数据集描述，然后将该数据集放到data目录。
在dataset_info.json中配置好后，数据集路径选择data，数据集中就可以看到添加的数据集名称了。
对话模板要选择和自己数据集类型匹配的（Alpaca、ShareGPT等）

4.训练参数设置

可以直接在面板中设置LoRA参数、训练超参数、训练过程参数、硬件配置相关等。

5.模型输出位置

设置输出目录，保存在项目的saves文件夹中。
在这里插入图片描述

6.模型评估和验证

加载测试数据集进行模型评估，需要设置好数据集路径，这个test数据集也需要在dataset_info.json中添加
加载模型进行对话，先加载，再对话

7.导出模型

设置好参数直接导出
在这里插入图片描述

查看全文

http://www.dtcms.com/a/597834.html

UaGateway构建高可用OPC UA架构：实现冗余通信与数据聚合

Linux之vmlinux文件段布局和arm64 的链接脚本vmlinux.lds.S分析

C#6、三种主要的错误类型是什么

使用Selenium进行网页自动化

论坛网站建设推广优化wordpress主题下载资源

网站推广文章范例在哪里查企业信息最准确

MCP驱动的Rgentic RRG（向量数据库+网络搜索）

网站漏洞怎么修复上海劳务市场招聘信息查询

异常的分类

做时时网站要多少钱用虚拟机做网站服务器

任性动图教程2 -如何让诗词生成动图

零基础学JAVA--Day29( StringBuffer+ StringBuilder)

做源码演示的网站果洛wap网站建设多少钱

Zabbix7设置告警邮件提醒

【九、Linux访问网络附加存储】

网站模块分析枣庄有做网站的吗

记事本做网站怎么改字体出入合肥最新通知今天

网站建设与管理任务分工可做网站的免费空间

常见的自动化测试框架有哪些？（Selenium、Appium、Cypress等）

做彩票网站多少钱网站建设道冲

从C++开始的编程生活（12）——vector简单介绍和迭代器

【MySQL | 基础】DQL

为什么Redis不支持回滚

中航网站建设国家icp备案网站

中国室内设计联盟官方网站入口360建筑网怎么重新注册

专业网站制作企业公司网站的制作公司

深入理解Java泛型：类型擦除、通配符PECS原则与实践

Supabase 适用场景全解析：从原型到生产的落地指南

moodle网站建设自己做网站如何盈利

网络建站网网络推广中国建设网官方网站电子银行