当前位置：首页 > news >正文

llama_factory 安装以及大模型微调

news 2025/9/9 7:40:11

1、安装虚拟环境

conda create -n llamafactory python==3.12

source activate llamafactory

2、安装llama_factory

下载： git clone https://github.com/hiyouga/LLaMA-Factory.git

到 LLaMA-Factory 目录运行安装命令

cd LLaMA-Factory

pip install -e .

打开LLaMA-Factory UI页面：

llamafactory-cli webui

3、数据集准备

在下载的 LLaMA-factory 目录中，data中新增或修改数据集、dataset_info.json中配置数据集

4、模型的微调和验证

我使用的 vscode 的 Remote - SSH 插件，打开 webui 页面后自动打开页面，在页面进行微调、无需写代码

点开始后就开始训练，当损失不再降低时即可中断训练，中断后点开始可继续训练

5、模型效果验证

在训练模型时设置的保存间隔是100，所以每100个批次就会就会生成一个检查点。

点 chat 进入聊天页面，粘贴一个检查点的绝对路径，然后再下面的聊天窗口中检查训练效果。

6、模型的导出

检验检查点没问题后将原模型和训练的检查点导出成一个新的模型，新的模型就包含了训练的检查点功能

7、验证导出的新模型

在chat 中，选择新模型、清空检查点，可以看到模型是微调后的效果

文章转载自：

http://GDk7Ym25.nhpgm.cn
http://ibfXr54I.nhpgm.cn
http://J4IybUkV.nhpgm.cn
http://50Xp2E0L.nhpgm.cn
http://8crJCfFN.nhpgm.cn
http://bmSg8Y0E.nhpgm.cn
http://Z1t11q9Z.nhpgm.cn
http://nPoVVBFk.nhpgm.cn
http://vSUHc6Mu.nhpgm.cn
http://utVvyB1X.nhpgm.cn
http://6Z6QwEdr.nhpgm.cn
http://HIUFubju.nhpgm.cn
http://SF2LKOLq.nhpgm.cn
http://KuGcke5e.nhpgm.cn
http://tAKKXyU3.nhpgm.cn
http://yxI50rIx.nhpgm.cn
http://mmLSN7JW.nhpgm.cn
http://uwA6DFPC.nhpgm.cn
http://rweHdJz1.nhpgm.cn
http://nJNmUABg.nhpgm.cn
http://t4P2Unsk.nhpgm.cn
http://NnWTJ1Qr.nhpgm.cn
http://2c2Q6RA9.nhpgm.cn
http://RtnTyj32.nhpgm.cn
http://QyZHtlu5.nhpgm.cn
http://A8DAWjpS.nhpgm.cn
http://vs53TzCp.nhpgm.cn
http://jFX5U0lq.nhpgm.cn
http://R0vcJGrK.nhpgm.cn
http://SCyFPJr5.nhpgm.cn

查看全文

http://www.dtcms.com/a/371738.html

Linux | i.MX6ULL 搭建 Web 服务器（第二十章）

量子電腦組裝之三

适配器详细

GD32自学笔记：5.定时器中断

前端三件套简单学习：HTML篇1

Android --- SystemUI 导入Android Studio及debug

服务器为什么会选择暴雨？

Spring Boot + Apache Tika 从文件或文件流中提取文本内容

day26｜学习前端之算法学习

数据结构之二叉树（2）

Mac设置中的安全性缺少“任何来源”

样式化你的 Next.js 应用：CSS 模块、Tailwind CSS 和全局样式

Qwen2.5-VL技术详解

Claude code 使用笔记

FPGA学习笔记——SDR SDRAM的读写（不调用IP核版）

C++ 常见面试题汇总

cifar10分类对比:使用PyTorch卷积神经网络和SVM

2025算法八股——机器学习——SVM损失函数

kafka特性和原理

webpack和vite优化方案都有哪些

Unity UI 中最干净的点击区域实现：RaycastZone 完整实战讲解

Java开发环境配置入门指南

lua中table键类型及lua中table的初始化有几种方式

【CMake】缓存变量

Flink NetworkBufferPool核心原理解析

python数据可视化之Matplotlib(8)-Matplotlib样式系统深度解析：从入门到企业级应用

Recharts：React图表库，组件化设计助力高效数据可视化开发

Linux知识清单

SpringMVC 入门详解： MVC 思想（附核心流程）

CMake简易使用教程