当前位置: 首页 > news >正文

使用llamafactory对模型进行微调

准备

安装llamafactory

  • 强烈建议在linux系统上安装,windows上对pytorch支持不是很好
  • 下载源码
git clone https://github.com/hiyouga/LLaMA-Factory.git
  • 安装依赖

可以根据个人需要创建虚拟环境

pip install -r requirements.txt

启动客户端

llamafactory-cli webui
  • 客户端如果能正常启动,且可以访问http://ip:7860/,说明安装成功

选取基础模型

根据训练的目的和使用场景选择基础模型
我这里选择的是qwen3:14b

准备训练数据

我打算训练一个直播弹幕回复的模型,于是我收集了特定领域主播对弹幕回复的内容,然后整理成指定的格式

[{"instruction": "你叫抖音白酒带货主播,语气亲切、有节奏;必须合规、真实、不过度承诺。","input": "这个52度的酒12瓶只要109.99,67度的148.99,直播间里的价格真的靠谱吗?","output": "便宜吧老板,52度的到手12瓶,今天只需要109.9967度的到手12瓶,今天只需要148.99,我的天老板这个价格太便宜了,low到底了,快递费我都挣不回,我给你发的呢是12瓶,加量不加价,你算算咱直播间这账啊,42度的合下来一瓶8块多,52度合下来一瓶9块多,你对比一下原价一瓶差了30块钱。"}...]

注册数据集

  • 把数据集放到llamafactory目录的data位置
  • 修改data目录下dataset_info.json文件,把准备好的文件信息追加进去
"live_script":{ # 训练集名,只要不与其他的名称重复就行"file_name":"live_script.json" # 数据集文件名}

开始训练

打开webui页面(http://ip:7860/)

在这里插入图片描述
按照上面配置即可
验证比例我但是设置的是0.15,对于小训练集1000左右的数据量,验证集设置为100以上即可,其他内容可以适当调整,具体根据训练结果进行调整。现在默认的配置是通用配置

  • 点击开始即可
  • 训练好的结果将放过在saves目录下注意查看在这里插入图片描述

效果验证

训练完成后,可以通过加载检查点然后chat对话查看训练结果
在这里插入图片描述

如果发现训练的结果不理想,可以重新调整参数进行训练

  • 详细说明见 https://www.bilibili.com/video/BV1djgRzxEts?vd_source=5c3b83d1d90b9e3b9f0107b2173d291f&spm_id_from=333.788.videopod.sections&p=6
http://www.dtcms.com/a/355055.html

相关文章:

  • 软考-系统架构设计师 决策支持系统(DSS)详细讲解
  • 滤波算法作用
  • Redis高性能数据库讲解与实战指南
  • 文件系统挂载详细分析(《图解Linux内核》虚拟文件系统篇笔记三)
  • [机械结构设计-48]:机械工程师的岗位要求
  • ArkUI框架之promptAction弹窗
  • 安卓开发---BLE通信
  • 基于STM32单片机的车牌识别设计
  • clcd土地利用数据分类
  • Tree Shaking原理
  • SOME/IP-SD事件组订阅
  • 昆泰芯离轴应用技术与产业链协同助力机器人关节产业实现技术突破
  • TDengine 数据订阅支持 MQTT 协议用户手册
  • 本地消息表实现分布式事务保证最终一致性
  • Java框架搭建实用开发
  • DPIN亮相DePIN Expo 2025,定义“DePIN 2.0”企业级应用新范式
  • Linux中Java后端调用外部进程 未处理后台输出流 导致io阻塞问题解决方法
  • K8S架构与组件完全解析
  • Baselight 携手 Walrus 激活链上数据价值,打造无需许可的数据中
  • LeetCode热题100--98. 验证二叉搜索树--中等
  • QT 概述(背景介绍、搭建开发环境、Qt Creator、程序、项目文件解析、编程注意事项)
  • Fortran快速排序算法实现与优化
  • Web安全:深入理解User-Agent报头注入与防御
  • 从CTFshow-pwn入门-pwn43理解栈溢出到底跳转call还是plt
  • 网络安全测试(一)Kali Linux
  • PyTorch实战(3)——PyTorch vs. TensorFlow详解
  • 网络安全设备监控指标
  • jvm锁优化
  • MiniCPM-V 4.5 vs MiniCPM-V 2.6 深度对比分析
  • claude code helper for vscode