当前位置: 首页 > news >正文

llama_factory 安装以及大模型微调

1、安装虚拟环境

        conda create -n llamafactory python==3.12

        source activate llamafactory

2、安装llama_factory

       下载: git clone https://github.com/hiyouga/LLaMA-Factory.git 

        到 LLaMA-Factory 目录运行安装命令

                cd LLaMA-Factory

                pip install -e .

         打开LLaMA-Factory UI页面:

             llamafactory-cli webui

3、数据集准备

        在下载 的 LLaMA-factory 目录中,data中新增或修改数据集、dataset_info.json中配置数据集

      

4、模型的微调和验证

       我使用的 vscode 的 Remote - SSH 插件,打开 webui 页面后自动打开页面,在页面进行微调、无需写代码

       

            

    点 开始后就开始训练,当损失不再降低时即可中断训练,中断后点 开始 可继续训练

5、模型效果验证

      在训练模型时设置的保存间隔是100,所以每100个批次就会就会生成一个检查点。

      点 chat 进入聊天页面,粘贴一个检查点的绝对路径,然后再下面的聊天窗口中检查训练效果。

  

6、模型的导出

      检验检查点没问题后将 原模型和训练的检查点 导出成一个新的模型,新的模型就包含了训练的检查点功能

7、验证导出的新模型

      在chat 中,选择新模型、清空检查点,可以看到模型是微调后的效果


文章转载自:

http://GDk7Ym25.nhpgm.cn
http://ibfXr54I.nhpgm.cn
http://J4IybUkV.nhpgm.cn
http://50Xp2E0L.nhpgm.cn
http://8crJCfFN.nhpgm.cn
http://bmSg8Y0E.nhpgm.cn
http://Z1t11q9Z.nhpgm.cn
http://nPoVVBFk.nhpgm.cn
http://vSUHc6Mu.nhpgm.cn
http://utVvyB1X.nhpgm.cn
http://6Z6QwEdr.nhpgm.cn
http://HIUFubju.nhpgm.cn
http://SF2LKOLq.nhpgm.cn
http://KuGcke5e.nhpgm.cn
http://tAKKXyU3.nhpgm.cn
http://yxI50rIx.nhpgm.cn
http://mmLSN7JW.nhpgm.cn
http://uwA6DFPC.nhpgm.cn
http://rweHdJz1.nhpgm.cn
http://nJNmUABg.nhpgm.cn
http://t4P2Unsk.nhpgm.cn
http://NnWTJ1Qr.nhpgm.cn
http://2c2Q6RA9.nhpgm.cn
http://RtnTyj32.nhpgm.cn
http://QyZHtlu5.nhpgm.cn
http://A8DAWjpS.nhpgm.cn
http://vs53TzCp.nhpgm.cn
http://jFX5U0lq.nhpgm.cn
http://R0vcJGrK.nhpgm.cn
http://SCyFPJr5.nhpgm.cn
http://www.dtcms.com/a/371738.html

相关文章:

  • Linux | i.MX6ULL 搭建 Web 服务器(第二十章)
  • 量子電腦組裝之三
  • 适配器详细
  • GD32自学笔记:5.定时器中断
  • 前端三件套简单学习:HTML篇1
  • Android --- SystemUI 导入Android Studio及debug
  • 服务器为什么会选择暴雨?
  • Spring Boot + Apache Tika 从文件或文件流中提取文本内容
  • day26|学习前端之算法学习
  • 数据结构之二叉树(2)
  • Mac设置中的安全性缺少“任何来源”
  • 样式化你的 Next.js 应用:CSS 模块、Tailwind CSS 和全局样式
  • Qwen2.5-VL技术详解
  • Claude code 使用笔记
  • FPGA学习笔记——SDR SDRAM的读写(不调用IP核版)
  • C++ 常见面试题汇总
  • cifar10分类对比:使用PyTorch卷积神经网络和SVM
  • 2025算法八股——机器学习——SVM损失函数
  • kafka特性和原理
  • webpack和vite优化方案都有哪些
  • Unity UI 中最干净的点击区域实现:RaycastZone 完整实战讲解
  • Java开发环境配置入门指南
  • lua中table键类型及lua中table的初始化有几种方式
  • 【CMake】缓存变量
  • Flink NetworkBufferPool核心原理解析
  • python数据可视化之Matplotlib(8)-Matplotlib样式系统深度解析:从入门到企业级应用
  • Recharts:React图表库,组件化设计助力高效数据可视化开发
  • Linux知识清单
  • SpringMVC 入门详解: MVC 思想(附核心流程)
  • CMake简易使用教程