llama_factory 安装以及大模型微调
1、安装虚拟环境
conda create -n llamafactory python==3.12
source activate llamafactory
2、安装llama_factory
下载: git clone https://github.com/hiyouga/LLaMA-Factory.git
到 LLaMA-Factory 目录运行安装命令
cd LLaMA-Factory
pip install -e .
打开LLaMA-Factory UI页面:
llamafactory-cli webui
3、数据集准备
在下载 的 LLaMA-factory 目录中,data中新增或修改数据集、dataset_info.json中配置数据集
4、模型的微调和验证
我使用的 vscode 的 Remote - SSH 插件,打开 webui 页面后自动打开页面,在页面进行微调、无需写代码
点 开始后就开始训练,当损失不再降低时即可中断训练,中断后点 开始 可继续训练
5、模型效果验证
在训练模型时设置的保存间隔是100,所以每100个批次就会就会生成一个检查点。
点 chat 进入聊天页面,粘贴一个检查点的绝对路径,然后再下面的聊天窗口中检查训练效果。
6、模型的导出
检验检查点没问题后将 原模型和训练的检查点 导出成一个新的模型,新的模型就包含了训练的检查点功能
7、验证导出的新模型
在chat 中,选择新模型、清空检查点,可以看到模型是微调后的效果