AI大模型:(二)3.2 Llama-Factory微调训练deepseek-r1实践
目录
1.环境准备
2.模型下载
2.1.显存计算
2.2.存储计算
2.3.模型下载
3.Llama-Factory下载
4.数据准备
5.训练
5.1.Llama-Factory数据格式
5.2.配置外部数据集
5.3.运行Llama-Factory
5.4.UI界面配置
5.5.开始训练
5.6.评测
5.7.推理
5.8.导出模型
1.环境准备
我们使用python虚拟环境做隔离,防止包冲突:
python -m venv python_model # 创建名为python_model的虚拟环境
source python_model /bin/activate # 激活环境(Linux/macOS)python_model\Scripts\activate.bat # 激活环境 windows
2.模型下载
训练时选择模型大小,需要考虑gpu显存、模型存储(存储一般现在存储资源也不贵,也很大,一般都够):
2.1.显存计算
gpu显存计算公式:</