当前位置: 首页 > news >正文

LlamaFactory部署及模型微调【win10环境】

在这里插入图片描述

1.Llama-Factory简介

LLaMA-Factory,全称 Large Language Model Factory,旨在简化大模型的微调过程,帮助开发者快速适应特定任务需求,提升模型表现。它支持多种预训练模型和微调算法,适用于智能客服、语音识别、机器翻译等多种应用场景。

2.Llama-Factory部署

2.1.git克隆项目

git clone https://github.com/hiyouga/LLaMA-Factory

2.2.基础模块安装

pip install -e ".[torch,metrics]" -i  https://mirrors.aliyun.com/pypi/simple/

在这里插入图片描述

2.3.开启量化

pip install https://github.com/jllllll/bitsandbytes-windows-webui/releases/download/wheels/bitsandbytes-0.41.2.post2-py3-none-win_amd64.whl

2.4.开启FlashAttention-2

如果要在 Windows 平台上开启 FlashAttention-2,需要安装预编译的 flash-attn 库,支持 CUDA 12.1 到 12.2,请根据需求到 flash-attention 下载对应版本安装。

 pip install F:\11-X-AGI\python-whl\flash_attn-2.7.1.post1+cu124torch2.3.1cxx11abiFALSE-cp310-cp310-win_amd64.whl

2.5.torch版本不匹配问题解决

pip uninstall torch torchvision torchaudio -y
pip install torch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 --index-url https://download.pytorch.org/whl/cu121

2.6.验证torch是否可用

import torch
torch.cuda.current_device()
torch.cuda.get_device_name(0)
torch.__version__
print(torch.cuda.is_available())

3.下载模型

https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B/tree/main
在这里插入图片描述
模型文件放置到你可以找到的目录即可

4.启动web-ui

python webui.py

在这里插入图片描述

5.训练模型初体验

界面操作比较简单,选择模型、选择数据集、开始训练
在这里插入图片描述
在这里插入图片描述
微调模型的评估、保存、挂载等操作都是界面上显而易见的操作,不再赘述。

http://www.dtcms.com/a/92082.html

相关文章:

  • 论坛系统自动化测试项目报告
  • 【JavaEE】Mybatis 传参与排序模糊查询
  • FDCAN应用说明
  • RAPTOR:如何用树状结构重塑RAG检索能力?
  • LangChain开发(八)自定义工具调用
  • RocketMQ可视化工具使用 - Dashboard(保姆级教程)
  • Pydantic递归模型深度校验36计:从无限嵌套到亿级数据的优化法则
  • hugo+github pages 部署实验室网站
  • 量子计算:开启未来计算的新纪元
  • 【初探数据结构】归并排序与计数排序的序曲
  • 从0开始配置 React 开发环境
  • C语言自定义数据类型详解——枚举类型
  • SFT实验报告
  • 【Git 常用指令速查表】
  • Spring Boot响应压缩配置与优化
  • React组件简介
  • 免费使用Gemini 2.5 Pro的完整教程
  • 空转 | GetAssayData doesn‘t work for multiple layers in v5 assay.
  • 【MVCC快照如何实现】
  • MSF木马的生成及免杀
  • 测试 SpatialLM 空间语义识别
  • Android HAL 架构详解,底层开发不再难
  • 服务器硬盘爆满100%问题解决
  • 电动自行车 RFID 智能管控系统社区方案技术解析
  • 鸿蒙OS 5 架构设计探秘:从分层设计到多端部署
  • AI浪潮下的测试人:破局与前行
  • DDR4、DDR5、固态硬盘(SSD)和机械硬盘(HDD)在连续读/写、随机读/写性能的对比分析
  • Linux——进程信号(2)(函数信号与软件信号与硬件中断)
  • 六级词汇量积累(day12)
  • Go 语言规范学习(1)