当前位置: 首页 > news >正文

基于 docker 的 LLaMA-Factory 全流程部署指南

一、下载代码

请在控制台下面执行下面的命令

# 克隆仓库到本地的 LLaMA-Factory 目录,使用 --depth 1 参数仅获取最新的一次提交,减少下载量, 命令如下:
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git LLaMA-Factory
# 注:如果您的网络环境不好,可以使用国内镜像仓库,命令如下
# git clone --depth 1 https://gitee.com/hiyouga/LLaMA-Factory.git LLaMA-Factory

二、安装环境

1、安装 docker 和 docker-compose

略(注:安装完成后请执行 docker -vdocker-compose -v 验证是否安装成功)

三、制作镜像

请在控制台下面切换到 LLaMA-Factory 目录下执行下面的命令

# 执行下面的命令,根据您的环境选择不同的镜像制作方法
# 使用 cuda(英伟达) 微调训练的镜像制作方法
docker-compose -f "LLaMA-Factory/docker/docker-cuda/docker-compose.yml" up --build
# 使用 npu(昇腾) 微调训练的镜像制作方法
# docker-compose -f "LLaMA-Factory/docker/docker-npu/docker-compose.yml" up --build
# 使用 ROCm(AMD) 微调训练的镜像制作方法
# docker-compose -f "LLaMA-Factory/docker/docker-rocm/docker-compose.yml" up --build

注:制作镜像完成后,您可以在控制台下面执行 docker images 命令查看是否有 docker-*-llamafactory:latest 镜像,如果有则说明制作成功。

四、创建容器

请在控制台下面执行下面的命令

# 执行下面的命令,根据您的环境选择不同的容器创建方法
# 使用 cuda(英伟达) 微调训练的容器创建方法
docker-compose -f "LLaMA-Factory/docker/docker-cuda/docker-compose.yml" up -d
# 使用 npu(昇腾) 微调训练的容器创建方法
# docker-compose -f "LLaMA-Factory/docker/docker-npu/docker-compose.yml" up -d
# 使用 ROCm(AMD) 微调训练的容器创建方法
# docker-compose -f "LLaMA-Factory/docker/docker-rocm/docker-compose.yml" up -d

注:创建容器完成后,您可以在控制台下面执行 docker ps 命令查看是否有 llamafactory 容器,如果有则说明制作成功。

五、启动WEB服务

请在控制台下面执行下面的命令,进入容器 llamafactory 内部:

docker exec -it llamafactory /bin/bash

在容器 llamafactory 内部执行下面的命令:

# 给如下目录赋予权限
chmod -R 777 /app/data
# 启动web服务,命令如下:
nohup llamafactory-cli webui > /app/webui.log 2>&1 &

六、访问WEB服务

请在浏览器中访问 http://localhost:7860/ ,即可访问WEB服务。

相关文章:

  • 开发体育直播即时比分系统:赛事收藏功能的技术实现方案
  • vscode集成deepseek实现辅助编程(银河麒麟系统)【详细自用版】
  • Android学习总结之Kotlin 协程
  • presto行转列
  • Vulnhub-zico2靶机打靶记录
  • ML 聚类算法 dbscan|| OPTICS|mean-shift
  • C语言基础系列【32】指针进阶5:指针与常量
  • 上市电子制造企业如何实现合规的质量文件管理?
  • 0301-组件基础-react-仿低代码平台项目
  • 【AI微信小程序开发】AI减脂菜谱小程序项目代码:根据用户身高/体重等信息定制菜谱(含完整前端+后端代码)
  • 爱心计算器:用 Python 创建带有动态爱心效果的计算器
  • Ubuntu20.04安装OpenVINO环境以及YOLOv8 C++部署测试
  • Android里面内存优化
  • 【Redis】基础1:基本概念,基本数据结构
  • Git操作指南
  • Python数据类型-int
  • JavaScript基础-触屏事件
  • 加密钱包助记词丢失后的一天
  • 在MFC中使用Qt(三):通过编辑项目文件(.vcxproj)实现Qt的自动化编译流程
  • 循环神经网络 - 通用近似定理 图灵完备
  • 铁路12306回应“五一前大量放票”传闻:个别方向和区段出现新增票额,均即时进入系统重新发售
  • 遍体鳞伤就是击不倒,这是国米老男孩最后的倔强
  • 杨轶群任莆田市荔城区人民政府副区长
  • 拍摄《我们这一代》的肖全开展“江浙沪叙事”
  • 澎湃回声丨23岁小伙“被精神病”8年续:今日将被移出“重精”管理系统
  • 五一去哪儿|外国朋友来中国,“买买买”成为跨境旅游新趋势