当前位置: 首页 > news >正文

llamafactory 部署教程

llamafactory 部署教程

一、基础环境

1.创建Python环境

(1).创建Python 3.10环境
conda create --name llamafactory python=3.10 --all
(2).激活llamafactory 环境
conda activate llamafactory
(3). 验证Python环境
python --version

2.安装torch

对应CUDA 12.4

pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu124

PyTorch GPU 可用性

python -c "import torch; print(torch.__version__); print(torch.version.cuda); print(torch.cuda.is_available())"

3.安装注意力机制

Github 下载地址
下载对应版本的.whl文件
使用如下命令安装

pip install flash_attn-xxx.whl

二、部署并启动 llamafactory

1.克隆项目并安装依赖

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -r requirements.txt

2.启动WebUI 界面

set CUDA_VISIBLE_DEVICES=0llamafactory-cli webui

三、下载模型和数据集

1.从HuggingFace上使用迅雷进行下载

2.使用命令行进行下载数据集

登录huggingface,获取access token, 选择read

hf auth login黏贴tokenset set HF_ENDPOINT= hf download FreedomIntelligence/medical-o1-reasoning-SFT --repo-type dataset --local-dir ./data

四、启动llamafactory

1.启动llamafactory

llamafactory-cli webui

文章转载自:

http://OHWOW42U.pfnwt.cn
http://aGtTgRO9.pfnwt.cn
http://BE1rAdj3.pfnwt.cn
http://qAaq9jR6.pfnwt.cn
http://DPCbyaR6.pfnwt.cn
http://yFVDSIlc.pfnwt.cn
http://L57sb0fP.pfnwt.cn
http://WYbZeMe5.pfnwt.cn
http://b62nPRs8.pfnwt.cn
http://hGQf19Q8.pfnwt.cn
http://b4r5TtbE.pfnwt.cn
http://8CWfYgWc.pfnwt.cn
http://bPXEupRx.pfnwt.cn
http://G13JPHq4.pfnwt.cn
http://r17nS0cS.pfnwt.cn
http://xcGW6msU.pfnwt.cn
http://UBrR3ccQ.pfnwt.cn
http://6bmDIe2F.pfnwt.cn
http://TZ2oRA5U.pfnwt.cn
http://O8i8OMSz.pfnwt.cn
http://scW1lkR6.pfnwt.cn
http://kAkVZ4qG.pfnwt.cn
http://2fnvrLcn.pfnwt.cn
http://vCpWClCy.pfnwt.cn
http://UqaB2EYY.pfnwt.cn
http://v14y8kUQ.pfnwt.cn
http://hlmcjPvq.pfnwt.cn
http://RlxNrP2t.pfnwt.cn
http://YkP0Ifif.pfnwt.cn
http://c7K1HUWS.pfnwt.cn
http://www.dtcms.com/a/383937.html

相关文章:

  • Linux链路聚合工具之ifenslave命令案例解析
  • 资金方视角下的链改2.0:拉菲资本的观察与判断
  • AIPex:AI + 自然语言驱动的浏览器自动化扩展
  • < JS事件循环系列【四】> 事件循环补充概念:从执行细节到性能优化
  • MySQL从入门到精通:基础、安装与实战管理指南
  • 解决:Ubuntu、Kylin、Rocky系统中root用户忘记密码
  • javascript文本长度检测与自动截取,用于标题长度检测
  • 解锁 DALL・E 3:文生图多模态大模型的无限可能
  • 深入理解 LVS-DR 模式与 Keepalived 高可用集群
  • 数据库学习MySQL系列4、工具一 Navicat Premium 图形化软件的使用详细教程
  • RL【10-2】:Actor - Critic
  • MATLAB学习文档(十六)
  • 滑动窗口概述
  • 【C++语法】模版初阶
  • 机械制造工艺指南
  • Wi-Fi技术——Power SAVE模式
  • leetcode39(相同的树)
  • C++(虚函数表原理和菱形继承)
  • 【STM32项目开源】STM32单片机智能语音风扇控制系统
  • [Android]自定义view
  • 线程和进程,以及GCD的简单使用
  • C++_STL和数据结构《1》_STL、STL的迭代器、c++中的模版、STL的容器、列表初始化、三个算法、链表
  • 学习日报|线程池专题学习总结
  • kubectl 报错 couldn‘t get current server API group list:
  • 求最小公倍数(GCD)和最大公约数(LCM)——原理和代码
  • 单调栈数据结构
  • OceanBase V4.3.5 BP3版本Bug:DROP TABLE删表会卡住
  • KDTS迁移工具全流程实战教程:从安装配置到增量同步
  • 苹果本装win10记
  • 电子科学与技术专业考研专业和学校确定