当前位置：首页 > news >正文

LLaMA-Factory安装部署

news 2025/11/6 0:08:08

一、环境安装准备

CUDA安装

CUDA 是由 NVIDIA 创建的一个并行计算平台和编程模型，它让开发者可以使用 NVIDIA 的 GPU 进行高性能的并行计算。

首先，在 https://developer.nvidia.com/cuda-gpus 查看您的 GPU 是否支持CUDA

保证当前 Linux 版本支持CUDA.在命令行中输入，应当看到类似的输出：

uname -m  && cat /etc/*release

2、检查是否安装了 gcc.在命令行中输入gcc--version，若没有安装，则使用apt-get install gcc进行安装。

3、在以下网址下载所需的 CUDA，这里我安装12.6版本。（我的显卡是Tesla P40）

从下面地址中选择合适的版本：CUDA Toolkit Archive | NVIDIA Developer

如果您之前安装过 CUDA(例如为12.1版本)，需要先使用 sudo /usr/local/cuda-12.1/bin/cuda-uninstaller 卸载。如果该命令无法运行，可以直接:

sudo rm-r/usr/local/cuda-12.1/   
sudo apt clean && sudo apt autoclean

根据上面的选择下载包：

wget https://developer.download.nvidia.com/compute/cuda/12.6.3/local_installers/cuda_12.6.3_560.35.05_linux.run
sudo sh cuda_12.6.3_560.35.05_linux.run

选择install后进行安装，出现如下图所示，表明安装成功！

设置如下环境变量：

export CUDA_PATH=/usr/local/cuda-12.6
export LD_LIBRARY_PATH=/usr/local/cuda-12.6/lib64
export PATH=$CUDA_PATH/bin:$PATH

执行如下命令：nvcc -V 表明cuda安装成功

执行如下命令：nvidia-smi ，表明驱动是正常的。

Anaconda安装(略)

使用conda 创建虚拟环境

conda create -n llama-factory  python=3.10

切换到llama-factory环境中

source activate llama-factory

二、LLaMA-Factory安装

从源码安装

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]" --no-build-isolation

安装校验

完成安装后，可以通过使用 1lamafactory-cli version 来快速校验安装是否成功

如果您能成功看到类似下面的界面，就说明安装成功了

高级选项

QLoRA

如果您想启用量化 LORA(QLORA)，请根据您的 CUDA 版本选择适当的 bitsandbytes 发行版本。地址如下：https://github.com/jllllll/bitsandbytes-windows-webui/releases/tag/wheels/

FlashAttention-2

如果您要在 Windows 平台上启用 FlashAttention-2，请根据您的 CUDA 版本选择适当的 fash-attention 发行版本。地址如下：https://github.com/kingbri1/flash-attention/releases

查看全文

http://www.dtcms.com/a/273700.html

uniapp实现微信小程序端图片保存到相册

深入拆解Spring思想：DI（依赖注入）

Python-正则表达式-信息提取-滑动窗口-数据分发-文件加载及分析器-浏览器分析-学习笔记

榫卯企业云平台自服务中心模块（SSC）关键能力解读

数据库报错：Column ‘xxx‘ in field list is ambiguous

2025年体育科学与健康大数据国际会议（ICSSHBD 2025）

在 GitHub 上创建私有仓库

如何在 Windows 10 上安装设置 Apache Kafka

hive/spark sql中unix_timestamp 函数的坑以及时间戳相关的转换

AI技术正以前所未有的速度重塑职业生态与行业格局，尤其在自动化测试领域，AI驱动的测试框架通过智能化、低代码化重构传统测试流程。

PySpark中python环境打包和JAR包依赖

spark3 streaming 读kafka写es

Google Benchmark 介绍和使用指南

流批一体的“奥卡姆剃刀”：Apache Cloudberry 增量物化视图应用解析

CReFT-CAD 笔记带标注工程图dxf，png数据集

【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（四）

Jenkins 项目类型及配置项

FPGA实现SDI转LVDS视频发送，基于GTP+OSERDES2原语架构，提供工程源码和技术支持

资源分享-FPS, 矩阵, 骨骼, 绘制, 自瞄, U3D, UE4逆向辅助实战视频教程

飞算 JavaAI 深度体验：开启 Java 开发智能化新纪元

【拓扑空间】示例及详解4

python的社区残障人士服务系统

了解环网式 CAN 转光纤中继器

BPE（Byte Pair Encoding）分词算法

leetcode-hot100(283.移动零)

政安晨【零基础玩转开源AI项目】ACE-Step —— 迈向音乐生成基础模型的重要一步：AI自动谱曲与自动演唱的免费开源框架部署实践

RLHF：人类反馈强化学习 | 对齐AI与人类价值观的核心引擎

python实现DoIP基本通信(收发报文)

第十二章：网络编程

Typescript -字面量类型