当前位置: 首页 > news >正文

大模型部署基础设施搭建 - LlamaFactory

参考:https://llamafactory.readthedocs.io/

一、系统

windows11

二、安装CUDA

2.1 下载安装(exe)

注意选择自定义安装,全选

2.2 CMD命令验证

nvcc -V

三、安装LlamaFactory

3.1 下载安装

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

3.2 验证

llamafactory-cli version

四、使用LlamaFactory

4.1 启动webui

llamafactory-cli webui

4.2 访问webui

http://localhost:7860/

4.3 以CPU方式启动webui

llamafactory-cli webui --force_cpu

五、常见问题

5.1 PyTorch版本问题

(1)卸载当前的 CPU 版 PyTorch

pip uninstall -y torch torchvision torchaudio

(2)安装与 CUDA 12.4 兼容的 GPU 版 PyTorch

pip install torch==2.3.0 torchvision==0.18.0 torchaudio==2.3.0 --index-url https://download.pytorch.org/whl/cu121

(3)验证安装

python -c "import torch; print(f'PyTorch版本: {torch.__version__}\nCUDA可用: {torch.cuda.is_available()}')"

(4)卸载当前GPU版本PyTorch

pip uninstall -y torch torchvision torchaudio

(5)安装CPU版本PyTorch

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu

(6)验证安装

python -c "import torch; print(f'PyTorch版本: {torch.__version__}\nCUDA可用: {torch.cuda.is_available()}')"
http://www.dtcms.com/a/339506.html

相关文章:

  • Java优选算法——滑动窗口
  • Fragment重要知识点总结
  • CloudDM 新增支持 GaussDB 与 openGauss:国产数据库管理更高效
  • OpenHarmony 之多模态输入子系统源码深度架构解析
  • Android -登录注册实践技术总结
  • 2025最新华为云国际版注册图文流程-不用绑定海外信用卡注册
  • 延时任务定时器的实现
  • Python 新工具 uv
  • 读《精益数据分析》:营收(Revenue)—— 设计可持续盈利模式
  • 【ASP.NET Core】ASP.NET Core中间件解析
  • sfc_os!SfcQueueValidationRequest函数分析之sfc_os!IsFileInQueue
  • 关闭VSCode Markdown插件在Jupyter Notebook中的自动预览
  • 在linux系统中下载Andconda
  • windows电脑对于dell(戴尔)台式的安装,与创建索引盘,系统迁移到新硬盘
  • Vim 编辑器使用指南
  • Java I/O 模型精讲:从传统BIO到高性能NIO与AIO
  • uv与conda的区别及选择指南
  • Linux软件编程:进程与线程(进程(消息队列、共享内存、信号灯))
  • 决策树二-泰坦尼克号幸存者
  • 微服务集训整理
  • AI赋能市场拓展:从智能潜力洞察到渠道精准深耕,解锁商业增长新蓝海
  • 【Proteus仿真】【51单片机】基于51单片机密码锁
  • 优秘企业智脑 AISEO 实战:如何通过多模态大模型提升搜索引擎排名?附 3 大行业案例
  • pytorch学习笔记-argparse的使用(加更版)
  • 基于SpringBoot+Vue的写真馆预约管理系统(邮箱通知、WebSocket及时通讯、协同过滤算法)
  • 哪些仪器适合对接电子实验记录本,哪些不适合?
  • Java 11中的Collections类详解
  • Web安全攻防基础
  • 什么是IP隔离?一文讲清跨境电商/海外社媒的IP隔离逻辑
  • JVM对象创建和内存分配