当前位置: 首页 > wzjs >正文

嘉兴网站建设品牌升级网址域名大全2345网址

嘉兴网站建设品牌升级,网址域名大全2345网址,广州网站建设q479185700棒,大连制作网站多少钱在 5090 显卡上成功安装 TabbyAPIExllamav2 和 vLLM 并非易事,经过一番摸索,我总结了以下详细步骤,希望能帮助大家少走弯路。 重要提示: 用户提供的 PyTorch 安装使用了 cu128,这并非标准 CUDA 版本。请根据你的系统实…

在 5090 显卡上成功安装 TabbyAPI+Exllamav2 和 vLLM 并非易事,经过一番摸索,我总结了以下详细步骤,希望能帮助大家少走弯路。

重要提示: 用户提供的 PyTorch 安装使用了 cu128,这并非标准 CUDA 版本。请根据你的系统实际 CUDA 版本(通常为 12.1 或 12.2)进行调整。

1. 安装 TabbyAPI+Exllamav2

步骤 1:克隆 TabbyAPI 仓库

git clone https://github.com/theroyallab/tabbyAPI
cd tabbyAPI

步骤 2:创建并激活 Python 虚拟环境

python3 -m venv venv
source venv/bin/activate  # 如果使用 fish shell,则使用:source venv/bin/activate.fish

步骤 3:安装带有 CUDA 支持的 PyTorch

python -m pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu12.1 # 根据实际 CUDA 版本调整

步骤 4:安装 TabbyAPI 与 Exllamav2(禁用编译)

EXLLAMA_NOCOMPILE=1 pip install .

步骤 5:安装所需的系统依赖(如果需要)

sudo apt-get update
sudo apt-get install -y build-essential g++ gcc libstdc++-10-dev ninja-build

步骤 6:安装 Flash Attention(可选但推荐)

git clone https://github.com/Dao-AILab/flash-attention
cd flash-attention
python -m pip install wheel
python setup.py install

步骤 7:TabbyAPI 安装完成

请参考 TabbyAPI 的官方文档了解如何使用。

2. 安装 vLLM

步骤 1:克隆 vLLM 仓库

git clone https://github.com/vllm-project/vllm
cd vllm

步骤 2:创建并激活 Python 虚拟环境

python3.12 -m venv venv
source venv/bin/activate # 如果使用 fish shell,则使用:source venv/bin/activate.fish

步骤 3:安装带有 CUDA 支持的 PyTorch

python -m pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu12.1 # 根据实际 CUDA 版本调整

步骤 4:使用已存在的 PyTorch 安装(推荐)

python use_existing_torch.py

步骤 5:安装构建依赖

python -m pip install -r requirements/build.txt

步骤 6:安装通用依赖

python -m pip install -r requirements/common.txt

步骤 7:从源代码安装 vLLM(可编辑模式)

python -m pip install -e . --no-build-isolation

步骤 8:vLLM 安装完成

请参考 vLLM 的官方文档了解如何使用。

重要注意事项:

  • CUDA 版本: 确保你使用的 CUDA 版本与 5090 显卡和 PyTorch 安装相匹配。请验证你的 NVIDIA 驱动程序支持的 CUDA 版本。
  • Python 版本: vLLM 可能对 Python 版本有特定要求。用户指定了 Python 3.12。请查阅 vLLM 的官方文档以获取最新信息。
  • 依赖项: 仔细检查 TabbyAPI 和 vLLM 的 requirements.txt 文件,确保安装了所有必要的依赖项。
  • 虚拟环境: 使用虚拟环境对于隔离项目依赖项和避免冲突至关重要。
  • Flash Attention: Flash Attention 可以显著提高性能,尤其是对于大型模型。如果可能,建议安装。
  • 驱动版本: 确保您的 Nvidia 驱动程序是最新的,并且支持您的 5090 GPU。
  • 调整 CUDA 版本:cu12.1 替换为您已安装的正确 CUDA 版本。
http://www.dtcms.com/wzjs/154387.html

相关文章:

  • 为什么网站用静态页面直通车官网
  • 苏州企业网站建设定制外链工厂
  • 大连网站建设服务优化营商环境发言材料
  • 极限优化wordpress核心关键词如何优化
  • 室内装饰设计说明句容市网站seo优化排名
  • 美女直接做的网站有哪些免费b站推广
  • 特效很好的网站seo培训公司
  • 网站建设网站定制开发网页在线代理翻墙
  • 网站公安备案流程天津seo优化排名
  • 网站开发行业新闻昆明排名优化
  • 互动平台论坛湘潭seo公司
  • 青岛做外贸网站哪家好中国最大网站排名
  • 深圳集团网站开发公司常见的网络营销方法有哪些
  • 宁波做网站的公司一个品牌的策划方案
  • app下载官方网站深圳网络推广哪家公司好
  • 福州网站营销百度有免费推广广告
  • 温州网站开发多少钱google store
  • win网站建设网站seo收费
  • 坛墨网站建设头条指数
  • 网站建设宗旨及商业模式竞价推广套户渠道商
  • wordpress内部优化谷歌seo什么意思
  • 计算网站制作教程小型项目外包网站
  • 网站建设具体详细过程广东最新疫情
  • 用html做的游戏网站免费观看行情软件网站下载
  • 个人博客首页seo排名点击首页
  • 日本做h动漫电影网站郑州网站制作公司
  • 珠海舒讯网站建设长沙网站快速排名提升
  • 网站建设情况说明书青岛自动seo
  • 做企业网站 签合同要注意什么汕头网站建设方案开发
  • 天津注册公司多少钱百度seo 优化