当前位置: 首页 > wzjs >正文

嘉兴ai人工智能开发网站建设深圳优化公司统高粱seo

嘉兴ai人工智能开发网站建设,深圳优化公司统高粱seo,外贸做网站推广,html的基本结构在 5090 显卡上成功安装 TabbyAPIExllamav2 和 vLLM 并非易事,经过一番摸索,我总结了以下详细步骤,希望能帮助大家少走弯路。 重要提示: 用户提供的 PyTorch 安装使用了 cu128,这并非标准 CUDA 版本。请根据你的系统实…

在 5090 显卡上成功安装 TabbyAPI+Exllamav2 和 vLLM 并非易事,经过一番摸索,我总结了以下详细步骤,希望能帮助大家少走弯路。

重要提示: 用户提供的 PyTorch 安装使用了 cu128,这并非标准 CUDA 版本。请根据你的系统实际 CUDA 版本(通常为 12.1 或 12.2)进行调整。

1. 安装 TabbyAPI+Exllamav2

步骤 1:克隆 TabbyAPI 仓库

git clone https://github.com/theroyallab/tabbyAPI
cd tabbyAPI

步骤 2:创建并激活 Python 虚拟环境

python3 -m venv venv
source venv/bin/activate  # 如果使用 fish shell,则使用:source venv/bin/activate.fish

步骤 3:安装带有 CUDA 支持的 PyTorch

python -m pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu12.1 # 根据实际 CUDA 版本调整

步骤 4:安装 TabbyAPI 与 Exllamav2(禁用编译)

EXLLAMA_NOCOMPILE=1 pip install .

步骤 5:安装所需的系统依赖(如果需要)

sudo apt-get update
sudo apt-get install -y build-essential g++ gcc libstdc++-10-dev ninja-build

步骤 6:安装 Flash Attention(可选但推荐)

git clone https://github.com/Dao-AILab/flash-attention
cd flash-attention
python -m pip install wheel
python setup.py install

步骤 7:TabbyAPI 安装完成

请参考 TabbyAPI 的官方文档了解如何使用。

2. 安装 vLLM

步骤 1:克隆 vLLM 仓库

git clone https://github.com/vllm-project/vllm
cd vllm

步骤 2:创建并激活 Python 虚拟环境

python3.12 -m venv venv
source venv/bin/activate # 如果使用 fish shell,则使用:source venv/bin/activate.fish

步骤 3:安装带有 CUDA 支持的 PyTorch

python -m pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu12.1 # 根据实际 CUDA 版本调整

步骤 4:使用已存在的 PyTorch 安装(推荐)

python use_existing_torch.py

步骤 5:安装构建依赖

python -m pip install -r requirements/build.txt

步骤 6:安装通用依赖

python -m pip install -r requirements/common.txt

步骤 7:从源代码安装 vLLM(可编辑模式)

python -m pip install -e . --no-build-isolation

步骤 8:vLLM 安装完成

请参考 vLLM 的官方文档了解如何使用。

重要注意事项:

  • CUDA 版本: 确保你使用的 CUDA 版本与 5090 显卡和 PyTorch 安装相匹配。请验证你的 NVIDIA 驱动程序支持的 CUDA 版本。
  • Python 版本: vLLM 可能对 Python 版本有特定要求。用户指定了 Python 3.12。请查阅 vLLM 的官方文档以获取最新信息。
  • 依赖项: 仔细检查 TabbyAPI 和 vLLM 的 requirements.txt 文件,确保安装了所有必要的依赖项。
  • 虚拟环境: 使用虚拟环境对于隔离项目依赖项和避免冲突至关重要。
  • Flash Attention: Flash Attention 可以显著提高性能,尤其是对于大型模型。如果可能,建议安装。
  • 驱动版本: 确保您的 Nvidia 驱动程序是最新的,并且支持您的 5090 GPU。
  • 调整 CUDA 版本:cu12.1 替换为您已安装的正确 CUDA 版本。
http://www.dtcms.com/wzjs/185446.html

相关文章:

  • 北京seo实战培训班班级优化大师使用心得
  • wordpress添加下文件seo专员是干什么的
  • dede网站qq类文章源码深圳搜索引擎优化推广便宜
  • 电子政务网站建设的步骤一般为b2b电子商务平台
  • 网站怎么盈利长沙排名推广
  • 做代购网站湖南竞价优化哪家好
  • 网站关键词库如何做成都网站关键词排名
  • 福州云建站模版合肥seo
  • 网站如何免费推广软文怎么写
  • 做衣服的教程网站在线crm网站建站
  • 在网站上怎么做推广论坛软文案例
  • 浏览器怎样屏蔽网站枸橼酸西地那非片
  • 品牌网站建设浩森宇特常州seo
  • 秦皇岛网站制作市场营销证书含金量
  • 建设一个商城网站要多少钱seo诊断方法步骤
  • 江苏住房建设厅网站百度域名注册官网
  • 蚌埠网站建设专业的公司新媒体运营工作是什么
  • 赣州开发区网站建设建立网站
  • 网站与云平台区别吗惠城网站设计
  • 宝应县建设局网站百度推广电话销售好做吗
  • 网站建设推广资讯本周国内重大新闻十条
  • 连云港网站建设小姐关键词代发排名
  • wordpress 微信 插件开发性能优化工具
  • 如何在虚拟空间上做多个网站seo实战论坛
  • 流量比对网站深圳网络优化公司
  • 做网站致富武汉网站营销seo方案
  • 个人如何做网站链交换反应
  • 知乎网页版网络优化app哪个好
  • 电商网站怎么推广免费广告推广平台
  • 网站开发有什么职位seo推广软件代理