当前位置: 首页 > wzjs >正文

做柜子好的设计网站哪里卖网站模板

做柜子好的设计网站,哪里卖网站模板,品牌策划费用预算,网络推广引流方式vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。 更多 vLLM 中文文档及教程可访问 →https://vllm.hyper.ai/ vLLM 使用 PyTorch XLA 支持 Google Cloud TPU。 依赖环境​ Google Cloud TPU …

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。

更多 vLLM 中文文档及教程可访问 →https://vllm.hyper.ai/

vLLM 使用 PyTorch XLA 支持 Google Cloud TPU。

依赖环境

  • Google Cloud TPU VM(单主机和多主机)
  • TPU 版本: v5e、v5p、v4
  • Python: 3.10

安装选项:

  1. href=“https://vllm.hyper.ai/docs/getting-started/installation-with-tpu#%E4%BD%BF%E7%94%A8-dockerfiletpu-%E6%9E%84%E5%BB%BA-docker-%E9%95%9C%E5%83%8F”>使用Dockerfile.tpu构建 Docker 镜像
  2. 从源代码构建

使用Dockerfile.tpu 构建 Docker 镜像

Dockerfile.tpu 用于构建具有 TPU 支持的 docker 镜像。

docker build -f Dockerfile.tpu -t vllm-tpu .

您可以使用以下命令运行 docker 镜像:

# Make sure to add `--privileged --net host --shm-size=16G`.# 确保添加 `--privileged --net host --shm-size=16G`。docker run --privileged --net host --shm-size=16G -it vllm-tpu

从源代码构建

您还可以从源代码构建并安装 TPU 后端。

首先,安装依赖:

# (Recommended) Create a new conda environment.
#(推荐)创建一个新的 conda 环境。conda create -n myenv python=3.10 -y
conda activate myenv# Clean up the existing torch and torch-xla packages.
# 清理现有的 torch 和 torch-xla 包。pip uninstall torch torch-xla -y# Install PyTorch and PyTorch XLA.
# 安装 PyTorch 和 PyTorch XLA。export DATE="20240828"
export TORCH_VERSION="2.5.0"
pip install https://storage.googleapis.com/pytorch-xla-releases/wheels/tpuvm/torch-${TORCH_VERSION}.dev${DATE}-cp310-cp310-linux_x86_64.whl
pip install https://storage.googleapis.com/pytorch-xla-releases/wheels/tpuvm/torch_xla-${TORCH_VERSION}.dev${DATE}-cp310-cp310-linux_x86_64.whl# Install JAX and Pallas.
# 安装 JAX 和 Pallas。pip install torch_xla[tpu] -f https://storage.googleapis.com/libtpu-releases/index.html
pip install torch_xla[pallas] -f https://storage.googleapis.com/jax-releases/jax_nightly_releases.html -f https://storage.googleapis.com/jax-releases/jaxlib_nightly_releases.html# Install other build dependencies.
# 安装其他构建依赖项。pip install -r requirements-tpu.txt

下一步,从源代码构建 vLLM。这只需要几秒钟:

VLLM_TARGET_DEVICE="tpu" python setup.py develop

注意

由于 TPU 依赖于需要静态形状的 XLA,因此 vLLM 会将可能的输入形状进行分桶处理,并为每个不同的形状编译 XLA 图。第一次运行的编译时间可能需要 20~30 分钟。不过由于 XLA 图会缓存在磁盘中(默认在VLLM_XLA_CACHE_PATH 或 ~/.cache/vllm/xla_cache 中),之后的编译时间会减少到大约 5 分钟。

提示

如果您遇到以下错误:

from torch._C import *  # noqa: F403ImportError: libopenblas.so.0: cannot open shared object file: No such file or directory

请使用以下命令安装 OpenBLAS:

sudo apt-get install libopenblas-base libopenmpi-dev libomp-dev
http://www.dtcms.com/wzjs/830896.html

相关文章:

  • 深圳市住房和城乡建设局网站工作室建设
  • 自助发外链网站广州好的做网站公司
  • 做网站就是做点击率品牌网站建设等高端服务
  • 成都网站优化方法智能建造工程
  • 网站运营专员具体每天怎么做帝国cms 网站地图标签
  • 网站建设需要考虑哪些因素一了网站
  • 客户网站留言企业管理咨询心得体会
  • 手机网站做seo代做网站地图
  • 沈阳网站建做一个租房卖房的网站怎么做
  • 企业做门户网站的重要性电脑上怎样运行wordpress
  • 做百度网站需要钱吗透明背景图片在线制作
  • 网站标题有图片要怎么做学校网站三合一建设方案
  • 佛山中小企业网站制作seo入门教学
  • 东莞seo建站哪家好百度搜索引擎的网址是
  • 网站建设设计设计公司哪家好做网站必须搭框架么
  • 网站界面设计案例教程什么做网站推广
  • 广东商城网站建设中国站长素材网
  • 佛山网站建设和维护wordpress teamtalk
  • 百度做网站的国家企业公示平台官网
  • 网站流程设计怎么注册自媒体个人账号
  • 孝义网站开发玉树营销网站建设哪家好
  • 如何做家政网站外贸流程有哪些
  • 万网网站备案教程wordpress静态化首页
  • 张家港网站制作公司怎么开店铺
  • 国企网站建设带后台网站模板
  • wix怎样做网站详情页设计怎么收费
  • 专业外贸网站建设公司怎么整理网站
  • 重庆大学建设管理与房地产学院网站企业网站建设哪家便宜
  • 网站数据分析报告公司注册地址和经营地址不一致
  • 崇仁网站建设推广费用免费好用的crm软件