当前位置: 首页 > news >正文

vLLM启用笔记

一、vLLM
vLLM 的安装较为复杂,pip 包的安装方式,需要环境中支持 CUDA 12.1
项目地址:https://github.com/vllm-project/vllm
支持的模型列表:https://docs.vllm.ai/en/latest/models/supported_models.html

二、camke 版本问题
参考官方文档进行安装:https://docs.vllm.ai/en/latest/getting_started/cpu-installation.html

sh cmake-3.30.3-linux-aarch64.sh
export PATH=/home/aidlux/tools/cmake-3.30.3-linux-aarch64/bin:$PATH


三、



VLLM_TARGET_DEVICE=cpu python setup.py install

vLLM 项目对硬件的要求很高,需要 CPU 支持 AVX512、AVX2 或 Power9+ 高级指令集,而对于 ARM 架构 的 CPU,通常并不支持 AVX2 和 AVX512。 vLLM一般很难安装~

相关文章:

  • 常用排序算法
  • SPSS—回归分析
  • 基于SpringBoot+Vue的科研项目验收管理系统的设计与实现(源码+SQL脚本+LW+部署讲解等)
  • React 第二十五节 <Fragment></Fragment> 的用途以及使用注意事项详解
  • 基于 MATLAB 的粒子滤波算法实现示例,用于处理手机传感器数据并估计电梯运行参数。
  • 回归预测 | Matlab实现PSO-HKELM粒子群算法优化混合核极限学习机多变量回归预测
  • MySQL篇之对MySQL进行参数优化,提高MySQL性能
  • Mac ARM 架构的命令行(终端)中,删除整行的快捷键是:Ctrl + U
  • 基于微信小程序校园订餐的设计与开发(ssm论文源码调试讲解)
  • Nginx之rewrite重写功能
  • 嵌入式硬件篇---原码、补码、反码
  • Java实现MinIO上传PDF文件并配置浏览器在线打开而非下载
  • NHANES指标推荐:DDA!
  • 小爱音箱控制手机和电视听歌的尝试
  • np.hstack函数的用法
  • Vue学习笔记4
  • 文心一言4月起全面免费,6月底开源新模型:AI竞争进入新阶段?
  • uniapp - iconfont下载本地并且运用至项目上
  • 「软件设计模式」单例模式
  • NO.18十六届蓝桥杯备战|循环嵌套|乘法表|斐波那契|质数|水仙花数|(C++)
  • 济南网站建设开发公司哪家好/种子搜索神器在线搜
  • 工作一般做网站视频的工作叫做什么/seo快排
  • 怎么在手机上做微电影网站/海外免费网站推广
  • 深圳自适应网站开发多少钱/销售培训
  • 大连网站优化技术/运营推广怎么做
  • 邹城网站建设公司/哈市今日头条最新