当前位置: 首页 > news >正文

vLLM启用笔记

一、vLLM
vLLM 的安装较为复杂,pip 包的安装方式,需要环境中支持 CUDA 12.1
项目地址:https://github.com/vllm-project/vllm
支持的模型列表:https://docs.vllm.ai/en/latest/models/supported_models.html

二、camke 版本问题
参考官方文档进行安装:https://docs.vllm.ai/en/latest/getting_started/cpu-installation.html

sh cmake-3.30.3-linux-aarch64.sh
export PATH=/home/aidlux/tools/cmake-3.30.3-linux-aarch64/bin:$PATH


三、



VLLM_TARGET_DEVICE=cpu python setup.py install

vLLM 项目对硬件的要求很高,需要 CPU 支持 AVX512、AVX2 或 Power9+ 高级指令集,而对于 ARM 架构 的 CPU,通常并不支持 AVX2 和 AVX512。 vLLM一般很难安装~

http://www.dtcms.com/a/15816.html

相关文章:

  • 常用排序算法
  • SPSS—回归分析
  • 基于SpringBoot+Vue的科研项目验收管理系统的设计与实现(源码+SQL脚本+LW+部署讲解等)
  • React 第二十五节 <Fragment></Fragment> 的用途以及使用注意事项详解
  • 基于 MATLAB 的粒子滤波算法实现示例,用于处理手机传感器数据并估计电梯运行参数。
  • 回归预测 | Matlab实现PSO-HKELM粒子群算法优化混合核极限学习机多变量回归预测
  • MySQL篇之对MySQL进行参数优化,提高MySQL性能
  • Mac ARM 架构的命令行(终端)中,删除整行的快捷键是:Ctrl + U
  • 基于微信小程序校园订餐的设计与开发(ssm论文源码调试讲解)
  • Nginx之rewrite重写功能
  • 嵌入式硬件篇---原码、补码、反码
  • Java实现MinIO上传PDF文件并配置浏览器在线打开而非下载
  • NHANES指标推荐:DDA!
  • 小爱音箱控制手机和电视听歌的尝试
  • np.hstack函数的用法
  • Vue学习笔记4
  • 文心一言4月起全面免费,6月底开源新模型:AI竞争进入新阶段?
  • uniapp - iconfont下载本地并且运用至项目上
  • 「软件设计模式」单例模式
  • NO.18十六届蓝桥杯备战|循环嵌套|乘法表|斐波那契|质数|水仙花数|(C++)
  • C++ Primer 函数基础
  • 基于Pygame搭建的雷达、光电和数据链数据生成引擎
  • 【进程与线程】如何编写一个守护进程
  • 在Ubuntu24.04上安装Stable-Diffusion1.10.1版本
  • Web渗透实战--XSS 常用语句以及绕过思路
  • 2025-2-14算法打卡
  • 深入理解小波变换:信号处理的强大工具
  • GESP C++二级真题及解析分享
  • 【做一个微信小程序】校园事件页面实现
  • 高效开发!使用Chrome对MoonBit生成的Wasm进行性能分析!