当前位置: 首页 > news >正文

vllm作为服务启动,无需额外编写sh文件,一步到位【Ubuntu】

看到网上有的vllm写法,需要额外建立一个.sh文件,还是不够简捷。这里提供一种直接编写service文件一步到位的写法:

vi /etc/systemd/system/vllm.service

[Unit]
Description=vLLM Service
After=network.target

[Service]
Type=simple
User=root
WorkingDirectory=/data/llm
ExecStart=/bin/bash -c "source /root/miniconda3/bin/activate cosyvoice && exec python -m vllm.entrypoints.openai.api_server --model /data/llm/Qwen_QwQ-32B-Q5_K_S.gguf --served-model-name qwen-qwq-q5 --max-model-len 10240 --port 8081 --tensor-parallel-size 2 --dtype half --swap-space 4 --max-num-batched-tokens 25600"
Restart=always
Environment="PATH=/usr/bin:/usr/local/bin"
Environment="PYTHONUNBUFFERED=1"

[Install]
WantedBy=multi-user.target

我的是使用minicoda3安装在默认路径的,因此激活文件是/root/miniconda3/bin/activate

几个参数修改点:
/data/llm:这个是运行目录,我是直接指定了GGUF目录

cosyvoice:这个是conda的环境名,你的vllm装在哪个环境,就指定为哪个环境

/data/llm/Qwen_QwQ-32B-Q5_K_S.gguf:这个是你的模型文件位置

qwen-qwq-q5:这个是安装后OPENAI的服务模型名称

tensor-parallel-size 2:这里是指定在2个显卡上运行,由于我的环境是双卡,因此启用了张量并行

以上参数调整完后:

更新服务:
systemctl daemon-reload
设置自启动:
systemctl enable vllm

启动服务:
systemctl start vllm.service

查看服务启动日志(VLLM启动很慢,因此有需要查看日志):
sudo journalctl -u vllm --since "5 minute ago"

http://www.dtcms.com/a/113543.html

相关文章:

  • 『Linux_网络』 第一章 网络基础概念
  • 分表字段选择策略:以电商交易订单为例的最佳实践
  • Java项目之基于ssm的怀旧唱片售卖系统(源码+文档)
  • 大数据时代的隐私保护:区块链技术的创新应用
  • 通过构造函数和几何条件,研究了不同函数的最近点存在性、性质及单调性
  • ZKmall开源商城多云高可用架构方案:AWS/Azure/阿里云全栈实践
  • 紧急更新!MinIO发布RELEASE.2025-04-03T14-56-28Z版本,修复高危漏洞CVE-2025-31489,用户需立即升级!
  • raft协议中一条数据写入流程
  • Java 实现插入排序:[通俗易懂的排序算法系列之三]
  • 文献总结:TPAMI综述BEV感知—Delving into the devils of bird‘s-eye-view perception
  • Socket编程TCP
  • HarmonyOS:WebView 控制及 H5 原生交互实现
  • 硬件学习之器件篇-蜂鸣器
  • 第三章 react redux的学习之redux和react-redux,@reduxjs/toolkit依赖结合使用
  • use_tempaddr 笔记250405
  • setj集合
  • 1.5 基于改进蛇优化VGG13SE故障诊断方法的有效性分析
  • Python实现链接KS3,并将文件数据上传到KS3
  • 【spring Cloud Netflix】OpenFeign组件
  • 第二十九章:Python-mahotas库:图像处理的高效工具
  • 使用 pytest-xdist 进行高效并行自化测试
  • PHP的垃圾回收机制
  • 我的创作历程:从不情愿到主动分享的成长
  • 用北太天元脚本解决了关于双曲线的求离心率对应的参数、等腰三角形条件下的点坐标和向量点积条件下的参数范围
  • 如何判断栈生长的方向
  • SDL显示YUV视频
  • 快速从零部署一个DeepSeek-R1服务
  • NAS原理与技术详解:从基础概念到实践应用
  • 基础知识补充篇:关于数据不可修改
  • 功能测试和性能测试的区别有哪些?