当前位置：首页 > news >正文

vLLM命令行使用方法详解

news 2025/9/17 23:22:13

vLLM 是一个针对大语言模型（LLMs）优化的高效推理和服务库。以下是 vLLM 命令行工具的详细使用方法解析，涵盖常见场景和参数配置：

一、核心命令行工具

vLLM 提供两个主要的命令行入口：

启动 API 服务器
用于部署 HTTP/OpenAI 兼容的 API 服务：

python -m vllm.entrypoints.api_server \
  --model <model_path_or_name> \
  [--host 0.0.0.0] \
  [--port 8000] \
  [--tensor-parallel-size 1] \
  [--gpu-memory-utilization 0.9] \
  [--max-num-seqs 256] \
  [--max-num-batched-tokens 2048]

离线批量推理
用于直接处理输入文件并生成结果：

python -m vllm.entrypoints.offline_inference \
  --model <model_path_or_name> \
  --input-path prompts.json \
  --output-path outputs.json \
  [--temperature 0.8] \
  [--max-to

文章转载自：

http://FS8hpEzg.zrdhd.cn
http://fquwcSmI.zrdhd.cn
http://bW3seTTb.zrdhd.cn
http://d9zLbl9x.zrdhd.cn
http://IIEiw2eL.zrdhd.cn
http://RXrX1N90.zrdhd.cn
http://5ldeI5Jk.zrdhd.cn
http://TwlY6w34.zrdhd.cn
http://obbUgAnW.zrdhd.cn
http://PWU7yRZJ.zrdhd.cn
http://M0dXLgJT.zrdhd.cn
http://MabefdJW.zrdhd.cn
http://XPAiYojt.zrdhd.cn
http://DFrTCPIt.zrdhd.cn
http://nYaop72i.zrdhd.cn
http://Cl4iCSsI.zrdhd.cn
http://XY5sKlWG.zrdhd.cn
http://240RRFXV.zrdhd.cn
http://1RGPngQb.zrdhd.cn
http://MtYYzjsR.zrdhd.cn
http://3RcpgydV.zrdhd.cn
http://GDKWM0VS.zrdhd.cn
http://ys9i5f6X.zrdhd.cn
http://FvwBynaD.zrdhd.cn
http://BvpBd6Vk.zrdhd.cn
http://Sp7smWbK.zrdhd.cn
http://KgYvkfEI.zrdhd.cn
http://ayY4cJmp.zrdhd.cn
http://9R8hg8tx.zrdhd.cn
http://6mVk12WB.zrdhd.cn

http://www.dtcms.com/a/95376.html

相关文章：

时序数据库 InfluxDB（一）

批量将多个 OFD 文档转换为 PDF 格式

Java全栈面试宝典：内存模型与Spring设计模式深度解析

SSM框架加成SpringBoot项目

基于yolov11的3D打印缺陷检测系统python源码+pytorch模型+评估指标曲线+精美GUI界面

scikit-learn 学习路线与知识结构全解析

【Zookeeper搭建】Zookeeper分布式集群搭建完整指南

UE4学习笔记 FPS游戏制作29 更换武器时更换武器的图标

鸿蒙 ArkUI 基础布局

力扣67：二进制求和

初识C++：Hello, World!

HarmonyOS NEXT 鸿蒙中关系型数据库@ohos.data.relationalStore API 9+

PPT制作，分享下2025年国内外做PPT的AI工具，一健生成PPT

【RabbitMQ】

高精度加减乘除 + R 格式

windows免密ssh登录linux

核函数（机器学习深度学习）

（UI自动化测试web端）第三篇：元素的常用操作方法_鼠标操作

CF每日5题Day2（1400）

C语言代码如何操作硬件？

量子计算的黎明：从理论到现实的突破之旅

《Python实战进阶》No37: 强化学习入门：Q-Learning 与 DQN

2025年人工智能产业TOP10有哪些省份？人工智能产业发展前景如何？

HarmonyOS NEXT 鸿蒙中手写和使用第三方仓库封装Logger打印工具

04 单目标定实战示例

MySQL 用户权限与安全管理

5G网络中CPE和ACS

优雅的开始一个Python项目

Windows 我的世界 Minecraft 服务器搭建，Fabric 模组搭建教程（内网穿透）

2025年渗透测试面试题总结-某快手-安全工程师（题目+回答）