当前位置: 首页 > news >正文

vLLM命令行使用方法详解

vLLM 是一个针对大语言模型(LLMs)优化的高效推理和服务库。以下是 vLLM 命令行工具的详细使用方法解析,涵盖常见场景和参数配置:


一、核心命令行工具

vLLM 提供两个主要的命令行入口:

  1. 启动 API 服务器
    用于部署 HTTP/OpenAI 兼容的 API 服务:

    python -m vllm.entrypoints.api_server \
      --model <model_path_or_name> \
      [--host 0.0.0.0] \
      [--port 8000] \
      [--tensor-parallel-size 1] \
      [--gpu-memory-utilization 0.9] \
      [--max-num-seqs 256] \
      [--max-num-batched-tokens 2048]
  2. 离线批量推理
    用于直接处理输入文件并生成结果:

    python -m vllm.entrypoints.offline_inference \
      --model <model_path_or_name> \
      --input-path prompts.json \
      --output-path outputs.json \
      [--temperature 0.8] \
      [--max-to
http://www.dtcms.com/a/95376.html

相关文章:

  • 时序数据库 InfluxDB(一)
  • 批量将多个 OFD 文档转换为 PDF 格式
  • Java全栈面试宝典:内存模型与Spring设计模式深度解析
  • SSM框架加成SpringBoot项目
  • 基于yolov11的3D打印缺陷检测系统python源码+pytorch模型+评估指标曲线+精美GUI界面
  • scikit-learn 学习路线与知识结构全解析
  • 【Zookeeper搭建】Zookeeper分布式集群搭建完整指南
  • UE4学习笔记 FPS游戏制作29 更换武器时更换武器的图标
  • 鸿蒙 ArkUI 基础布局
  • 力扣67:二进制求和
  • 初识C++:Hello, World!
  • HarmonyOS NEXT 鸿蒙中关系型数据库@ohos.data.relationalStore API 9+
  • PPT制作,分享下2025年国内外做PPT的AI工具,一健生成PPT
  • 【RabbitMQ】
  • 高精度加减乘除 + R 格式
  • windows免密ssh登录linux
  • 核函数(机器学习深度学习)
  • (UI自动化测试web端)第三篇:元素的常用操作方法_鼠标操作
  • CF每日5题Day2(1400)
  • C语言代码如何操作硬件?
  • 量子计算的黎明:从理论到现实的突破之旅
  • 《Python实战进阶》No37: 强化学习入门:Q-Learning 与 DQN
  • 2025年人工智能产业TOP10有哪些省份?人工智能产业发展前景如何?
  • HarmonyOS NEXT 鸿蒙中手写和使用第三方仓库封装Logger打印工具
  • 04 单目标定实战示例
  • MySQL 用户权限与安全管理
  • 5G网络中CPE和ACS
  • 优雅的开始一个Python项目
  • Windows 我的世界 Minecraft 服务器搭建,Fabric 模组搭建教程(内网穿透)
  • 2025年渗透测试面试题总结-某快手-安全工程师(题目+回答)