当前位置: 首页 > news >正文

vllm server返回404的一种可能得解决方案

我的 server 启动指令

CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7  PYTHONPATH=${PYTHONPATH}:/root/experiments/vllm vllm serve ./models/DeepSeek-V3-awq --tensor-parallel-size 8 --trust-remote-code  --disable-log-requests --load-format dummy --port 8040 

client 端访访问后,server端返回:
在这里插入图片描述
就很奇怪,不都是直接访问 /v1/completions 这个路径吗?咋能404呢?

哦,原来是模型路径填错了

python benchmark_client.py \--backend vllm \--num_prompts 3000 \--warmup_round 1 \--concurrency 256 \--host localhost \--port 8000 \--model_name /test/models/DeepSeek-V3-awq      # <---------

启动server的时候写的是相对路径,这里写成绝对路径了
benchmark_client.py 这里是我的测试脚本,你看看你的请求头里的模型名字/路径改对了吗

相关文章:

  • UE5 Mat HLSL - Load
  • LangGraph(七)——Workflows
  • Vue-02 (使用不同的 Vue CLI 插件)
  • C++数据结构 : map和set的使用
  • docker环境搭建与常用指令
  • docker 搭建php 开发环境 添加扩展redis、swoole、xdebug(1)
  • 如何用Spring Cache实现对Redis的抽象
  • Oracle 正则表达式匹配(Oracle 11g)
  • 威联通QNAP替换docker源
  • 高频面试--redis
  • Python打卡 DAY 38
  • Docker 挂载卷并保存为容器
  • LeetCode 2894.分类求和并作差:数学O(1)一行解决
  • 大语言模型 21 - MCP 自动操作 Figma+Cursor 实现自动原型开发!
  • 利用 MkDocs 和 GitHub 部署个人博客网页
  • 基于 SpringBoot 与 VueJS 的智慧就业服务平台构建:技术融合与实践创新
  • AI赋能引爆短剧全球化风潮,腾讯云媒体处理助力短剧平台出海吸金
  • proteus8.4 安装包下载地址与安装教程
  • Web通信协议全景解析:从HTTP到WebService的技术演进与对比
  • NGINX HTTP/2 全面指南开启、调优与实战
  • 为您服务网站/杭州专业seo
  • 怎么提高网站的权重/如何制作一个属于自己的网站
  • 51zwd一起做网站/seo优化需要做什么
  • 武汉高端网站建设/站长工具流量统计
  • 最新的网站开发技术/英文站友情链接去哪里查
  • 宠物商店的网站开发论文/网络游戏推广员