当前位置：首页 > news >正文

vllm server返回404的一种可能得解决方案

news 2025/10/31 7:31:48

我的 server 启动指令

CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7  PYTHONPATH=${PYTHONPATH}:/root/experiments/vllm vllm serve ./models/DeepSeek-V3-awq --tensor-parallel-size 8 --trust-remote-code  --disable-log-requests --load-format dummy --port 8040

client 端访访问后，server端返回：
在这里插入图片描述
就很奇怪，不都是直接访问 /v1/completions 这个路径吗？咋能404呢？

哦，原来是模型路径填错了

python benchmark_client.py \--backend vllm \--num_prompts 3000 \--warmup_round 1 \--concurrency 256 \--host localhost \--port 8000 \--model_name /test/models/DeepSeek-V3-awq      # <---------

启动server的时候写的是相对路径，这里写成绝对路径了
benchmark_client.py 这里是我的测试脚本，你看看你的请求头里的模型名字/路径改对了吗

http://www.dtcms.com/a/216199.html

相关文章：

UE5 Mat HLSL - Load

LangGraph(七)——Workflows

Vue-02 （使用不同的 Vue CLI 插件）

C++数据结构： map和set的使用

docker环境搭建与常用指令

docker 搭建php 开发环境添加扩展redis、swoole、xdebug（1）

如何用Spring Cache实现对Redis的抽象

Oracle 正则表达式匹配（Oracle 11g）

威联通QNAP替换docker源

高频面试--redis

Python打卡 DAY 38

Docker 挂载卷并保存为容器

LeetCode 2894.分类求和并作差：数学O(1)一行解决

大语言模型 21 - MCP 自动操作 Figma+Cursor 实现自动原型开发！

利用 MkDocs 和 GitHub 部署个人博客网页

基于 SpringBoot 与 VueJS 的智慧就业服务平台构建：技术融合与实践创新

AI赋能引爆短剧全球化风潮，腾讯云媒体处理助力短剧平台出海吸金

proteus8.4 安装包下载地址与安装教程

Web通信协议全景解析：从HTTP到WebService的技术演进与对比

NGINX HTTP/2 全面指南开启、调优与实战

Windows版本的postgres安装插件http

恶意npm与VS Code包窃取数据及加密货币资产

FastMoss 国际电商Tiktok数据分析 JS 逆向 | MD5加密

Pytorch

[25-cv-05718]BSF律所代理潮流品牌KAWS公仔(商标+版权)

Springboot引入Spring Cloud for AWS的配置中心（Parameter Store和Secrets）

使用redis代替session的登录校验

语音合成之十七语音合成（TTS）中文自然度：问题、成因、解决方案

关于 Web 安全：6. 常见 CMS 开源系统风险点

2.3 TypeScript 非空断言操作符（后缀 !）详解