当前位置: 首页 > wzjs >正文

东莞网站外包百度浏览器

东莞网站外包,百度浏览器,wordpress 读书主题,免费做logo报错信息 刚开始运行程序的时候,一直报错: ERROR:root:调用本地模型失败: Error code: 404 - {object: error, message: The model Qwen/QwQ-32B does not exist., type: NotFoundError, param: None, code: 404}排查 使用下面的命令,查看…

报错信息

刚开始运行程序的时候,一直报错:

ERROR:root:调用本地模型失败: Error code: 404 - {'object': 'error', 'message': 'The model `Qwen/QwQ-32B` does not exist.', 'type': 'NotFoundError', 'param': None, 'code': 404}

排查

使用下面的命令,查看模型的详细信息。

curl http://127.0.0.1:8000/v1/models

返回结果

{"object": "list","data": [{"id": "/root/.cache/modelscope/hub/models/Qwen/QwQ-32B","object": "model","created": 1748241077,"owned_by": "vllm","root": "/root/.cache/modelscope/hub/models/Qwen/QwQ-32B","parent": null,"max_model_len": 40960,"permission": [{"id": "modelperm-c461f1432aa348cea67b07443c0f0da2","object": "model_permission","created": 1748241077,"allow_create_engine": false,"allow_sampling": true,"allow_logprobs": true,"allow_search_indices": false,"allow_view": true,"allow_fine_tuning": false,"organization": "*","group": null,"is_blocking": false}]}]
}

原因

其中 id 就是模型的实际名称,如下

# 使用 vLLM 的模型名(根据你 curl /v1/models 返回的 model id 来填写)MODEL_NAME = "/root/.cache/modelscope/hub/models/Qwen/QwQ-32B"

回顾之前的启动命令,即使用 vllm 启动 QWQ-32B 的命令如下:

python -m vllm.entrypoints.openai.api_server \
--model /root/.cache/modelscope/hub/models/Qwen/QwQ-32B \
--tensor-parallel-size 4 \
--host 0.0.0.0 \
--port 8000 \
--max-num-batched-tokens 2048 \
--gpu-memory-utilization 0.85

并没有指定对外暴露的模型名称。

要让 MODEL_NAME = "QwQ-32B" 成功调用你的本地模型,你需要在启动 vLLM 服务时加上一个参数::

# 最后添加这个参数
--hosted-model-name QwQ-32B \# 也就是
--host 0.0.0.0 \
--port 8000 \
--model /root/.cache/modelscope/hub/models/Qwen/QwQ-32B \
--hosted-model-name QwQ-32B \

它表示:虽然模型实际路径是 /root/.cache/...,但对外暴露的模型名是 QwQ-32B

vLLM启动,完整的命令如下

python -m vllm.entrypoints.openai.api_server \
--model /root/.cache/modelscope/hub/models/Qwen/QwQ-32B \
--tensor-parallel-size 4 \
--host 0.0.0.0 \
--port 8000 \
--max-num-batched-tokens 2048 \
--gpu-memory-utilization 0.85 \
--hosted-model-name QwQ-32B

参数详解

1. python -m vllm.entrypoints.openai.api_server

  • 启动的是 vLLM 的 OpenAI API 兼容服务器
  • 这个服务器对外提供与 OpenAI API 类似的接口(如 /v1/chat/completions
  • 可以用 curl、Python SDK 或前端调用,兼容 OpenAI 格式请求

2. --model /root/.cache/modelscope/hub/models/Qwen/QwQ-32B

  • 指定要加载的模型路径
  • 这里是本地存储的 QwQ-32B 模型,通常是一个 HuggingFace 风格的模型文件夹
  • 支持 GGUF、HuggingFace、以及经过 vLLM 转换后的张量并行模型

3. --tensor-parallel-size 4

  • 表示使用 4 块 GPU 来进行 Tensor Parallelism(张量并行)
  • QwQ-32B 是一个大模型,单卡放不下,所以需要拆分到多个 GPU 上推理
  • 如果你有 4 张卡,这个设置合理;如果只有 1 张卡,就设为 --tensor-parallel-size 1

4. --host 0.0.0.0

  • 设置监听地址为所有网络接口
  • 这样可以从外部访问该服务(比如从其他机器通过 IP 访问)
  • 如果只想本机访问,可以改为 --host 127.0.0.1

5. --port 8000

  • 设置服务监听的端口号为 8000
  • 可以通过浏览器或 API 请求访问:http://localhost:8000http://<ip>:8000

6. --max-num-batched-tokens 2048

  • 控制每次 batch 中最多处理多少个 token(输入 + 输出)
  • 增大这个值可以提高吞吐量,但会占用更多显存
  • 默认值通常是 2560 左右,这里设为 2048 是为了控制显存使用

7. --gpu-memory-utilization 0.85

  • 设置 GPU 显存使用率为 85%
  • 这是为了防止 OOM(Out Of Memory),留出一部分缓冲空间
  • 默认值是 0.9,如果你的显存较小,可以适当降低(如 0.7)

8. --hosted-model-name QwQ-32B

它表示:虽然模型实际路径是 /root/.cache/…,但对外暴露的模型名是 QwQ-32B


示例请求(使用 curl)

你可以使用如下命令测试服务是否正常运行:

curl http://localhost:8000/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{"model": "QwQ-32B","messages": [{"role": "user", "content": "讲个笑话吧"}]
}'

示例请求(使用python代码)

import openaiclient = openai.OpenAI(base_url="http://localhost:8000/v1",api_key="EMPTY"  # 如果没有启用鉴权,可以为空
)completion = client.chat.completions.create(model="QwQ-32B",  # ← 这里就能用了!messages=[{"role": "user", "content": "你好,请讲个笑话。"}]
)print(completion.choices[0].message.content)
http://www.dtcms.com/wzjs/596317.html

相关文章:

  • 青岛移动网站建设南京一对一网站建设
  • 网站定制哪家比较好网站空间租用多少钱
  • 小程序官方开发文档烟台seo网站排名优化
  • 网页建设与网站设计心德体会网站建设设计流程图
  • 做网站文件下载wordpress中dw是什么
  • 马洪旭 做的网站大学论述网站建设整个流程
  • 手机网站吧软件前端开发
  • 学企业管理培训班山东seo推广
  • 品牌网站制作流程wordpress登陆才能访问
  • 公司网站百度小程序开发哈尔滨市城乡建设局官网
  • 百度站长工具网站提交怎么增加网站浏览量
  • 无锡网站改版多少钱零售商城
  • 中卫建设厅网站网站建设与维护大作业
  • 商城式网站具备哪些功能吗网络营销推广计划
  • 建一个购物网站大约多少钱鱼台县建设局网站
  • 百色网站免费建设深圳物流公司排名
  • 服务器做网站移动端网站搭建
  • 寻找电子商务网站建设海口 网站开发
  • 昆山高新区规划建设局网站网站如何获取用户信任
  • wordpress门户网站模板下载做我姓什么的网站
  • dedecms网站地图路径修改生成后 网站地图前台路径不变深圳知名企业
  • 软件网站建设的目的买域名网站
  • 安徽网站优化多少钱网站备案信息传
  • 网站建设技术支持方案做推广必须知道的网站吗
  • 网站相应速度明薇通网站建设首选
  • 手机网站如何开发微信小程序怎么做免费
  • 做网站建设的上市公司有哪些seo网站标题
  • 适合网站参加的培训班资源网站建设多少钱
  • 国外的有趣设计网站用哪个程序做网站收录好
  • 涉县移动网站建设报价ui设计都包括什么