调用 vLLM API 时常用的三种请求头模板:普通请求、带鉴权请求、流式请求。
目录
📌 1. 普通 JSON 请求(最基础)
📌 2. 带鉴权请求(常见于生产环境)
📌 3. 流式请求(Streaming / SSE)
📌 推荐模板(适配大多数情况)
📌 1. 普通 JSON 请求(最基础)
headers = {"Content-Type": "application/json","Accept": "application/json"
}
-
Content-Type
:告诉服务器请求体是 JSON 格式。 -
Accept
:希望返回 JSON。
📌 2. 带鉴权请求(常见于生产环境)
headers = {"Content-Type": "application/json","Accept": "application/json","Authorization": "Bearer YOUR_API_KEY" # 如果配置了 API Key
}
-
Authorization
:常用 Bearer Token 格式,例如:Authorization: Bearer sk-xxxxxx
📌 3. 流式请求(Streaming / SSE)
headers = {"Content-Type": "application/json","Accept": "text/event-stream","Authorization": "Bearer YOUR_API_KEY" # 可选
}
-
Accept: text/event-stream
:告诉服务器你要用 流式响应 (Server-Sent Events),适合长文本生成逐步返回。
📌 推荐模板(适配大多数情况)
headers = {"Content-Type": "application/json","Accept": "application/json", # 普通请求# "Accept": "text/event-stream", # 如果要流式输出,启用这个# "Authorization": "Bearer YOUR_API_KEY" # 如果需要鉴权,启用这个
}
👉 建议在写代码时,先用 普通 JSON 请求测试通了,再根据需要切换到 流式模式或 加上鉴权。