当前位置: 首页 > news >正文

VLLM专题(三十一)—架构概述

本文档提供了vLLM架构的概述。

1. 入口点

vLLM 提供了多个与系统交互的入口点。下图展示了它们之间的关系。
在这里插入图片描述

1.1 LLM 类

LLM 类提供了用于进行离线推理的主要 Python 接口,即在不使用单独的模型推理服务器的情况下与模型进行交互。

以下是 LLM 类的使用示例:

from vllm import LLM, SamplingParams

# Define a list of input prompts
prompts = [
    "Hello, my name is",</

相关文章:

  • doris:审计日志
  • C#通过SignalR直接返回流式响应内容
  • 【RabbitMQ】RabbitMQ中死信交换机是什么?延迟队列呢?有哪些应用场景?
  • 【vue3+vant】移动端 - 部门树下拉选择组件 DeptTreeSelect 开发
  • Vue3 界面设计插件 microi-pageengine 入门教程一
  • MyBatis 学习经验分享
  • 责任链模式:优雅处理请求的设计艺术
  • Docker运行Mysql异常:Operation not permitted
  • OceanBase 读写分离最佳实践
  • ADB三个模块介绍
  • C# HTTP认证方式详解与代码实现
  • Docker 最佳实践(MySQL)
  • [spring] Spring JPA - Hibernate 多表联查 1
  • K8S学习之基础三十三:K8S之监控Prometheus部署程序版
  • 【蓝桥杯python研究生组备赛】005 数学与简单DP
  • windows安装金仓V9初始化数据库失败
  • Grid 布局实现三栏布局
  • Vue3:构建高效用户界面的利器
  • VUE中使用路由router跳转页面
  • HTTP请求方法详解:GET、POST、PUT在微信小程序中的应用
  • AI世界的年轻人,如何作答未来
  • 国家卫健委有关负责人就白皮书发布答记者问
  • 是否进行了及时有效处置?伤者情况如何?辽阳市相关负责人就饭店火灾事故答问
  • 2024“好评中国”网络评论大赛结果揭晓
  • 万科:一季度营收近380亿元,销售回款率超100%
  • 上海市十六届人大常委会第二十一次会议表决通过有关人事任免事项