当前位置: 首页 > news >正文

vLLM专题(六)-Pooling模型

vLLM 还支持池化模型,包括嵌入、重排序和奖励模型。

在 vLLM 中,池化模型实现了 VllmModelForPooling 接口。这些模型使用 Pooler 提取输入的最终隐藏状态,然后返回结果。

注意
我们目前支持池化模型主要是出于方便考虑。如兼容性矩阵所示,大多数 vLLM 功能不适用于池化模型,因为它们仅在生成或解码阶段工作,因此性能提升可能不会很大。

对于池化模型,我们支持以下 --task 选项。选择的选项将设置默认的池化器,用于提取最终的隐藏状态:
在这里插入图片描述

  • 默认的池化器始终由模型定义。

注意
如果模型在 vLLM 中定义了自己的池化器,则默认池化器将设置为该池化器,而不是表中指定的池化器。

在加载 Sentence Transformers 模型时,我们会根据其 Sentence Transformers 配置文件(modules.json)尝试覆盖默认的池化器。

相关文章:

  • floodfill算法系列一>扫雷游戏
  • vue基础(十)
  • 如何使用 Ollama 在本地设置和运行 DeepSeek R1
  • 如何使用 Docker 搭建 FastAPI 环境, 本地仅编辑代码
  • 力扣LeetCode: 931 下降路径最小和
  • 【小白学AI系列】NLP 核心知识点(七)Embedding概念介绍
  • 【Elasticsearch】`nested`字段
  • 巨控GRM530系列的远程模块用于PLC远程上下载方案
  • 9.综合调试|输入不能存在空格|desc存在None|输出权值和ID|函数重名|修改文件名|权值和实际关键词出现次数(C++)
  • 网工项目理论1.10 路由结构设计
  • 999感冒灵抖音KOL内容营销案例拆解
  • 2.17日学习总结
  • javacv将视频切分为m3u8视频并播放
  • 三级等保项目设备清单及高风险项整改方向
  • 嵌入式 lwip http server makefsdata
  • Node.js 异步并发控制:`p-map` 和 `p-limit` 的使用与对比
  • ubuntu在线安装PostgreSQL(pgsql)
  • 大幂计算和大阶乘计算【C语言】
  • idea 2023.3.7常用插件
  • Redis基本数据结构
  • 戴紫薇评《不像说母语者》丨后殖民语境下的母语追寻
  • 国际观察丨澳大利亚新一届政府面临系列挑战
  • 国铁集团:5月4日全国铁路预计发送旅客2040万人次
  • 乘客被困停滞车厢超4小时,哈尔滨铁路局客服:列车晚点,表示歉意
  • 车展之战:国产狂飙、外资反扑、智驾变辅助
  • 美乌矿产协议签署被曝“临门一脚”时生变,美方提附加条件