当前位置: 首页 > news >正文

[CLS] 向量是 BERT 类模型中一个特别重要的输出向量,它代表整个句子或文本的全局语义信息

[CLS] 向量是 BERT 类模型中一个特别重要的输出向量,它代表整个句子或文本的全局语义信息


✅ 什么是 [CLS]

在 BERT 模型中,每条输入前会加一个特殊的 token:[CLS](classification 的缩写)。这个 token 没有具体语义,它的作用是:

充当整个句子的“代表”,最终用于下游任务,比如分类、回归、句子匹配等。


✅ 结构上发生了什么?

举个例子,假设我们输入一句话:

text = "今天北京天气很好"

经过 tokenizer 编码后,变成:

['[CLS]', '今天', '北京', '天气', '很', '好', '[SEP]']

经过 BERT 编码器后,每个 token 都会有一个向量(比如维度是 768)。其中:

  • [CLS] 对应的向量:是模型设计用来表示“整句话”的向量
  • 北京天气 等 token 也会有自己的向量,但它们是词级别的

✅ 举个例子说明 [CLS] 的用途

假设你要做情感分类任务,比如判断一句话是“正面”还是“负面”:

text = "这个产品很好用,我很喜欢"

你输入这句话,BERT 模型就会输出一组向量,包括一个 [CLS] 向量。

然后你会这样用它:

logits = classifier(cls_embedding)  # 把 [CLS] 向量输入分类器

这个 classifier 通常是一个线性层或者小 MLP,用来输出二分类结果(正面/负面)。


[CLS] 向量 vs Sentence-BERT 向量

对比点[CLS] 向量Sentence-BERT 向量
目的原生是为分类服务的特别为句子表示训练过(句子检索、语义匹配)
训练方式原始 BERT 没训练 句子级别相似度SBERT 专门训练了 句子对 相似度任务
效果用于分类不错,用于 句子匹配 较差更适合做语义检索和句子表示
表达方式单个 [CLS] 向量通常是 mean pooling 所有 token 向量

✅ 总结一句话:

[CLS] 向量是 BERT 的“全句代表”,适合分类任务;但如果你要做语义检索、句子相似度,Sentence-BERT 更合适。

相关文章:

  • LeetCode 2918.数组的最小相等和:if-else
  • 物品识别 树莓派4 YOLO v11
  • 常用的Linux命令100条
  • 如何启动vue项目及vue语法组件化不同标签应对的作用说明
  • 批量图片处理的小工具
  • Paging 3.0 + Kotlin 分页加载指南
  • 计算机网络与多线程同步机制详解
  • Pytorch应用 小记 第一回:基于ResNet网络的图像定位
  • 汇编语言的温度魔法:单总线温度采集与显示的奇幻之旅
  • Python-函数
  • 备战菊厂笔试3
  • C# 使用 WinUI 3 项目模板创建桌面应用程序
  • C++GO语言微服务之图片、短信验证码生成及存储
  • Ajax基础
  • .Net HttpClient 管理客户端(初始化与生命周期管理)
  • 202534 | KafKa简介+应用场景+集群搭建+快速入门
  • kafka的安装及简单使用
  • [sklearn机器学习概述]机器学习-part3
  • 运算符与表达式 -《Go语言实战指南》
  • Scala与Go的异同教程
  • 体坛联播|穆勒主场完成拜仁谢幕战,山西车队再登环塔拉力赛
  • 家电维修担心遇“李鬼”?上海推动“物业+专业服务”进社区
  • “苏河超级管”调研:桥下公园“留白”很好,指引差点
  • 华泰柏瑞基金总经理韩勇因工作调整卸任,董事长贾波代为履职
  • 2025世界数字教育大会将于5月14日至16日在武汉举办
  • 明明睡够了,怎么还有黑眼圈?可能是身体在求救