当前位置: 首页 > news >正文

深度学习的Logits:logist 是什么,上一维度的隐藏向量怎么获取

1. Logits 是什么?

在这里插入图片描述

在深度学习(尤其是语言模型)中,Logits 指模型最后一层输出的 原始分数向量,未经过 Softmax 等概率归一化。它的维度等于词汇表大小(n_vocab),**每个元素对应一个词的“原始打分”,**数值越大表示模型认为该词越可能是正确预测结果。

关键点

  • Logits 不是概率(范围通常是任意实数,如 -10 到 +10);
  • 需通过 Softmax 转换为概率分布(每个元素值在 0~1 之间,总和为 1)。

2. “直接就是词的可信度吗?”

  • Logits 数值越大 → 对应词的 Softmax 概率越高 → 模型认为该词越可信;
  • 但单独看 Logits 无法直接判断可信度(需归一化后对比)。

上一维度的向量怎么获取?outputs.hidden_states

图中“上一维度的向量”通常指模型前一层的输出,例如:

  • 语言模型中,可能是 Transforme
http://www.dtcms.com/a/295120.html

相关文章:

  • Linux C: 函数
  • 洪水预报中的序列到序列模型及其可解释性扩展
  • 设置低秩适配器(LoRA)
  • 优化:Toc小程序猜你喜欢功能
  • 基于python的微博评论和博文文本分析,包括LDA+聚类+词频分析+lstm热度预测,数据量10000条
  • 浅谈Python 中的 @contextmanager:资源管理与状态切换的最佳实践
  • 实验室信息管理系统的设计与实现/实验室管理系统
  • Remote Framebuffer Protocol (RFB) 详解
  • 洛谷 P11249 [GESP202409 七级] 小杨寻宝-普及/提高-
  • Python 中的上下文管理器:@asynccontextmanager 解析与实战案例
  • 【Pytorch】数据集的加载和处理(二)
  • MySQL梳理二:索引
  • 抽奖系统(2)——注册/登陆
  • AI语音芯片跨界集成屏幕驱动让开发更简单
  • Show-o 论文解读
  • 嵌入式与 Linux 系统中的核心图形库全解析
  • 认识Transformer架构
  • 【element plus】el-select,allow-create不需要点回车键
  • 【tmux无法使用鼠标滚轮滚动页面的问题】解决方案
  • web自动化--鼠标键盘事件滚动操作
  • HTML5 网页游戏设计开发——1、HTML基础
  • 环境搭建①:下载STM32标准外设库(固件库下载)
  • GNSS差分定位系统之二:差分定位能直接提高移动站的定位精度吗?
  • lwIP学习记录4——裸机移植lwIP工程
  • HCIP一二章笔记
  • Linux运维新手的修炼手扎之第24天
  • 仰望星空:DIY国际空间站(ISS)过境提醒天线
  • Pig Cloud使用Debezium实时监听数据变更
  • pandas库
  • 18-设备虚拟化IRF