当前位置：首页 > news >正文

logits和softmax分布

news 2025/10/3 6:21:07

logits

logits是模型的输出分数

在大语言模型里，logits 是每个 token 的“相对偏好分数”，可以是正数、负数或零

# 输入文本
text = "你好"
inputs = tokenizer(text, return_tensors="pt")# 获取模型输出
with torch.no_grad():outputs = model(**inputs)  # 输出是 ModelOutput 对象# logits
logits = outputs.logits  # shape: [batch_size, seq_len, vocab_size]
print(logits.shape)
print(logits)  # 每个 token 对应词表每个 token 的分数# torch.Size([1, 1, 151936])
# tensor([[[ 2.8750,  0.4199,  0.5938,  ..., -1.2109, -1.2109, -1.2109]]],
#        device='cuda:0', dtype=torch.bfloat16)

softmax

softmax公式

e≈ 2.71828（自然常数）

分母就是对所有 token 的指数求和

http://www.dtcms.com/a/434586.html

相关文章：

硬件工程师入门基础知识（九）压敏电阻

[Linux]学习笔记系列 -- lib/xarray.c eXtensible Array (XArray) 可扩展数组

基于物理信息神经网络（PINN）求解二维稳态对流-扩散方程的MATLAB实现

物流网站建设可行性分析品牌网站制作网站公司

温州专业微网站制作网络公司建设125摩托车价格及图片

《嵌入式 – GD32开发实战指南(RISC-V版本)》第5章跳动的心脏-内核TIMER

《嵌入式 – GD32开发实战指南(RISC-V版本)》第7章定时器

佛山新网站建设平台专业动画制作软件

《WebAssembly指南》第九章：WebAssembly 导入全局字符串常量

轻量之选：不依赖宝塔，用 NPM 与命令行部署在线工具箱

RUST 静态生命周期和动态生命周期

Rocky Linux 8 远程管理配置指南（宿主机 VNC + KVM 虚拟机 VNC）

北京网站快速备案建站手机网站

第四章信息系统管理

【开发日记】记一次公司服务器中Redis服务问题排查

linux问题10--克隆后ip地址和源linux主机相同

社交网站模版steam交易链接怎么改

AI重塑销售管理，突破“人”的能力边界｜纷享AI主题研讨会宁波站圆满落幕

[C++项目组件] 后台服务器部署docker

移动固态优盘坏道读写速率下降等测试

解决django.db.utils.OperationalError: attempt to write a readonly database问题

Django SimpleUI 配置与优化详解

从入门到精通：Django的深度探索之旅

【数据结构】考研重点掌握：顺序查找算法实现与ASL计算详解

大型网站建立1800做网站因为专业

医疗AI平台化转型：从单点试点到体系化建设的互操作性与质量控制路径研究（上）

做装修效果图的网站沈阳哪有wordpress

Linux命令行指令返回值data空降Python的机枪与大炮(DeepSeek)

c++中this指针使用bug

网站源码中国有限公司外贸网站建设怎么制作