当前位置: 首页 > news >正文

大语言模型涉及的一些概念(持续更新)

1、entropy

在自然语言处理(NLP)和机器学习中,entropy(熵)是一个非常重要的概念,来自信息论(Information Theory),本质上是用来衡量“不确定性”或“信息量”的。

通俗理解 Entropy(熵)

熵 = 不确定性 = 随机程度

举例:

  • 如果一个模型输出的概率分布是:
    {"猫": 0.33, "狗": 0.33, "鸟": 0.34}
    → 表示模型非常不确定 → 熵高

  • 如果输出是:
    {"猫": 0.98, "狗": 0.01, "鸟": 0.01}
    → 模型很有把握 → 熵低

2、token

什么是 Token?

Token(标记) 是把文本分割成模型可理解的“最小单位”,可以是:

类型示例描述
单词级 token["I", "am", "happy"]一个词就是一个 token(粗粒度)
子词级 token["un", "happi", "ness"]把词拆成词根+后缀(BPE等方法)
字符级 token["h", "e", "l", "l", "o"]每个字符一个 token(细粒度)

不同模型和 tokenizer 使用不同的分词策略。

 

http://www.dtcms.com/a/313205.html

相关文章:

  • VisualStudio的一些开发经验
  • 思二勋:数字资产化与资产数权化是RWA运作的核心逻辑
  • AtCoder Beginner Contest 417
  • MySQL事务与存储引擎的学习(一)
  • Docker国内镜像列表
  • Effective C++ 条款19: 设计class犹如设计type
  • Python从入门到精通计划Day02: Python语法探秘:当现代艺术遇到古典音乐
  • 最小半径覆盖问题【C++解法+二分+扫描线】
  • 【CF】Day118——杂题 (随机哈希 / 思维 | 贪心 / DP | 位运算构造 | 状态压缩 + 建图 + 最短路 | 构造 | 贪心)
  • 使用纯Docker命令搭建多服务环境(Linux版)
  • Python篇---包
  • 在Ansys Mechanical中对磨损进行建模
  • 力扣经典算法篇-40-螺旋矩阵(方向遍历:方向数组+已访问元素集合)
  • 【ROS2】常用命令
  • 04.Redis 的多实例
  • 双八无碳小车设计【16张cad】三维图+设计说明书
  • 【C++ 初级工程师面试--5】inline内联函数特点 、和普通函数的区别、什么时候适合内联?
  • json-server 快速搭建本地 Mock 数据服务
  • Day23--回溯--39. 组合总和,40. 组合总和 II,131. 分割回文串
  • Android 之 MVC架构
  • 线段树学习笔记 - 摩尔投票问题
  • I2C基础
  • mybatis-plus从入门到入土(四):持久层接口之BaseMapper和选装件
  • PHP现代化全栈开发:前后端分离与API架构实践
  • uni-app学习笔记01-项目初始化及相关文件
  • Go语言常量
  • 11.消息队列
  • 计算机视觉CS231n学习(2)
  • 从马武寨穿越关山
  • ICCV 2025 | EPD-Solver:西湖大学发布并行加速扩散采样算法