LLM中最后一个位置的对数概率是什么? 怎么作为LOSS实现方式
LLM中最后一个位置的对数概率是什么? 怎么作为LOSS实现方式
在自然语言处理(NLP)中,对数概率(Log Probability)是评估语言模型生成文本时不确定性的常用指标,通常用于衡量模型对某个 token(如单词、子词)的预测置信度。最后一个位置的对数概率特指模型在生成序列的最后一个位置时,对当前生成 token 的对数概率值。
核心概念解析
-
概率(Probability)
语言模型(如 LLM)在生成文本时,会为每个位置预测下一个可能的 token,并输出所有可能 token 的概率分布(总和为 1)。
例:假设模型生成到句子末尾时,预测最后一个 token 是 “苹果” 的概率为 0.3,“香蕉” 为 0.2,“水果” 为 0.5,则概率分布为[0.3, 0.2, 0.5]
。 -
对数概率(Log Probability)
为了避免概率