当前位置：首页 > news >正文

【人工智能99问】什么是教师强制？(16/99)

news 2025/7/22 12:56:16

什么是教师强制？

教师强制是一种在训练循环神经网络（RNN）或序列到序列（Seq2Seq）模型时常用的技巧。其核心思想是：在训练过程中，不使用模型自身在上一个时间步的预测输出作为下一个时间步的输入，而是直接使用真实的标签（ground truth）作为输入。这种方法可以加速模型的收敛速度并提高训练的稳定性。

“原比例”并不是一个与“教师强制”直接相关的术语。在教师强制的上下文中，可能提到的是“教师强制的比例”，即在训练过程中使用真实标签作为输入的比例。例如，在计划采样（Scheduled Sampling）中，会逐渐减少使用真实标签的比例，增加使用模型自身预测的比例。

假设我们正在训练一个机器翻译模型，将英语翻译成法语。输入序列是英语句子，目标序列是对应的法语句子。以下是教师强制的具体应用过程：

训练阶段

输入序列：假设输入的英语句子是“Mary had a little lamb”。
目标序列：对应的法语句子是“Marie avait un petit agneau”。
教师强制的训练过程：
- 在时间步1，模型的输入是“Mary”，目标输出是“Marie”。
- 在时间步2，不使用模型在时间步1生成的输出，而是直接将“Marie”作为输入，目标输出是“avait”。
- 在时间步3，将“avait”作为输入，目标输出是“un”，依此类推。
- 每个时间步的损失是通过计算模型输出与真实目标之间的交叉熵来计算的，然后通过反向传播更新模型参数。

推理阶段
在推理阶段（即实际使用模型进行翻译时），模型无法获取真实的目标序列，因此需要使用自身生成的输出作为下一个时间步的输入：

输入序列：仍然是“Mary had a little lamb”。
生成过程：
- 在时间步1，模型的输入是“Mary”，生成的输出可能是“Marie”。
- 在时间步2，将“Marie”作为输入，生成的输出可能是“avait”。
- 在时间步3，将“avait”作为输入，生成的输出可能是“un”，依此类推，直到生成结束标记或达到最大长度。

场景：机器翻译（英译中）
输入序列（英文）: “I love cats”

目标序列（中文）: “我爱猫”

训练步骤：

若不用教师强制：
假设模型第一步错误预测为 “你” 而非 “我”，则后续输入变为 [, “你”]，错误会持续放大，导致训练困难。

优点：
- 加速训练：使用真实标签可以减少模型在早期训练阶段因错误预测而导致的连锁反应，从而加速收敛。
- 提高稳定性：避免了模型在训练初期可能产生的错误预测的累积效应，使得训练过程更加稳定。
缺点：
- 曝光偏差（Exposure Bias）：模型在训练时只接触到真实的数据分布，而在实际推理时，模型需要根据自身的预测进行下一步的生成，这两种情况存在差异，可能导致模型在推理时表现下降。