大模型微调 SFTTrainer 数据处理与训练器配置解析(116)
SFTTrainer 数据处理
- 大模型微调 SFTTrainer 数据处理与训练器配置解析(116)
- 务必检查数据是否按预期加载成功
- 填充标记(padding tokens)应当放在左侧。在训练生成式语言模型(generative language models)时,右侧填充(right-padding)是绝对不可取的(big no-no)。
大模型微调 SFTTrainer 数据处理与训练器配置解析(116)
如你所见,我们在第 2、3、4 讲中已经涵盖了这部分内容的大部分。当然,值得注意的例外是训练参数(training arguments),这将是下一部分的主题。
不过,首先我们来创建一个 “最小可行训练器”(Minimum Viable Trainer),简称 MVT。
mvt_trainer = SFTTrainer(
model=peft_model,
processing_class=tokenizer,
train_dataset=dataset,
args=SFTConfig(
output_dir