QWEN2.5_0.5 微调生成文件目录

一、通用文件(checkpoint-6 和 final_model 中共有的文件)
-
config.json
- 存储模型的架构配置信息,包括模型层数、隐藏层大小、注意力头数等参数,用于复现模型结构。
-
generation_config.json
- 记录模型生成文本时的默认参数(如最大生成长度、温度系数、top-p 等),定义推理阶段的生成策略。
-
model.safetensors
- 存储模型的权重参数,是一种安全的权重存储格式,包含训练后更新的模型参数,用于加载模型进行推理或继续训练。
-
training_args.bin