当前位置: 首页 > news >正文

LLaMA-Factory 中配置文件或命令行里各个参数的含义

常见参数分类 & 含义对照表:

🔹模型相关

参数含义
model_name_or_path基础模型的路径(本地或 HuggingFace Hub 上的名字,如 meta-llama/Llama-2-7b-hf)
adapter_name_or_pathLoRA/Adapter 权重路径(如果要在已有权重上继续训练或推理)
cache_dir模型缓存路径
use_fast_tokenizer是否使用 fast tokenizer(基于 tokenizers 的实现,速度快)
resize_vocab是否根据新增的 special tokens 扩充词表

🔹 数据集相关

参数含义
dataset使用的数据集名称(框架内置如 alpaca_gpt4,也可以自定义)
dataset_dir数据集目录路径
templatePrompt 模板(例如 alpaca、vicuna,会决定输入拼接格式)
cutoff_len每条样本的最大 token 长度(超出会被截断)
max_samples限制训练时使用的最大样本数(调试时用)

🔹 训练相关

参数含义
do_train是否进行训练
do_eval是否进行评估
output_dir模型保存目录
num_train_epochs训练的总 epoch 数
max_steps如果指定,训练到该步数后停止(优先级高于 num_train_epochs)
per_device_train_batch_size每张 GPU 的训练 batch size
gradient_accumulation_steps梯度累计步数,用于模拟更大 batch
learning_rate学习率
lr_scheduler_type学习率调度器(linear, cosine, constant等)
warmup_steps / warmup_ratio学习率预热步数/比例
weight_decay权重衰减系数
max_grad_norm梯度裁剪阈值
logging_steps日志打印间隔
save_steps模型保存间隔(步数)
save_total_limit只保留最近的多少个 checkpoint

🔹 PEFT / LoRA 参数

参数含义
finetuning_type微调方式:lora, full, freeze, qlora
lora_rankLoRA 低秩矩阵维度 r
lora_alphaLoRA 缩放系数 α
lora_dropoutLoRA dropout 比例
target_modules应用 LoRA 的模块(默认 q_proj,k_proj,v_proj,o_proj)

🔹 推理/生成相关

参数含义
do_predict是否运行预测/推理
max_new_tokens生成时最大新 token 数
temperature生成时温度(越高越随机)
top_k采样时 top-k
top_pnucleus sampling 概率阈值
repetition_penalty重复惩罚系数

🔹 量化相关

参数含义
quantization_bit量化比特数(4, 8等)
bnb_4bit_use_double_quant是否使用双重量化
bnb_4bit_quant_type量化类型(如 nf4、fp4)
bnb_4bit_compute_dtype计算时数据类型(float16/bfloat16)

🔹 其他常用参数

参数含义
seed随机数种子(保证可复现)
report_to日志上报方式(wandb, tensorboard, none)
ddp_find_unused_parameters分布式训练时是否查找未用参数(DDP 必要选项)
http://www.dtcms.com/a/347398.html

相关文章:

  • 深度集成Dify API:基于Vue 3的智能对话前端解决方案
  • Maven仓库与Maven私服架构
  • Vue 3 useModel vs defineModel:选择正确的双向绑定方案
  • 自然语言处理——05 Transformer架构和手写实现
  • 微前端架构核心要点对比
  • 小区物业对大楼顶面的巡查通常是定期巡查+特殊情况下的临时巡查相结合
  • 认识模块化及常见考点
  • 【秋招笔试】2025.08.23京东秋招笔试题
  • onnx入门教程(二)—— PyTorch 转 ONNX 详解
  • C#多线程同步利器:Monitor全解析
  • 安卓10.0系统修改定制化____如何修改固件 去除开机后默认的屏幕锁定
  • AcWing 114. 【0x07】国王游戏
  • C代码学习笔记(一)
  • Windows打开命令窗口的几种方式
  • 使用 PSRP 通过 SSH 建立 WinRM 隧道
  • 注意力机制中为什么q与k^T相乘是注意力分数
  • 每日定投40刀BTC(22)20250802 - 20250823
  • 编程刷题-染色题DFS
  • 03_数据结构
  • 在 CentOS 7 上搭建 OpenTenBase 集群:从源码到生产环境的全流程指南
  • MSPM0G3507工程模板创建
  • 微信小程序自定义组件开发(上):从创建到数据通信详解(五)
  • 纠删码技术,更省钱的分布式系统的可靠性技术
  • 使用springboot开发-AI智能体平台管理系统,统一管理各个平台的智能体并让智能体和AI语音设备通信,做一个属于自己的小艾同学~
  • Dubbo vs Feign
  • 个人思考与发展
  • 探秘北斗卫星导航系统(BDS):架构、应用与未来蓝图,展现中国力量
  • 详细说一说JIT
  • Redis面试精讲 Day 28:Redis云原生部署与Kubernetes集成
  • Js逆向 拼夕夕anti_content