LLaMA-Factory微调教程4:模型评估
文章目录
-
-
-
- 通用能力评估
-
- 评估结果
- NLG 评估
-
- **一、BLUE(Bilingual Evaluation Understudy)**
- 1. 核心原理
- 2. 计算步骤
- 3. 特点与适用场景
- **二、ROUGE(Recall-Oriented Understudy for Gisting Evaluation)**
-
- 1. 核心原理
- 2. 计算步骤(以ROUGE-N为例)
- 3. 特点与适用场景
- **三、BLUE与ROUGE的对比**
- **四、总结**
- 评估结果
- 评估相关参数
-
-
通用能力评估
在完成模型训练后,可以通过 llamafactory-cli eval examples/train_lora/llama3_lora_eval.yaml 来评估模型效果。
模仿llama3_lora模型的评估参数文件,准备qwen2_7b模型的评估参数文件,
下面是qwen2_lora_eval文件,
### model
model_name_or_path: ../Qwen2-7B
adapter_name_or_path: saves/qwen2-7b/lora/sft
trust_remote_code: 