当前位置：首页 > news >正文

微调这件小事：训练集中的输入数据该作为instruction还是input？从LLaMA-Factory的源码中寻找答案吧~

news 2025/8/21 19:28:22

在之前的博文中，我们已经了解了LLaMA-Factory框架执行各类任务的流程。今天，我们将深入探讨SFT微调过程中关于数据集的两个关键问题：

数据集中的instruction和input是如何结合起来生成大模型可以理解的输入的？instruction是不是就是system prompt呢？（之所以会问这个问题，是因为我发现有的数据集将输入作为instruction，有的作为input，而它们在效果上基本没有区别）
模板(template)是如何起作用的？它如何将文本数据转换为模型可以理解的格式？

这两个问题其实在处理流程上是一体的，由于篇幅限制，我们这里先聚焦于第一个问题。

文章目录

- SFT微调整体流程
- - 主要流程概括
  - 数据集与微调参数准备
  - SFT入参调试
- 数据生成源码解析
- - 数据集准备
  - - 数据集加载部分
    - - 读取单个文件
      - 格式转换（解开谜题的钥匙）
      - 多数据集合并
    - 数据集后处理部分
- 结论

🎉进入大模型应用与实战专栏 | 🚀查看更多专栏内容

http://www.dtcms.com/a/86349.html

相关文章：

深度学习框架PyTorch——从入门到精通（8）保存并加载模型

渐进式滑坡多场信息演化特征与数据挖掘研究

蓝桥杯C++基础算法-0-1背包（优化为一维）

keda基于postgresql伸缩dify-api服务

Vite 创建 Vue3 项目指定 Package name 问题：Invalid package. json name

list的模拟实现和学习

基于Matlab的大气湍流光束传输特性的研究

基于springboot的古典舞在线交流平台（046）

使用 Node.js 从零搭建 Kafka 生产消费系统

数组作为哈希表的妙用：寻找缺失的第一个正数

【NR NTN 3GPP协议】非地面网络（NR NTN）3GPP协议简介

Java-01-源码篇-并发编程-多线程常见接口讲解

04_Linux驱动_06_GPIO子系统总结

护网期间监测工作全解析：内容与应对策略

强化学习的常用策略浅析

【嵌入式学习2】函数

【MySQL】字符集与排序规则

unsloth微调QwQ32B(4bit)

PyTorch 深度学习实战（22）：多智能体强化学习（MARL）

QT5.14.2 gradle 构建安卓失败的处理方法

[RoarCTF 2019]Easy Calc-3.23BUUCTF练习day5(2)

大语言模型-2.2/3-主流模型架构与新型架构

CH32V208蓝牙内部带运放32位RISC-V工业级微控制器CH32V208CBU6、CH32V208GBU6开发板原理图和PCB

【Linux文件IO】Linux中标准IO的API的描述和基本用法

SpringBoot集成Couchbase开发与实践

使用 docker compse 启动 Milvus 修改 MINIO_ACCESS_KEY 导致启动失败

onedav一为导航批量自动化导入网址（完整教程）

回归——数学公式推导全过程

//TODO 动态代理的本质?

深度学习与计算机视觉方向