当前位置: 首页 > news >正文

微调这件小事:训练集中的输入数据该作为instruction还是input?从LLaMA-Factory的源码中寻找答案吧~

在之前的博文中,我们已经了解了LLaMA-Factory框架执行各类任务的流程。今天,我们将深入探讨SFT微调过程中关于数据集的两个关键问题:

  1. 数据集中的instruction和input是如何结合起来生成大模型可以理解的输入的?instruction是不是就是system prompt呢?(之所以会问这个问题,是因为我发现有的数据集将输入作为instruction,有的作为input,而它们在效果上基本没有区别)
  2. 模板(template)是如何起作用的?它如何将文本数据转换为模型可以理解的格式?

这两个问题其实在处理流程上是一体的,由于篇幅限制,我们这里先聚焦于第一个问题。

文章目录

    • SFT微调整体流程
      • 主要流程概括
      • 数据集与微调参数准备
      • SFT入参调试
    • 数据生成源码解析
      • 数据集准备
        • 数据集加载部分
          • 读取单个文件
          • 格式转换(解开谜题的钥匙)
          • 多数据集合并
        • 数据集后处理部分
    • 结论


🎉进入大模型应用与实战专栏 | 🚀查看更多专栏内容


相关文章:

  • 深度学习框架PyTorch——从入门到精通(8)保存并加载模型
  • 渐进式滑坡多场信息演化特征与数据挖掘研究
  • 蓝桥杯C++基础算法-0-1背包(优化为一维)
  • keda基于postgresql伸缩dify-api服务
  • Vite 创建 Vue3 项目指定 Package name 问题:Invalid package. json name
  • list的模拟实现和学习
  • 基于Matlab的大气湍流光束传输特性的研究
  • 基于springboot的古典舞在线交流平台(046)
  • 使用 Node.js 从零搭建 Kafka 生产消费系统
  • 数组作为哈希表的妙用:寻找缺失的第一个正数
  • 【NR NTN 3GPP协议】非地面网络(NR NTN)3GPP协议简介
  • Java-01-源码篇-并发编程-多线程常见接口讲解
  • 04_Linux驱动_06_GPIO子系统总结
  • 护网期间监测工作全解析:内容与应对策略
  • 强化学习的常用策略浅析
  • 【嵌入式学习2】函数
  • 【MySQL】字符集与排序规则
  • unsloth微调QwQ32B(4bit)
  • PyTorch 深度学习实战(22):多智能体强化学习(MARL)
  • QT5.14.2 gradle 构建安卓失败的处理方法
  • “一百零一个愿望——汉字艺术展”亮相意大利威尼斯
  • 李家超:明日起香港特区护照持有人可免签入境阿联酋
  • 网约车座椅靠背张贴“差评者得癌症”,如祺出行:未收到投诉无法处理
  • 微软将在全球裁员6000人,目标之一为减少管理层
  • 西安市未央区委书记刘国荣已任西咸新区党工委书记
  • 风雨天涯梦——《袁保龄公牍》发微