当前位置: 首页 > news >正文

大模型sft-数据构建和选择

1 数据形式

一、通用文本格式

1. 单轮问答(文本对)

  • 结构:输入(Input)与输出(Output)的简单配对。

  • 格式示例

     

    [ {"input": "如何学习Python?", "output": "建议从基础语法开始,逐步实践项目。"}, {"input": "推荐一部科幻电影", "output": "《星际穿越》是一部经典的科幻作品。"} ]

     

    input,output "如何学习Python?","建议从基础语法开始,逐步实践项目。" "推荐一部科幻电影","《星际穿越》是一部经典的科幻作品。"

    • 适用场景:文本生成、翻译、摘要等单轮任务。

    • 优点:简单易用,兼容大多数模型。

    • 缺点:无法处理多轮对话或复杂上下文。

    二、对话格式

    1. 多轮对话(Hugging Face推荐格式)

    • 结构:使用messages字段记录完整对话历史,每条消息包含role(角色)和content(内容)。

    • 格式示例

       

      [ { "messages": [ {"role": "user", "content": "推荐巴黎的必去景点"}, {"role": "assistant", "content": "埃菲尔铁塔、卢浮宫值得一游。"}, {"role": "user", "content": "卢浮宫门票价格?"}, {"role": "assistant", "content": "常规门票17欧元,每月第一个周六免费。"} ] } ]

      • 适用场景:客服对话、聊天机器人等需要上下文的任务。

      • 优点:保留完整对话逻辑,适配对话模型(如LLaMA-2-chat)。

      • 缺点:存储空间较大,需处理长文本分块。

      2. 角色扮演对话

      • 结构:添加system角色定义助手行为,增强对话引导。

      • 格式示例

         

        { "messages": [ {"role": "system", "content": "你扮演李白,用唐诗风格回答"}, {"role": "user", "content": "如何看待现代都市生活?"}, {"role": "assistant", "content": "钢筋林立遮星月,车马喧嚣乱心弦。"} ] }

        • 适用场景:个性化角色对话、风格迁移任务。

        三、指令微调格式

        1. Alpaca风格(指令-输入-输出)

        • 结构:明确任务指令(Instruction)、输入(Input)和期望输出(Output)。

        • 格式示例

           

          [ { "instruction": "将句子翻译成英文", "input": "人工智能将改变未来。", "output": "Artificial intelligence will reshape the future." }, { "instruction": "写一首关于春天的诗", "input": "", "output": "春风拂面花香溢,绿柳垂丝映碧池……" } ]

          • 适用场景:任务导向的指令遵循模型(如Alpaca、Vicuna)。

          • 优点:任务定义清晰,支持零样本学习。

          http://www.dtcms.com/a/81317.html

          相关文章:

        • [特殊字符] 2025蓝桥杯备赛Day7——B2117 整理药名
        • Q2 电商订单数据分析优化
        • WPF UI元素保存为图像文件
        • ip2region与express最佳实践
        • 一些硬件知识【2025/3/1】
        • Maven安装与环境配置
        • 各类神经网络学习:(四)RNN 循环神经网络(下集),pytorch 版的 RNN 代码编写
        • 练习题:98
        • 使用 Ansys Fluent 评估金属管道腐蚀
        • AIGC-名人语录账号运营创作智能体完整指令(DeepSeek,豆包,千问,Kimi,GPT)
        • 实现一个日语假名自测小程序html-css-js版
        • XSS漏洞原理分类标签及关卡
        • 一般c++项目的目录结构
        • Ajax与Axios,以及Apifox的入门使用
        • 【AI-Coding】2025再实现简单的省市联动
        • NAT实验
        • 鸿蒙Flutter开发故事:不,你不需要鸿蒙化
        • Linux_进程概念(B)-环境变量进程地址空间【Linux】
        • 智能工厂能耗分析:Python驱动的高效能源管理
        • Python 编程题 第十二节:柠檬水找零、统计数字、合并排序数组、插入5、字符串置换
        • 内存管理(C++篇)
        • NLP高频面试题(八)——GPT三个版本的区别
        • 启明星辰春招面试题
        • 机器学习knnlearn2
        • coding ability 展开第五幕(二分查找算法)超详细!!!!
        • C语言中的指针
        • kvm虚拟机的基本使用
        • node-ddk, electron组件, 自定义本地文件协议,打开本地文件
        • C51 Proteus仿真实验22:按键发声
        • 云原生算力引擎:分布式推理的流体动力学