当前位置：首页 > news >正文

大模型sft-数据构建和选择

news 2025/11/2 3:56:33

1 数据形式

一、通用文本格式

1. 单轮问答（文本对）

结构：输入（Input）与输出（Output）的简单配对。
格式示例：
[ {"input": "如何学习Python？", "output": "建议从基础语法开始，逐步实践项目。"}, {"input": "推荐一部科幻电影", "output": "《星际穿越》是一部经典的科幻作品。"} ]
input,output "如何学习Python？","建议从基础语法开始，逐步实践项目。" "推荐一部科幻电影","《星际穿越》是一部经典的科幻作品。"
适用场景：文本生成、翻译、摘要等单轮任务。
优点：简单易用，兼容大多数模型。
缺点：无法处理多轮对话或复杂上下文。

二、对话格式

1. 多轮对话（Hugging Face推荐格式）

结构：使用messages字段记录完整对话历史，每条消息包含role（角色）和content（内容）。
格式示例：
[ { "messages": [ {"role": "user", "content": "推荐巴黎的必去景点"}, {"role": "assistant", "content": "埃菲尔铁塔、卢浮宫值得一游。"}, {"role": "user", "content": "卢浮宫门票价格？"}, {"role": "assistant", "content": "常规门票17欧元，每月第一个周六免费。"} ] } ]
适用场景：客服对话、聊天机器人等需要上下文的任务。
优点：保留完整对话逻辑，适配对话模型（如LLaMA-2-chat）。
缺点：存储空间较大，需处理长文本分块。

2. 角色扮演对话

结构：添加system角色定义助手行为，增强对话引导。
格式示例：
{ "messages": [ {"role": "system", "content": "你扮演李白，用唐诗风格回答"}, {"role": "user", "content": "如何看待现代都市生活？"}, {"role": "assistant", "content": "钢筋林立遮星月，车马喧嚣乱心弦。"} ] }
适用场景：个性化角色对话、风格迁移任务。

三、指令微调格式

1. Alpaca风格（指令-输入-输出）

结构：明确任务指令（Instruction）、输入（Input）和期望输出（Output）。
格式示例：
[ { "instruction": "将句子翻译成英文", "input": "人工智能将改变未来。", "output": "Artificial intelligence will reshape the future." }, { "instruction": "写一首关于春天的诗", "input": "", "output": "春风拂面花香溢，绿柳垂丝映碧池……" } ]
适用场景：任务导向的指令遵循模型（如Alpaca、Vicuna）。
优点：任务定义清晰，支持零样本学习。

http://www.dtcms.com/a/81317.html

相关文章：

[特殊字符] 2025蓝桥杯备赛Day7——B2117 整理药名

Q2 电商订单数据分析优化

WPF UI元素保存为图像文件

ip2region与express最佳实践

一些硬件知识【2025/3/1】

Maven安装与环境配置

各类神经网络学习：（四）RNN 循环神经网络（下集），pytorch 版的 RNN 代码编写

练习题：98

使用 Ansys Fluent 评估金属管道腐蚀

AIGC-名人语录账号运营创作智能体完整指令(DeepSeek，豆包，千问，Kimi，GPT)

实现一个日语假名自测小程序html-css-js版

XSS漏洞原理分类标签及关卡

一般c++项目的目录结构

Ajax与Axios，以及Apifox的入门使用

【AI-Coding】2025再实现简单的省市联动

NAT实验

鸿蒙Flutter开发故事：不，你不需要鸿蒙化

Linux_进程概念(B)-环境变量进程地址空间【Linux】

智能工厂能耗分析：Python驱动的高效能源管理

Python 编程题第十二节：柠檬水找零、统计数字、合并排序数组、插入5、字符串置换

内存管理（C++篇）

NLP高频面试题（八）——GPT三个版本的区别

启明星辰春招面试题

机器学习knnlearn2

coding ability 展开第五幕（二分查找算法）超详细！！！！

C语言中的指针

kvm虚拟机的基本使用

node-ddk, electron组件, 自定义本地文件协议,打开本地文件

C51 Proteus仿真实验22：按键发声

云原生算力引擎：分布式推理的流体动力学