当前位置：首页 > news >正文

LLaMA-Factory微调DeepSeek-R1-Distill-Qwen-7B

news 2025/11/3 0:29:46

1.数据准备

为了对比原生模型效果与微调后的效果，这里选择医疗诊断数据medical-o1-reasoning-SFT来进行微调实验，首先将数据转化为LLaMA-Factory支持的Alpaca数据格式,并划分数据集

{"instruction": "医疗问题示例","input": "上下文信息","output": "预期回答"
}

相关脚本如下：

from datasets import load_dataset
import json, osdataset = load_dataset('/workspace/luoshiyong/deepseek-ai/medical_sft/medical-o1-reasoning-SFT', 'zh')
dataset = {"train": dataset['train'][:2000], 'val': dataset['train'][-200:]}
root = '/workspace/luoshiyong/deepseek-ai/medical_sft/convert'
for key in ['train', 'val']:list_r = []for q, r

http://www.dtcms.com/a/175912.html

相关文章：

微软输入法常用快捷键介绍以及调教技巧

【Hive入门】Hive数据导入与导出：批量操作与HDFS数据迁移完全指南

设计模式之状态模式

企业该如何选择合适的DDOS防护？

交替序列长度的最大值

AI辅助DevOps与自动化测试：重构软件工程效率边界

2025年数字藏品行业DDoS攻防指南：技术升级与合规防御双轨制

系统思考：教育焦虑恶性循环分析

解决leetcode第3537题填充特殊网格

CentOS服务器中如何解决内存泄漏问题？

微信小程序pinia的应用

矩阵扩展-算卷积算法介绍及C语言代码实现

软件架构评估方法全面解析

c# LINQ-Query01

利用动态数字孪生：Franka Research 3 机械臂在机器人策略评估中的创新实践——基于Real-is-Sim框架的仿真与现实闭环验证

5.0.4 VisualStateManager（视觉状态管理器）使用说明

分区器（2）

kotlin一个函数返回多个值

数据可视化与数据编辑器：直观呈现数据价值

用 CodyBuddy 帮我写自动化运维脚本

Ubuntu 安装 Keepalived

Failed building wheel for pycuda

Go语言基础学习详细笔记

Python小酷库系列：5个常用的dict属性化访问扩展库

极狐GitLab 命名空间的类型有哪些？

SENSE2020BSI sCMOS科学级相机主要参数及应用场景

SLAM:单应矩阵，本质矩阵，基本矩阵详解和对应的c++实现

Baumer工业相机堡盟工业相机如何通过BGAPI SDK在Linux系统下设置多个USB相机（C++）

python 绝对引用和相对引用

从字节到链接：用类型化数组生成神奇的对象 URL