当前位置: 首页 > news >正文

LLaMA-Factory微调DeepSeek-R1-Distill-Qwen-7B

1.数据准备

为了对比原生模型效果与微调后的效果,这里选择医疗诊断数据medical-o1-reasoning-SFT来进行微调实验,首先将数据转化为LLaMA-Factory支持的Alpaca数据格式,并划分数据集

{"instruction": "医疗问题示例","input": "上下文信息","output": "预期回答"
}

相关脚本如下:

from datasets import load_dataset
import json, osdataset = load_dataset('/workspace/luoshiyong/deepseek-ai/medical_sft/medical-o1-reasoning-SFT', 'zh')
dataset = {"train": dataset['train'][:2000], 'val': dataset['train'][-200:]}
root = '/workspace/luoshiyong/deepseek-ai/medical_sft/convert'
for key in ['train', 'val']:list_r = []for q, r 
http://www.dtcms.com/a/175912.html

相关文章:

  • 微软输入法常用快捷键介绍以及调教技巧
  • 【Hive入门】Hive数据导入与导出:批量操作与HDFS数据迁移完全指南
  • 设计模式之状态模式
  • 企业该如何选择合适的DDOS防护?
  • 交替序列长度的最大值
  • AI辅助DevOps与自动化测试:重构软件工程效率边界
  • 2025年数字藏品行业DDoS攻防指南:技术升级与合规防御双轨制
  • 系统思考:教育焦虑恶性循环分析
  • 解决leetcode第3537题填充特殊网格
  • CentOS服务器中如何解决内存泄漏问题?
  • 微信小程序pinia的应用
  • 矩阵扩展-算卷积算法介绍及C语言代码实现
  • 软件架构评估方法全面解析
  • c# LINQ-Query01
  • 利用动态数字孪生:Franka Research 3 机械臂在机器人策略评估中的创新实践——基于Real-is-Sim框架的仿真与现实闭环验证
  • 5.0.4 VisualStateManager(视觉状态管理器)使用说明
  • 分区器(2)
  • kotlin一个函数返回多个值
  • 数据可视化与数据编辑器:直观呈现数据价值
  • 用 CodyBuddy 帮我写自动化运维脚本
  • Ubuntu 安装 Keepalived
  • Failed building wheel for pycuda
  • Go语言基础学习详细笔记
  • Python小酷库系列:5个常用的dict属性化访问扩展库
  • 极狐GitLab 命名空间的类型有哪些?
  • SENSE2020BSI sCMOS科学级相机主要参数及应用场景
  • SLAM:单应矩阵,本质矩阵,基本矩阵详解和对应的c++实现
  • Baumer工业相机堡盟工业相机如何通过BGAPI SDK在Linux系统下设置多个USB相机(C++)
  • python 绝对引用和相对引用
  • 从字节到链接:用类型化数组生成神奇的对象 URL