当前位置: 首页 > news >正文

LLaMA-Factory微调DeepSeek-R1-Distill-Qwen-7B

1.数据准备

为了对比原生模型效果与微调后的效果,这里选择医疗诊断数据medical-o1-reasoning-SFT来进行微调实验,首先将数据转化为LLaMA-Factory支持的Alpaca数据格式,并划分数据集

{"instruction": "医疗问题示例","input": "上下文信息","output": "预期回答"
}

相关脚本如下:

from datasets import load_dataset
import json, osdataset = load_dataset('/workspace/luoshiyong/deepseek-ai/medical_sft/medical-o1-reasoning-SFT', 'zh')
dataset = {"train": dataset['train'][:2000], 'val': dataset['train'][-200:]}
root = '/workspace/luoshiyong/deepseek-ai/medical_sft/convert'
for key in ['train', 'val']:list_r = []for q, r 

相关文章:

  • 微软输入法常用快捷键介绍以及调教技巧
  • 【Hive入门】Hive数据导入与导出:批量操作与HDFS数据迁移完全指南
  • 设计模式之状态模式
  • 企业该如何选择合适的DDOS防护?
  • 交替序列长度的最大值
  • AI辅助DevOps与自动化测试:重构软件工程效率边界
  • 2025年数字藏品行业DDoS攻防指南:技术升级与合规防御双轨制
  • 系统思考:教育焦虑恶性循环分析
  • 解决leetcode第3537题填充特殊网格
  • CentOS服务器中如何解决内存泄漏问题?
  • 微信小程序pinia的应用
  • 矩阵扩展-算卷积算法介绍及C语言代码实现
  • 软件架构评估方法全面解析
  • c# LINQ-Query01
  • 利用动态数字孪生:Franka Research 3 机械臂在机器人策略评估中的创新实践——基于Real-is-Sim框架的仿真与现实闭环验证
  • 5.0.4 VisualStateManager(视觉状态管理器)使用说明
  • 分区器(2)
  • kotlin一个函数返回多个值
  • 数据可视化与数据编辑器:直观呈现数据价值
  • 用 CodyBuddy 帮我写自动化运维脚本
  • 巴防空系统击落印度无人机,印称巴方违反停火协议
  • 4月金融数据前瞻:受去年低基数因素影响,社融增量有望同比大幅多增
  • 长三角地区中华老字号品牌景气指数发布,哪些牌子是你熟悉的?
  • OpenAI任命了一位新CEO
  • AMD:预计美国芯片出口管制将对全年营收造成15亿美元损失
  • 吴清:巴菲特即将退休,但价值投资、长期投资、理性投资、努力回报投资者等理念不会退休