当前位置: 首页 > news >正文

蒸馏微调DeepSeek-R1-Distill-Qwen-7B

数据集:中文基于满血DeepSeek-R1蒸馏数据集(Chinese-Data-Distill-From-R1)
中文数据集中的数据分布如下:
Math:共计36568个样本,
Exam:共计2432个样本,
STEM:共计12648个样本,
General:共计58352,包含弱智吧、逻辑推理、小红书、知乎、Chat等。
数据样例
在这里插入图片描述
基于unsloth进行微调
微调过程及显存占用
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
微调后推理测试
在这里插入图片描述
推理显存占用
在这里插入图片描述

在通用数据集上微调很成功,但是,在专业数据集上微调却不行,我使用控制变量进行了许多次测试,都无法得到好的效果,无论是回答格式,还是回答内容,都无法使用。至少在华为910上是这样

http://www.dtcms.com/a/251071.html

相关文章:

  • Leetcode 刷题记录 16 —— 栈
  • [windows工具]OCR识文找图工具1.2版本使用教程及注意事项
  • [windows工具]OCR多区域识别导出excel工具1.2版本使用教程及注意事项
  • Unity3D仿星露谷物语开发63之NPC移动
  • XR-RokidAR-ADB环境搭建
  • OpenSpeedy:让游戏体验“飞”起来的秘密武器
  • 【Shader学习】完整光照效果
  • Unity基础-范围检测
  • 【Quest开发】初始项目环境配置
  • 用c语言实现简易c语言扫雷游戏
  • 嵌入式硬件篇---常见电平标准
  • NJet Portal 应用门户管理介绍
  • 实时操作系统(FreeRTOS、RT-Thread)RISC-V
  • 基于SpringBoot和Leaflet的电影票房时序展示-以《哪吒2》为例
  • Django图片管理系统
  • 在idea上打包DolphinScheduler
  • VTK 显示大量点云数据及交互(点云拾取、着色、测量等)功能
  • SAP实施服务专家——哲讯科技,赋能企业智慧升级
  • RTDETRv2 pytorch 官方版自己数据集训练遇到的问题解决
  • SQL Server 2025 预览版发布:AI深度集成、开发者体验飞跃与混合云新篇章
  • Composer 的 PHP 依赖库提交教程
  • Linux安装LLaMA Factory
  • Python数字信号处理——利用块间系数相关性的DCT域鲁棒盲图像水印(PyQT5界面)
  • linux云计算学习第八周,第九周
  • sqli-labs靶场54-65关(次数限制,数据更新)
  • Python爬虫实战:研究Mr. Queue相关技术
  • 【图像处理入门】7. 特征描述子:从LBP到HOG的特征提取之道
  • 智能土木通 - 土木工程专业知识问答系统02-RAG检索模块搭建
  • 幂级数 (0,R); R ;(R,+oo)
  • 图数据库neo4j部分用法浅讲