当前位置: 首页 > news >正文

第二次中医知识问答微调

由于昨天微调效果并不理想,因此更换数据集和参数进行重新进行了微调

本次微调参数如下:

llamafactory-cli train \

    --stage sft \

    --do_train True \

    --model_name_or_path /home/qhyz/zxy/LLaMA-Factory/model \

    --preprocessing_num_workers 16 \

    --finetuning_type lora \

    --template deepseek3 \

    --flash_attn fa2 \

    --dataset_dir data \

    --dataset knowledge \

    --cutoff_len 4096 \

    --learning_rate 1e-05 \

    --num_train_epochs 2.0 \

    --max_samples 70309 \

    --per_device_train_batch_size 2 \

    --gradient_accumulation_steps 12 \

    --lr_scheduler_type cosine \

    --max_grad_norm 1.0 \

    --logging_steps 5 \

    --save_steps 100 \

    --warmup_steps 0 \

    --packing False \

    --report_to tensorboard --logging_dir single_log4 \

    --output_dir saves/DeepSeek-R1-7B-Distill/lora/train_4.0 \

    --bf16 True \

    --plot_loss True \

    --trust_remote_code True \

    --ddp_timeout 180000000 \

    --include_num_input_tokens_seen True \

    --optim adamw_torch \

    --lora_rank 4 \

    --lora_alpha 8 \

    --lora_dropout 0.1 \

    --lora_target q_proj,v_proj \

    --deepspeed cache/ds_z2_config.json

数据集部分数据截图:

相关文章:

  • Java 代码生成工具:如何快速构建项目骨架?
  • 游戏盾功能与技术解析
  • 数据库表关系详解
  • Python实例题:Python实现简单画板
  • 建筑资料员考试主要考什么
  • 谷歌2025年I/O开发者大会热点总结
  • 欧拉系统安装,配置静态ip
  • SAP-ABAP:ABAP异常处理与安全工程的融合 —— 构建防注入、防泄漏、合规审计的防御性编程体系
  • SID103S/D/Q-300nA,轨至轨 CMOS 运算放大器,替代SGM8141/2/4,TP2111
  • AI应用电商篇汇总(持续补充)
  • 使用Redis的Bitmap实现了签到功能
  • RT_Thread——快速入门
  • 逆向音乐APP:Python爬虫获取音乐榜单 (1)
  • SQL语句-常用版
  • OpenCV CUDA模块图像过滤------创建一个盒式滤波器(Box Filter)函数createBoxFilter()
  • 从零开始的嵌入式学习day25
  • 时间序列预测的迁移学习
  • 学习黑客了解5分钟了解中间人攻击(MITM)
  • Redis面试题全面解析:从基础到底层实现
  • vLLM v1源码阅读 : 整体流程梳理(详细debug)
  • 物流公司网站怎么做/新东方在线教育平台官网
  • 做论坛网站/成都百度推广
  • 湖南建设工程竣工备案表查询网站/怎么搭建自己的网站
  • 电子网站建设ppt模板/赛雷猴是什么意思
  • 个人网站设计图/百度搜索量统计
  • 猎聘做简历的网站收费靠谱吗/seo前景