当前位置: 首页 > news >正文

第二次中医知识问答微调

由于昨天微调效果并不理想,因此更换数据集和参数进行重新进行了微调

本次微调参数如下:

llamafactory-cli train \

    --stage sft \

    --do_train True \

    --model_name_or_path /home/qhyz/zxy/LLaMA-Factory/model \

    --preprocessing_num_workers 16 \

    --finetuning_type lora \

    --template deepseek3 \

    --flash_attn fa2 \

    --dataset_dir data \

    --dataset knowledge \

    --cutoff_len 4096 \

    --learning_rate 1e-05 \

    --num_train_epochs 2.0 \

    --max_samples 70309 \

    --per_device_train_batch_size 2 \

    --gradient_accumulation_steps 12 \

    --lr_scheduler_type cosine \

    --max_grad_norm 1.0 \

    --logging_steps 5 \

    --save_steps 100 \

    --warmup_steps 0 \

    --packing False \

    --report_to tensorboard --logging_dir single_log4 \

    --output_dir saves/DeepSeek-R1-7B-Distill/lora/train_4.0 \

    --bf16 True \

    --plot_loss True \

    --trust_remote_code True \

    --ddp_timeout 180000000 \

    --include_num_input_tokens_seen True \

    --optim adamw_torch \

    --lora_rank 4 \

    --lora_alpha 8 \

    --lora_dropout 0.1 \

    --lora_target q_proj,v_proj \

    --deepspeed cache/ds_z2_config.json

数据集部分数据截图:

http://www.dtcms.com/a/205350.html

相关文章:

  • Java 代码生成工具:如何快速构建项目骨架?
  • 游戏盾功能与技术解析
  • 数据库表关系详解
  • Python实例题:Python实现简单画板
  • 建筑资料员考试主要考什么
  • 谷歌2025年I/O开发者大会热点总结
  • 欧拉系统安装,配置静态ip
  • SAP-ABAP:ABAP异常处理与安全工程的融合 —— 构建防注入、防泄漏、合规审计的防御性编程体系
  • SID103S/D/Q-300nA,轨至轨 CMOS 运算放大器,替代SGM8141/2/4,TP2111
  • AI应用电商篇汇总(持续补充)
  • 使用Redis的Bitmap实现了签到功能
  • RT_Thread——快速入门
  • 逆向音乐APP:Python爬虫获取音乐榜单 (1)
  • SQL语句-常用版
  • OpenCV CUDA模块图像过滤------创建一个盒式滤波器(Box Filter)函数createBoxFilter()
  • 从零开始的嵌入式学习day25
  • 时间序列预测的迁移学习
  • 学习黑客了解5分钟了解中间人攻击(MITM)
  • Redis面试题全面解析:从基础到底层实现
  • vLLM v1源码阅读 : 整体流程梳理(详细debug)
  • CAU人工智能class3 优化器
  • java 集合总结
  • 【Vue3】Vue3工程的创建 及 开发者工具的安装
  • 运维Web服务器核心知识与实战指南
  • 时源芯微|π型LC滤波电路
  • Vue3使用DataV报错无法使用的解决方案
  • 手术机器人行业新趋势:Kinova多机械臂协同系统如何突破复杂场景适应性瓶颈?
  • el-radio-group 与 el-dropdown 组合使用的注意事项
  • torch.matmul() VS torch.einsum()
  • 独占内存访问指令LDXR/STXR