当前位置：首页 > news >正文

第二次中医知识问答微调

news 2025/10/30 23:22:55

由于昨天微调效果并不理想，因此更换数据集和参数进行重新进行了微调

本次微调参数如下：

llamafactory-cli train \

--stage sft \

--do_train True \

--model_name_or_path /home/qhyz/zxy/LLaMA-Factory/model \

--preprocessing_num_workers 16 \

--finetuning_type lora \

--template deepseek3 \

--flash_attn fa2 \

--dataset_dir data \

--dataset knowledge \

--cutoff_len 4096 \

--learning_rate 1e-05 \

--num_train_epochs 2.0 \

--max_samples 70309 \

--per_device_train_batch_size 2 \

--gradient_accumulation_steps 12 \

--lr_scheduler_type cosine \

--max_grad_norm 1.0 \

--logging_steps 5 \

--save_steps 100 \

--warmup_steps 0 \

--packing False \

--report_to tensorboard --logging_dir single_log4 \

--output_dir saves/DeepSeek-R1-7B-Distill/lora/train_4.0 \

--bf16 True \

--plot_loss True \

--trust_remote_code True \

--ddp_timeout 180000000 \

--include_num_input_tokens_seen True \

--optim adamw_torch \

--lora_rank 4 \

--lora_alpha 8 \

--lora_dropout 0.1 \

--lora_target q_proj,v_proj \

--deepspeed cache/ds_z2_config.json

数据集部分数据截图：

查看全文

http://www.dtcms.com/a/205350.html

Java 代码生成工具：如何快速构建项目骨架？

游戏盾功能与技术解析

数据库表关系详解

Python实例题：Python实现简单画板

建筑资料员考试主要考什么

谷歌2025年I/O开发者大会热点总结

欧拉系统安装，配置静态ip

SAP-ABAP:ABAP异常处理与安全工程的融合 —— 构建防注入、防泄漏、合规审计的防御性编程体系

SID103S/D/Q-300nA，轨至轨 CMOS 运算放大器，替代SGM8141/2/4,TP2111

AI应用电商篇汇总（持续补充）

使用Redis的Bitmap实现了签到功能

RT_Thread——快速入门

逆向音乐APP：Python爬虫获取音乐榜单 (1)

SQL语句-常用版

OpenCV CUDA模块图像过滤------创建一个盒式滤波器（Box Filter）函数createBoxFilter()

从零开始的嵌入式学习day25

时间序列预测的迁移学习

学习黑客了解5分钟了解中间人攻击（MITM）

Redis面试题全面解析：从基础到底层实现

vLLM v1源码阅读 : 整体流程梳理（详细debug）

CAU人工智能class3 优化器

java 集合总结

【Vue3】Vue3工程的创建及开发者工具的安装

运维Web服务器核心知识与实战指南

时源芯微｜π型LC滤波电路

Vue3使用DataV报错无法使用的解决方案

手术机器人行业新趋势：Kinova多机械臂协同系统如何突破复杂场景适应性瓶颈？

el-radio-group 与 el-dropdown 组合使用的注意事项

torch.matmul() VS torch.einsum()

独占内存访问指令LDXR/STXR

相关文章：