当前位置：首页 > news >正文

unsloth 笔记： training的时候进行evaluation

news 2025/9/8 8:49:45

在训练过程中设置评估，需要先把数据集拆分成 训练集 和 测试集。4
- 一定要对数据集进行打乱（shuffle），否则评估结果是不正确的！

new_dataset = dataset.train_test_split(test_size = 0.01,  # 测试集大小，这里是 1%，也可以用整数表示具体行数shuffle = True,    # 一定要设置为 True！seed = 3407,       # 随机种子，保证可复现
)train_dataset = new_dataset["train"] # 训练集
eval_dataset  = new_dataset["test"]  # 测试集

split 数据集是在unsloth笔记：运行&微调 gemma-CSDN博客 5.5.3 dataset.map()之后

设置训练参数以启用评估

评估可能会 非常非常慢，尤其是当你设置 eval_steps = 1 时 —— 这意味着每训练一步就评估一次
- 如果你真的要这么做，建议把 eval_dataset 的大小缩减，比如只保留 100 行

from trl import SFTTrainer, SFTConfigtrainer = SFTTrainer(args = SFTConfig(fp16_full_eval = True,          # 开启后减少显存占用per_device_eval_batch_size = 2, # 增大批大小会占用更多显存eval_accumulation_steps = 4,    # 累积多少步再反向传播，可替代增大 batch_sizeeval_strategy = "steps",        # 每隔若干步或若干 epoch 进行一次评估# 如果按照epoch那么这边就是"epoch"eval_steps = 1,                 # 每训练多少步进行一次评估),train_dataset = new_dataset["train"],eval_dataset  = new_dataset["test"],...
)trainer.train()

文章转载自：

http://dVJB8TYj.ckLgf.cn
http://2geZ8Stw.ckLgf.cn
http://KJq4ncJO.ckLgf.cn
http://WBR76oPK.ckLgf.cn
http://XRcIs23a.ckLgf.cn
http://Xw7BLvzg.ckLgf.cn
http://kyApamPe.ckLgf.cn
http://h4cxGflm.ckLgf.cn
http://lWR3UJqv.ckLgf.cn
http://CBtg11XE.ckLgf.cn
http://1hEcGj6X.ckLgf.cn
http://PrJi3cMu.ckLgf.cn
http://iXcmFPZd.ckLgf.cn
http://64Oq2WmZ.ckLgf.cn
http://TvFOxzN9.ckLgf.cn
http://tuAC7rlM.ckLgf.cn
http://4P10nOIG.ckLgf.cn
http://KPKIAZEl.ckLgf.cn
http://Gan5JSkf.ckLgf.cn
http://z5kgUbDe.ckLgf.cn
http://BlGbbSK2.ckLgf.cn
http://jw5n1rbo.ckLgf.cn
http://XGqsT2Og.ckLgf.cn
http://77K8c2WT.ckLgf.cn
http://5Ts7pkar.ckLgf.cn
http://r76oqvuf.ckLgf.cn
http://cDtkNdIX.ckLgf.cn
http://rnlkUlHJ.ckLgf.cn
http://ZXqvCJMO.ckLgf.cn
http://2LKKTYK1.ckLgf.cn

http://www.dtcms.com/a/372135.html

相关文章：

【linux kernel 常用数据结构和设计模式】【数据结构 1】【如何表达数据之间的一对一、一对多、多对多关系】

【软件架构设计（19）】软件架构评估二：软件架构分析方法分类、质量属性场景、软件评估方法发展历程

在OpenHarmony上适配图形显示【1】——确认drm是否正常

四大金刚之计算机组成原理

第 15 篇：PCA与降维——如何在信息爆炸的时代，抓住“主要矛盾”？

《沈南鹏传 - 做最擅长的事》（中篇）读书笔记

还在重启应用改 Topic？Spring Boot 动态 Kafka 消费的“终极形态”

纸飞机飞行漂流瓶小游戏抖音快手微信小程序看广告流量主开源

《沈南鹏传 - 做最擅长的事》（下篇）读书笔记

网易UU远程，免费电脑远程控制软件

Prometheus 存储学习

八.迪杰斯特拉(Dijkstra)算法

大模型术语

Python入门教程之关系运算符

9. Mono项目与Unity的关系

【C#】资源共享和实例管理：静态类，Lazy＜T＞单例模式，IOC容器Singleton我们该如何选

【C语言】函数指针的使用分析：回调、代码逻辑优化、代码架构分层

SQLAlchemy ORM-表与表之间的关系

系统架构性能优化与容灾设计深度解析

K8s ConfigMap配置管理全解析

【Beetle RP2350】人体运动感应警报系统

tomcat下载

数据结构精讲：栈与队列实战指南

风电设备预测性维护方案：AIoT驱动的风电运维智能化转型

Shell脚本监控系统资源详解

Vue基础知识-脚手架开发-Vue Router路由及params、query传参

鱼眼相机模型

类的加载和对象的创建

trl GRPO源码分析：如何处理多个reward function？

临床研究三千问——临床研究体系的3个维度（8）