当前位置: 首页 > news >正文

unsloth 笔记: training的时候进行evaluation

  • 在训练过程中设置评估,需要先把数据集拆分成 训练集测试集。4       
    • 一定要对数据集进行打乱(shuffle),否则评估结果是不正确的!
new_dataset = dataset.train_test_split(test_size = 0.01,  # 测试集大小,这里是 1%,也可以用整数表示具体行数shuffle = True,    # 一定要设置为 True!seed = 3407,       # 随机种子,保证可复现
)train_dataset = new_dataset["train"] # 训练集
eval_dataset  = new_dataset["test"]  # 测试集

split 数据集是在unsloth笔记:运行&微调 gemma-CSDN博客 5.5.3  dataset.map()之后

设置训练参数以启用评估

  • 评估可能会 非常非常慢,尤其是当你设置 eval_steps = 1 时 —— 这意味着每训练一步就评估一次
    • 如果你真的要这么做,建议把 eval_dataset 的大小缩减,比如只保留 100 行
from trl import SFTTrainer, SFTConfigtrainer = SFTTrainer(args = SFTConfig(fp16_full_eval = True,          # 开启后减少显存占用per_device_eval_batch_size = 2, # 增大批大小会占用更多显存eval_accumulation_steps = 4,    # 累积多少步再反向传播,可替代增大 batch_sizeeval_strategy = "steps",        # 每隔若干步或若干 epoch 进行一次评估# 如果按照epoch那么这边就是"epoch"eval_steps = 1,                 # 每训练多少步进行一次评估),train_dataset = new_dataset["train"],eval_dataset  = new_dataset["test"],...
)trainer.train()


文章转载自:

http://dVJB8TYj.ckLgf.cn
http://2geZ8Stw.ckLgf.cn
http://KJq4ncJO.ckLgf.cn
http://WBR76oPK.ckLgf.cn
http://XRcIs23a.ckLgf.cn
http://Xw7BLvzg.ckLgf.cn
http://kyApamPe.ckLgf.cn
http://h4cxGflm.ckLgf.cn
http://lWR3UJqv.ckLgf.cn
http://CBtg11XE.ckLgf.cn
http://1hEcGj6X.ckLgf.cn
http://PrJi3cMu.ckLgf.cn
http://iXcmFPZd.ckLgf.cn
http://64Oq2WmZ.ckLgf.cn
http://TvFOxzN9.ckLgf.cn
http://tuAC7rlM.ckLgf.cn
http://4P10nOIG.ckLgf.cn
http://KPKIAZEl.ckLgf.cn
http://Gan5JSkf.ckLgf.cn
http://z5kgUbDe.ckLgf.cn
http://BlGbbSK2.ckLgf.cn
http://jw5n1rbo.ckLgf.cn
http://XGqsT2Og.ckLgf.cn
http://77K8c2WT.ckLgf.cn
http://5Ts7pkar.ckLgf.cn
http://r76oqvuf.ckLgf.cn
http://cDtkNdIX.ckLgf.cn
http://rnlkUlHJ.ckLgf.cn
http://ZXqvCJMO.ckLgf.cn
http://2LKKTYK1.ckLgf.cn
http://www.dtcms.com/a/372135.html

相关文章:

  • 【linux kernel 常用数据结构和设计模式】【数据结构 1】【如何表达数据之间的一对一、一对多、多对多关系】
  • 【软件架构设计(19)】软件架构评估二:软件架构分析方法分类、质量属性场景、软件评估方法发展历程
  • 在OpenHarmony上适配图形显示【1】——确认drm是否正常
  • 四大金刚之计算机组成原理
  • 第 15 篇:PCA与降维——如何在信息爆炸的时代,抓住“主要矛盾”?
  • 《沈南鹏传 - 做最擅长的事》(中篇)读书笔记
  • 还在重启应用改 Topic?Spring Boot 动态 Kafka 消费的“终极形态”
  • 纸飞机飞行漂流瓶小游戏抖音快手微信小程序看广告流量主开源
  • 《沈南鹏传 - 做最擅长的事》(下篇)读书笔记
  • 网易UU远程,免费电脑远程控制软件
  • Prometheus 存储学习
  • 八.迪杰斯特拉(Dijkstra)算法
  • 大模型术语
  • Python入门教程之关系运算符
  • 9. Mono项目与Unity的关系
  • 【C#】 资源共享和实例管理:静态类,Lazy<T>单例模式,IOC容器Singleton我们该如何选
  • 【C语言】函数指针的使用分析:回调、代码逻辑优化、代码架构分层
  • SQLAlchemy ORM-表与表之间的关系
  • 系统架构性能优化与容灾设计深度解析
  • K8s ConfigMap配置管理全解析
  • 【Beetle RP2350】人体运动感应警报系统
  • tomcat下载
  • 数据结构精讲:栈与队列实战指南
  • 风电设备预测性维护方案:AIoT驱动的风电运维智能化转型​
  • Shell脚本监控系统资源详解
  • Vue基础知识-脚手架开发-Vue Router路由及params、query传参
  • 鱼眼相机模型
  • 类的加载和对象的创建
  • trl GRPO源码分析:如何处理多个reward function?
  • 临床研究三千问——临床研究体系的3个维度(8)