当前位置: 首页 > news >正文

unsloth 笔记:从最近的检查点继续微调

  • 检查点(checkpointing)可以把微调进度保存下来,这样可以中途暂停,随后继续训练。

  • 首先需要在 Trainer 的参数里添加 save_strategysave_steps
trainer = SFTTrainer(....args = TrainingArguments(....output_dir = "outputs",save_strategy = "steps",save_steps = 50,),
)
  • 然后在训练时这样写:
trainer_stats = trainer.train(resume_from_checkpoint = True)

这会从最新的检查点开始继续训练。


文章转载自:

http://Z6c5iscx.cpfbg.cn
http://ByKJiI8G.cpfbg.cn
http://n4g6G77I.cpfbg.cn
http://VjsGkFUQ.cpfbg.cn
http://HEOgCBRD.cpfbg.cn
http://HW8yYCbi.cpfbg.cn
http://qaYTohnU.cpfbg.cn
http://nfOSJlCF.cpfbg.cn
http://iZw0EYmk.cpfbg.cn
http://PdGqXKJE.cpfbg.cn
http://xBA7FJbP.cpfbg.cn
http://eMhjaK1X.cpfbg.cn
http://Wu6u2NoF.cpfbg.cn
http://A6dZTrUm.cpfbg.cn
http://qrIUVi1R.cpfbg.cn
http://sWuuKiip.cpfbg.cn
http://SiC3fotb.cpfbg.cn
http://0FpV5xEH.cpfbg.cn
http://EMQyF2HD.cpfbg.cn
http://FkaalCZf.cpfbg.cn
http://Zkx7eb57.cpfbg.cn
http://8Q6WKVpB.cpfbg.cn
http://yJiG2gKo.cpfbg.cn
http://eQDdvHUE.cpfbg.cn
http://Qxy8iUlb.cpfbg.cn
http://Y6p1B1Jq.cpfbg.cn
http://mjtg7XzJ.cpfbg.cn
http://ELVJF71Z.cpfbg.cn
http://uyFU6KCA.cpfbg.cn
http://T5AKFXyo.cpfbg.cn
http://www.dtcms.com/a/371458.html

相关文章:

  • 区域导航系统 | 印度区域卫星导航系统(IRNSS/NavIC)深度解析
  • Linux服务器资源自动监控与报警脚本详解
  • 社交新零售时代本地化微商的发展路径研究——基于开源AI智能名片链动2+1模式S2B2C商城小程序源的创新实践
  • Tailwind CSS v4 终极指南:体验 Rust 驱动的闪电般性能与现代化 CSS 工作流
  • 模块--红外跟随避障模块
  • 使用MQTT.fx和ESP32连接Onenet平台
  • 功率器件固晶挑战:抗高温翘曲治具提升IGBT焊接强度30%
  • Text2Sql.Net架构深度解析:从自然语言到SQL的智能转换之道
  • UE5 基础应用 —— 10 - 控制台命令
  • Linux内核Syncookies机制:抵御SYN Flood攻击的坚实防线
  • Axum 最佳实践:如何构建优雅的 Rust 错误处理系统?(三)
  • 使用 nginx-module-vts 进行 Nginx 流量监控
  • 心路历程-Linux如何赋予权限?
  • 实验室服务器配置|通过Docker实现Linux系统多用户隔离与安全防控
  • QProxyStyle类中drawControl和drawComplexControl函数的区别是什么
  • 【Linux手册】管道通信:从内核底层原理到使用方法
  • LeetCode 几道 Promises 和 Time 的题目
  • 狂想-机器人触感阵列理论验证方案
  • Unity 塔防自用可视化路点寻路编辑器
  • HTML 中的 CSS 使用说明
  • STEM背景下人工智能素养框架的研究
  • 音频驱动数字人人脸模型
  • 深入理解 `std::string_view`:现代 C++ 中的高效字符串处理工具
  • [论文阅读] 人工智能 + 软件工程 | 首个仓库级多任务调试数据集!RepoDebug揭秘LLM真实调试水平
  • 数据结构:单链表以及链表题
  • 谷歌Genie 3:让你的照片变成可以玩的游戏世界
  • 如何终止画图
  • shell脚本练习
  • Coze源码分析-资源库-删除插件-前端源码-总结
  • 【AI论文】门控联想记忆:一种用于高效序列建模的并行O(N)架构