当前位置：首页 > news >正文

yolo 用roboflow标注的数据集本地训练 kaggle训练 comet使用训练笔记5

news 2025/7/2 5:54:16

本地训练

8gb内存，机械硬盘用了4分钟训练完了

~~...........~~

~~model = torch.hub.load('path/to/yolov5', 'custom', path='./runs/train/exp10/weights/best.pt', source='local')~~

连不上github

kaggel训练

传kaggle了

# Train YOLOv5s on COCO128 for 3 epochs
!python train.py --img 640 --batch 16 --epochs 3 --data /kaggle/input/cube-and-cylinder/data.yaml --weights yolov5s.pt --cache

用kaggle不到20秒训练完了

训练完模型找不到

套了4层

/kaggle/working/yolov5/yolov5/yolov5/yolov5/runs/train/exp2/weights/best.pt

comet使用

Comet - Build Better Models Faster

~~拿5张图片训练20轮~~

~~损失变高？~~

从您提供的图表来看，这些是典型的训练和验证损失随训练步数变化的曲线图，通常用于监控机器学习模型的训练过程。这里有一些关键点可以帮助您理解这些图表：
训练损失（train loss）:box_loss: 这个损失衡量的是模型预测框与真实框之间的位置偏差。可以看到，随着训练步数的增加，box_loss在波动中逐渐下降，这表明模型在逐步学习如何更准确地定位目标。cls_loss: 分类损失，表示模型对不同类别分类的准确性。同样地，这个损失值也在波动中呈现下降趋势，说明模型在不断优化其分类能力。obj_loss: 目标检测中的置信度损失，反映了模型对目标存在与否判断的准确性。该损失值也显示出下降的趋势。验证损失（val loss）:box_loss, cls_loss, obj_loss: 这些验证损失曲线显示了模型在未见过的数据上的表现。理想情况下，我们希望看到这些损失值随着训练的进行而稳定下降，这表明模型不仅在训练数据上表现良好，而且具有较好的泛化能力。观察与建议:过拟合风险: 如果训练损失持续下降但验证损失开始上升或停滞不前，可能意味着模型出现了过拟合现象，即模型在训练数据上表现得过于优秀，但在新数据上的表现不佳。可以通过增加数据集、使用正则化技术或减少模型复杂度来缓解这一问题。训练稳定性: 从图表上看，训练过程中存在一定的波动性，这是正常的，尤其是在早期训练阶段。但如果波动过大或没有明显的下降趋势，则可能需要调整学习率、优化器参数等。收敛情况: 在训练后期，如果所有损失值都趋于平稳且不再显著下降，可以认为模型已经基本收敛。此时，您可以考虑停止训练以节省计算资源。总的来说，这些图表提供了关于模型训练状态的重要信息，帮助您评估模型的学习进度和性能，并据此做出相应的调整和优化。