yolo 用roboflow标注的数据集本地训练 kaggle训练 comet使用 训练笔记5
本地训练
8gb内存,机械硬盘用了4分钟训练完了
...........
model = torch.hub.load('path/to/yolov5', 'custom', path='./runs/train/exp10/weights/best.pt', source='local')
连不上github
kaggel训练
传kaggle了
# Train YOLOv5s on COCO128 for 3 epochs
!python train.py --img 640 --batch 16 --epochs 3 --data /kaggle/input/cube-and-cylinder/data.yaml --weights yolov5s.pt --cache
用kaggle不到20秒训练完了
训练完模型找不到
套了4层
/kaggle/working/yolov5/yolov5/yolov5/yolov5/runs/train/exp2/weights/best.pt
comet使用
Comet - Build Better Models Faster
拿5张图片训练20轮
损失变高?
从您提供的图表来看,这些是典型的训练和验证损失随训练步数变化的曲线图,通常用于监控机器学习模型的训练过程。这里有一些关键点可以帮助您理解这些图表:
训练损失(train loss):box_loss: 这个损失衡量的是模型预测框与真实框之间的位置偏差。可以看到,随着训练步数的增加,box_loss在波动中逐渐下降,这表明模型在逐步学习如何更准确地定位目标。cls_loss: 分类损失,表示模型对不同类别分类的准确性。同样地,这个损失值也在波动中呈现下降趋势,说明模型在不断优化其分类能力。obj_loss: 目标检测中的置信度损失,反映了模型对目标存在与否判断的准确性。该损失值也显示出下降的趋势。验证损失(val loss):box_loss, cls_loss, obj_loss: 这些验证损失曲线显示了模型在未见过的数据上的表现。理想情况下,我们希望看到这些损失值随着训练的进行而稳定下降,这表明模型不仅在训练数据上表现良好,而且具有较好的泛化能力。观察与建议:过拟合风险: 如果训练损失持续下降但验证损失开始上升或停滞不前,可能意味着模型出现了过拟合现象,即模型在训练数据上表现得过于优秀,但在新数据上的表现不佳。可以通过增加数据集、使用正则化技术或减少模型复杂度来缓解这一问题。训练稳定性: 从图表上看,训练过程中存在一定的波动性,这是正常的,尤其是在早期训练阶段。但如果波动过大或没有明显的下降趋势,则可能需要调整学习率、优化器参数等。收敛情况: 在训练后期,如果所有损失值都趋于平稳且不再显著下降,可以认为模型已经基本收敛。此时,您可以考虑停止训练以节省计算资源。总的来说,这些图表提供了关于模型训练状态的重要信息,帮助您评估模型的学习进度和性能,并据此做出相应的调整和优化。
我惊讶的发现图像要开投影线,不然后面的尺寸是看不见的
还是no detections
训练轮次不够100轮就检测到了
map在50轮后才稳定上升
换个notebook