RTDETRv2 pytorch训练
RTDETRv2 pytorch训练
- 1. 代码获取
- 2. 数据集制作
- 3. 环境配置
- 4. 代码修改
- 1)configs/dataset/coco_detection.yml
- 2) configs/src/data/coco_dataset.py
- 3)configs/src/core/yaml_utils.py
- 4)configs/rtdeterv2/include/optimizer.yml
- 5. 代码训练、验证、以及模型参数和FLOPs
- 1) 训练
- 2)验证
1. 代码获取
从github上下载官方源码官方源码,将其中的redetrv2_pytorch单独移动到桌面上
git clone https://github.com/lyuwenyu/RT-DETR.git
2. 数据集制作
使用github仓库中的 yolo2coco_1.py
将YOLO标签转化为COCO数据集格式,然后将其转化为如下的存储顺序,最终移动到redetrv2_pytorch中
dataset└── coco├── train2017 ├── val2017 ├── test2017 └── annotations├── instance_train2017.json├── instance_val2017.json└── instance_test2017.json
3. 环境配置
windows 11
GPU4090
模型训练环境为YOLOv9,然后需要单独安装faster-coco-eval库
pip install faster-coco-eval
或者直接
pip install -r requirements.txt
4. 代码修改
1)configs/dataset/coco_detection.yml
num_classes: 2 # 原始 80 以二标签数据集为例(flame、smoke)# 如果按照上面的数据集制作数据集格式,则不需要修改内容,以个人数据集为例
img_folder: ./dataset/coco/train2017/
ann_file: ./dataset/coco/annotations/instances_train2017.json
2) configs/src/data/coco_dataset.py
将mscoco_category2name
修改为自己的标签内容
# 注意,0、1需要根据自己转化的COCO数据集确定的 我的是使用这个
mscoco_category2name = {0: 'flame',1: 'smoke'
}
# 按照80标签的COCO数据集是从1开始的
mscoco_category2name = {1: 'flame',2: 'smoke'
}
3)configs/src/core/yaml_utils.py
如果在训练的时候出现读取yaml文件,字体格式的报错,可将代码修改为如下。如果没有出现,可直接跳过本步骤。
# 添加encoding='utf-8'
with open(file_path, encoding='utf-8') as f:file_cfg = yaml.load(f, Loader=yaml.Loader)if file_cfg is None:return {}
4)configs/rtdeterv2/include/optimizer.yml
如果需要修改epoch,可以修改如下代码
epoches: 300
此时,对应的configs/rtdeterv2/include/dataloader.yml需要进行如下修改
train_dataloader: dataset: transforms:ops:- {type: RandomPhotometricDistort, p: 0.5}- {type: RandomZoomOut, fill: 0}- {type: RandomIoUCrop, p: 0.8}- {type: SanitizeBoundingBoxes, min_size: 1}- {type: RandomHorizontalFlip}- {type: Resize, size: [640, 640], }- {type: SanitizeBoundingBoxes, min_size: 1}- {type: ConvertPILImage, dtype: 'float32', scale: True} - {type: ConvertBoxes, fmt: 'cxcywh', normalize: True}policy:name: stop_epochepoch: 299 # epoch in [71, ~) stop `ops` 原始为71ops: ['RandomPhotometricDistort', 'RandomZoomOut', 'RandomIoUCrop']collate_fn:type: BatchImageCollateFuncionscales: [480, 512, 544, 576, 608, 640, 640, 640, 672, 704, 736, 768, 800]stop_epoch: 299 # epoch in [71, ~) stop `multiscales` 原始为71
5. 代码训练、验证、以及模型参数和FLOPs
1) 训练
python tool/train.py -c ./configs/rtdetrv2/rtdetrv2_r50vd_m_7x_coco.yml --use-amp --seed=0
2)验证
python tool/train.py -c path/to/config -r path/to/checkpoint --test-only