YOLO系列
问题梳理
(1)当输入图片非方形时,YOLO会自动调整输入图片大小,以适应模型的固定输入尺寸。
模型的输入尺寸和原始图片的尺寸是相关的,但它们的关系需要通过预处理来协调。
①缩放
②填充
③归一化
④边界框调整
(2)训练时数据增强(调整大小之后):
- 随机裁剪(Random Crop)
- 随机旋转(Random Rotation)(不适用)
- 颜色抖动(Color Jittering)
- 随机翻转(Random Flip)
(3)为什么需要固定输入尺寸?
- 网络结构要求:YOLO的网络结构是基于固定输入尺寸设计的,输入尺寸的变化会导致网络参数不匹配。
- 计算效率:固定输入尺寸可以提高计算效率,因为卷积操作在固定尺寸下更容易优化。
- 硬件限制:固定输入尺寸可以更好地利用GPU的并行计算能力。
(4)输入尺寸对检测结果的影响
- 大尺寸输入:可以保留更多细节,适合检测小目标,但计算量较大,速度较慢。
- 小尺寸输入:计算速度快,但可能丢失细节,适合检测大目标或实时性要求高的场景。
核心函数:letterbox函数
- 功能:对输入图像进行缩放和填充,使其适应指定的目标尺寸
new_shape
(默认640x640),并保持图像的纵横比。
处理后图像: