CV目标检测中的LetterBox操作
LetterBox类比理解:想象你要把一张任意形状的照片放进一个正方形的相框里,照片不能变形拉伸,所以你先等比例缩小照片,然后在空余的地方填上灰色背景。
第1章 数学原理
当我们有一个原始图像的尺寸为 1920×1080(宽××高),并希望使用 letterbox
方法将其转换为 640×640 的正方形尺寸时,我们需要遵循以下步骤进行数学推导。目的是保持原始图像的长宽比不变,并通过填充来达到目标尺寸。
1.1 计算缩放比例
首先,我们需要计算缩放比例,以确保图像能完全适应目标尺寸中的一个维度(高度或宽度)而不会超出,同时保持其原始比例。
取两者中的最小值作为最终的缩放比例:
1.2 应用缩放比例调整图像尺寸
根据缩放比例调整图像的尺寸:
这意味着原图在保持比例的情况下被缩小到 360×640 的尺寸。
1.3 计算填充区域
由于我们的目标尺寸是 640×640,而缩放后的图像尺寸为 360×640,我们需要在上下两侧添加填充以达到目标尺寸。
因此,顶部和底部各填充 140 像素。
1.4 计算偏移量
最后计算偏移量,这里仅考虑垂直方向上的偏移(因为水平方向没有偏移):
这表示在垂直方向上,填充部分占了总高度的大约 21.875%。
总结
在这个例子中,原始图像从 1920×1080被按比例缩小到了 640×360,然后在上下两边分别添加了 140像素的填充,使得最终输出的图像尺寸为 640×640。这样既保证了图像的比例不变,又满足了模型输入所需的固定尺寸要求。
具体数值总结如下:
这个过程确保了原始图像的内容不被拉伸或压缩,同时达到了模型输入所需的标准尺寸。