Class34锚框
Class34锚框
边缘框(Bounding Box)
描述真实物体位置的矩形框,也叫真值框。
边缘框,是由人工标注得到的,图片中的一个物体只有一个边缘框。
锚框(Anchor Box)
预先在图片的某些位置、用不同大小和宽高比生成的矩形框。
锚框是由多种不同形状的,每一种可能都有若干个锚框。
将整张图片分割成3x3的网格,被检测的真实物体及其边缘框在第2个网格中。锚框有3种,分别为100x100像素、100x50像素和50x100像素,一个网格里有3个,9个网格则一共有3*9=27个锚框。
交并比IoU
两个集合的交集比上两个集合的并集就是交并比。
锚框标号
每个锚框是一个训练样本,对于每个锚框,要么标注成背景,要么关联上一个真实的边缘框。所以我们会生成大量的锚框,会导致大量的负样本。
将锚框和真实边界框进行比较(IoU≥阈值,阈值假设为0.5),大于阈值则是正样本标注成该目标类别,否则为负样本标注成背景。
为每个边缘框找一个锚框,先从最高值出发,找到X23,将X23所在的行和列都删除,再在没删除下面找下一个最大值;此时找到X71,再将X71所在的行和列都删除;以此类推,将每个对应的边缘框都找到一个对应最大值的锚框做对应。
非极大值抑制(NMS)输出
在目标检测中,用锚框预测物体位置时,模型通常会对同一个物体给出多个重叠的候选框,并且每个框有一个置信度分数。
如果直接输出这些框,结果会很乱,会出现同一个物体会出现很多框。
假设有一组候选框,每个框有位置和置信度:
1.按置信度从高到低排序。
2.选取最高分的框,加入最终输出结果。
3.计算该框与其余框的 IoU(交并比)。
4.去掉 IoU 大于设定阈值(比如 0.5)的框,因为它们很可能是同一个物体的重复预测
总结