关于图片分类任务的猜想 | 撰写论文 paper
关于图片分类任务的猜想 | 撰写论文 paper
- 背景
- Yolo 是一次巨大的飞跃
- 过滤无关的特征
- Yolo 的问题
背景
在计算视觉领域,有几个关键的演变。
1)CNN 卷积的出现,这是一个大的创新;
2)从卷积到 AlexNet ,是更大网络上的使用卷积,从此卷积带来的在平移旋转等情况下,依然可以准确的识别特征,被证明有明显的优势,但这不是很大的创新;
3)从 AlexNet 到 ResNet,是进一步的扩大网络,因此更大参数的网络可以被训练,从而进一步的丰富了网络拟合特征的能力,但这不是很大的创新;
4)从 ResNet 到 Yolo,是一次明显的创新,可以说,Yolo 的创新可以和 CNN 的贡献相媲美。
Yolo 是一次巨大的飞跃
Yolo 是识别物体的轮廓,在卷积的基础上使用框体去分析轮廓。而轮廓,并且往往是基于色块的轮廓,是物体的主要特征。基于颜色识别轮廓,基于轮廓识别物体。
过滤无关的特征
在物体图片分类任务中,最主要的是识别轮廓,很多生产工作领域,其图片尤其适合用轮廓做区分。比如人物证件照,有一个背景,然后是人物的轮廓,在人物轮廓内包含了子轮廓,比如鼻子、眼睛等。
猜想:如果我们用一个算法,将图片处理为等高线类似的图片,再次进入 CNN 进行分类,那么效果会非常好。 原因是:无关的特征已经被过滤。
比如,在一个复杂的地形,我们想要找到最短的上到山顶的路线,那么就是看等高线地图,而不是看原始的地图,在原始的地图中,我们会被很多因素干扰。
Yolo 的问题
Yolo 的创新在于识别轮廓,而其依赖的训练数据需要标注轮廓。有没有一种算法能基于非标注的数据,首先的识别出轮廓?然后基于轮廓完成分类,能不能超越现在的最好的算法?
关键的问题,在于过滤无关的特征,让关注的特征凸显出来,这样即便数据量很少,也会有非常准确的效果。
这是一个猜想。