非模板匹配目标识别算法
同一类目标形态不同、遮挡、背景复杂、目标混合
数据驱动的方法-机器学习
HOG+支持向量机SVM
卷积网络
但阶段方法、两阶段、DOTA-V1.0(大作业数据集)
Q:如何识别一张图片里的人?框出并给出置信度
数据:正训练样本(图片里面有人)负训练样本(没有人)
策略:滑动窗口(拿一个模板滑动,看哪块相似度最高---模板匹配,Q:窗口多大?从小窗口慢慢到大窗口一直滑动)
手工设计特征+SVM: 特征工程:Harr、区域协方差、SHapelets、HOG......(现在看来毫无意义?) 如HOG提取特征得到四个区域的梯度图
SVM支持向量机:找一条线,将向量分开,Q有很多条线用哪条呢?分类面离两类的边界距离最大,确保鲁棒性,克服噪声
Fast R-CNN 图片卷积得到特征图,将原图ROI部分对应的特征图部分池化,然后接分类头
Faster R-CNN 区域建议换为RPN都是双阶段法
mask R-CNN.....
加金字塔特征
单阶段法:ssd、yolo、retinaNet-金字塔特征、Focal loss(解决类别不平衡问题)
旋转目标的识别方法:水平boundingbox vs 旋转boundingbox 空洞卷积、特征回流、特征精修改变交并比....
视觉关系推理方法研究:机场+飞机,看见机场,对图片一架飞架掩码,于是推测有飞机
基于空间语义交互的一致性关系学习
