人工智能学习60-Yolo
人工智能学习60-Yolo—快手视频
人工智能学习61-Yolo—快手视频
人工智能学习62-Yolo—快手视频
人工智能学习63-Yolo—快手视频
Yolo目标检测网络
前面列举人工智能算法AlexNet、VGG、Googlenet、ResNet都是完成图片分类应用的,在目标检测领域需要其他新的算法,比如RCNN、Fast-RCNN、Faster-RCNN、Yolo等算法,对目标检测应用,比较实用算法就是Yolo算法。
目标检测解决的问题
在图片或视频流的每帧图片中,分别找出图片中所有的物体,并且找出所有物体的位置,如下图:
目标检测也是我们应用人工智能技术解决实际生活中比较重要的问题,比如智能驾驶。
Yolo算法核心思想
YOLO算法的核心思想是将目标检测任务转化为回归问题,通过单一神经网络直接从整张图像预测边界框(Bounding Box)的位置及其所属类别,实现端到端的检测流程。这一设计显著提升了检测速度并优化了模型效率。
采用多尺寸特征图多粒度提取特征,利用Anchor锚框机制,采用端到端的训练与优化。
YOLO通过统一框架实现目标检测的所有组件(如特征提取、边界框回归、分类等),简化了模型结构并加速了训练过程。其损失函数通常包含位置误差、置信度误差及分类误差的综合优化。
Yolo算法处理图片尺寸为416416,通过Darknet分别转化1313、2626、5252三个特征图,在三个特征图上采用先验框Anchor机制为每个网格选定三个预测框,然后对候选框进行分类和回归的检测方法调整网络模型参数。
Yolo算法的新概念
mAP
在YOLO系列目标检测模型中,mAP(mean Average Precision,平均精度均值)是评估模型性能的核心指标,综合反映模型在精度和召回率上的平衡能力。
mAP的定义与核心作用
mAP通过计算所有类别的平均精度(AP)后取均值得出,其核心作用包括:
综合评估模型性能:综合考虑不同IoU阈值下的检测精度和召回率;
多类别平衡性度量:适用于多类别目标检测任务的统一评价标准。
Iou交并比
两个矩形重叠部分面积S与两个矩形面积和减去S的比值,如下图。
具体在代码设计层面可能存在某些问题,因此还有一些补充算法,比如giou,diou,ciou等等。
可以参考博文https://zhuanlan.zhihu.com/p/648882134
NMS非极大值抑制
NMS即non maximum suppression即非极大抑制,顾名思义就是抑制不是极大值的元素,搜索局部的极大值。在最近几年常见的物体检测算法(包括rcnn、sppnet、fast-rcnn、faster-rcnn等)中,最终都会从一张图片中找出很多个可能是物体的矩形框,然后为每个矩形框为做类别分类概率。
Yolo算法环境准备
Yolo算法开发更新了多个版本YoloV1-YoloV7,本例采用YoloV3版本学习,Git下载地址https://github.com/bubbliiiing/yolo3-keras.git,为了方便大家学习对YoloV3的部分代码做了微调,通过Git网络下载YoloV3训练好的模型和样本集,也可以通过云盘地址下载训练好的模型和样本集。YoloV3网络模型如图: