【YOLO 系列】基于YOLO的飞机表面缺陷智能检测系统【python源码+Pyqt5界面+数据集+训练代码】
前言
在航空领域,飞机表面的缺陷检测对于保障飞行安全和减少维护成本至关重要。传统的人工检测方法不仅耗时耗力,而且容易受到人为因素影响,导致检测结果的不稳定性。为了提高检测效率和准确性,我们开发了基于YOLO V8的飞机表面缺陷智能检测系统。该系统利用深度学习技术,能够自动识别飞机表面的缺陷,如裂纹、凹陷、缺失的螺钉头、涂层脱落和划痕等,从而实现自动化、高效率的缺陷检测。
通过对数据集的深入分析和标注,我们训练了YOLO V8模型,使其能够精确识别飞机表面的各种缺陷。这一系统能够实时处理图像数据,即使在不同光照、角度和背景下,也能提供准确的缺陷检测结果。通过这个项目,我们不仅提升了飞机表面缺陷检测的技术水平,还为航空安全提供了一种新的技术手段。
基于此项目,设计了一个使用Pyqt5库来搭建页面展示系统。本系统支持的功能包括训练模型的导入、初始化;置信度与IOU阈值的调节、图像上传、检测、可视化结果展示、结果导出与结束检测;视频的上传、检测、可视化结果展示、结果导出与结束检测;摄像头的上传、检测、可视化结果展示与结束检测;已检测目标信息列表、位置信息;以及推理用时。本博文提供了完整的Python代码和使用教程,适合新入门的朋友参考,完整代码资源文件请转至文末的下载链接。
优势:
-
高准确性:YOLO V8模型针对飞机表面缺陷进行了优化,提高了在复杂环境下的缺陷识别准确度。
-
实时性:系统能够快速处理图像数据,提供实时的缺陷检测结果,适用于需要快速响应的应用场景。
-
鲁棒性:即使在不同光照和背景下,系统也能保持较高的识别率,显示出良好的鲁棒性。
-
可扩展性:系统设计考虑了不同型号和环境下的飞机表面,具有良好的可扩展性。
-
降低成本:自动化的检测系统减少了人工检查的需求,从而降低了维护成本和人力资源消耗。
应用场景:
-
航空安全监控:系统可以帮助监控人员快速识别飞机表面的异常情况,提高飞行安全。
-
飞机维护:在飞机维护过程中,系统可以辅助技术人员检测和记录缺陷,优化维护流程。
-
质量控制:系统可以作为质量控制的一部分,确保飞机制造和维修过程中的质量符合标准。
-
研究与开发:在飞机设计和材料研究中,系统可以提供关于缺陷分布和类型的重要数据,辅助研发工作。
-
教育与培训:系统可以作为教育工具,帮助学生和工程师了解飞机表面缺陷的类型和检测技术。
-
智能检测技术发展:研究成果可以推广到其他领域的物体检测任务中,具有广泛的应用前景
一、软件核心功能介绍及效果演示
软件主要功能
-
支持
图片、图片批量、视频及摄像头
进行检测,同时摄像头可支持内置摄像头和外设摄像头; -
可对
检测结果进行单独分析
,并且显示单个检测物体的坐标、置信度等
; -
界面可实时显示
目标位置
、检测结果
、检测时间
、置信度
、检测结果回滚
等信息; -
支持
图片
、视频
及摄像头
的结果保存,将检测结果保持为excel文件;
视频演示
飞机表面缺陷检测系统
图片检测演示
-
点击
打开图片
按钮,选择需要检测的图片,或者点击打开文件夹
按钮,选择需要批量检测图片所在的文件夹,操作演示如下: -
点击表格中的指定行,界面会显示该行表格所写的信息内容。
视频检测演示
-
点击
视频按钮
图标,打开选择需要检测的视频,在点击开始运行
会自动显示检测结果。再次点击停止按钮
,会停止检测视频。 -
点击表格中的指定行,界面会显示该行表格所写的信息内容。
摄像头检测演示
-
在
选择相机源
中输入需要检测的摄像头(可以是电脑自带摄像头,也可以是外接摄像头,视频流等方式),然后点击摄像头图标
来固定选择的推理流方式,最后在点击开始运行
即可开始检测,当点击停止运行
时则关闭摄像头检测。 -
点击表格中的指定行,界面会显示该行表格所写的信息内容。
检测结果保存
点击导出数据
按钮后,会将当前选择的图片【含批量图片】、视频或者摄像头
的检测结果进行保存为excel文档,结果会存储在output
目录下。
二、环境搭建
创建专属环境
conda create -n yolo python==3.8
激活专属环境
conda activate yolo
安装torch-GPU库
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple "torch-2.0.1+cu118-cp38-cp38-win_amd64.whl"
安装torchvision-GPU库
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple "torchvision-0.15.2+cu118-cp38-cp38-win_amd64.whl"
安装ultralytics库
pip install ultralytics -i https://pypi.tuna.tsinghua.edu.cn/simple
测试环境
yolo predict model=yolov8n.pt source='https://ultralytics.com/images/bus.jpg'
此时就表明环境安装成功!!!
安装图形化界面库 pyqt5
pip install pyqt5 -i https://pypi.tuna.tsinghua.edu.cn/simple
三、YOLOv11 算法原理
Ultralytics YOLO11是一款尖端的、最先进的模型,它在之前YOLO版本成功的基础上进行了构建,并引入了新功能和改进,以进一步提升性能和灵活性。YOLO11设计快速、准确且易于使用,使其成为各种物体检测和跟踪、实例分割、图像分类以及姿态估计任务的绝佳选择。
整体网络结构
C3K2 模块
从下面图中我们可以看到,C3K2模块其实就是C2F模块转变出来的,它代码中有一个设置,就是当c3k这个参数为FALSE的时候,C3K2模块就是C2F模块,也就是说它的Bottleneck是普通的Bottleneck;反之当它为true的时候,将Bottleneck模块替换成C3模块。
C2PSA 模块
C2PSA是对 C2f
模块的扩展,它结合了PSA(Pointwise Spatial Attention)块,用于增强特征提取和注意力机制。通过在标准 C2f
模块中引入 PSA 块,C2PSA实现了更强大的注意力机制,从而提高了模型对重要特征的捕捉能力。
C2f 模块
C2f模块是一个更快的 CSP(Cross Stage Partial)瓶颈实现,它通过两个卷积层和多个 Bottleneck 块进行特征提取。相比传统的 CSPNet,C2f 优化了瓶颈层的结构,使得计算速度更快。在 C2f中,cv1
是第一个 1x1 卷积,用于减少通道数;cv2
是另一个 1x1 卷积,用于恢复输出通道数。而 n
是一个包含 Bottleneck 块的数量,用于提取特征。
C2PSA 模块
C2PSA 扩展了 C2f,通过引入PSA( Position-Sensitive Attention),旨在通过多头注意力机制和前馈神经网络来增强特征提取能力。它可以选择性地添加残差结构(shortcut)以优化梯度传播和网络训练效果。同时,使用FFN 可以将输入特征映射到更高维的空间,捕获输入特征的复杂非线性关系,允许模型学习更丰富的特征表示。
四、模型的训练、评估与推理
数据集准备
本文使用的 飞机表面缺陷 数据集共包含 1250 张图片。
各类标签的数量分别为:
Paint Peeling: 2845
Dents or Deformation: 572
Cracks: 1679
Corrosion: 1514
Scratches: 567
标签类别如下:['Paint Peeling', 'Dents or Deformation', 'Cracks', 'Corrosion', 'Scratches']
图片数据集的存放格式如下:
-
运行splitDataset.py,用于划分数据集;
-
运行xml2txt.py,用于得到训练标注文件;
-
运行ViewCategory.py,用于查看一共有那些类别。
模型训练
数据准备完成后,通过调用train.py
文件进行模型训练,epochs
参数用于调整训练的轮数,代码如下:
from ultralytics import YOLOif __name__ == "__main__":model = YOLO('./weights/yolov8n.pt')model.train(data='./VOCData/mydata.yaml', epochs=300)
训练结果分析
YOLOv8在训练结束后,可以在runs/
目录下找到训练过程及结果文件,如下所示:
P_curve.png
confusion_matrix_normalized.png
训练 batch
验证 batch
模型推理
模型训练完成后,可以得到一个最佳的训练结果模型best.pt
文件,在runs/trian/weights
目录下。我们通过使用该文件进行后续的推理检测。
图片检测代码如下:
from ultralytics import YOLOif __name__ == "__main__":# Load a modelmodel = YOLO('./runs/detect/train/weights/best.pt')# Run batched inference on a list of imagesmodel("./img", imgsz=640, save=True, device=0)
执行上述代码后,会将执行的结果直接标注在图片上,结果如下:
关于该系统涉及到的完整源码、UI界面代码、数据集、训练代码、测试图片视频等相关文件,均已打包上传,感兴趣的小伙伴可以通过下载链接自行获取。
五、获取方式
本文涉及到的完整全部程序文件:包括
python源码、数据集、训练好的结果文件、训练代码、UI源码、测试图片视频
等(见下图),获取方式见文末:
硬性的标准其实限制不了无限可能的我们,所以啊!少年们加油吧!