YOLOV8模型优化-选择性视角类别整合模块(SPCI):遥感目标检测的注意力增强模型详解
一、研究背景与挑战
随着卫星和无人机技术的普及,高分辨率遥感影像为城市规划、灾害监测等领域提供了海量数据。然而,遥感目标检测面临三大难题:
- 尺度剧变:目标尺寸从几米到几百米不等(如飞机vs油罐)
- 密集分布:港口/机场等场景存在大量密集目标
- 背景干扰:自然/人造景观交织导致语义混淆
现有方法如YOLOv8虽在通用目标检测表现优异,但在遥感场景存在以下局限:
- Backbone缺乏显式的多尺度特征融合机制
- 传统注意力模块(SE/CBAM)难以捕捉长距离依赖
- 类别判别能力不足导致相似目标混淆(如桥梁vs建筑物)
二、核心技术架构
我们提出YOLO-SPCI框架,通过创新的三维注意力机制提升遥感目标检测性能。整体架构遵循YOLOv8设计哲学,在保持实时检测速度(65 FPS)的同时显著提升精度。