YOLO优化之双池化下采样融合块、注意力引导逆残差块
一、研究背景与挑战
火灾检测是公共安全领域的核心问题,但动态环境下的火灾检测面临多重挑战:
- 光照变化干扰:强光反射或阴影易与火焰混淆
- 小目标检测难题:早期火灾往往仅有烟雾或微弱火苗
- 特征信息丢失:传统下采样操作导致关键细节丢失
- 计算效率瓶颈:实时检测需求与模型复杂度的矛盾
现有YOLO系列模型虽具备实时检测能力,但在火灾场景存在显著缺陷:
- 标准残差块无法有效捕捉长距离依赖关系
- 常规池化操作导致空间细节丢失
- 多尺度特征融合不充分
二、核心技术架构
提出YOLO-FireAD框架,通过两大创新模块实现高效精准的火灾检测:
- 注意力引导逆残差块(AIR):融合通道-空间注意力与逆残差结构
- 双池化下采样融合块(DPDF):并行最大-平均池化保留多尺度特征