Yolo11改进策略:Block改进|MKP,多尺度卷积核级联结构,增强感受野适应性|即插即用|AAAI 2025
文章目录
- 1 论文信息
- 2 创新点
- 2.1 特征互补映射模块(FCM)
- 2.2 多内核感知单元(MKP)
- 2.3 冗余驱动的轻量化设计
- 3 方法
- 3.1 整体架构
- 3.2 MKP单元优化
- 3.3 MKP设计优势
- 4 效果
- 4.1 性能对比实验
- 4.2 消融实验
- 4.3 效率优势
- 5 论文总结
- 代码
- 完整代码
- Pzconv模块代码详解
- 辅助函数和基础模块
- Pzconv模块核心实现
- 测试代码
- 关键设计解析
- 1. 多尺度特征提取
- 2. 深度可分离卷积
- 3. 特征变换与非线性激活
- 4. 残差连接
- 5. 尺寸保持
- 改进策略
- 测试结果
- 总结
1 论文信息
FBRT-YOLO(Faster and Better for Real-Time Aerial Image Detection)是由北京理工大学团队提出的专用于航拍图像实时目标检测的创新框架,发表于AAAI 2025。论文针对航拍场景中小目标检测的核心难题展开研究,重点解决小目标因分辨率低、背景干扰多导致的定位困难,以及现有方法在实时性与精度间的失衡问题。
航拍图像目标检测是无人机、遥感监测等应用的关键技术,但面临独特挑战:图像中目标(如车辆、行人)通常仅由少量像素(<0.1%图像面积)构成,且易受云层、建筑群等复杂背景干扰。传统方法通过增加分辨率提升精度,但显著增加计算负担,难以满足嵌入式设备(如无人机芯片)的实时需求。FBRT-YOLO通过轻量化设计,在Visdrone、UAVDT和AI-TOD三大航拍数据集上实现了精度与速度的突破性平衡。
论文链接: