Deformable DETR(复习专用)
1. Deformable DETR 网络结构
Deformable DETR 在 DETR原有的基础上加入了特征提取部分加入了FPN多尺度feature map方式。
Deformable DETR 相比 DETR有哪些优点:
- 多尺度特征融合:通过多级特征和稀疏采样,模型能有效捕捉小目标的局部细节
- Deformable Attention 模型仅关注关键位置,将计算复杂度从 O(N²) 降至 O(N),每个查询点根据内容生成偏移量,调整采样位置(如图像中的关键区域),避免全图计算
- Deformable Attention 仅对少量关键点计算注意力,适合处理高分辨率图像或大规模场景。
总结:(1)稀疏空间采样 (2)可变形注意力机制 (3)适用高分辨率特征
2. Deformable Singal Attention
2.1 详细图解
假设特征向量96, head数量为3, 被查询向量设置为3的情况下。
代码中计算出feature map中所有像素的value,在提取三个k对应的value。