BiFormer注意力机制YOLOV8
BiFormer模型的核心思想是引入了双层路由注意力机制,每个图像都会和一个管理路由器相连,这些管理路由器会根据图像特定的规则为其分配上下双层路由器,上层路由器负责全局信息,下层路由器负责局部细节信息
通俗来讲,上层路由器通过全局注意力机制进行交互,生成全局图像,下层路由器对邻近的图像信息进行交互,生成局部的图像表示,该注意力机制可以同时捕获全局和局部特征信息提升性能
1、全局操作,但高复杂计算,大占大量内存
234、稀疏矩阵,讲注意力放在特点区域内
5、可变性注意力,通过改变注意力网络规格,自适应图像,提高关注图像重要信息
6、本文双层注意力机制
总结:引入双层注意力机制代替传统的,去适应内容在图像中稀疏模式,提升效率
Biformer的优劣势
优势:
高效的计算性能,BiFormer利用双层路由注意力机制,他最关注最相关的键值对,去应对稀疏性。
缺点:
1、可能存在信息确实,,因为只关注最相关的键值对,导致次要的信息可能会被忽略。
2、参数调整,在引入双层路由注意力算法需要引入额外的超参数和参数,需要调整优化,需要额外实验去找到最佳的参数配置
看一下Biformer的网络结构
BiFormer的整体架构。该架构包括多个BiFormer块的堆叠