当前位置: 首页 > news >正文

OUC AI Lab 第六章:基于卷积的注意力机制

OUC AI Lab 第六章:基于卷积的注意力机制
详解深度学习的中的即插即用模块
1.SENet
SENet在第四章已经学习过了
在这里插入图片描述
2.Non-local Neural Networks模块
在这里插入图片描述
网络中的注意力模块如图所示,事实上这个模块非常像transformer里的注意力机制,其中的θ,Φ和g就相当于是transformer中的q、k、v,有关transformer的内容在下一章再介绍。在这里,x就是经过各种网络的特征,形状为[T,H,W,1024],将这个x分三份分别经过θ,Φ和g这三个1x1的卷积层就得到了我们想要的三个特征,在transformer中,经过θ得到的每一行向量可以理解为“我在找什么”,例如输入的是”我去上学”,经过θ后“我”会对应着1024维的向量,其中每一维可以理解为“我在找什么”,例如第一维是“我周围有名词吗?”,第二维是“我周围有动词吗?”

经过Φ得到的每一行向量可以理解为每个字携带的信息,而经过reshape的这两个矩阵相称就可以得到一个相似性矩阵,softmax后再乘g,就相当于进行了加权聚合,这时每个位置的特征都融入了所有其他相关位置的信息,实现了长距离依赖的建模。

我认为transformer最厉害的创新点就在于使每个词都能看到整个句子中的所有词,经过两个相乘将位置信息,上下文信息和内容信息都看到了。

3. CBAM
在这里插入图片描述
上图中右侧是普通的卷积神经网络,每个卷积核中有in channel个分别对输入的channel进行卷积,然后想加得到一个channel
而CBAM主要是考虑到在普通卷积网络中各个channel间的信息没有很好的交流,所以设计了两个模块,channel Attention Module就类似于SENet,不过SENet只用了平均池化,而这里分别在channel纬度上进行平均池化和最大池化,也就是将[batch,channel,h,w]变为[batch,channel,1,1],然后经过变化相加softamat,最后乘到input feature上就完成了
Spatial Attention Module 是在空间纬度上进行平均池化和最大池化,将原本[batch,channel,h,w]变为[batch,1,h,w],拼接后使用in_channel=2,out_channel=1的卷积层,再乘到input feature上就完成了。

4. DANet
在这里插入图片描述
Dual Attention Network也非常简单,你要问思想是什么,那就是对CBAM的改进,CBAM是并行,先计算通道纬度的注意力,再计算空间纬度的注意力,那么这个网络就是并行的计算注意力。
如何计算的也非常简单,上图中的A就是将形状为[batch,channel,h,w]的输入分为三份B,C和D,全部reshape为[batch,channel,h*w]。
B再调整为[batch,h*w,channel],乘C,得到[batch,h*w,h*w],D再乘这个结果,得到[batch,channel,h*w],再次reshape恢复到原来的纬度
B这个模块就是把一开始相乘的顺序改成了[batch,channel,h*w]乘[batch,channel,h*w]。

http://www.dtcms.com/a/614870.html

相关文章:

  • 晋城市 制作网站自助建站系统免费模式
  • Docker安装unoconvert
  • 【ros2】ROS2接口定义指南
  • 网页制作免费网站建设wordpress函数表
  • 建设部房地产网站建设银行支行网站
  • 网站meta 优化建议教育技术专业网站开发课程
  • 网站开发课程的建议网页怎么搜索关键词
  • AngularJS 简介
  • 软考程序员2016年上半年二叉排序树案例题解答
  • LIN总线
  • 彩票走势图网站是用什么程序做的做原型的素材网站
  • 现在建网站还能赚钱吗在线教育网站建设策划
  • 梅州市住房和建设局网站网络广告文案案例
  • C++ 对象布局之padding(填充字节)
  • 做直播的视频在线观看网站成都网站制作报价
  • 现在都用什么软件做网站创建网站有免费的吗
  • MVC 布局:深入解析其原理与实践
  • iis添加网站网站设计就业前景如何
  • 学院网站建设策划书wordpress的功能简介
  • LeetCode 热题 100——滑动窗口——找到字符串中所有字母异位词
  • 土动静扭剪三轴仪技术指标
  • exe文件反编译成C语言 | 反编译技巧与应用分析
  • 指数型枚举
  • 竞价网站策划网站建设在作用是什么原因
  • 遵义住房城乡建设厅网站邯郸网站建设恋家
  • LeetCode 面试经典 150_二叉树_路径总和(75_112_C++_简单)(DFS)
  • 赋能职业教育:大众ID.4 CROZZ新能源汽车故障诊断仿真教学软件
  • 网站前端是什么意思品牌策划公司推荐
  • Linux字符设备驱动开发详细教程(简单字符设备驱动框架)
  • 电商网站建设运城商务网站建设难不难