当前位置: 首页 > news >正文

深度感知卷积和深度感知平均池化

A. 深度感知卷积(Depth-Aware Convolution)

将深度感知卷积和深度感知平均池化整合到深度卷积神经网络(DCNNs)中,可以有效地增强特征提取能力。传统的卷积和池化操作对不同深度的像素进行无差别处理,往往忽略空间几何信息;而深度感知方法通过在卷积核和池化区域内引入深度相似度函数(公式1和2),在特征聚合过程中赋予具有相似深度的像素更大的权重。具体来说,深度感知卷积通过加权机制强调深度一致区域,从而保留更多的细节和结构信息。

公式(1):

y(p0)=∑pn∈Rw(pn)⋅FD(p0,p0+pn)⋅x(p0+pn) y(p_0) = \sum_{p_n \in R} w(p_n) \cdot FD(p_0, p_0 + p_n) \cdot x(p_0 + p_n) y(p0)=pnRw(pn)FD(p0,p0+pn)x(p0+pn)

公式(2):

FD(pi,pj)=exp⁡(−∣D(pi)−D(pj)∣) FD(p_i, p_j) = \exp(-|D(p_i) - D(p_j)|) FD(pi,pj)=exp(D(pi)D(pj))

其中,x(p0+pn)x(p_0 + p_n)x(p0+pn) 代表输入特征图在位置 p0+pnp_0 + p_np0+pn 处的值,FD(pi,pj)FD(p_i, p_j)FD(pi,pj) 是深度相似度函数,D(pi)D(p_i)D(pi)D(pj)D(p_j)D(pj) 分别表示位置 pip_ipipjp_jpj 处的深度值。

B. 深度感知平均池化(Depth-Aware Average Pooling)

深度感知平均池化利用深度相似度函数为计算平均值时赋予具有相似深度的像素更高的贡献。其输出可以表示为公式(3),其中 RRR 表示池化区域,x(⋅)x(\cdot)x() 表示输入特征图。该方法能够有效地保留深度丰富场景中的物体边缘和几何信息,从而增强图像在视觉任务中的细粒度识别能力,如物体检测和图像分割。

公式(3):

y(p0)=∑pn∈RFD(p0,p0+pn)⋅x(p0+pn)/∑pn∈RFD(p0,p0+pn) y(p_0) = \sum_{p_n \in R} FD(p_0, p_0 + p_n) \cdot x(p_0 + p_n) \Big/ \sum_{p_n \in R} FD(p_0, p_0 + p_n) y(p0)=pnRFD(p0,p0+pn)x(p0+pn)/pnRFD(p0,p0+pn)

此公式表示,通过深度相似度函数 FD(p0,p0+pn)FD(p_0, p_0 + p_n)FD(p0,p0+pn) 为池化区域中的每个位置赋予加权,从而更好地保留图像中重要的深度信息。

公式解读

A. 深度感知卷积(Depth-Aware Convolution)
  1. 公式 (1):
    该公式表示深度感知卷积的输出 y(p0)y(p_0)y(p0) 是输入特征图中的一个位置 p0p_0p0 的加权和,公式中 x(p0+pn)x(p_0 + p_n)x(p0+pn) 代表输入特征图在位置 p0+pnp_0 + p_np0+pn 处的值。每个位置的权重 w(pn)w(p_n)w(pn) 是通过深度相似度函数 FD(pi,pj)FD(p_i, p_j)FD(pi,pj) 来计算的,其中 pip_ipipjp_jpj 是卷积核内的不同位置,而 D(pi)D(p_i)D(pi)D(pj)D(p_j)D(pj) 分别表示位置 pip_ipipjp_jpj 处的深度值。

  2. 公式 (2):
    该公式定义了深度相似度函数 FD(pi,pj)FD(p_i, p_j)FD(pi,pj),通过计算位置 pip_ipi 和位置 pjp_jpj 之间的深度差异来评估它们的相似度。具体来说,深度相似度函数 FD(pi,pj)FD(p_i, p_j)FD(pi,pj) 是深度差的指数衰减函数 exp⁡(−∣D(pi)−D(pj)∣)\exp(-|D(p_i) - D(p_j)|)exp(D(pi)D(pj)),这意味着深度相似度随着深度差的增大而迅速减小。

总结: 在深度感知卷积中,模型会根据像素间的深度相似性加权计算卷积操作,以此来保留结构性和细节信息,特别是在深度信息一致的区域。

B. 深度感知平均池化(Depth-Aware Average Pooling)
  1. 公式 (3):
    该公式表示深度感知平均池化的输出 y(p0)y(p_0)y(p0) 是一个池化区域 RRR 内所有位置的加权和,其中每个位置的权重是通过深度相似度函数 FD(p0,pn)FD(p_0, p_n)FD(p0,pn) 来计算的。与传统平均池化不同,深度感知池化根据深度相似度对每个位置的贡献进行加权,从而保持图像中深度丰富区域的细节,如物体边缘等重要特征。

总结: 在深度感知平均池化中,通过加权计算池化区域内像素的平均值,深度相似度函数用于增强相似深度区域的贡献,从而有助于保留重要的物体和几何信息。

http://www.dtcms.com/a/352290.html

相关文章:

  • python自动测试 crictl 可以从哪些国内镜像源成功拉取镜像
  • pulsar、rocketmq常用命令
  • C#由Dictionary不正确释放造成的内存泄漏问题与GC代系
  • Text to Speech技术详解与实战:GPT-4o Mini TTS API应用指南
  • 从“脚本语言”到“企业级引擎”——PHP 在 2025 年技术栈中的再定位
  • Linux服务器安全配置与NTP时间同步
  • 记录一下,qt问题:qt ui文件的改动无法更新到cpp
  • 疯狂星期四文案网第51天运营日记
  • Typescript入门-interface讲解
  • 类型签名,位置参数,关键字参数
  • open webui源码分析8—管道
  • 域名常见问题集(十一)——为什么要进行域名管理?
  • 【实时Linux实战系列】基于实时Linux的音频实时监控系统
  • 从16个粉丝到680万年收入:AI创业的117天奇迹
  • 声明式微服务通信新范式:OpenFeign如何简化RestTemplate调用
  • Windows下实现类似`watch nvidia-smi`的实时监控效果
  • 进入docker中mysql容器的方法
  • Java:TreeSet的使用
  • (Arxiv-2024)VideoMaker:零样本定制化视频生成,依托于视频扩散模型的内在力量
  • QT qml(quick3D)模型的移动
  • 专业解读《Light》封面:可调谐混合超表面(THCMs)如何革新下一代LiDAR系统
  • 3D游戏角色建模资源搜索指南(资料来源于网络)
  • 湖仓一体:小米集团基于 Apache Doris + Apache Paimon 实现 6 倍性能飞跃
  • JavaWeb之分布式事务规范
  • LInux(二十一)——Linux SSH 基于密钥交换的自动登录原理简介及配置说明
  • jenkins2025配置邮箱发送
  • 基于Android的车位预售预租APP/基于Android的车位租赁系统APP/基于Android的车位管理系统APP
  • Leetcode—1163. 按字典序排在最后的子串【困难】
  • Linux(二十二)——服务器初始化指南
  • cuda编程笔记(16)--使用 cuDNN 实现卷积、激活、池化等反向操作