当前位置: 首页 > news >正文

HOW MUCH POSITION INFORMATION DO CONVOLUTIONAL NEURAL NETWORKS ENCODE?

1. 动机:

  卷积神经网络中的卷积操作实际上是一个局部的操作,这样的话就会使得它虽然知道自己看的是什么,但是却不清楚他在图像中的位置信息,但是位置信息实际上是很有用的,因此CNN可能潜在的学习到了如何去编码这种位置信息。所以这篇论文就是为了研究这种位置信息是如何在CNN中编码得到的。

2. 介绍:

  在这篇工作中,他们通过执行一系列的随机试验来检验绝对位置信息的作用,他们假设实际上CNN确实能够编码这种位置信息。本研究揭示了CNN的这种位置信息是从常用到的zero-padding中得到的。

  之前有研究表明即使图像是完全的噪声仍然可以通过训练得到0的损失值,据此,作者也通过这追踪随机性的检测来研究CNN的学习的特征,但是这篇工作不同于之前的方法只关注于可视化和理解,并没有研究位置的关系。


  问题的定式表达:给定一个输入的图像,我们的目标是为了预测一个gradient-like的位置信息遮罩,它里面的每个像素位置的值代表了他在那从左往右或从上往下的位置。我们生成一个遮罩\mathcal{G}_{pos} \in \mathbb{R}^{h \times w},这个遮

http://www.dtcms.com/a/146936.html

相关文章:

  • web原生API AbortController网络请求取消方法使用介绍:防止按钮重复点击提交得最佳方案
  • 总结设计测试用例的万能公式
  • 基于LLM的响应式流式处理实践:提升用户体验的关键技术
  • 算法 | 鲸鱼优化算法(WOA)原理,公式,应用,算法改进研究综述,完整matlab代码
  • 测试用例书写规范详解:构建高效测试体系的基础
  • STM32H5开发陀螺仪LSM6DSV16X(3)----SFLP获取四元数
  • spring boot使用Scheduling实现动态增删启停定时任务
  • 8051单片机所有Keil C51汇编伪指令和C语言关键字大全
  • DAG(有向无环图)计算模型面试内容整理-DAG的特点和应用场景
  • Python第一周作业
  • 大模型学习笔记 day01 提示工程入门1.One-shot Few-shot提示学习法
  • XSS详解
  • Oracle RMAN同步数据库Active database duplicate
  • Elasticsearch中的_source字段讲解
  • YOLOv12综述:基于注意力的增强与先前版本的对比分析
  • Spring MVC 执行流程全解析:从请求到响应的七步走
  • JavaWeb学习打卡-Day1-分层解耦、Spring IOC、DI
  • 实践项目开发-hbmV4V20250407-readme
  • Redis 慢查询分析与优化
  • 2025 年职业院校技能大赛网络建设与运维赛项Docker赛题解析
  • JS省市区三级联动查询示例代码(城市查询、地区查询)
  • SaltStack远程协助工具
  • 我用deepseek做了一个提取压缩文件夹下pdf和word文件工具
  • Java抽象类、接口和内部类介绍
  • Spring AI Alibaba Graph基于 ReAct Agent 的天气预报查询系统
  • 解决 Arduino IDE 2.3.6 在 Windows 上无法启动:缺少 Documents 文件夹与注册表路径错误
  • Spring AOP 事务
  • 【Linux专栏】zip 多个文件不带路径
  • 2025年渗透测试面试题总结-拷打题库09(题目+回答)
  • Windows1909,21H2哪个版本更稳定