当前位置：首页 > news >正文

感受野（Receptive Field）

news 2025/7/1 22:23:01

感受野（Receptive Field）是卷积神经网络（CNN）中一个神经元在输入图像上能“看到”的区域范围。简单来说，它表示某个特征图中的像素点，对应原始输入图像中的多大区域。

举个栗子🌰

假设你有一个3×3的卷积核，第一层卷积输出的每个神经元，感受野就是3×3（直接覆盖输入图像的3×3区域）。
如果后续再叠加一个3×3卷积层，第二层神经元的感受野就会扩大到5×5（如下图所示）。
层级越深，感受野越大，网络能“理解”的图像范围越广。

为什么感受野重要？

决定网络感知能力：
- 小感受野适合捕捉局部细节（如纹理、边缘）。
- 大感受野适合理解全局结构（如物体形状、上下文关系）。
平衡细节与语义：
浅层网络感受野小，关注局部特征；深层网络感受野大，提取抽象语义。
任务适配：
- 目标检测中，感受野需覆盖目标物体大小（如大物体需更大的感受野）。
- 图像分割中，需同时保留局部细节和全局上下文。

感受野计算公式

对于第 $k$ 层卷积，感受野大小 $RF_k$ 与前一层的关系为：

$RF_k = RF_{k-1} + (kernel\_size_k - 1) \times \prod_{i=1}^{k-1} stride_i$

其中， $stridei$ 是第 i 层的步长，初始输入的感受野 $RF_0 = 1$ 。

示例计算

假设网络结构如下：

输入图像 → 卷积层1（ $kernel=3×3, stride=1$ ）
$RF_1 = 1 + (3 - 1) \times 1 = 3$
卷积层1 → 卷积层2（ $kernel=3×3, stride=2$ ）
$RF_1 = 3 + (3 - 1) \times 1 = 5$
卷积层2 → 卷积层3（ $kernel=3×3, stride=1$ ）
$RF_1 = 5 + (3 - 1) \times 1 = 9$
最终第三层的感受野为9×9。

增大感受野的方法

方法	原理	特点
加深网络	堆叠更多卷积层	自然扩大，但增加计算量
增大卷积核	直接使用更大的kernel（如5×5）	简单暴力，可能参数量大
空洞卷积	在卷积核中插入空洞（dilation）	不增加参数，扩大感受野
池化层	通过下采样（如最大池化）间接扩大	牺牲空间分辨率

实际应用技巧

目标检测网络设计：YOLO、Faster R-CNN 通过多尺度特征融合，兼顾不同感受野。
语义分割优化：使用空洞卷积（如DeepLab系列）保持高分辨率的同时扩大感受野。
可视化工具：用代码库（如receptivefield）计算各层感受野。

一句话总结

感受野决定了神经网络“看得有多广”，是平衡局部细节与全局语义的关键参数。

http://www.dtcms.com/a/163927.html

相关文章：

高瓴资本张磊的顶级价值投资之道

SSR同构渲染深度解析

实现在h5中添加日历提醒：safari唤起系统日历，其它浏览器跳转google日历

阿里巴巴Qwen3发布：登顶全球开源模型之巅，混合推理模式重新定义AI效率

选择AGV行业用的丝杆升降机时，需要考虑哪些因素？

Jupyter notebook快捷键

飞蛾扑火算法优化+Transformer四模型回归打包（内含MFO-Transformer-LSTM及单独模型）

高效 Transformer 的综述

Ansible 铸就 Linux 安全之盾（Ansible Builds Linux Security Shield）

4、RabbitMQ的七种工作模式介绍

算法备案类型解析：如何判断你的算法属于哪种类型？

【动手学大模型开发】使用 LLM API：讯飞星火

ShenNiusModularity项目源码学习（25：ShenNius.Admin.Mvc项目分析-10）

Go语言Context机制深度解析：从原理到实践

【angular19】入门基础教程(四):默认的css隔离作用域

项目三 - 任务1：采用面向对象方式求三角形面积

Tauri 跨平台开发指南及实战：用前端技术征服桌面应用（合集-万字长文）

Javascript 中作用域的理解?

【AI提示词】第一性原理

k8s学习笔记

2025年KBS新算法 SCI1区TOP：长颖燕麦优化算法AOO，深度解析+性能实测

【计算机视觉】深度解析MediaPipe：谷歌跨平台多媒体机器学习框架实战指南

海外App数据隐私架构实战：构建GDPR、CCPA合规的全栈解决方案

打造美观 API 文档：Spring Boot + Swagger 实战指南

案例速成GO+Socket，个人笔记

Linux 服务管理两种方式service和systemctl

《数学物理方程》——第一章引入与基本概念

AGILE：开启LLM Agent强化学习的创新框架

【dify—3】拉取镜像、本地访问dify

AimRT 从零到一：官方示例精讲 —— 六、pb_chn示例.md