【DL学习笔记】感受野(Receptive Field)
感受野(Receptive Field)
-
感受野(receptive field)是卷积神经网络输出特征图上的像素点在原始图像上所能看到的(映射的)区域的大小
-
它决定了该像素对输入图像的感知范围(获取信息的范围)。较小的感受野可以捕捉到更细节的特征,而较大的感受野可以捕捉到更全局的特征。
如果连续进行2次卷积操作,卷积核大小都为 3x3,stride=1, padding=0, 如下图,layer3上的每一个像素点在 layer1上的感受野 为 5x5
感受野计算公式
F(i)=(F(i+1)−1)×Stride+Ksize F(i) = (F(i + 1) - 1) \times Stride + Ksize F(i)=(F(i+1)−1)×Stride+Ksize
- F(i)F(i)F(i) :在第 iii 层的感受野
- StrideStrideStride :第 iii 层步距
- KsizeKsizeKsize :第 iii 层卷积或池化的 kernel size
或者:Fin=(Fout−1)×Stride+Ksize F_{in} = (F_{out} - 1) \times Stride + Ksize Fin=(Fout−1)×Stride+Ksize
计算举例:求layer3 上的每个像素在 layer1 上的感受野
-
计算
layer3
上一个像素(F(3)=1F(3) = 1F(3)=1)在layer2
上的感受野:
F(2)=(F(3)−1)×Stride+Ksize=(1−1)×2+2=2 F(2) = (F(3) - 1) \times Stride + Ksize = (1 - 1) \times 2 + 2 = 2 F(2)=(F(3)−1)×Stride+Ksize=(1−1)×2+2=2 -
计算
layer3
上一个像素(F(3)=1F(3) = 1F(3)=1,F(2)=2F(2) = 2F(2)=2 )在layer1
上的感受野:
F(1)=(F(2)−1)×Stride+Ksize=(2−1)×2+3=5 F(1) = (F(2) - 1) \times Stride + Ksize = (2 - 1) \times 2 + 3 = 5 F(1)=(F(2)−1)×Stride+Ksize=(2−1)×2+3=5 -
若仅计算
layer2
上一个像素(F(2)=1F(2) = 1F(2)=1)在layer1
上的感受野:
F(1)=(F(2)−1)×Stride+Ksize=(1−1)×2+3=3 F(1) = (F(2) - 1) \times Stride + Ksize = (1 - 1) \times 2 + 3 = 3 F(1)=(F(2)−1)×Stride+Ksize=(1−1)×2+3=3