卷积神经网络的感受野(receptive field)

发布时间 2023-09-26 17:01:05作者: Liang-ml

感受野 Receptive Field

卷积核输出的 feature map 特征图中某个节点对应其输入图像的区域大小即为该位置的感受野。

感受野相关的性质:

  • 感受野越大,说明其接触的原始图像的范围越大,意味着其包含着更加全局、语义信息更丰富的特征;
  • 感受野越小,说明其包含的特征更关注局部细节;
  • 感受野不受padding的影响,sripe会影响下一层的感受野。

感受野大小的要求:

  • 一般的任务要求感受野越大越好,如图像分类的最后卷积层输出特征图的感受野要大于输入图像
  • 密集预测任务(如分割任务)要求输出像素的感受野足够大,即获得全局的信息以帮助分类决策
  • 目标检测任务中设置anchor要严格对应感受野。anchor太大或者偏离感受野都会严重影响检测性能

感受野的计算

 

感受野的计算方法有自上而下和自下而上,目前看到的观点认为自下而上反推计算感受野比较靠谱,但两种方法算出的最终感受野一致,中间部分不同。

自上而下正推:

可按照如上公式进行计算,rn-1表示上一层的感受野大小,kn表示卷积核的大小,si为核的步长,步长影响的是下一层的感受野,

按照上述公式,VGG16的感受野计算为

(1 + (3 - 1) * 1 + (3 - 1) * 1 + (2 - 1) * 1 + (3 - 1) * 2 + (3 - 1) * 2 + .... ) = 212

3 → 5 → 6 → 10 → 14 → 16 → 24 → 32 → 40 → 44 → 60 → 76 → 92 → 100 → 132 → 164 → 196 → 212

自下而上反推:

 VGG16的最后一层卷积层是池化层,尺寸大小为2,则最后一层的感受野为2,以2为开始进行推导

2 → 4 → 6 → 8→ 16 → 18 → 20 → 22 → 44 → 46 → 48 → 50 → 100 → 102 → 104 → 208 → 210 → 212

 

 VGG16