解释全连接层的“参数数量”和“计算过程”,保证像看动画片一样直观~
假设场景
- 输入图像:一张极小的
灰度图(即 H=2,W=2,共4个像素),像素值如图所示:
- 隐藏层:假设隐藏层也是
(即 H=2,W=2,共4个神经元),每个神经元用
( 表示(i=1,2 是行,j=1,2 是列)。
一、全连接的“参数数量”为什么是 H×W×H×W?
关键:每个隐藏层神经元都要和输入图像的 所有像素 连接,且每个连接都有一个独立的权重。
- 输入图像像素数量:H×W=2×2=4(每个像素坐标
,
,
)。
- 隐藏层神经元数量:
(每个神经元坐标
,
,
)。
每个神经元需要多少权重?
以隐藏层神经元 为例:它要连接输入图像的 所有4个像素,所以需要 4个权重(每个像素对应一个权重)。
总权重数量:
总权重=隐藏层神经元数量×每个神经元的权重数量=4×4=16
对应公式中的
二、计算过程:如何通过“累加”得到隐藏层神经元值?
以隐藏层神经元
为例,一步步计算它的值 
步骤1:明确神经元
的权重(假设权重值如下)
权重 是一个4阶矩阵(可以理解为“每个神经元有一组权重”),这里简化为:神经元
的权重为一个
的矩阵(对应输入图像的4个像素):
(符号中,前两个下标
表示隐藏层神经元,后两个下标
表示输入图像像素。)
步骤2:每个像素乘以对应权重
输入图像的4个像素分别为:
:
,对应权重
→ 乘积:
:
,对应权重
→ 乘积:
:
,对应权重
→ 乘积:
:
,对应权重
→ 乘积:
步骤3:累加所有乘积结果(关键!)
这就是“累加结果”的过程:把所有像素与对应权重的乘积加起来,得到神经元的输出值。
三、隐藏层的4个神经元都要这样算!
上面只算了隐藏层的1个神经元 ,但还有
、
、
三个神经元,每个神经元都有 自己独立的4个权重,都要重复上述“像素×权重→累加”的过程。
- 例如神经元
的权重可能是
,计算方式完全相同;
- 4个神经元 × 每个4个权重 = 16个权重(对应前面的参数数量)。
为什么要“累加”?一句话总结
每个神经元像一个“小计算器”,它需要综合输入图像的 所有信息(全连接特性),而“加权求和”(像素×权重后累加)是综合信息最简单的方式(就像你期末考试时,把各科成绩乘以学分后相加得到总分)。
视觉化比喻
- 输入图像的4个像素 = 4个学生的成绩;
- 隐藏层神经元 1,1
(1,1) = 一个“总成绩计算器”;
- 权重 = 各科成绩的“学分”(不同计算器可以设置不同学分);
- 累加结果 = 学生的“加权总分”(神经元的输出值)。