从单个神经元到数字识别神经网络的演变
1. 单个神经元:像一个 “智能开关”
图中最上面的圆圈就是一个神经元,它做两件事:
- 加权求和:把输入的x₁, x₂, ..., xₙ分别乘以权重w₁, w₂, ..., wₙ,再加偏置b,得到net = w₁x₁ + w₂x₂ + ... + wₙxₙ + b。
- 激活函数(Sigmoid):把net扔进 Sigmoid 函数,输出y = sigmoid(net),结果在 0~1 之间。
2. 神经元的作用:判断 “匹配度”
比如识别数字 3 时:
- 输入x是图片的像素;
- 权重w是 “数字 3” 的模板;
- 输出y越接近 1,说明图片越像数字 3。
3. 神经网络:多个神经元 “组队干活”
下面的图展示了两层神经网络:
- 输入层:接收原始数据(比如图片像素);
- 输出层:多个神经元同时判断(比如同时识别数字 3 和数字 8)。
每个输出层神经元对应一个数字的 “匹配度”,最终选择数值最大的那个作为结果(比如y₃和y₈中,谁大就认为图片是哪个数字)。
4. 数字识别神经网络:“全民投票” 模式
最下面的图是一个完整的数字识别网络(比如识别 0-9 十个数字):
- 输入层:接收图片像素;
- 隐藏层:中间的神经元会自动提取特征(比如边缘、线条);
- 输出层:10 个神经元分别对应数字 0-9,每个输出y_i代表 “图片是数字 i 的概率”。
最终,选择输出最大的那个神经元对应的数字,就是识别结果。
总结
这张图把 “加权求和 + Sigmoid” 包装成了一个叫 “神经元” 的单元,多个神经元组队就成了神经网络。本质上,它是用数学公式模拟 “人类判断事物” 的过程 —— 先看局部特征(加权求和),再综合判断(Sigmoid 归一化),最后多个判断一起投票(神经网络)。而数字识别网络就是用这种方式,让 AI 学会 “看图片认数字”。