《玩转AI大模型:从入门到创新实践》(12)LLM初步(2)
第12.2节 一个简单的神经网络
1. 数据准备与问题定义
(1)输入特征解析
- RGB颜色值(专业术语:特征向量)
→ 像给物体拍彩色证件照,如叶子的RGB为(32,107,56)
→ 每个颜色通道对应数字:红=32,绿=107,蓝=56 - 体积数据(Vol:11.2ml)
→ 用数字尺测量物体大小,鲜花体积显著大于叶子(59.5ml vs 11.2ml)
(2)输出目标设计
- 分类方案选择(专业术语:输出层设计)
→ 方案一:单输出节点(正数为叶子,负数为花朵)
→ 方案二:双输出节点(比较两个数值大小决定类别)
→ 本例采用方案二,输出层结构:[叶子得分, 花朵得分]
(3)数据表示样例
类别 | R | G | B | Vol |
---|---|---|---|---|
叶子 | 32 | 107 | 56 | 11.2 |
鲜花 | 241 | 200 | 4 | 59.5 |
2. 神经网络架构详解
(1)层级结构(专业术语:网络拓扑)
输入层(4节点) → 隐藏层(3节点) → 输出层(2节点)
│ │ │
R值 蓝色神经元 叶子得分
G值 橙色神经元 花朵得分
B值 灰色神经元
Vol值