当前位置：首页 > news >正文

【机器学习05】神经网络、模型表示、前向传播、TensorFlow实现

news 2025/10/21 8:48:18

视频链接
吴恩达机器学习p38-46

一、神经网络简介 (Introduction to Neural Networks)

经过对线性回归和逻辑回归的学习，我们已经掌握了构建强大预测模型的基础。现在，我们将进入一个更高级、更强大的算法领域：神经网络（Neural Networks），以及决策树等。

[图片]

神经网络（NN）是一类算法，其最初的灵感来源于对生物大脑工作方式的模仿。

[图片]

它并非一个全新的概念，早在20世纪80年代和90年代初就已被使用。但由于当时计算能力和数据量的限制，它在90年代后期一度失宠。然而，自2005年左右以来，得益于大数据和计算能力的飞速发展，神经网络迎来了巨大的复兴，并迅速在语音、图像、自然语言处理（NLP）等众多领域取得了突破性进展。

在大脑中，神经元（Neuron）是基本的信息处理单元。它通过树突（Dendrites）接收输入信号，处理后通过轴突（Axon）产生输出信号。

[图片]

人工神经网络就是对这个过程的一个简化数学建模。我们将一个生物神经元抽象成一个接收数字输入、进行计算、然后输出一个数字的数学单元。

[图片]

神经网络的再度崛起，主要得益于两个关键因素的结合：海量的可用数据（大数据） 和 强大的计算能力（更快的处理器，特别是GPU）。

[图片]

上图清晰地展示了，当数据量非常大时，大型神经网络（绿色曲线）的性能远超传统的机器学习算法（红色曲线）。数据越多，模型越大，性能就越强。

我们其实已经接触过最简单的神经元了——它本质上就是一个我们前面学过的逻辑回归单元。

[图片]

这个“神经元”接收输入 x（例如商品价格），通过一个 激活函数（activation function）（这里是Sigmoid函数），计算并输出一个 激活值（activation） a，这个 a 值代表了某个事件发生的概率（例如，商品成为爆款的概率）。

神经网络的强大之处在于，它将许许多多这样的单个神经元，组织成一个个“层（Layer）”。

[图片]

一个典型的神经网络由三部分组成：

输入层 (Input Layer)：接收原始的特征数据 x⃗（如价格、运费、营销投入等）。
隐藏层 (Hidden Layer)：位于输入层和输出层之间，负责进行大部分的计算。隐藏层能够学习到数据中更抽象、更深层次的特征（如“性价比”、“品牌知名度”等）。
输出层 (Output Layer)：输出最终的预测结果 a。

当一个网络包含多个隐藏层时，它也被称为多层感知机（Multilayer Perceptron, MLP）。我们可以通过增加隐藏层的数量和每层神经元的数量，来构建更加复杂的神经网络架构（architecture）。

[图片]