深度学习概述
近年来,我们在媒体上到处可见人工智能(AI)这个词,而深度学 习是人工智能的一种实现方法。下面我们就来简单地看一下深度学习具 有怎样划时代的意义。
下面是三张花的图片,它们都具有同一个名字,那究竟是什么呢?
![]() | ![]() | ![]() |
答案是玫瑰。虽然大小和形状都不一样,但这些的确都是玫瑰花的 图片。看到玫瑰花的图片,我们理所当然就能辨别出“这是玫瑰花”。
在计算机和数学的世界中,这个玫瑰花的例子属于模式识别问题。 人类每天都在进行着模式识别。比如,我们在逛街的时候就会无意识地 进行着物体的辨别:“那是电影院”“信号灯是红灯”,等等。换言之,这 就是在进行模式识别。
然而,像这样的人类认为很自然的事情,一旦想让机器来做,就变 得非常困难。例如,现在让你编写一个模式识别的计算机程序,使其从大量花的图片中单独提取出玫瑰花的图片,你可能就束手无策了。
实际上,关于模式识别的理论创建一直在碰壁。例如,对于玫瑰花 的模式识别,以前的逻辑是将“玫瑰是具有这样特征的东西”教给机器, 然而效果甚微。因为玫瑰花的形状实在是太多了,即使是相同品种的玫 瑰花,其颜色和形状每时每刻也都在发生变化,不同品种的玫瑰花则会 有更大的差异。要从如此多样的特征之中得出“玫瑰”这样一个概念, 的确是太难了。
后来,一种被称为神经网络的数学方法被研究出来。具体来说,就 是将模拟动物的神经细胞的神经元聚集起来形成网络,然后让这个网络 去观察大量的玫瑰花的图片,进行“自学习”。相比之前的模式识别逻 辑,该方法取得了很大的成功。特别是利用称为卷积神经网络的多层结构的神经网络,甚至可以从图片和视频中识别出人和猫。深度学习就是用具有这种结构的神经网络实现的人工智能。
虽然“自学习”听起来很难,但神经网络运用的数学理论是非常简 单的,基本上是比较基础的数学知识。然而,很多文献大量使用公式和 专业术语,令人难以看透神经网络的本质,这对于今后人工智能的发展 是莫大的不幸和障碍。本专栏作为人工智能的入门,目的就是要破除这 种障碍,让所有人都能够体会到神经网络的趣味性。本专栏的目标是用初 级的数学知识详细地讲解深度学习的思想。
只要从本质上理解了基础知识,就可以在应用中大展身手。但愿本专栏能够对 21 世纪人工智能的发展有所贡献。
本专栏的使用说明
● 本专栏的目的在于提供理解神经网络所需的数学基础知识。为了便于读者直观地理解,本专栏使用大量图片,并通过具体示例来介绍。因此, 本专栏将数学的严谨性放在第二位。
● 深度学习的世界是丰富多彩的,本专栏主要考虑阶层型神经网络和卷积 神经网络在图像识别中的应用。
● 本专栏将 Sigmoid 函数作为激活函数,除此之外也可以考虑其他函数。
● 本专栏以最小二乘法作为数学上的最优化的基础,除此之外也可以考虑 其他方法。
● 神经网络可分为有监督学习和无监督学习两类。本专栏主要讲解有监督学习。
● 人工智能相关的文献之所以难读,其中一个原因就是各文献所用的符 号不统一。本专栏采用的是相关文献中常用的符号。
● 本专栏使用 Excel 进行理论验证。Excel 是一个非常优秀的工具,能够在 工作表上可视化地展现逻辑,有助于我们理解。因此,相应的项目需 要以 Excel 的基础知识为前提。