【橘子的AI | 每日一课】Day4!机器学习 (ML) 基础
机器学习 (ML) 基础介绍
一、机器学习的定义
从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。“训练”与“预测”是机器学习的两个过程,“模型”则是过程的中间输出结果,“训练”产生“模型”,“模型”指导 “预测”。
机器学习方法是计算机利用已有的数据(经验),得出了某种模型(迟到的规律),并利用此模型预测未来(是否迟到)的一种方法。可以把机器学习的过程与人类对历史经验归纳的过程做个比对,人类在成长、生活过程中积累了很多的历史与经验,定期地对这些经验进行“归纳”,获得了生活的“规律”,当人类遇到未知的问题或者需要对未来进行“推测”的时候,人类使用这些“规律”,对未知问题与未来进行“推测”,从而指导自己的生活和工作。机器学习中的“训练”与“预测”过程可以对应到人类的“归纳”和“推测”过程。
二、机器学习的核心思想
机器学习的核心思想可以从以下几个方面来理解:
- 数据驱动:机器学习依赖于大量的数据,就像人们通过阅读书籍来学习知识一样,机器学习通过分析数据来学习规律。
- 模式识别:其目标是识别数据中的模式,比如,通过分析大量猫的图片,机器可以学会识别猫的特征。
- 算法优化:使用各种算法来处理数据,这些算法会不断优化以更好地从数据中学习,就像人们通过不断练习来提高技能一样。
- 预测与决策:学习到的模式可以用于预测和决策,比如,一个天气预报模型可以预测明天的天气。
- 自适应性:机器学习模型可以随着新数据的输入而不断更新和改进,这就像人们根据新信息调整自己的观点和决策。
- 泛化能力:好的机器学习模型不仅能在训练数据上表现良好,还能泛化到未见过的数据上,这就像是学会了骑自行车的人,即使换了一辆不同的自行车也能骑得很好。
- 自动化:可以自动化许多任务,比如自动化邮件分类、语音识别等,这大大提升了效率。
三、机器学习与AI的关系
人工智能(AI)是一个更广泛的领域,涵盖了让机器表现出类似于人类智能的各种技术和方法,而机器学习是实现人工智能的一种具体方法和技术,是人工智能的一个子领域。人工智能的目标是使机器能够模拟人的认知功能,甚至超越人类在某些任务中的表现,其应用领域非常广泛,包括自然语言处理、计算机视觉、专家系统、机器人控制等。而机器学习主要专注于如何让计算机自动从数据中学习和优化。
简单来说,机器学习是实现人工智能的一种方式,属于人工智能的一个分支。人工智能不仅仅包括机器学习,还涵盖了知识表示、推理、规划等其他技术。
四、机器学习的三种主要范式
(一)监督学习
监督学习是一种基于已标记数据进行训练的学习方式。在训练过程中,算法会接受输入数据及其对应的标签(或者称为输出),以此来学习输入和输出之间的关系,其主要目的是找到一个从输入到输出的映射函数,使得模型能够对新数据进行预测。监督学习可以进一步分为分类和回归:
- 分类:将输入分配到离散的类别中,例如垃圾邮件检测、图像分类等。
- 回归:预测连续的数值输出,例如预测房价、股票价格等。
常见的监督学习算法包括线性回归、逻辑回归、决策树、随机森林、支持向量机等。以房价预测为例,使用线性回归模型,通过分析房屋的面积、房间数量、地理位置等特征数据,以及对应的房价标签,训练出一个预测模型,当有新的房屋数据输入时,就可以使用该模型预测其房价。
(二)无监督学习
与监督学习不同,无监督学习是在没有标签的数据集上进行训练的学习方式,其主要目的是发现数据中的结构、模式、或者隐藏的关系,更加关注数据的内部相似性和聚集特征,通常用于数据探索和降维。无监督学习主要包括聚类和降维:
- 聚类:将相似的数据点归为一类,例如客户细分、文档分类等。
- 降维:将高维数据投射到低维空间,以便于可视化和处理,例如主成分分析(PCA)。
常见的无监督学习算法有K均值聚类、层次聚类、主成分分析(PCA)、自编码器等。例如在市场营销中,根据客户的购买历史、浏览行为等特征数据,使用无监督学习算法进行聚类分析,可以将客户分为不同的群体,企业可以针对不同群体制定个性化的营销策略。
(三)强化学习
强化学习是一种使智能体(agent)通过与环境(environment)交互,学习如何采取行动以最大化累积奖励(cumulative reward)的机器学习方法。与监督学习和无监督学习不同,强化学习更注重序列决策和长期回报的优化。
强化学习系统通常包括智能体、环境、状态、动作、奖励、策略、价值函数、Q值等基本组成部分。智能体在每一步都要从环境中接收状态,选择动作,并根据环境的反馈更新策略,这个过程通常被建模为马尔可夫决策过程(MDP)。
常见的强化学习算法有Q学习、深度Q网络(DQN)等。以游戏为例,智能体就像是游戏玩家,环境就是游戏世界,游戏中的各种场景和角色状态就是状态,玩家可以采取的操作(如移动、攻击、跳跃等)就是动作,当玩家完成一个任务或击败一个敌人时,游戏会给予一定的分数奖励,这就是奖励,玩家通过不断地尝试不同的操作,根据获得的分数来学习如何在游戏中取得更高的分数,即最大化长期累积奖励。