当前位置: 首页 > news >正文

机器学习相关内容

文章目录

  • 感知机和SVM
    • 感知机
    • SVM(支持向量法)
    • 二者联系和区别
  • GRU和LSTM
    • GRU
    • LSTM
    • 二者区别与联系
    • 正则化
      • L1正则化和L2正则化

感知机和SVM

感知机

参考文章
对上述文章部分内容进行额外补充和解释:
在这里插入图片描述
这里的“在训练数据集中选取数据(x,y)”具体是如何选取的?
在这里插入图片描述
通俗解释:
在这里插入图片描述

SVM(支持向量法)

参考文章

二者联系和区别

感知机(Perceptron)和支持向量机(Support Vector Machine, SVM)都是经典的线性分类器,它们旨在找到一个能够将不同类别数据分开的超平面。SVD可以认为是基于感知机基础上的改进。
区别:
主要是下图标注的地方内容
在这里插入图片描述

GRU和LSTM

在这里插入图片描述

GRU

参考文章
额外补充:
在这里插入图片描述
上述内容的记忆和遗忘是针对新的候选信息h^t\hat h_th^t!GRU通过一个更新门ztz_tzt同时控制遗忘和更新,当ztz_tzt很大,就意味着大量遗忘旧信息并大量吸收新信息;如果ztz_tzt很小,就意味着大量保留旧信息并大量忽略新消息。它没有 LSTM 那样独立地“只遗忘一部分旧信息,但完全不吸收新信息”的能力。
在这里插入图片描述

LSTM

参考文章

二者区别与联系

联系:
上述两者都是基于循环神经网络(RNN)的改进,可以解决RNN中不能长期记忆和反向传播中的梯度等问题。它们通过引入门控机制来选择性地记忆和遗忘信息。
区别:
主要的区别在于它们的内部结构、门的数量以及门控机制的实现方式。
1.门控机制和数量
LSTM有是三个门,俩状态
在这里插入图片描述
两个状态分别为:
(1).细胞状态CtC_tCt
在这里插入图片描述
(2).隐藏状态hth_tht
在这里插入图片描述
细胞状态 (CtC_tCt) 负责长期信息的存储和传输,是 LSTM 核心的记忆通道。
隐藏状态 (hth_tht) 负责当前时间步的输出,并在一定程度上也携带了信息,参与到下一个时间步的门控计算中。

GRU有两个门:
在这里插入图片描述
2.内部结构与状态
在这里插入图片描述
3.对信息的控制粒度
在这里插入图片描述
4.参数数量和计算效率
在这里插入图片描述

正则化

参考文章
正则化存在的意义,能帮助我们在训练模型的过程中,防止模型过拟合。在不减少模型特征参数的前提情况下,降低模型的复杂程度。
为什么正则化约束可以防止模型过拟合?
在这里插入图片描述
通过约束参数的数值,从而限制模型的复杂程度。

L1正则化和L2正则化

在这里插入图片描述
图中的“L2正则化只能使得模型的参数数值趋于零,但不能等于0,而L1正则化却可以”内容,这是为什么?
下图从数学角度分析:
在这里插入图片描述
文章中也有从几何方式解释内容:
在这里插入图片描述
上述图是从二维空间进行分析,(坐标系分别对应w1,w2w_1,w_2w1,w2
注:带正则化的约束问题的目标函数是:minwL(w)+tR(w)min_wL(w)+tR(w)minwL(w)+tR(w),可以转化为带有约束的形式为minwL(w),s.t.R(w)<=Tmin_wL(w) ,s.t.R(w)<=TminwL(w)s.t.R(w)<=T
图具体表示什么意思:图中的蓝色图像表示的是损失函数的等高线(代表L(w)L(w)L(w)的值), 图中的红色图像分别表示的是L2正则化约束区域和L1正则化约束区域(代表了R(w)<=TR(w)<=TR(w)<=T的区域,优化算法只能在这个区域内寻找解,否则www值过大,则会使得带约束的问题目标函数数值很大)

L2正则化目标函数公式:
minw(L(w)+t∣∣w∣∣22min_w(L(w)+t||w||_2^2minw(L(w)+t∣∣w22
其中的蓝色的圆的半径长度对应的就是L(w)L(w)L(w)数值,红色的图形中,红色圆表示的是L2正则化约束范围,即t∣∣w∣∣22t||w||_2^2t∣∣w22(原点到红色边的距离),
同理:
L1正则化目标函数公式:
minw(L(w)+t∣∣w∣∣1)min_w(L(w)+t||w||_1)minw(L(w)+t∣∣w1)
红色菱形图形表示的就是L1正则化约束范围,即t∣∣w∣∣1t||w||_1t∣∣w1(原点到红色边的距离)。
我们想要求目标函数数值最低时的www数值,即红色图像和蓝色图像关于某个点(www)的距离之和最小。这个数值往往是蓝色和红色这两个图像的相切地方。

http://www.dtcms.com/a/393935.html

相关文章:

  • 【win11】自动登录,开机进入桌面
  • 关系型数据库系统概述:MySQL与PostgreSQL
  • python编程练习(Day8)
  • 【Linux命令从入门到精通系列指南】apt 命令详解:Debian/Ubuntu 系统包管理的现代利器
  • xtuoj 7的倍数
  • 【开题答辩全过程】以 java牙科门诊管理系统为例,包含答辩的问题和答案
  • 【论文速递】2025年第19周(May-04-10)(Robotics/Embodied AI/LLM)
  • 鸿蒙 - 验证码功能
  • 大数据毕业设计选题推荐-基于大数据的汽车之家数据分析系统-Hadoop-Spark-数据可视化-BigData
  • Bioconductor 项目为高通量生物数据分析提供了大量强大的工具 Bioconductor规范,核心是一系列设计精良、标准化的数据对象
  • 还有新援?利物浦即将启动预签协议,锁定英格兰新星
  • Audacity音频软件介绍和使用
  • SpringBoot配置优化:Tomcat+数据库+缓存+日志全场景教程
  • 《数据库系统概论》——陈红、卢卫-1-数据库系统概述
  • VLA-Adapter:一种适用于微型 VLA 的有效范式
  • JVM内存模型深度剖析与优化
  • 固定收益理论(六)波动率曲面、曲线及其构建模型
  • Zotero使用学习笔记
  • 分布式 | 布隆过滤器实战指南:原理、编码实现、应用与Redisson最佳实践
  • STM32的VSCode下开发环境搭建
  • Rsync+sersync实现数据实时同步
  • HttpServletRequest/Response/请求转发/响应重定向
  • 数据结构(2) —— 双向链表、循环链表与内核链表
  • 告别传统打版:用CLO 3D联动Substance,打造超写实数字服装
  • Linux | i.MX6ULL Sqlite3 移植和使用(第二十三章)
  • SpringBoot整合Smart Doc
  • 部署dataxweb
  • C#练习题——双向链表的创建,添加和删除
  • 大厂思维与“小快轻准”产品的矛盾
  • C++二进制转八进制