当前位置: 首页 > news >正文

深度学习笔记——残差网络和模型选择

在B站上听李沐老师的课记录的笔记
1.残差神经网络Residual Neural Network,简称ResNet)属于深度学习模型的一种,其核心在于让网络的每一层不直接学习预期输出,而是学习与输入之间的残差关系。

残差块使得很深的网络更加容易训练,甚至可以训练一千层的网络。残差网络对随后的深层神经网络设计产生了深远影响,无论是卷积类网络还是全连接类网络。

2.感知机是一个二分类模型,是最早的AI模型之一·它的求解算法等价于使用批量大小为1的梯度下降它不能拟合XOR函数,导致的第一次 AI寒冬.

3.sigmoid激活函数

Tanh激活函数

ReLU激活函数

4.验证数据集和测试数据集
验证数据集:一个用来评估模型好坏的数据集,例如拿出 50% 的训练数据,不要跟训练数据混在一起(常犯错误)

测试数据集:只用一次的数据集。例如未来的考试、我出价的房子的实际成交价、用在 Kaggle私有排行榜中的数据集等

5  K-则交叉验证
在没有足够多数据时使用(这是常态)

算法:
将训练数据分割成K块

For i=1,...,K
使用第i块作为验证数据集,其余的作为训练数据

报告K个验证集误差的平均

常用:K=5或10

6  多层感知机使用隐藏层和激活函数来得到非线性模型。常用激活函数是Sigmoid,Tanh,ReLu,使用 Softmax来处理多类分类。超参数为隐藏层数,和各个隐藏层大小

7 automl模型:自动化机器学习也称为自动化 ML 或 AutoML,是将机器学习模型开发过程中耗时的反复性任务自动化的过程。 

8 训练误差和泛化误差
训练误差:模型在训练数据上的误差

泛化误差:模型在新数据上的误差
例子:根据摸考成绩来预测未来考试分数,在过去的考试中表现很好(训练误差)不代表主来考试一定会好(泛化误差)。学生A通过背书在摸考中拿到很好成绩,学生B知道答案后面的原因。

9 训练数据集:训练模型参数

验证数据集:选择模型超参数

非大数据集上通常使用k-折交叉验证

10 过拟合和欠拟合 

                                                                数据

模型容量

              简单复杂
                低正常欠拟合
                 高 过拟合正常

模型容量:拟合各种函数的能力,低容量的模型难以拟合训练数据,高容量的模型可以记住所有的训练数据。(过拟合未必是一件坏事)

11 VC维:统计学习理论的一个核心思想。对于一个分类模型,VC等于一个最大的数据集的大小,不管如何给定标号,都存在一个模型来对它进行完美分类。

线性分类器的VC 维
2 维输入的感知机,VC维=3。能够分类任何三个点,但不是4个(xor)

支持N维输入的感知机的VC维是N+1,一些多层感知机的VC维 O(N log2N)

12  VC 维的用处
提供为什么一个模型好的理论依据,它可以衡量训练误差和泛化误差之间的间隔。但深度学习中很少使用,因为衡量不是很准确,计算深度学习模型的VC维很困难。

13总结:
模型容量需要匹配数据复杂度,否则可能导致欠拟合和过拟合
统计机器学习提供数学工具来衡量模型复杂度

实际中一般靠观察训练误差和验证误差

相关文章:

  • 【python-uiautomator2】手机上的ATX应用界面报错问题处理:无法提供服务,非am instrument启动
  • 图像处理篇---opencv中的图像特征
  • JavaScript基本知识
  • 【C++模板】:开启泛型编程之门(函数模版,类模板)
  • 大模型在甲状腺良性肿瘤诊疗全流程中的应用研究报告
  • 【Golang】第一弹-----初步认识GO语言
  • docker 小记
  • 使用 OpenSSL 和 Python 实现 AES-256-CBC 加密与解密(安全密钥管理)
  • Node 使用 SSE 结合redis 推送数据(echarts 图表实时更新)
  • Javascript基础语法详解
  • 深入探索Matter协议:开发Matter智能家居设备的基本步骤
  • 《Java三剑客:JDK、JRE、JVM的“塑料友情”》
  • wireshark 如何关闭混杂模式 wireshark操作
  • redis在ubuntu更新至最新版本-官方提供方法-查看版本和状态-查看数据库中数据
  • 【Javascript网页设计】在线食谱分享页面案例
  • 网络防火墙是什么有什么用_网络防火墙:守护信息安全的重要屏障
  • 【论文精读】ACE-Zero
  • 电脑的写字板如何使用?
  • FastJSON常用注解
  • 利用python生成excel中模板范围对应的shape文件
  • 昆山网站建设公司/免费站推广网站2022
  • 北京网站开发哪家好/谷歌seo服务
  • 净化科技网站建设/佛山做网站推广的公司
  • 青岛网站建设方案咨询/市场营销教材电子版
  • 如何编辑做网站/nba总得分排行榜最新
  • 黄骅做网站/免费关键词搜索工具