当前位置: 首页 > news >正文

李宏毅(Deep Learning)--(三)

一.前向传播与反向传播的理解:

 

二.模型训练遇到的问题

在模型训练中,我们可能会遇到效果不好的情况,那么我们应该怎么思考切入,找到问题所在呢?

流程图如下:

第一个就是去看训练的损失函数值情况。如果损失较大,那么就有可能是两种情况:
(1)模型过于简单:如图:当你设计的模型所能拟合的函数集合(蓝色区域)这么大时,即使你找了蓝色区域内最优的函数(optimization最优),但是真正完美拟合的函数不能通过该模型拟合(不在蓝色区域内),所以loss较大。

(2) optimization效果不佳(梯度下降难以到达最优解)

基于以上情况,我们怎么去判别呢?(我们可以去增加模型的复杂度,如果新模型的loss在training data上比原model还高,那就说明是optimization的问题了)

假如经过努力,你已经可以让training data的loss变得小了,这时我们看testing data的loss,假如我们发现testing data的loss较大,这时候也有两种可能得原因:

(1) over fitting :在training data上的loss好,在testing 上的loss差(缺一不可)才叫过拟合

比如:如上图,所有的data拟合的预期目标函数是二次函数,但由于 某些原因(原因很多,这里暂不探讨),导致拟合的函数虽然能够在有training data限制的地方,表现的很好,但是在其他地方是随机预测的(函数弹性过大,如黑色箭头所指函数),这使得testing data在该函数的loss较大

解决方法:add training data or data augmentation or regularation

今天先学到这啦

谢谢

http://www.dtcms.com/a/276021.html

相关文章:

  • python内置函数 —— zip
  • MyBatis实现分页查询-苍穹外卖笔记
  • 在 Android 库模块(AAR)中,BuildConfig 默认不会自动生成 VERSION_CODE 和 VERSION_NAME 字段
  • docker基础与常用命令
  • 如何让AI更高效
  • 留学真相:凌晨两点被海关拦下时,我才明白人生没有退路
  • 如何用Python编程实现一个简单的Web爬虫?
  • Echarts学习方法分享:跳过新手期,光速成为图表仙人!
  • 【Lucene/Elasticsearch】 数据类型(ES 字段类型) | 底层索引结构
  • 易混淆英语单词对比解析与记忆表
  • 股票的k线
  • BKD 树(Block KD-Tree)Lucene
  • 以太坊重放攻击
  • 特辑:Ubuntu,前世今生
  • 关于学习docker中遇到的问题
  • AI领域的黄埔军校:OpenAI是新一代的PayPal Mafia,门生故吏遍天下
  • 可以用一台伺服电机控制多台丝杆升降机联动使用吗
  • 类和对象—多态
  • C语言:20250712笔记
  • SpringBoot集合Swagger2构建可视化API文档
  • P2619 [国家集训队] Tree I
  • 【Datawhale AI夏令营】Task2 笔记:MCP Server开发的重难点
  • 【LeetCode 热题 100】98. 验证二叉搜索树——(解法一)前序遍历
  • Python 三大高频标准库实战指南——json · datetime · random 深度解析
  • 【Java入门到精通】(二)Java基础语法(上)
  • 27. 移除元素
  • 【android bluetooth 协议分析 07】【SDP详解 1】【SDP 介绍】
  • 19th Day| 530.二叉搜索树的最小绝对差,501.二叉搜索树中的众数, 236.二叉树的最近公共祖先
  • springboot3X 整合高版本mybatisplus
  • pyqt5绘制矩形和线条