当前位置: 首页 > news >正文

机器学习-03(机器学习任务攻略)

对于训练出来的模型不满意:

1.检查训练所使用的数据 

训练数据的Loss 过大

model bias(模型过于简单,模型偏差)

所求出的任何\theta,带入函数之后都不能使Loss变得足够低。可以让Loss变低的函数不在求出的函数集合之中。

解决方法:重新设计模型,增加层数,使其更有弹性。比如可以增加输入的特征。

最佳化问题(Optimization Issue)处理的不好

因为目前使用的gradient descent没有给出最佳的函数。

解决方法: 

当训练数据的Loss不够低时,如何判断是以上情况的哪种?

通过比较不同的模型,得知目前的模型是否足够大,层数是否够多。

56层的弹性一定比20层大,故一定是最佳化的问题。不是过拟合或者模型偏差的问题。

从小的(层数少的)模型入手,过渡到层数更多的模型。如果层数多的模型比层数小的模型的Loss还要大,那么就是最佳化出现了问题。

训练数据的Loss已经变小

测试数据的Loss小

此结果是我们想要的结果

测试数据的Loss大
overfitting问题(过拟合)

过拟合是指模型在训练数据上表现非常好,但在测试数据上表现较差。这通常是因为模型过于复杂,学习了训练数据中的噪声和细节,而未能提取数据的普遍规律,导致泛化能力差。

只有训练数据Loss小,但是测试数据Loss大才是过拟合问题。

极端的例子:

解决方法:

1.增加训练资料(训练数据)

2.不要让模型具有太大的弹性,给予其一些限制。 比如说给其较少的参数,在深度学习方面可以给其较少的神经元数目(但不能给太多的限制)

 

mismatch(数据不匹配)问题

训练资料和测试资料分布不同,增加训练资料不能解决此问题。

http://www.dtcms.com/a/265662.html

相关文章:

  • npm 命令入门指南(前端小白版)
  • 使用numpy的快速傅里叶变换的一些问题
  • 记忆翻牌记忆力小游戏流量主微信小程序开源
  • 万能公式基分析重构补丁复分析和欧拉公式原理推导
  • 国外开源集成平台(业务编排)camel及Mule介绍
  • 为什么是直接在**原型(prototype)上**添加函数
  • 构建引擎: 打造小程序编译器
  • 边缘计算解决方案:电力作业行为图像识别
  • Mac电脑 触摸板增强工具 BetterTouchTool
  • Linux开发工具——gcc/g++
  • 虚拟机网络检查
  • 数据结构-栈的实现
  • 电动车信用免押小程序免押租赁小程序php方案
  • 数据库运维手册指导书
  • 移动端Html5播放器按钮变小的问题解决方法
  • Laravel8中使用phpword生成word文档
  • LeetCode--40.组合总和II
  • 【ArcGIS Pro】属性表咋不能编辑了?
  • wvp-GB28181-pro 项目 ZLMediaKit 部署 (Centos7)
  • XILINX Ultrascale+ Kintex系列FPGA的架构
  • R语言开发记录,二(创建R包)
  • vue-37(模拟依赖项进行隔离测试)
  • 《导引系统原理》-西北工业大学-周军-“2️⃣导引头的角度稳定系统”
  • 定时点击二次鼠标 定时点击鼠标
  • Node.js中exports与module.exports区别
  • DPDK开发环境配置
  • SpringCloud系列(49)--SpringCloud Stream消息驱动之实现生产者
  • 《Spring 中上下文传递的那些事儿》 Part 1:ThreadLocal、MDC、TTL 原理与实践
  • 使用 Docker Swarm 部署高可用集群指南
  • 副作用是什么?