当前位置: 首页 > news >正文

深度学习让鱼与熊掌兼得

通常,一个大的复杂的模型的loss会低,但是拟合方面不够,小的模型在拟合方面更好,但是loss高,我们可以通过深度学习来得到一个有着低loss的小模型

我们之前学过,peacewise linear可以用常数加上一堆这个阶梯型函数得到,然后因为peacewise linear可以逼近任何function,所以理论上,用neural network可以实现任何function 

 所以有人说只要neuron足够多,一层network就可以了,那我们就应该通过矮胖model和高瘦model来对比,看看怎么回事

结果是这样的,这证明同样参数量的时候,深的模型会更好,也更有效率

为什么多层会带来好处?

用逻辑电路是这样子的

在做程序的时候

剪窗花

接下来解释为什么深度比宽度好

第二层是这样子的一个关系,那么第三层是什么样的关系呢

于是我们可以发现,这是dimension上的差别,neuron数量之间有极大差距,也可以这么说,实现同一个function,shallow的model更复杂,也就更容易overfitting

所以,深度学习是一个鱼与熊掌兼得的方法

相关文章:

  • 填报表之自动计算
  • 力扣-236.二叉树的最近公共祖先
  • 【Java Web】速通JSON
  • 【Fifty Project - D26】
  • Python函数返回值的艺术:为何True/False是更优实践及例外情况分析
  • Da14531蓝牙特征值1读没有回调解决
  • DataHub:现代化元数据管理的核心平台与应用实践
  • 数据结构与算法-线性表-单链表(Linked List)
  • 【免费分享】虚拟机VM(适用于 Windows)17.6.3
  • 一文讲透 Vue3 + Three.js 材质属性之皮革篇【扫盲篇】
  • JAVA:多线程使用哈希表
  • Java类加载器深度解析:从原理到实践
  • 通用软件项目全技术栈综合能力评估 - 架构师级挑战
  • 第三章:JavaScript引擎 · 行为之火
  • 黑马程序员c++2024版笔记 第一章
  • vue-quill-editor富文本编辑器
  • 【有理数加法结构体】2022-1-3
  • “禁塑行动·我先行”环保公益项目落地宁夏,共筑绿色生活新篇章
  • HashSet
  • 使用CMake中的configure_file命令自动生成项目版本信息
  • 临港新片区将新设5亿元启航基金:专门投向在临港发展的种子期、初创型企业
  • 美联储主席:供应冲击或更频繁,将重新评估货币政策方法中的通胀和就业因素
  • 上海“城市文明开放麦”全城总动员,樊振东担任首位上海城市文明大使
  • 中办、国办关于持续推进城市更新行动的意见
  • 布局50多个国家和地区,我国科技型企业孵化器数量全球第一
  • 当番茄霸总遇上晋江古言,短剧IP小变局