当前位置: 首页 > wzjs >正文

网站源代码制作百度视频下载

网站源代码制作,百度视频下载,装修网站平台排行榜,手机端网页制作公司零、如何读论文 读三遍: 1. 第一遍 读完标题和摘要后,直接跳到结论,这几个部分读完就大概知道文章在讲什么东西了,之后还可以看一下正文中的图表,判断一下这篇文章是否适合自己,是否要继续读; 2…

零、如何读论文

        读三遍:

        1. 第一遍

                读完标题摘要后,直接跳到结论,这几个部分读完就大概知道文章在讲什么东西了,之后还可以看一下正文中的图表,判断一下这篇文章是否适合自己,是否要继续读;

        2. 第二遍

                按顺序通读一遍全文,了解文章中的图表、方法都在干什么,有什么特点,这期间遇到不懂的细节可以先做标记,之后如果要精读再去研究引用的相关论文。读完之后根据需要选择是否需要精读;

        3. 第三遍

                精读,读的时候思考如果是我来做我会怎么做,想象自己来实现整篇文章

一、AlexNet

        AlexNet 是深度学习的奠基之作,其精髓在于它首次成功证明了深度卷积神经网络(CNN)在大规模图像识别任务上的卓越性能,并引入或有效推广了几项关键技术和设计理念

        1. 深度网络的可行性

                AlexNet 拥有 8 层学习层(5 个卷积层 + 3 个全连接层),这在当时是“非常深”的网络。它在ImageNet上的成功证明了深度网络的可行性;它的架构展示了深度学习的过程就是一个知识的压缩过程,将原始信息的尺寸(size)逐渐压缩,但信息密度(channel)逐渐增大,将人类能看懂的一个个像素压缩成机器能看懂的向量。

AlexNet整体架构

        2. ReLu的应用

                激活函数使用ReLu而不是当时常用的tanh和sigmoid,发现训练速度要更快。虽然当时认为ReLu更快的原因现在看来都不是很对,但现在仍然流行ReLu,因为它更简单。

        3. 多GPU训练

                受限于当时 GPU 显存,模型被拆分成两部分,分别在两块 NVIDIA GTX 580 GPU 上并行训练,并在特定层进行通信。这启发了后续更大模型的分布式训练策略。

        4. 重叠池化

                使用步长 (stride=2) 小于池化窗口大小 (size=3) 的池化操作。相比于传统的非重叠池化 (stride=size),重叠池化能略微提升精度,并有助于减轻过拟合(通过引入轻微的空间平移不变性扰动)。它代表了池化操作的一种优化选择。

        5. Dropout的应用

                Dropout就是在训练期间,以一定概率(前两个全连接层设为 0.5)随机将神经元的输出置零。在当时人们会采用模型融合(结合多个模型的预测结果)来避免过拟合,但是对于本身就需要数天来训练的深度网络来说成本太昂贵了,所以作者使用了Dropout,认为其效果相当于每次输入就得到一个新模型,等价于模型融合。不过后来的研究发现Dropout更多等价于一个L2正则项。

        6. 数据增强

                采用图像平移和水平翻转(生成位置和镜像变化)、改变 RGB 通道强度使用 PCA 对 RGB 像素值进行扰动,模拟光照和颜色变化)等技术来扩充训练数据,利用有限的数据生成更多的训练样本,提高模型的泛化能力,是缓解过拟合的关键且成本低廉的方法。

二、ResNet

        ResNet的精髓在于使用了Residual Connection(残差连接)来更好地训练很深的网络避免了退化问题和梯度消失问题。所谓退化问题指网络较浅时效果好,加深后反而不好,这不合常理,因为如果更深的层次没用,将其设为恒等映射也不至于效果更差。

        1. Residual Connection

                残差连接就是将浅层的输出跳跃到深层的输出处将两者相加,使网络学习残差映射(F(x) = H(x) - x)而不是目标映射 (H(x))。若最优映射接近恒等变换(H(x) = x),则学习残差 F(x) → 0 比学习完整映射更易优化

                另外残差连接还解决了梯度消失的问题,使得训练更快。梯度消失是指由于反向传播中使用了求梯度的链式法则,如果梯度都是小于1的,连乘之后会接近0导致梯度消失。而残差连接的输出是F(x) + x,其梯度由于加法的存在不会变为0,避免了梯度消失问题。

梯度公式

        2. Bottleneck Block

                当层数比较深时输入输出的通道数会比较大,这时如果直接计算的话复杂度会比较高,ResNet采用了Bottleneck Block的设计,先使用1*1的卷积对输入进行降维计算以后再用1*1的卷积对输出进行升维还原回原来的维度,这样可以将复杂度降低到与降维之后的通道数差不多

Building Block (左) Bottleneck Block (右)


文章转载自:

http://9dCwiApR.LjxxL.cn
http://uVTBXMs3.LjxxL.cn
http://UeguuCco.LjxxL.cn
http://chGXCPAw.LjxxL.cn
http://6Wq8rI1r.LjxxL.cn
http://7M31CqQF.LjxxL.cn
http://dc5N4MTT.LjxxL.cn
http://zSckaBIP.LjxxL.cn
http://xIjG6GCu.LjxxL.cn
http://gHvekRVb.LjxxL.cn
http://dnjMYG6s.LjxxL.cn
http://06bAfZQg.LjxxL.cn
http://YuJiTiIa.LjxxL.cn
http://m4bx3K4D.LjxxL.cn
http://pKcGUe3S.LjxxL.cn
http://g5oFSOoO.LjxxL.cn
http://SrNZCefH.LjxxL.cn
http://GIuYBoOb.LjxxL.cn
http://5UKeKiOC.LjxxL.cn
http://NMKAHrdo.LjxxL.cn
http://9E5AQXzi.LjxxL.cn
http://T2AHcJxO.LjxxL.cn
http://tpKK13H0.LjxxL.cn
http://jLfUQq5z.LjxxL.cn
http://3zu44B0a.LjxxL.cn
http://bnxd4e2C.LjxxL.cn
http://smg3OJdh.LjxxL.cn
http://MQTsnajY.LjxxL.cn
http://qyIa0koS.LjxxL.cn
http://iA8fDuRS.LjxxL.cn
http://www.dtcms.com/wzjs/715452.html

相关文章:

  • 刷会员网站怎么做程序界面设计
  • 手机网站 微信小程序网页设计报价表
  • 招远住房和规划建设管理局网站搜索引擎排名优化是什么意思
  • 南京网站建设 小程序推广文案类型
  • 潮州网站网站建设资质做网站需要用到什么
  • 易网做的网站后台域名注册流程及费用
  • 网站怎么提升百度收入什么网站做任务能挣
  • 南京市住房与城乡建设局网站衡水网站建设公司联系电话
  • 17网站一起做网店广州做网站设计图用什么软件
  • 类模板模板下载网站有哪些内容闸北区网站设计与制作
  • 怎样才能建设一歌网站有学给宝宝做衣服的网站吗
  • 做的网站怎才能被别人访问到asp静态网站
  • 网站收录查询系统沂水网站开发
  • 网站建设经验王者荣耀恺和网页设计页面
  • 网站改版对seo的影响网站建设和网页设计的关系
  • 网站分为重庆市地图
  • 网站开发技术大学教材建筑人才招聘哪个网站最好
  • 网站模板交易自己的电脑做服务器建立网站的方法
  • 网站用户运营做外贸网站挣钱吗
  • 网站设计 布局wordpress代码
  • 福州网站制作官网免费seo网站自动推广软件
  • 如何创建网站难吗西安做公司网站
  • 千山科技做网站好不好个人网站必须备案吗
  • 网站备案换接入商丹阳高铁站对面的规划
  • 建设英文网站的必要性平房装修设计图片大全 效果图
  • 要建立网站做玻璃钢的企业网站
  • 菲律宾菠菜网站建设平面设计师务所
  • 网站建设 预算企点登录
  • 网站建设这门课好学吗珠海金泉做网站号公司或个人码
  • 怎样做网站后台运营设计网站设计网站