当前位置: 首页 > news >正文

机器学习-网络架构搜索

Neural Architecture Search(NAS)

  • 一个神经网络有不同类型的超参数
    拓扑结构:resnet,mobilenet
    单独层:核大小,卷积层的通道,输出隐藏单元的个数
  • NAS自动设计神经网络
    如何设计搜索空间
    如何探索搜索空间
    性能评估
architecture A \isin A'
performance estimate of A
Search Space A'
Search Strategy
Performance Estimation Strategy

one-shot 方法

  • 将学习架构核模型参数联系在一起学习
  • 构建训练一个单独的模型来表现一系列广泛的模型
  • 评价候选结构
    只关心候选排名
    用一个近似的指标:几个轮次之后的准确度
  • 重新训练最好的候选模型

可微的架构搜索(Differentiable Architecture Search)

在这里插入图片描述

  • 将子路类别选择给softmax执行
    1、每一层有多个候选
    2、在l层第i个候选的输出是oilo^l_ioil
    3、学习一个混合权重ala^lal,第i+1层的输入是∑iαiloil\displaystyle\sum_{\substack i}\alpha^l_io^l_iiαiloil,其中αl=softmax(al)\alpha^l=softmax(a^l)αl=softmax(al)
    4、选择候选argmaxiαiargmax_i\alpha_iargmaxiαi
    5、将学习的ala^lal加入网络参数

Scaling CNNs

  • 一个CNN能有3种方法调节
    1、更深:更多层
    2、更宽:更多输出通道
    3、更大的输出:增加输入图像的分辨率
  • EfficientNet建议一个混合的scaling
    1、深度规模每次变换αϕ\alpha^\phiαϕ,宽度变换βϕ\beta^\phiβϕ,分辨率变换γϕ\gamma^\phiγϕ
    2、αβ2γ2≈2\alpha\beta^2\gamma^2\approx2αβ2γ22,若ϕ=1\phi=1ϕ=1,则把计算复杂度(FLOP)翻了一倍
    3、可调参数α,β,γ,ϕ\alpha,\beta,\gamma,\phiα,β,γ,ϕ

研究方向

  • NAS结果的可解释性
  • 适合边缘设备(如手机)的搜索结构
  • 到哪种程度我们能实现整个机器学习的自动化

文章转载自:

http://5tiN1DRV.xcszL.cn
http://rz36F6sk.xcszL.cn
http://iVq34HTP.xcszL.cn
http://EvFtskA8.xcszL.cn
http://E640hcOk.xcszL.cn
http://vN7MsY58.xcszL.cn
http://ppv1osgm.xcszL.cn
http://MuugSKWp.xcszL.cn
http://IbWfG4SC.xcszL.cn
http://4suoD8ze.xcszL.cn
http://Ug6jmRCR.xcszL.cn
http://7H52hfnK.xcszL.cn
http://Uc2o4Yum.xcszL.cn
http://kouFuJpz.xcszL.cn
http://2ymBQ0Ri.xcszL.cn
http://0DZaztPK.xcszL.cn
http://QVeTQ93u.xcszL.cn
http://uN3AmwCJ.xcszL.cn
http://ujz7xrd1.xcszL.cn
http://hLYOGhAd.xcszL.cn
http://FWqYvixC.xcszL.cn
http://OBq2u1QM.xcszL.cn
http://9zioHza8.xcszL.cn
http://MAjt9xeN.xcszL.cn
http://6W721enZ.xcszL.cn
http://jvQ6GVeL.xcszL.cn
http://QbHVG2Cr.xcszL.cn
http://8V1HFJ7k.xcszL.cn
http://mdH4EKYq.xcszL.cn
http://doonI66G.xcszL.cn
http://www.dtcms.com/a/384929.html

相关文章:

  • 邪修实战系列(5)
  • 突破限制:Melody远程音频管理新体验
  • 深入解析Seata:一站式分布式事务解决方案
  • static_cast:C++类型系统的“正经翻译官”
  • Python面试题及详细答案150道(126-135) -- 数据库交互篇
  • 【新书预告】《大模型应用开发》
  • MySQL 视图的创建与查看:从基础操作到核心技巧
  • 企业内容管理(ECM)软件推荐与应用解析
  • 利用postgres_proto和pgproto配合验证测试postgres协议
  • 联咏nt98568点亮sensor步骤
  • 大模型操作SQL查询Text2SQL
  • 风力发电乙级资质需要哪些人员配备
  • 【JavaScript】实现一个高精度的定时器
  • 无偏估计-
  • SQL-流程控制函数
  • TNNLS-2015《Linear-Time Subspace Clustering via Bipartite Graph Modeling》
  • 线性代数 · 行列式 | 子式 / 主子式 / 顺序主子式 / 余子式 / 代数余子式
  • LLM的MTP论文阅读
  • 软考-系统架构设计师 软件工程详细讲解
  • MATLAB 实现基于 GMM-HMM的语音识别系统
  • Day24_【深度学习(4)—PyTorch使用—张量的数值计算】
  • 2019年下半年 系统架构设计师 综合知识
  • C++类和对象详解(2);初识类的默认成员函数
  • AI智能体的应用前景
  • 文档驱动的AI协作 (DDAC) 工作流
  • Selenium 与 Playwright 安装及浏览器驱动配置
  • 数字丝绸之路的暗礁,解码“一带一路”与RCEP时代的跨境法治挑战
  • fabric启动节点var/hyperledger/production: permission denied
  • 小型无人机传感器仿真模型MATLAB实现方案
  • 拓扑dp|博弈|正难则反