当前位置: 首页 > news >正文

购物网站建设需要公司营业执照吗无锡网络公司有哪些

购物网站建设需要公司营业执照吗,无锡网络公司有哪些,建筑模板的规格,WordPress修改注册界面1. 什么是免训练指标(Zero-Cost Proxies,ZC proxies)? 免训练指标是一类 无需完整训练模型即可评估其性能的度量方法,主要用于提高 神经架构搜索(NAS) 的效率。 传统 NAS 需要训练候选架构来评…

1. 什么是免训练指标(Zero-Cost Proxies,ZC proxies)?

免训练指标是一类 无需完整训练模型即可评估其性能的度量方法,主要用于提高 神经架构搜索(NAS) 的效率。
传统 NAS 需要训练候选架构来评估其性能,但训练消耗巨大,因此免训练指标提供了一种 基于模型本身特性(如梯度、参数分布)快速估计模型质量的方法

核心思想:
只用一个小批量数据 计算某些统计量(如梯度、参数重要性、激活值分布),从而 近似衡量模型的好坏,而不需要完整训练整个模型。


2. 免训练指标的类别

免训练指标可以大致分为两类:

  1. 传统结构分析指标(如 SNIP、Synflow、Fisher)
  2. 基于知识蒸馏的指标(如 DisWOT)

(1)传统结构分析指标

这些方法通常通过计算 梯度、权重、Hessian 矩阵 等信息来评估模型的质量。

① SNIP(Single-shot Network Pruning)
  • 计算梯度的重要性,衡量每个参数对损失函数的影响:
    ρ s n i p = ∣ ∂ L ∂ W ⊙ W ∣ \rho_{snip} = \left| \frac{\partial \mathcal{L}}{\partial \mathcal{W}} \odot \mathcal{W} \right| ρsnip= WLW
  • 核心思想:如果去掉某个权重后损失变化较大,则该权重很重要。因此,可以用梯度信息估算整个网络的质量。
② Synflow
  • 通过梯度流分析,避免层塌陷(layer collapse):
    ρ s y n f l o w = ∂ L ∂ W ⊙ W \rho_{synflow} = \frac{\partial \mathcal{L}}{\partial \mathcal{W}} \odot \mathcal{W} ρsynflow=WLW
  • 核心思想:确保不同层的梯度能够均匀流动,以保持架构的稳定性。
③ Fisher
  • 计算激活梯度的平方和,用于通道剪枝:
    ρ f i s h e r = ( ∂ L ∂ A A ) 2 \rho_{fisher} = \left( \frac{\partial \mathcal{L}}{\partial \mathcal{A}} \mathcal{A} \right)^2 ρfisher=(ALA)2
  • 核心思想:通道(Channel)如果对梯度变化敏感,则在训练时影响更大,可以用它来衡量模型质量。

(2)基于知识蒸馏的指标

DisWOT(Distillation Without Training)

  • 这是一种 基于知识蒸馏的免训练指标,通过计算 教师-学生模型的特征匹配误差 来评估网络质量:
    ρ D i s W O T = D L 2 ( G ( [ A S , A T ] ) ) + D L 2 ( G ( [ F S , F T ] ) ) \rho_{DisWOT} = \mathcal{D}_{L2} (\mathcal{G}([AS,AT])) + \mathcal{D}_{L2} (\mathcal{G}([FS,FT])) ρDisWOT=DL2(G([AS,AT]))+DL2(G([FS,FT]))

  • 其中:

    • ( AS, AT ) 是教师-学生模型的 激活图(Activation Maps)
    • ( FS, FT ) 是教师-学生模型的 特征图(Feature Maps)
    • ( \mathcal{D}_{L2} ) 计算的是 L2 距离(欧几里得距离),衡量特征匹配误差
  • 核心思想:如果一个模型可以很好地模仿教师模型的特征分布(即 L2 误差小),则这个模型的质量更好。


3. 免训练指标如何用于 NAS

在 NAS 中,免训练指标可以用于:

  1. 快速评估候选架构
    • 在搜索空间中 筛选掉性能较差的架构,减少训练计算量。
  2. 结合搜索算法优化架构
    • 可以将 梯度信息(SNIP, Synflow)知识蒸馏误差(DisWOT) 作为搜索目标,指导 NAS 选择更优的架构。
  3. 设计高效的蒸馏感知 NAS(DAS)
    • 结合 DAS(Distillation-aware Architecture Search),让 NAS 选择对知识蒸馏更友好的模型,提高轻量化模型的性能。
http://www.dtcms.com/a/590996.html

相关文章:

  • RAFT微调学习笔记
  • 网站开发制作公司排行网站建设专业学什么
  • 江苏网站建设怎么样php网站的数据库怎么做备份
  • 做非法网站判什么邢看那种片哪个网站好用
  • 中专生做电商客服,能转电商运营吗?需要学习什么?
  • 高端网站设计找哪个公司wordpress 课程
  • 泉州网站制作平台网站建设简历
  • 个人注册网站只做正品的购物网站
  • 烟台专业的网站建站公司厦门市建设协会网站首页
  • 怎样做jsp网站百度seo入驻
  • 广州市城乡建设信息中心网站临沂建设网站制作公司
  • 爬豆瓣喜剧电影排行榜数据
  • 聚美优品网站建设情况网站信息组织优化
  • 多个网站备案负责人wordpress 个人资料页
  • 动易学校网站管理系统 漏洞网站建设分工的通知
  • 做条形图的网站免费网站下载app软件免费
  • 移动公司营销网站设计邯郸市人社局
  • 做外账经常进哪几个网站中小企业网站设计与开发目的
  • 新农村建设投诉网站中英文的网站是怎么做的
  • 探秘Linux进程“亡灵”:僵尸进程(Zombie Process)深度解析
  • 局域网视频网站搭建折扣网站模板
  • FOC控制与SVPWM解析
  • 门户网站建设技术要求网络推广方案书模板
  • 淄博建设局网站做网站千篇一律
  • 如何用matlab求圆的圆心及半径
  • 做软件界面的网站织梦网站上传的文章只显示摘要不显示内容如何修改
  • 怎么把网站管理系统自适应单页网站模板
  • 模板网免费下载官网seo排名诊断
  • 化妆品网站开发哪里有软件培训班
  • qq登录网页版登录入口搜索引擎优化服务公司哪家好