当前位置: 首页 > news >正文

CVPR焦点 | 神经网络新范式:轻量化与精度并行,重塑视觉任务性能天花板

关注gongzhonghao【CVPR顶会精选

神经网络卷积想找新亮点?不妨考虑:动态结构设计。作为深度学习架构搜索与高效建模两大热点的结合,动态神经网络凭借自适应推理与高效特征利用的优势,在视觉识别、视频理解等任务中脱颖而出,发展前景相当可观,已成为CVPR发文热门。

这一方向尤其在轻量化推理、场景自适应等任务中容易产出创新点。近年顶会顶刊收录的趋势也显示,结构重构、条件计算、稀疏激活等方向极具潜力。今天小图给大家精选3篇CVPR有关神经网络方向的论文,请注意查收!

论文一:Training-free Neural Architecture Search through Variance of Knowledge of Deep Network Weights

方法:

作者以随机初始化的候选网络和少量数据为输入,并统计权重层面的“知识方差”,用以量化架构的可学性与泛化潜力。 这些局部统计被在层与网络尺度上进行归一化与加权汇聚,形成对模型规模不敏感的单一评分,从而能公平比较不同深度与宽度的候选结构。最终将该评分作为训练免费代理嵌入NAS流程,快速筛选并重评分候选,几乎无需训练即可锁定高质量架构,显著降低搜索时间与算力消耗并在标准图像分类基准上取得SOTA表现。

图片

创新点:

  • 提出以Fisher信息为核心的知识方差指标,作为零训练准确率预测器,摆脱完整训练与参数更新的束缚。

  • 通过层级与全局统计的稳健汇聚获得高排名相关性,在多搜索空间与数据集上均可稳定指引架构选择。

  • 将极低开销代理融入NAS循环,实现数量级的计算加速,同时保持甚至提升最终性能,优于现有训练免费与轻训练基线。

图片

论文链接:

https://arxiv.org/abs/2502.04975

图灵学术论文辅导

论文二:Brain-Inspired Spiking Neural Networks for Energy-Efficient Object Detection

方法:

作者构建MSD框架,以脉冲神经元堆叠形成多尺度特征主干,并通过跨尺度聚合与轻量级检测头,把离散时间步中的脉冲活动凝练为类别与边界框预测,兼顾细粒度与全局语义。在训练阶段,采用时间展开的端到端优化与替代梯度,对分类与回归目标联合约束,同时调控发放稀疏度以平衡信息保真与能耗。推理时模型以少量时间步传播并依赖稀疏计算完成检测,在降低运算密度与时延的同时保持甚至提升精度,体现出显著的能源效率优势。

图片

创新点:

  • 提出融合多尺度时空特征的脉冲检测架构,充分利用脉冲稀疏性同时兼顾小物体与大场景表征。

  • 端到端的时序脉冲推理与训练设计,实现有限时间步内的高效检测,显著降低能耗与延迟。

  • 在多数据集与多基线下展现优越的能效-准确率折中,整体性能稳定优于现有方法,具备良好可部署性。

图片

论文链接:

https://ieeexplore.ieee.org/document/11092565

图灵学术论文辅导

论文三:VISTREAM: Improving Computation Efficiency of Visual Streaming Perception via Law-of-Charge-Conservation Inspired Spiking Neural Network

方法:

作者将VISTREAM以SNN作为主干并注入“电荷守恒”启发式,约束跨时间步的脉冲积累与转移,保留关键信息同时削减冗余脉冲以源头降算。 面向持续视频流,系统依据帧间变化自适应调节时间步与稀疏度,复用跨帧状态并进行多尺度时空聚合,从而在低延迟路径上维持稳健的感知精度。训练与推理端到端一体优化,对能耗—准确率折中进行显式权衡,最终在多基准上实现显著节能且精度不降的平衡表现。

图片

创新点:

  • 引入“电荷守恒”理念约束脉冲传播,抑制冗余放电与震荡,显著减少无效计算。

  • 面向流式输入设计动态计算机制,按内容变化自适应分配时空算力,稳住精度同时降能耗。

  • 统一端到端框架兼顾效率与准确性,在真实视觉流任务上稳定优于现有方法,具备部署友好性。

图片

论文链接:

https://ieeexplore.ieee.org/document/11092726

本文选自gongzhonghao【CVPR顶会精选

http://www.dtcms.com/a/344800.html

相关文章:

  • 解释一下,Linux,shell,Vmware,Ubuntu,以及Linux命令和shell命令的区别
  • 1337俚语的由来
  • Seaborn数据可视化实战:Seaborn时间序列可视化入门
  • Linux学习-网络编程2
  • .java->.class->java 虚拟机中运行
  • 51.Seata-TCC模式
  • 前端函数防抖
  • Nginx + Keepalived 实现高可用负载均衡集群
  • 前端桌面端解决方案技术选型:全面指南
  • 深入理解强化学习的target network
  • 3.5MM防水耳机插座
  • 为什么访问HTTPS站点时,会发生SSL证书错误
  • JAVA基础代码示例
  • SpringBoot -- 集成Spring Security (二)
  • LightGBM时序预测详解:从原理到 PSO 参数优化
  • 如何理解面向过程和面向对象,举例说明一下?
  • [docker/大数据]Spark快速入门
  • 【实时Linux实战系列】实时系统中的预测性维护策略
  • 能源行业合同管理难点有哪些?企业该如何应对?
  • FIFO核心原理与机制
  • QGIS 绿色版修正
  • 基于vtkImageViewer2的MPR(二):改进
  • JavaScript 操作 DOM
  • 图论——Floyd算法
  • 四十一、【高级特性篇】API 文档驱动:OpenAPI/Swagger 一键导入测试用例
  • 上市公司能源消耗数据库
  • 【python】os.makedirs和with open
  • 密码管理中硬编码密码
  • (论文速读)并行自回归视觉生成
  • 硬件驱动---linux内核驱动 启动