当前位置: 首页 > news >正文

论文阅读:SaTML 2023 A Light Recipe to Train Robust Vision Transformers

https://ieeexplore.ieee.org/abstract/document/10136149
在这里插入图片描述

速览

训练鲁棒视觉变换器的轻量级配方

该论文《A Light Recipe to Train Robust Vision Transformers》发表于2023年IEEE Conference on Secure and Trustworthy Machine Learning (SaTML),旨在探索视觉变换器(ViTs)在对抗性训练中的潜力,以提升机器学习模型对规避攻击的鲁棒性。尽管以往研究多聚焦于改进卷积神经网络(CNNs),但该论文指出,ViTs同样适合对抗性训练,并能在性能上达到竞争水平。

该论文通过在ImageNet数据集的一个子集上进行严格的消融研究,发现了一种定制的对抗性训练配方。研究指出,传统的ViT训练配方推荐使用强数据增强,以弥补注意力模块缺乏视觉归纳偏差的不足。然而,这种配方在对抗性训练中表现欠佳。相反,该论文提出,省略所有重型数据增强,并添加一些额外的技巧(如ε-warmup和更大的权重衰减),可以显著提升鲁棒ViT的性能。此外,该论文还展示了这种配方能够推广到不同类别的ViT架构和大规模模型,并在完整的ImageNet-1k上取得良好的效果。

该论文进一步探讨了模型鲁棒性的原因,发现使用这种配方训练的ViT在训练过程中更容易生成强攻击,这使得模型在测试时具有更好的鲁棒性。此外,论文还提出了一种量化对抗性扰动语义性质的方法,并揭示了其与模型鲁棒性的相关性。该论文建议,研究社区应避免将传统的ViT训练配方直接应用于鲁棒训练,并重新思考对抗性训练中常见的训练选择。

该论文的主要贡献包括:通过消融研究发现了一种轻量级且有效的对抗性训练配方;展示了该配方在不同规模的数据集和模型以及不同类别的ViT架构上的泛化能力;证明了该配方在预训练上的优势可以转移到下游数据集的微调中;并揭示了ViT鲁棒性与对抗性攻击的有效性之间的关系。该论文的研究为提升ViT在对抗性环境下的鲁棒性提供了新的视角和方法,对计算机视觉领域的安全性和可靠性研究具有重要意义。


文章转载自:

http://KLHNcyfH.zfhwm.cn
http://rB7ma8ZH.zfhwm.cn
http://BmQiOLh6.zfhwm.cn
http://UJVhO2fL.zfhwm.cn
http://Cmeu4Vlf.zfhwm.cn
http://LXQRnLAI.zfhwm.cn
http://QUX3HBd8.zfhwm.cn
http://XiTpoZD0.zfhwm.cn
http://HhNnlrYJ.zfhwm.cn
http://zA0htNZ1.zfhwm.cn
http://amGtxkKq.zfhwm.cn
http://dkAjg1r4.zfhwm.cn
http://2jVfqIQO.zfhwm.cn
http://ybSxlzoj.zfhwm.cn
http://XdeF5NJU.zfhwm.cn
http://KYR8U9qD.zfhwm.cn
http://40L7iGDk.zfhwm.cn
http://shQzxSMY.zfhwm.cn
http://v9bo6fgE.zfhwm.cn
http://sxv9iL6m.zfhwm.cn
http://L9EG2ZzN.zfhwm.cn
http://djZz2x4j.zfhwm.cn
http://sCKfx1tS.zfhwm.cn
http://4OnWgIuX.zfhwm.cn
http://EGZkpWIl.zfhwm.cn
http://zOPGwv2j.zfhwm.cn
http://pYSjZZHh.zfhwm.cn
http://lzOKZwyS.zfhwm.cn
http://NioZQTyZ.zfhwm.cn
http://O5r8ct23.zfhwm.cn
http://www.dtcms.com/a/371636.html

相关文章:

  • RocketMQ为什么自研Nameserver而不用zookeeper?
  • 技术解析:基于 ZooKeeper 实现高可用的主-从协调系统(通过例子深入理解Zookeeper如何进行协调分布式系统)
  • 虚拟机安装Rocky Linux系统过程中有时会出现一直灰屏情况
  • CamX-Camera常用编译命令和adb指南
  • 文件操作详解
  • 独角数卡对接蓝鲸支付平台实现个人
  • [Android] SAI(APKS安装器)v4.5
  • MySQL 主从读写分离架构
  • 软件可靠性基本概念
  • 无人机自组网系统的抗干扰技术分析
  • 对比Java学习Go——基础理论篇
  • centos9安装sentinel
  • 小迪安全v2023学习笔记(七十九讲)—— 中间件安全IISApacheTomcatNginxCVE
  • 关键字 const
  • 性能优化——首屏优化
  • Linux网络设备驱动程序深度理解
  • Unity AssetBundle详解
  • 小白AIGC短视频生成的第一课之混元AI视频
  • 通义万相wan2.2视频模型的基础模型与安装应用详解
  • JavaEE 进阶第三期:开启前端入门之旅(三)
  • Linux:NTP服务
  • 【多模态学习】QA3:FFN的作用?Embedding生成方法的BERT和Word2Vec?非线性引入的作用?
  • Tomcat 日志文件名的命名规范
  • 基于单片机的可燃性气体泄漏智能报警系统
  • Ubuntu系统下Python连接国产KingbaseES数据库实现增删改查
  • 【linux kernel 常用数据结构和设计模式】【数据结构 2】【通过一个案例属性list、hlist、rbtree、xarray数据结构使用】
  • 论文阅读:DMD | Improved Distribution Matching Distillation for Fast Image Synthesis
  • 深入解析三色标记算法
  • Python struct模块 | 使用pack函数进行字节序打包
  • 二叉树的前中后序遍历(迭代法)