当前位置: 首页 > news >正文

计算机视觉CS231n学习(9)

对抗样本和对抗训练 Adversarial Examples and Adversarial Training

在这里插入图片描述

  1. 对抗性样本

    1. 什么是对抗性样本?

      是一种能欺骗机器学习模型的样本,通常通过对原始样本施加微小扰动得到

    2. 时间线

      • 2004 年,“Adversarial Classification”(Dalvi 等人)提出欺骗垃圾邮件过滤器5。
      • 2013 年,“Evasion Attacks Against Machine Learning at Test Time”(Biggio)提出欺骗神经网络67。
      • 2013 年,Szegedy 等人提出能 imperceptibly 欺骗 ImageNet 分类器8。
      • 2014 年,Goodfellow 等人提出廉价的、封闭形式的攻击9。
    3. 适用模型

      不仅适用于神经网络,还适用于线性模型、逻辑回归、支持向量机(SVMs)、决策树、最近邻等多种模型

    4. 为什么会产生对抗性样本?

      1. 过拟合
      2. 过度线性,现代深度网络具有很强的分段线性特性
    5. 迁移性

      跨模型、跨数据集迁移,如不同的深度学习模型(DNN)、线性回归(LR)、支持向量机(SVM)等之间存在迁移性

  2. 如何用于破坏机器学习系统?

    1. 攻击方法:

      快速梯度符号法(FGSM):通过公式计算扰动,使目标函数最大化,同时约束扰动的无穷范数不超过ε,即
      x~=x+ϵsign(∇x​J(x)) \widetilde{x} = x+ϵsign(∇ x ​J(x)) x=x+ϵsign(xJ(x))

    2. 实际攻击场景

      1. 欺骗远程托管API训练的真实分类器(如MetaMind、Amazon、Google)
      2. 欺骗恶意软件检测器网络
      3. 在物理世界中展示对抗性样本,欺骗通过相机感知它们的机器学习系统
  3. 防御措施有哪些?

    1. 失败的防御措施

      包括生成式预训练、测试时添加噪声、测试时减少置信度的扰动、权重衰减、各种非线性单元、用自编码器去除扰动、集成方法、纠错码、多次观察、双重反向传播、dropout、训练时添加噪声等

    2. 有效的防御措施

      1. 对抗性训练:在训练中使用对抗性样本,能提高模型在对抗性样本上的表现,且经对抗性训练的神经网络在对抗性样本上的实证成功率优于其他机器学习模型
      2. 虚拟对抗性训练:对于未标记数据,使模型在对抗性扰动下的猜测与原始猜测保持一致,可应用于文本分类等任务
  4. 如何利用对抗性样本改进机器学习?

    对抗训练提供了正则化和半监督学习(虚拟对抗性训练)

    虽然域外输入问题是基于模型优化的瓶颈,但对抗性样本可作为一种工具,帮助研究者更深入地理解模型的行为和弱点。

http://www.dtcms.com/a/330494.html

相关文章:

  • VLMs开发——基于Qwen2.5-VL 实现视觉语言模型在目标检测中的层级结构与实现方法
  • 【CV 目标检测】R-CNN①——Overfeat
  • PyCharm性能优化与大型项目管理指南
  • Linux 路由表建立过程分析
  • 开疆智能Ethernet转ModbusTCP网关连接UR机器人配置案例
  • LeetCode 面试经典 150_数组/字符串_最后一个单词的长度(19_58_C++_简单)(反向遍历)
  • 百川开源大模型Baichuan-M2的医疗能力登顶第一?
  • 【机器人-开发工具】ROS 2 (4)Jetson Nano 系统Ubuntu22.04安装ROS 2 Humble版本
  • OpenBMC中C++策略模式架构、原理与应用
  • AI数据仓库的核心优势解析
  • 设计模式基础概念(行为模式):策略模式
  • 【java实现一个接口多个实现类通用策略模式】
  • [Oracle数据库] ORACLE基本DML操作
  • 【软件测试】自动化测试 — selenium快速上手
  • Java设计模式之《策略模式》
  • STM32L051C8与STM32L151C8的主要区别
  • visual studio调试cmake项目记录
  • 用飞算JavaAI一键生成电商平台项目:从需求到落地的高效实践
  • 远程影音访问:通过 cpolar 内网穿透服务使用 LibreTV
  • Mybatis学习笔记(九)
  • Spring Boot + Redis + 布隆过滤器防止缓存穿透
  • [已解决]当启动 Spring Boot 应用时出现 Using generated security password xxx提示
  • OpenCV 视频处理全解析
  • EI学术会议 | 可再生能源、智能电网、电力系统优化、能源存储技术
  • Linux系统Namespace隔离实战:dd/mkfs/mount/unshare命令组合应用
  • 缓存元数据损坏操作步骤(lvmcache修复)
  • 微软推出AI恶意软件检测智能体 Project Ire
  • 截断重要性采样(TIS)在医疗AI大模型训练中的优化路径
  • 嵌入式领域,ROM和RAM的区别
  • pytorch学习笔记-Loss的使用、在神经网络中加入Loss、优化器(optimizer)的使用