当前位置：首页 > news >正文

NLP高频面试题（二十三）对抗训练的发展脉络，原理，演化路径

news 2025/7/13 7:32:20

对抗训练（Adversarial Training）作为提升深度学习模型鲁棒性的重要技术，近年来备受关注。本文将从计算机视觉出发，详细阐述对抗训练的发展脉络、基本原理、演化路径，并深入解析FGSM、FGM、PGD、FreeAT等常见对抗训练方法的原理、优缺点，以及模型在攻击阶段的不同应对策略。

一、对抗训练的发展脉络

对抗样本的概念由Szegedy等人在2013年提出。他们发现通过在输入数据中添加微小且难以察觉的扰动，能够导致深度学习模型出现错误且高置信度的预测。这一现象揭示了模型在对抗攻击下的脆弱性。

随后，Goodfellow等人在2014年提出快速梯度符号方法（FGSM），同时提出了对抗训练方法，即通过在训练集中加入对抗样本来提升模型鲁棒性。此后，以PGD、FGM、FreeAT为代表的更强大的攻击与防御方法陆续出现，不断提升了模型对抗攻击的稳健性。

二、对抗训练的基本原理

对抗训练核心思想是在模型训练过程中，利用对抗样本增强模型泛化和抵抗能力，具体步骤包括：

生成对抗样本：使用如FGSM、PGD等方法在原始样本上生成扰动样本。
混合训练：将生成的对抗样本与原始样本一同训练模型。
迭代优化：通过多次循环，使模型逐渐学习抵御对抗样本攻击。

三、对抗训练方法详解

（1）快速梯度符号方法（FGSM）

FGSM方法利用模型梯度符号方向快速生成对抗样本：

$x_{adv} = x + \epsilon \cdot sign(\nabla_x J(\theta,x,y))$

其中， $\epsilon$ 控制扰动大小。FGSM的优点在于计算高效，通过一次梯度计算即可生成对抗样本，因此广泛应用于快速评估模型的鲁棒性。然而，由于只考虑了梯度符号而忽略了梯度大小，生成的对抗样本往往较为粗糙，不一定是最有效的对抗攻击。

（2）快速梯度方法（FGM）

FGM在FGSM基础上进一步改进，通过梯度大小进行归一化生成扰动：

$x_{adv} = x + \epsilon \cdot \frac{\nabla_x J(\theta,x,y)}{\|\nabla_x J(\theta,x,y)\|_2}$

相比FGSM，FGM通过归一化后的扰动分布更加均匀和精细，能够产生更为有效的对抗样本，具有更高的攻击成功率和鲁棒性提升效果。

（3）投影梯度下降（PGD）

PGD通过多次迭代优化扰动，寻找更强的对抗样本，具体过程包括初始化、迭代更新扰动、以及扰动投影步骤：

$x_{adv}^{t+1} = Proj_{\epsilon}(x_{adv}^{t} + \alpha \cdot sign(\nabla_x J(\theta,x_{adv}^{t},y)))$

PGD扰动更加精确有效，通过多次小步梯度更新，更易逼近局部最优扰动，因此被视为更强大的攻击方式。但由于每次更新都需要梯度计算，计算开销较大，训练成本高。

（4）自由对抗训练（FreeAT）

FreeAT旨在解决传统对抗训练方法高计算开销的问题。其核心思想是在每个mini-batch内重复多次利用同一批样本并逐步更新扰动，从而极大减少计算成本。

具体步骤如下：

初始化扰动为零。
在每个mini-batch内重复进行：
1. 在当前输入上添加扰动后进行前向传播并计算损失。
2. 进行反向传播更新模型参数。
3. 利用当前梯度信息更新扰动，以便下次循环使用。

这种策略显著提高了对抗训练的效率，使其在实际应用中更加实用。

四、对抗训练的演化路径与应用

对抗训练最初在CV领域广泛应用，现已拓展至自然语言处理（NLP）和语音识别等领域：

CV领域：增强图像分类、目标检测模型的鲁棒性。
NLP领域：提高文本分类、情感分析模型泛化能力。
语音识别领域：提升模型对环境噪声的抵抗能力。

五、攻击阶段的模型应对策略

在对抗训练的攻击阶段，不同模型采取的策略取决于攻击类型：

白盒攻击：攻击者了解模型参数与结构，模型通常使用对抗训练、梯度掩码等方法防御。
黑盒攻击：攻击者无法获取模型信息，模型则采用迁移学习、输出随机化等策略防御。

模型采用特定防御策略的主要原因是为了权衡防御效果与计算成本。

查看全文

http://www.dtcms.com/a/98215.html

关于跨域与.NET的处理方案

软考-高级-系统架构设计师【考试备考资料下载】

自学-408-《计算机网络》（总结速览）

区块链在教育领域的创新应用：改变传统教育的未来

黑盒测试的等价类划分法(输入数据划分为有效的等价类和无效的等价类)

综合实验

qt之使用redis与其他程序（python）交互同通信

基于SpringBoot实现的高校实验室管理平台功能四

多线程 -- Thread类

vue学习

Linux内核同步机制：解锁并发编程的奥秘

软件的常用设计模式。可参考一个一个学习

用Nginx实现负载均衡与高可用架构（整合Keepalived）

[Linux]在vim中批量注释与批量取消注释

进程Kill杀死后GPU显存没有释放仍然被占用，怎么杀死僵尸进程

跟着StatQuest学知识08-RNN与LSTM

Claude 在 SVG 绘图创作中的潜力与技巧

【软考-架构】10.1、软件工程概述-CMM-软件过程模型-逆向工程

Pycharm （十）字符串扩展：统计小串在大串中出现的次数

C++23：现代C++的模块化革命与零成本抽象新高度

笔记：遇见未来——6G协同创新技术研讨会

FPGA调试笔记

从代码学习深度学习 - 含并行连结的网络（GoogLeNet）PyTorch版

淘宝双十一大促监控系统开发：实时追踪爆品数据与流量波动

谷粒微服务高级篇学习笔记整理---异步线程池

SQL Server数据库引擎服务启动失败：端口冲突

电源系统的热设计与热管理--以反激式充电器为例

1688 店铺清单及全商品数据、关键词检索 API 介绍

【蓝桥杯】每日练习 Day15

【自用记录】本地关联GitHub以及遇到的问题