当前位置：首页 > news >正文

对抗攻击-知识点

news 2025/7/28 12:40:44

在这里插入图片描述

所以轻微扰动即可使预测错误。

比如想象一张2x2的迷你图片（4个像素），这时正交基就是4个互相垂直的方向：单独增加像素1、像素2、像素3、像素4的亮度，且保证每次调整不会互相干扰。

假设图像有 d 个像素（如 224x224x3=150,528 维），正交基就是 d 个互相垂直的向量
- - 每个向量代表一种独立的像素修改模式
- - 任意两个模式互不干扰（修改模式A不会影响模式B的效果）

特征降采样（Feature Downsampling）是深度学习（尤其是卷积神经网络 CNN）中的一种核心操作，旨在逐步减少特征图的空间尺寸（宽和高），同时增加其通道数（深度）。

通过黑盒攻击（查询几百次才得到的对抗样本）来训练出鲁棒性更强的模型

计算示例（像素值R=100, G=150, B=200）：

Y = 0.299*100 + 0.587*150 + 0.114*200 ≈ 139.25
Cb = -0.1687*100 -0.3313*150 +0.5*200 +128 ≈ 113.23
Cr = 0.5*100 -0.4187*150 -0.0813*200 +128 ≈ 124.56

乘以固定系数即可

$F(u, v) = Σ_{i=0}^{7} Σ_{j=0}^{7} f(i, j) * B_{u,v}(i, j)$

$F (u, v)$ 是一个数值，不是波面
一个 $F (u, v)$ 相当于（u，v）确定基函数波面分别与64个像素点的乘积之和，表示了

DCT系数矩阵本质上是一个频率能量分布图：

每个位置对应特定方向/频率的波面系数值表示该频率分量（基函数波面）在图像中的强度整体分布揭示图像的空间频率特征

将系数按位置排列成8x8矩阵

$B_{u,v}(i,j) = C(u) * C(v) * cos( (2i+1)uπ / 16 ) * cos( (2j+1)vπ / 16 )$

i 相当于x，j 相当于y；
参数 uu 控制水平方向的频率（即横向条纹的密度）；
参数 vv 控制垂直方向的频率（即纵向条纹的密度）。
最终表达出来的是64个不同的波面
画图

在这里插入图片描述

C(u)也是

对任何8x8像素块，通过其得到的8x8基函数值都相同
在这里插入图片描述 >

DCT将图片的信息分散到64个基函数波面上来存储
而人眼对左上角的低频基函数波面更敏感
这些低频分量描述图像中缓慢、平滑的变化，如大面积的色块、亮度渐变、柔和边缘。人眼对这些大面积、平缓变化的信息极其敏感。

图像通道数（Channels）取决于格式和存储的数据类型。以下是主要区别：

典型通道数：
- RGB 模式：3 通道（红、绿、蓝）
- RGBA 模式：4 通道（红、绿、蓝 + Alpha 透明度）
- 灰度模式：1 通道（仅亮度）
- 灰度+Alpha：2 通道（亮度 + 透明度）
位深度：支持 8 位/通道（24 位色）或 16 位/通道（48 位色）
透明支持：Alpha 通道实现平滑过渡透明

格式	典型通道数	透明度支持	位深度	通道特性
PNG	1/2/3/4	✅ Alpha 通道	8 或 16 位	灵活支持多种模式
JPEG	3 (或 1)	❌	8 位固定	纯色彩数据，无扩展通道
RAW	1 (重建为3)	❌	12-16 位	原始传感器单通道 + 元数据