当前位置: 首页 > news >正文

深度学习(对抗)

数据预处理:像素标记与归一化

在 GAN 里,图像的确会被分解成一个个像素点来处理。在你的代码里,transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))]) 这部分对图像进行了预处理:

  • transforms.ToTensor():把图像转换为张量,也就是把图像的像素值转化为可以被神经网络处理的数值形式。
  • transforms.Normalize((0.5,), (0.5,)):对像素值进行归一化,将像素值的范围从 [0, 1] 转换到 [-1, 1]。这可以让训练过程更加稳定。

生成器:基于随机噪声生成假图像

生成器接收随机噪声作为输入,就像代码中的 noise = torch.randn(batch_size, z_dim).to(device),这里的 noise 是从标准正态分布中随机采样得到的。生成器的任务是把这个随机噪声转换为与真实图像相似的假图像,即 fake = gen(noise)。生成器通过一系列的神经网络层(在你的代码里是全连接层)对随机噪声进行变换,尝试学习到真实图像数据的分布。

判别器:判断图像真假

判别器接收真实图像和生成器生成的假图像作为输入,然后判断输入的图像是真实的还是假的。在代码中,disc_real = disc(real).view(-1) 和 disc_fake = disc(fake.detach()).view(-1) 分别表示判别器对真实图像和假图像的判断结果。判别器的输出是一个介于 [0, 1] 之间的概率值,越接近 1 表示判别器认为输入的图像是真实图像的可能性越大,越接近 0 则表示认为是假图像的可能性越大。

对比与优化

  • 判别器优化:判别器的目标是准确区分真实图像和假图像。代码中通过计算判别器对真实图像和假图像的损失,即 lossD_real = criterion(disc_real, torch.ones_like(disc_real)) 和 lossD_fake = criterion(disc_fake, torch.zeros_like(disc_fake)),然后将两者的平均值作为判别器的总损失 lossD = (lossD_real + lossD_fake) / 2。接着使用反向传播算法 lossD.backward() 和优化器 opt_disc.step() 来更新判别器的参数,使其能够更好地区分真假图像。
  • 生成器优化:生成器的目标是生成能够欺骗判别器的假图像。代码中通过计算生成器生成的假图像被判别器判断为真实图像的损失,即 lossG = criterion(output, torch.ones_like(output)),然后使用反向传播算法 lossG.backward() 和优化器 opt_gen.step() 来更新生成器的参数,使其能够生成更逼真的假图像。

  • 真实图像损失(lossD_real
    在代码里,disc_real = disc(real).view(-1) 这行将真实图像 real 输入到判别器 disc 中,得到判别器对真实图像的判断结果 disc_real。每个元素代表判别器认为对应真实图像是真实图像的概率。
    lossD_real = criterion(disc_real, torch.ones_like(disc_real)) 这行使用二元交叉熵损失函数 criterion 来计算判别器对真实图像的损失。torch.ones_like(disc_real) 构建了一个和 disc_real 形状相同且元素全为 1 的张量,这代表真实图像的标签都应该是 1。二元交叉熵损失函数会衡量 disc_real 和全 1 张量之间的差异,差异越大,损失值就越大。

  • 假图像损失(lossD_fake
    disc_fake = disc(fake.detach()).view(-1) 把生成器生成的假图像 fake 输入到判别器中得到判断结果 disc_fake。这里使用 detach() 方法是为了防止在更新判别器参数时影响到生成器的参数。
    lossD_fake = criterion(disc_fake, torch.zeros_like(disc_fake)) 使用二元交叉熵损失函数计算判别器对假图像的损失。torch.zeros_like(disc_fake) 构建了一个和 disc_fake 形状相同且元素全为 0 的张量,这代表假图像的标签都应该是 0。

  • 总损失(lossD
    lossD = (lossD_real + lossD_fake) / 2 把真实图像损失和假图像损失取平均值作为判别器的总损失。这样做能让判别器在区分真实图像和假图像时保持平衡。

相关文章:

  • forms实现快读阅读器
  • 操作系统 第三章 内存管理
  • 爬虫:IP代理
  • HTTP 1.1 比 HTTP1.0 多了什么?(详尽版)
  • Arm CPU安全通告:基于TrustZone的Cortex-M系统面临多重故障注入攻击
  • linux多线(进)程编程——(5)虚拟内存与内存映射
  • 14、nRF52xx蓝牙学习(串口 UART 和 UARTE 外设应用)
  • 【Linux】what is pam?PAM模块学习笔记
  • CTF-WEB排行榜制作
  • JavaWeb 课堂笔记 —— 10 MySQL DML + DQL
  • Node.js介绍
  • vue入门:函数式组件
  • 实现一个动态验证码生成器:Canvas与JavaScript的完美结合
  • 《C语言中的形参与实参:理解函数调用的核心概念》
  • NVIDIA AI Aerial
  • docker 安装 jenkins
  • SpringBoot实战2
  • 【强化学习-蘑菇书-3】马尔可夫性质,马尔可夫链,马尔可夫过程,马尔可夫奖励过程,如何计算马尔可夫奖励过程里面的价值
  • 奇怪的电梯——DFS算法
  • linux多线(进)程编程——(4)进程间的传音术(命名管道)
  • 2025吉林市马拉松开跑,用赛道绘制“博物馆之城”动感地图
  • 柬埔寨果农:期待柬埔寨榴莲走进中国市场
  • 以色列媒体:哈马斯愿意释放部分人员换取两个月停火
  • 舞者王佳俊谈“与AI共舞”:像多了一个舞伴,要考虑它的“感受”
  • 时隔3年,持续近2小时,俄乌在土耳其谈成了什么?
  • 雅典卫城上空现“巨鞋”形状无人机群,希腊下令彻查