当前位置: 首页 > news >正文

GAN/cGAN中到底要不要注入噪声

MelGAN

论文MelGAN针对的是从mel谱生成语音,里面说当条件很强的时候,随机噪声就没啥用了,因此没将noise注入到生成器中;

运用的判别器也仅有1个输入,不是cGAN的形式

image-to-image translation with conditional adversarial networks

主要针对图片到图片的转换任务,例如:给定轮廓,利用NN补充细节。也说随机噪声作用不大。文中仅以dropout的形式实现随机噪声,但本文也称自己为GAN。

仅使用L1会得到模糊结果(文中其他地方说用L2会更模糊),仅使用GAN会得到清晰但是有artifact的结果,联合使用L1+GAN效果最好;

L1loss和L2loss在图像问题上会导致模糊现象,但是这两个loss都捕捉到了低频信息。

采用GAN的目的是仅对高频进行建模,L1用来最低频做建模

如下结果表明:相较于GAN,cgan还是有优势的。cgan和gan的区别就是是否将原始特征输入x中;

http://www.dtcms.com/a/300472.html

相关文章:

  • InfluxDB 与 MQTT 协议集成实践(二)
  • Element表格单元格类名动态设置
  • Linux网络
  • libomxil-bellagio移植到OpenHarmony
  • Ubuntu简述及部署系统
  • MybatisPlus-19.插件功能-通用分页实体
  • JDK 11.0.16.1 Windows 安装教程 - 详细步骤+环境变量配置
  • Day44 Java数组08 冒泡排序
  • AI与区块链Web3技术融合:重塑数字经济的未来格局
  • SpringSecurity实战:核心配置技巧
  • 【前端】【vscode】【.vscode/settings.json】为单个项目配置自动格式化和开发环境
  • 【C++基础】类型转换:static_cast/dynamic_cast 面试高频考点与真题解析
  • Spring Retry 异常重试机制:从入门到生产实践
  • ESP32学习-FreeRTOS队列使用指南与实战
  • 【多模态】天池AFAC赛道四-智能体赋能的金融多模态报告自动化生成part2-报告输出
  • Java面试实战:企业级性能优化与JVM调优全解析
  • 小白成长之路-Ansible自动化(一)
  • 将远程 main 分支同步到 develop 分支的完整指南
  • 【硬件】嵌入式软件开发(2)
  • STM32-USART串口实现接收数据三种方法(1.根据\r\n标志符、2.空闲帧中断、3.根据定时器辅助接收)
  • Pytest 参数化进阶:掌握 parametrize 的多种用法
  • HCIP---MGRE实验
  • 嵌入式硬件篇---ESP32稳压板
  • OpenLayers 综合案例-轨迹回放
  • LeetCode|Day27|70. 爬楼梯|Python刷题笔记
  • catkin_make与catkin build的关系与区别(使用catkin build的好处)
  • MGRE实验
  • 深入解析 Vue 3 中 v-model 与表单元素的绑定机制
  • 多租户Kubernetes集群架构设计实践——隔离、安全与弹性扩缩容
  • Spring Boot自动配置原理深度解析