GreenStableYolo:多目标优化文本到图像生成的推理时间与图像质量
论文地址:https://arxiv.org/pdf/2407.14982
目录
一、论文结构
二、创新点
三、创新点结构与原理
1. GreenStableYolo框架
2. NSGA-II算法原理
3. Yolo质量评估
四、代码复现
1. 环境配置
2. 核心代码
3. 运行示例
五、仿真结果
1. 性能对比
2. 参数影响分析
六、应用场景
七、总结
一、论文结构
本文《GreenStableYolo: Optimizing Inference Time and Image Quality of Text-to-Image Generation》提出了一种结合多目标优化算法(NSGA-II)与Yolo目标检测的方法,用于优化Stable Diffusion模型的推理时间和图像质量。以下是论文的核心结构:
-
摘要
- 研究问题:现有文本到图像生成模型(如Stable Diffusion)在参数调优时缺乏对推理时间与图像质量的平衡优化。
- 方法