【深度学习新浪潮】近三年图像处理领域无监督学习的研究进展一览
近三年(2022-2025年),图像处理领域的无监督学习在生成模型、视频分析、3D视觉、异常检测等多个方向取得显著进展,以下是关键研究进展的系统梳理:
一、生成模型与图像复原
-
扩散模型的突破
扩散模型在图像生成和修复中表现突出。例如,2024年ECCV提出的3DEgo通过文本提示指导单目视频合成3D场景,利用高斯扩散和多视图一致性优化,将传统多阶段流程简化为单阶段工作流。2025年7月发布的HYPIR结合大语言模型和多模态技术,实现8K级图像复原,1.7秒完成老照片高清修复,在文化遗产保护和医疗成像领域具有重要应用价值。 -
StyleGAN的改进
2023年ICCV的StyleGANEX通过扩张卷积扩展浅层感受野,支持未对齐人脸的高分辨率生成和编辑,无需重新训练即可处理不同分辨率输入。同期ICLR的i-stylegan则优化了潜在空间的可控性,提升生成多样性。
二、视频与动态场景分析
-
无监督视频物体分割
CVPR 2023的RCF模