计算机视觉与深度学习 | 基于Transformer的低照度图像增强技术
基于Transformer的低照度图像增强技术通过结合Transformer的全局建模能力和传统图像增强理论(如Retinex),在保留颜色信息、抑制噪声和平衡亮度方面展现出显著优势。以下是其核心原理、关键公式及典型代码实现:
一、原理分析
1. 全局依赖建模与局部特征融合
- Transformer的核心优势:通过自注意力机制(Self-Attention)捕捉长距离像素间的依赖关系,弥补传统CNN局部感受野的局限性。
- 混合架构设计:多数方法采用CNN-Transformer混合结构,如RT-UNet结合轴向多头自注意力(Axial Multi-Head Attention)和U型网络,在编码器-解码器中平衡局部细节与全局上下文。
2. 颜色空间分离与亮度增强
- HSV空间分解:将RGB图像转换为HSV空间,保留色调(H)和饱和度(S),仅对亮度(V)进行增强。通过改进Retinex理论,引入扰动项生成多亮度图,结合亮度引导T