(论文速读)HVI:一种用于弱光图像增强的新色彩空间
论文题目:HVI: A New Color Space for Low-light Image Enhancement(一种用于弱光图像增强的新色彩空间)
会议:CVPR2025
摘要:弱光图像增强(LLIE)是一项重要的计算机视觉任务,旨在从损坏的弱光图像中恢复详细的视觉信息。现有的许多LLIE方法都是基于标准RGB (sRGB)空间,由于sRGB固有的高色彩敏感性,往往会产生色彩偏差和亮度伪影。虽然使用色调,饱和度和值(HSV)色彩空间转换图像有助于解决亮度问题,但它引入了显着的红色和黑色噪声伪影。为了解决这个问题,我们提出了一种新的LLIE色彩空间,即水平/垂直强度(HVI),由极化HS图和可学习强度定义。前者强制红色坐标的小距离以去除红色伪影,而后者压缩低光区域以去除黑色伪影。为了充分利用颜色和强度信息,进一步引入了一种新的颜色和强度解耦网络(CIDNet)来学习HVI空间中不同光照条件下的精确光度映射函数。基准和烧蚀实验的综合结果表明,基于CIDNet的HVI色彩空间在10个数据集上的性能优于目前最先进的方法。
代码可在https://github.com/Fediory/HVI-CIDNet上获得。

突破传统色彩空间限制:低光照增强新方案HVI
在计算机视觉领域,低光照图像增强一直是一个充满挑战的任务。你是否遇到过这样的情况:夜间拍摄的照片不仅暗淡模糊,增强后还出现严重的色彩偏差?来自西北工业大学和新加坡管理大学的研究团队在CVPR 2025上提出了一个创新方案——HVI色彩空间和CIDNet网络,为这个老大难问题带来了新的解决思路。
问题的根源:色彩空间的"阿喀琉斯之踵"
RGB的困境:色彩与亮度的纠缠
传统的低光照增强方法大多基于标准RGB色彩空间工作。但RGB有一个致命缺陷:亮度和颜色高度耦合。想象一下调整图片亮度时,三个颜色通道(红、绿、蓝)都会同时变化,稍有不慎就会导致色彩失真——本该红色的玫瑰可能变成粉色,蓝色的天空可能泛黄。
HSV的尝试与新问题
为了解决这个问题,一些研究者转向HSV色彩空间。HSV将颜色分解为:
- H (Hue):色调
- S (Saturation):饱和度
- V (Value):明度
这样确实实现了亮度与颜色的解耦。但新的问题出现了:
红色不连续问题:在HSV的圆柱坐标系中,红色同时出现在0°和360°两端。这就像一个首尾相连的色环被人为切断,相似的红色点在数学上距离很远,导致增强红色区域时出现诡异的黑点。
黑色平面噪声:极暗区域(接近黑色的像素)在HSV空间中形成一个"噪声平面",增强时会被放大,产生难看的伪影。
论文中有一张非常直观的对比图:同一张图片在sRGB空间增强后色彩失真,在HSV空间增强后红色区域和暗部出现严重噪点,而使用HVI空间后则近乎完美。(即最开头的图)
创新的核心:HVI色彩空间
研究团队提出的HVI空间巧妙地解决了上述两个问题,其设计理念是:让相似的颜色在空间中靠得更近。
1. 极化处理:修复红色断层
他们对HSV的色调轴进行了极化变换:
- 水平分量:h = cos(πh/3)
- 垂直分量:v = sin(πh/3)
这相当于把原本线性的色调轴"卷"成一个完整的圆,红色不再被分裂在两端,而是自然地聚集在一起。数学上,原本距离为6的两个红色点现在可以非常接近。
2. 可学习的强度塌陷:驯服黑暗
对于黑色平面问题,他们引入了一个可训练的塌陷函数Ck:
Ck(x) = ᵏ√(sin(πImax(x)/2) + ε)
其中k是一个可学习参数。这个函数的妙处在于:
- 低亮度区域:Ck接近0,相当于把暗部的"半径"压缩到原点附近,噪声点被聚集
- 高亮度区域:Ck逐渐增大到1,保持正常的颜色分布
- 自适应调节:k通过训练自动学习不同数据集的最优塌陷程度
最终的HVI表示为:
Ĥ = Ck ⊙ S ⊙ H
V̂ = Ck ⊙ S ⊙ V
加上原始强度I,构成三维HVI空间
CIDNet:为HVI量身定制的网络

有了好的色彩空间,还需要好的网络架构。CIDNet采用双分支设计:
架构亮点
- HV分支:专注于处理色度信息,输入是HV色度图+强度图的拼接
- I分支:专注于估计场景光照,输入是强度图
- 跨分支注意力:这是关键创新!两个分支不是独立工作,而是通过Lighten Cross-Attention (LCA)相互协作:
- I分支的强度特征告诉HV分支"哪里需要重点去噪"
- HV分支去噪后的纯净强度信息反馈给I分支,让亮度估计更平滑
为什么用跨分支而非自注意力?
研究者观察到:光照强度与噪声强度成反比。一张低光照图片可能局部很暗(需要大幅增强),但某些区域相对明亮(只需轻微调整)。如果让两个分支"各自为政",HV分支可能过度去噪导致全局色偏,I分支可能过度增强导致过曝。跨分支注意力让它们相互制约、相互指导,达到平衡。
损失函数的双重监督
L = λ · l(ÎHVI, IHVI) + l(Î, I)
同时在HVI和sRGB两个空间计算损失:
- HVI空间损失:优化色彩点的概率分布,特别是红色和黑色区域
- sRGB空间损失:保持像素级的结构细节
这种双重监督确保增强后的图像既符合人类视觉感知,又保留丰富细节。
实验结果
实验数据
在10个基准数据集上,CIDNet都取得了SOTA性能:


LOLv2-Real数据集:
- PSNR: 24.111(比次优高约1.3 dB)
- SSIM: 0.871
- LPIPS: 0.108(越低越好)
Sony-Total-Dark(极暗场景):
- PSNR: 22.904,比第二名高出惊人的6.678 dB!
这个极暗数据集的表现尤其惊艳,因为它专门设计了无gamma校正的极端暗度。传统方法很难区分细节和噪声,而CIDNet通过Ck函数有效维持了最优信噪比。
效率优势

- 参数量:1.88M(仅为扩散模型GSAD的10.8%)
- 计算量:7.57 GFLOPs
- 推理时间:0.053秒(最快)
在保持最佳性能的同时,CIDNet是唯一同时兼顾速度和质量的方法。相比之下,扩散模型虽然效果不错,但推理时间达到0.578秒,慢了近11倍。
即插即用的通用性
研究者将HVI变换作为"外挂"应用到6个现有LLIE方法上,所有方法都获得了提升:
- GSAD(扩散模型):+3.562 dB
- LEDNet:+3.456 dB
- LLFormer:+2.615 dB
这证明HVI不仅适配CIDNet,而且是一个通用的色彩空间工具,可以广泛提升现有方法。
消融实验:每个模块都很重要

| 配置 | PSNR提升 |
|---|---|
| sRGB → HSV | +1.287 dB |
| HSV → HVI(仅极化) | +0.209 dB |
| HSV → HVI(仅Ck) | +0.187 dB |
| HSV → HVI(完整) | +2.762 dB |
可以看到,极化和Ck单独使用时提升有限,但结合起来产生了协同效应,带来接近3 dB的巨大提升。
在网络结构上:
- 基线UNet → 加自注意力:+2.9 dB
- 自注意力 → 双分支+跨注意力:+1.8 dB
视觉效果:眼见为实
论文展示了大量对比图:
- 红色区域:其他方法在红色物体(如红色墙壁、红色标志)上出现明显黑点或色块,CIDNet完全没有
- 极暗场景:传统方法要么提亮不足细节模糊,要么过度增强噪声明显,CIDNet保持了清晰的细节和自然的色彩
- 整体亮度:相比GroundTruth,CIDNet的结果在亮度分布上更接近真实,既没有欠曝也没有过曝
特别是在无配对数据集上的表现,虽然BRISQUE指标不是最优,但视觉感知质量明显更接近真实场景——这可能是因为HVI基于真实世界的感知模型(Kubelka-Munk理论)设计。
技术细节与实现
训练设置
- 优化器:Adam(β1=0.9, β2=0.999)
- 学习率:初始1×10⁻⁴,余弦退火至1×10⁻⁷
- 硬件:单张RTX 2080Ti或3090
- 数据增强:
- LOLv1/v2-Real:裁剪为400×400,训练1500轮
- SICE:裁剪为160×160,训练1000轮
- Sony-Total-Dark:裁剪为256×256,训练1000轮
理论意义与实际价值
理论贡献
- 色彩空间设计范式:证明了针对特定任务设计专用色彩空间的可行性和必要性
- 物理启发:基于Kubelka-Munk理论和Max-RGB理论,而非纯数据驱动
- 可学习参数:k的引入为色彩空间带来了"自适应性",是传统固定色彩空间的重要突破
实际应用
- 手机摄影:轻量级模型(1.88M)非常适合移动端部署
- 视频监控:夜间监控画面增强,提高安全性
- 自动驾驶:改善夜间或隧道中的视觉感知
- 医学影像:低剂量X射线或低光照显微镜图像增强
局限性与未来方向
尽管HVI和CIDNet取得了显著成果,仍有改进空间:
- 色彩空间通用性:HVI专为LLIE设计,是否适用于其他任务(如HDR、去雾)需要验证
- 极端场景:在完全无光(全黑)或极度过曝场景下的表现还需测试
- 主观评价:虽然客观指标优秀,大规模用户研究将更有说服力
- 实时性:虽然速度已很快,视频流的实时处理(30fps以上)还需进一步优化
未来研究方向:
- 将HVI扩展到视频增强(考虑时间一致性)
- 结合NeRF等3D表示进行场景级增强
- 探索HVI在其他低级视觉任务中的应用
结语
HVI色彩空间和CIDNet的提出,代表了低光照图像增强领域的一次重要突破。它不仅解决了困扰HSV多年的红色和黑色噪声问题,还通过精心设计的双分支网络充分挖掘了新色彩空间的潜力。
更令人兴奋的是,HVI作为一个即插即用的模块,可以赋能现有的各种LLIE方法,这意味着它的影响力将远超单一论文。从理论到实践,从准确性到效率,HVI-CIDNet为我们展示了"正确的色彩空间+合适的网络架构"这一经典组合在深度学习时代依然充满活力。
如果你正在从事图像增强相关研究,或者对底层视觉任务感兴趣,这篇论文绝对值得精读。代码已开源,不妨动手尝试,也许你会发现HVI在其他领域的新用途!
希望这篇详细的介绍和博客能帮助你深入理解这项创新工作!HVI-CIDNet的设计思路非常清晰,从问题分析到解决方案都很有启发性,是一篇值得学习的优秀论文。
