图像滤波常用总结
一、 直方图规则化(伽马校正)
- 核心理论: 一种非线性的点运算(像素变换),通过对输入灰度值进行一个幂次变换(公式:
输出 = 输入^γ
)来重新映射图像的像素强度。 - 主要作用:
- 对比度调整: 通过选择不同的伽马值(γ),可以有针对性地增强图像的特定区域。
- γ < 1: 提升图像中暗部区域的对比度,使整体图像变亮,reveal阴影细节。
- γ > 1: 提升图像中亮部区域的对比度,使整体图像变暗,抑制过曝。
二、 平滑空间滤波器
- 核心理论: 属于空间域滤波,采用模板卷积(或排序) 的操作。使用一个滤波器模板( kernel )在图像上滑动,计算每个像素邻域的加权平均值或中值,并用该值替代中心像素的值。
- 主要作用: 模糊图像与抑制噪声,属于低通滤波。
- 线性滤波器(如均值滤波、高斯滤波): 通过计算邻域加权平均值来平滑图像。能有效抑制高斯噪声,但会导致边缘模糊。
- 非线性滤波器(如中值滤波): 通过计算邻域中值来平滑图像。对椒盐噪声(脉冲噪声) 有极好的滤除效果,且能更好地保护图像边缘。
三、 锐化空间滤波器
- 核心理论: 基于微积分中的导数。图像中的边缘对应着像素值发生剧烈变化的地方,而导数可以衡量变化的速率。
- 主要作用: 突出和增强图像的边缘、轮廓等细节信息,属于高通滤波。
- 一阶导数(如Sobel、Prewitt算子): 用于检测边缘本身。计算出的梯度值反映了边缘的强度,可以生成具有灰度过渡的边缘图像。
- 二阶导数(如Laplacian算子): 对图像中的突变(如噪声和边缘)更加敏感。它能够确定边缘的位置(过零点),但会产生双边缘响应,且对噪声更敏感。常与高斯平滑结合使用(LoG算子)以获得更好的效果。
四、 频率域滤波
- 核心理论: 通过傅里叶变换将图像从空间域转换到频率域。在频率域中,图像信息被分解为不同频率的成分(低频对应平滑区域和轮廓,高频对应边缘、噪声和细节),通过设计滤波器函数来有选择地衰减或增强特定频率成分,再通过傅里叶反变换回到空间域。
- 主要作用: 在频域中实现平滑(去噪) 和锐化(增强) 的目的,概念清晰,操作灵活。
- 低通滤波器(如理想低通、巴特沃斯低通、高斯低通): 衰减或阻挡高频成分。作用是平滑图像、去除噪声,但会导致边缘模糊。不同滤波器的区别在于截止频率处的过渡特性(是否产生振铃效应)。
- 高通滤波器(如理想高通、巴特沃斯高通、高斯高通): 衰减或阻挡低频成分。作用是锐化图像、增强边缘和细节。
五、 图像退化与复原
- 核心理论: 图像复原旨在从退化图像中重建或恢复原始图像。该过程基于一个退化模型:
g(x, y) = h(x, y) * f(x, y) + n(x, y)
,其中g
是观测到的退化图像,f
是原始图像,h
是导致退化的点扩散函数(PSF),*
代表卷积,n
是加性噪声。复原即是在已知g
和h
的某种知识的情况下,估计f
。 - 主要作用: 逆转或减轻图像在采集、传输过程中产生的模糊和噪声。
- 点扩散函数 (PSF): 定量描述成像系统(如运动、离焦)如何使一个理想点源变得模糊,是建模退化的核心。
- 逆滤波: 在频率域直接进行
F = G / H
。理论简单,但对噪声极度敏感(因为H
在高频值很小,会放大噪声),实用性差。 - 维纳滤波: 一种最优估计方法,在逆滤波的基础上考虑了噪声功率谱,旨在使估计图像与原始图像的均方误差最小。能有效抑制噪声放大,但需要已知或估计噪声统计特性。
- 约束最小二乘滤波: 另一种正则化方法,在求解过程中加入平滑性约束(如图像的二阶导数能量最小),无需已知噪声的功率谱,通常能产生比维纳滤波更令人满意的结果。
六、 彩色图像处理
- 核心理论: 将彩色图像(如RGB模型)视为多个通道(Channel) 的叠加。处理时可以分别对每个通道进行操作,也可以转换到其他颜色空间(如HSI)进行更符合视觉特性的处理。
- 主要作用: 对彩色图像进行去噪、增强、分割等操作。
- 加噪: 可以为RGB三个通道独立添加不同类型和强度的噪声,以模拟真实情况。
- 去噪: 对RGB图像去噪可直接对每个通道应用灰度图像的去噪方法(如高斯滤波、中值滤波、双边滤波等)。更先进的方法会考虑通道间的相关性或在HSI空间的亮度(I)分量上进行操作,以避免颜色失真。
七、 伪彩色图像增强
- 核心理论: 将灰度图像中不同的灰度级或灰度范围映射到不同的颜色,是一种将无法被人类视觉区分的细微灰度差别转换为明显的颜色差异的技术。
- 主要作用: 增强灰度图像中对人眼不敏感的细节的可见性。
- 灰度分层法: 将灰度级范围划分为若干区间,每个区间赋予一种颜色。方法简单,但会产生不连续的色块,细节粗糙。
- 灰度变换法: 为每一个灰度级独立地定义其在RGB三个通道中的颜色分量值。可以实现平滑、连续的颜色过渡,能展现更丰富的细节,灵活性更高。
八、 图像压缩编码
- 核心理论: 利用图像数据的冗余性(空间冗余、编码冗余、视觉心理冗余)和人类视觉系统(HVS)的特性,用尽可能少的数据位表示图像。
- 主要作用: 减少图像数据的存储量和传输带宽。
- 信息熵: 信源所含平均信息量的理论下限,表示编码每个符号所需的最小平均位数。
- 变长编码(Huffman, Shannon-Fano): 为出现概率高的符号分配短码字,为概率低的符号分配长码字,从而降低编码冗余,使平均码长接近信息熵。
- 变换编码(DCT): 将图像从空间域变换到频率域,能量会集中到少数低频系数上。通过量化(有损压缩的关键步骤)保留重要系数,舍弃不重要的高频系数,再利用之字形扫描(Zig-zag Scan)和熵编码进一步压缩数据。保留的DCT系数越少,压缩率越高,但图像质量(PSNR)越低。
-------------------------------------------------------------------------------------------------