图像理解、计算机视觉相关名词解释
1、本征图像(Intrinsic Image)
指将图像分解为反映物体固有属性(如反射率、材质)和外在成像条件(如光照、阴影)的分量图像。典型分解为反射率图像和光照图像,用于分离物体本身特性与拍摄环境影响。
2、曲率(Curvature)
在图像中,曲率通常用于描述图像边缘、轮廓或三维表面的弯曲程度。对于二维曲线,曲率是曲线切线方向相对于弧长的旋转率;对于三维曲面,曲率通过主曲率、高斯曲率等参数表征局部形状的弯曲特性。
3、图像分割(Image Segmentation)
将数字图像划分为多个互不重叠的像素区域(子图像)的过程,每个区域内的像素在某种特征(如灰度、颜色、纹理)或属性上具有相似性,不同区域间具有差异性,目的是简化图像表示以利于分析。
4、直方图(Histogram)
在图像处理中,直方图是对图像中像素值(如灰度值、颜色值)分布的统计图表。横轴表示像素值的范围,纵轴表示每个值出现的频率(像素数量),用于描述图像的亮度分布、对比度等特征。
5、图像增强(Image Enhancement)
通过信号处理技术改善图像的视觉效果,或突出感兴趣特征的过程。常用方法包括对比度调整、噪声滤波、边缘锐化等,目的是使图像更适合人眼观察或后续计算机处理。
6、遥感图像(Remote Sensing Image)
由遥感技术获取的图像,通过非接触式传感器(如卫星、无人机搭载的相机、雷达)从远距离探测目标物体反射或辐射的电磁波信息,经处理后形成的图像,用于地表观测、环境监测等领域。
7、模式识别(Pattern Recognition)
指对表征事物或现象的各种形式的(数值的、文字的、物理的)信息进行处理和分析,以对事物或现象进行描述、分类、解释的过程,涉及机器学习、统计分析等技术,用于图像分类、目标识别等任务。
8、模式(Pattern)
在模式识别与图像处理中,“模式”指可观察到的事物的特征、结构或样本,通常表示为一组数据或特征向量,用于表征物体、场景或现象的共性与特性,是分类与识别的基本单元。
9、视觉全过程
视觉全过程是指从图像采集、预处理、特征提取、目标识别到理解与决策的整个计算机视觉处理流程,模拟人类视觉系统对图像的感知与理解过程。
10、球心投影(Gnomonic Projection)
一种几何投影方式,将三维球面上的点沿球心到球面的射线投影到平面上。在图像处理中,常用于将球面图像(如全景图像)转换为平面表示,特点是球面上的大圆弧在投影平面上为直线。
11、马尔视觉计算理论(Marr’s Computational Theory of Vision)
马尔视觉计算理论是由David Marr提出的计算视觉理论体系,认为视觉可以分为多个层次:原始图(raw primal sketch)、原始草图(primal sketch)、2.5维草图(2.5D sketch)以及三维模型表示(3D model representation),强调从图像中逐步提取结构信息直至三维理解。
12、立体视觉(Stereo Vision)
通过模拟人类双眼视差原理,利用两台(或多台)相机从不同视角获取同一场景的图像,计算图像中对应点的位置差异(视差),进而重建场景三维结构的技术,广泛应用于深度估计、三维建模。
13、计算机视觉(Computer Vision)
计算机视觉是指利用计算机实现人的视觉功能,希望根据感知到的图像对实际目标和场景做出有意义的判断。这实际上也是图像理解的目标。
14、世界坐标系统(World Coordinate System, WCS)
在计算机视觉与三维重建中,世界坐标系是用于描述真实世界中物体位置的三维坐标系,通常以米(m)为单位,是相机坐标系、图像坐标系等其他坐标系的参考基准,用于建立场景的绝对位置关系。
15、黑板系统(Blackboard System)
一种人工智能系统架构,通过共享数据结构(“黑板”)集成多个独立模块(“知识源”),各模块可读取黑板上的信息并更新内容,实现多任务协作处理。在图像处理中,可用于整合不同算法的中间结果以完成复杂视觉任务。