OPENCV形态学基础之一膨胀
一.膨胀的原理
数学表达式:dst(x,y) = dilate(src(x,y)) = max(x,y)src(x+x,y+y)
膨胀是图像形态学的基本功能之一,膨胀顾名思义就是求图像的局部最大值操作,它的数学表达式是dst(x,y) = dilate(src(x,y)) = max(x,y)src(x+x,y+y)。
从数学的角度来看,无论是膨胀还是腐蚀实际上就是把图像跟核进行卷积(卷积:是通过两个函数f和g生成第三个函数的一种数学运算,它的本质就是微积分的转换,积分转换的数学公式
(f * g)(t) =∫f(τ)g(t -τ)dτ ),如上图:图像A和形状B进行卷积操作,然后形成右边的图像,右边的图像就是A+B的图像点。所谓的核就是指任意的形状或者大小,在多数情况下,核是一个小的中间带的正方形或者圆形。
膨胀本质上就是把图像与核进行卷积操作,然后计算出卷积区域的最大点,并把最大的值赋值给指定的像素(如上图)。操作完成之后,图像就会更加明亮(如下图)。
这是膨胀前和膨胀后图像的对比。从这张图我们可以看出来,右边经过dilate膨胀操作后整个图像更加的明亮和粗糙。
二.膨胀的API讲解:
1.dilate的API
在OPENCV中,有一个专门的API去处理图像的膨胀,这个API就是dilate
void dilate( InputArray src, OutputArray dst, InputArray kernel,Point anchor, int iterations, int borderType, const Scalar& borderValue )
第一个参数:src的类型是InputArray,它指的是输入图像,它可以是Mat类的数据。图像的通道数可以是任意数,但是图像的深度一般是CV_8U,CV_16U,CV_16S,CV_32F,CV_64F
第二个参数:dst的类型是OutputArray,它指的是目标图像,值得注意的是输出图像的尺寸、类型要和输入图像是一致的。
第三个参数:InputArray类型的kernel,膨胀操作的核。当这个值为NULL的时候,表示使用的核参考点默认是3*3。这个参数通常会配合getStructingElement参数的使用(这个参数的使用,下面我会详细说到)。
第四个参数:Point类型的anchor,描点的位置,默认是(-1,-1),表示中心位置。
第五个参数:int类型的迭代次数,默认是1
第六个参数:int类型的borderType,这个类型用于推断图像外部的边界模式,用的最多的是BORDER_DEFAULT
下面是常用的几种边框模式(这几种相对比较常用,其他的用的很少)
1.BORDER_CONSTANT:用指定的像素填充边框
2.BORDER_REPLICATE:用已知的边缘像素来填充边框
3.BORDER_WRAP:用另一边的像素来补偿填充
4.BORDER_DEFAULT:默认模式画边框
5.BORDER_TRANSPANT: 用透明的方式画框
第七个参数:const Scalar类型的borderType,一般不用填写,因为这个API已经有了默认值morphologyDefaultBorderValue()
2. getStructingElement的API
该函数的作用是返回一个卷积层
CV_EXPORTS_W Mat getStructuringElement(int shape, Size ksize, Point anchor = Point(-1,-1));
第一个参数:表示内核的形状,这里包括了:
1.矩形(MORPH_RECT)
2.交叉形(MORPH_CROSS)
3.椭圆形(MORPH_ELLIPSE)
常用的内核形状是矩形
第二个参数:内核的尺寸
第三个参数:锚点的位置,默认值Point(-1,-1),表示的是位于中心点