当前位置: 首页 > news >正文

RV1126 NO.42:OPENCV形态学基础之一:膨胀

一.膨胀的原理:

                      数学表达式:dst(x,y) = dilate(src(x,y)) = max(x,y)src(x+x,y+y)

图像膨胀是形态学处理的一项基本操作,其核心原理是求取图像的局部最大值。数学表达式可以表示为:dst(x,y) = dilate(src(x,y)) = max(x,y)src(x+x,y+y)。

从数学本质来看,膨胀和腐蚀都是图像与核的卷积运算。卷积是一种通过两个函数生成第三个函数的数学运算,其积分形式为(f * g)(t) =∫f(τ)g(t -τ)dτ。如图1所示,图像A与结构元素B进行卷积运算后,形成了右侧的A⊕B结果图像。

这里提到的"核"可以是任意形状和大小的结构元素,通常采用中心对称的正方形或圆形。膨胀运算的具体过程是:图像与核进行卷积后,计算卷积区域的最大值,并将该最大值赋给指定像素(如图1所示)。经过此处理后,图像整体会变得更加明亮,如图2所示。

                                                  

               (图一)                                                                                                        (图二)

图2就是膨胀前和膨胀后图像的对比。从这张图我们可以看出来,右边经过dilate膨胀操作后整个图像更加的明亮和粗糙。

二.膨胀的API讲解:

2.1.dilate的API

在OPENCV中,有一个专门的API去处理图像的膨胀,这个API就是dilate

void dilate( InputArray src, OutputArray dst, InputArray kernel, Point anchor, int iterations, int borderType, const Scalar& borderValue )

第一个参数:src的类型是InputArray,它指的是输入图像,它可以是Mat类的数据。图像的通道数可以是任意数,但是图像的深度一般是CV_8U,CV_16U,CV_16S,CV_32F,CV_64F

第二个参数:dst的类型是OutputArray,它指的是目标图像,值得注意的是输出图像的尺寸、类型要和输入图像是一致的。

第三个参数:InputArray类型的kernel,膨胀操作的核。当这个值为NULL的时候,表示使用的核参考点默认是3*3。这个参数通常会配合getStructingElement参数的使用(这个参数的使用,下面我会详细说到)

第四个参数:Point类型的anchor,描点的位置,默认是(-1,-1),表示中心位置。

第五个参数:int类型的迭代次数,默认是1

第六个参数:int类型的borderType,这个类型用于推断图像外部的边界模式,用的最多的是BORDER_DEFAULT

enum BorderTypes {BORDER_CONSTANT    = 0, //!< `iiiiii|abcdefgh|iiiiiii`  with some specified `i`BORDER_REPLICATE   = 1, //!< `aaaaaa|abcdefgh|hhhhhhh`BORDER_REFLECT     = 2, //!< `fedcba|abcdefgh|hgfedcb`BORDER_WRAP        = 3, //!< `cdefgh|abcdefgh|abcdefg`BORDER_REFLECT_101 = 4, //!< `gfedcb|abcdefgh|gfedcba`BORDER_TRANSPARENT = 5, //!< `uvwxyz|abcdefgh|ijklmno`BORDER_REFLECT101  = BORDER_REFLECT_101, //!< same as BORDER_REFLECT_101BORDER_DEFAULT     = BORDER_REFLECT_101, //!< same as BORDER_REFLECT_101BORDER_ISOLATED    = 16 //!< do not look outside of ROI
};

下面是常用的几种边框模式(这几种相对比较常用,其他的用的很少)

BORDER_CONSTANT:用指定的像素填充边框

BORDER_REPLICATE:用已知的边缘像素来填充边框

BORDER_WRAP:用另一边的像素来补偿填充

BORDER_DEFAULT:默认模式画边框

BORDER_TRANSPANT: 用透明的方式画框

第七个参数:const Scalar类型的borderType,一般不用填写,因为这个API已经有了默认值morphologyDefaultBorderValue()

2.2. getStructingElement的API

该函数的作用是返回一个卷积层,!!!该函数仅生成结构元素(核),不涉及图像数据,就是说这里并不是直接操作图像本身。

CV_EXPORTS_W Mat getStructuringElement(int shape, Size ksize, Point anchor = Point(-1,-1));

第一个参数:表示内核的形状,这里包括了:矩形(MORPH_RECT)、交叉形(MORPH_CROSS)、椭圆形(MORPH_ELLIPSE),常用的内核形状是矩形

第二个参数:内核的尺寸

第三个参数:锚点的位置,默认值Point(-1,-1),表示的是位于中心点

三.用OPENCV代码实现图像膨胀功能:

3.1. 用OPENCV实现膨胀功能的大体流程图

从上面的流程图我们可以看出来OPENCV实现膨胀功能需要有以下几步,分别是:imread读取图片、使用cvtColor对图片进行灰度操作、使用getStructingElement获取卷积层、使用dilate对图片进行膨胀、imwrite保存图片

3.2.代码分步流程

3.2.1. 读取我们需要处理的图片
    Mat testImage = imread("drink.png");if(testImage.empty()){printf("read testImage failed....\n");}

使用imread读取我们需要处理的图片

3.2.2. 获取卷积层
Mat vertical_structure = getStructuringElement(MORPH_RECT, Size(15,15));

使用getStructuringElement获取卷积层,参数设置内核的形状是MORPH_RECT、内核的长度是Size(15,15)

3.2.3. dilate对图片进行膨胀操作
dilate(testImage, testImage, vertical_structure);

获取完卷积层后,我们就对图片进行dilate膨胀,关于dilate的API上面已经详细说到了。最后用imwrite保存图片(这里就省略)

经过上述处理过后,我们来看看原图和处理后的图片效果:

左侧为原始图像,右侧展示的是经过膨胀处理后的效果图。对比可见,经过膨胀处理的图像亮度显著提升且纹理更加粗糙。这是由于膨胀操作本质上是将原始图像与卷积核进行叠加运算,导致图像整体像素值增大所致。

完整代码:
#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
#include <opencv2/imgcodecs.hpp>
#include <opencv2/imgproc.hpp>
#include <iostream>using namespace cv;
using namespace std;int main()
{Mat testImage = imread("drink.png");if(testImage.empty()){printf("read testImage failed....\n");}Mat vertical_structure = getStructuringElement(MORPH_RECT, Size(15,15));dilate(testImage, testImage, vertical_structure);imwrite("dilate_process.jpg", testImage);return 0;
}

http://www.dtcms.com/a/586050.html

相关文章:

  • 使用 Python 语言 从 0 到 1 搭建完整 Web UI自动化测试学习系列 24--数据驱动--参数化处理 Excel 文件 1
  • 如何使用ROS 2与STM32进行串口通信,并实现通过键盘按键‘1’来控制LED灯开关
  • jQuery 入门学习教程,从入门到精通, jQuery在HTML5中的应用(16)
  • Flutter TweenAnimationBuilder 使用指南
  • 快速网站搭建百度推广介绍
  • 婚纱摄影网站源码自己制作app的应用程序
  • 【经验分享】Spring Authorization Server 实现详解:构建企业级OAuth2认证中心(一)
  • 北京电脑培训网站备案号查询网站网址
  • 建可收费的网站一个网站策划需要多少钱
  • 吴恩达新课程:Agentic AI(笔记7)
  • 记录一次给Dell 10代cpu 重装系统遇到的BitLocker锁相关问题处理
  • Arbess CICD实践(2) - 使用Arbess+GitLab+PostIn实现Go项目构建/主机部署及接口自动化测试
  • 家具用品:撑起家的骨架与温度
  • 响应式网站建设的未来发展6滕州网站建设助企网络
  • 仿网站模板乐清网站制作公司招聘
  • .NET异步编程中内存泄漏的终极解决方案
  • 精读《JavaScript 高级程序设计 第4版》第14章 DOM(一)
  • Tr0ll 1 (VulnHub)做题笔记
  • 南宁建设银行官网招聘网站建设集团是做什么的
  • 【瑞芯微】【rk3128】【移植 qt 5.12.9】
  • 第十章 VLAN间通信
  • 苹果公司基于Transformer架构的蛋白质折叠开源模型SimpleFold-安装体验与比较
  • 网站制作的一般步骤中国建设人才网络学院
  • 长沙哪家做网站设计好网站设计制作的服务和质量
  • ENSP Pro Lab笔记:配置STP/RSTP/MSTP(5)
  • html5网站检测网站标签是什么
  • Java 内存模型(JMM)与 volatile、synchronized 可见性原理
  • 怎么开网站合肥做app公司
  • git本地分支创建
  • 操作系统(11)进程描述与控制--5种IO状态(1)