当前位置：首页 > news >正文

OPENCV形态学基础之一膨胀

news 2025/8/24 9:07:40

一.膨胀的原理

数学表达式：dst(x,y) = dilate(src(x,y)) = max(x,y)src(x+x,y+y)

膨胀是图像形态学的基本功能之一，膨胀顾名思义就是求图像的局部最大值操作，它的数学表达式是dst(x,y) = dilate(src(x,y)) = max(x,y)src(x+x,y+y)。

从数学的角度来看，无论是膨胀还是腐蚀实际上就是把图像跟核进行卷积(卷积：是通过两个函数f和g生成第三个函数的一种数学运算，它的本质就是微积分的转换，积分转换的数学公式

(f * g)(t) =∫f(τ)g(t -τ)dτ )，如上图：图像A和形状B进行卷积操作，然后形成右边的图像，右边的图像就是A+B的图像点。所谓的核就是指任意的形状或者大小，在多数情况下，核是一个小的中间带的正方形或者圆形。

膨胀本质上就是把图像与核进行卷积操作，然后计算出卷积区域的最大点，并把最大的值赋值给指定的像素(如上图)。操作完成之后，图像就会更加明亮(如下图)。

这是膨胀前和膨胀后图像的对比。从这张图我们可以看出来，右边经过dilate膨胀操作后整个图像更加的明亮和粗糙。

二.膨胀的API讲解：

1.dilate的API

在OPENCV中，有一个专门的API去处理图像的膨胀，这个API就是dilate

void dilate( InputArray src, OutputArray dst, InputArray kernel,Point anchor, int iterations, int borderType, const Scalar& borderValue )

第一个参数：src的类型是InputArray，它指的是输入图像，它可以是Mat类的数据。图像的通道数可以是任意数，但是图像的深度一般是CV_8U，CV_16U，CV_16S，CV_32F，CV_64F

第二个参数：dst的类型是OutputArray，它指的是目标图像，值得注意的是输出图像的尺寸、类型要和输入图像是一致的。

第三个参数：InputArray类型的kernel，膨胀操作的核。当这个值为NULL的时候，表示使用的核参考点默认是3*3。这个参数通常会配合getStructingElement参数的使用(这个参数的使用，下面我会详细说到)。

第四个参数：Point类型的anchor，描点的位置，默认是(-1,-1)，表示中心位置。

第五个参数：int类型的迭代次数，默认是1

第六个参数：int类型的borderType，这个类型用于推断图像外部的边界模式，用的最多的是BORDER_DEFAULT

下面是常用的几种边框模式(这几种相对比较常用，其他的用的很少)

1.BORDER_CONSTANT：用指定的像素填充边框

2.BORDER_REPLICATE：用已知的边缘像素来填充边框

3.BORDER_WRAP：用另一边的像素来补偿填充

4.BORDER_DEFAULT：默认模式画边框

5.BORDER_TRANSPANT: 用透明的方式画框

第七个参数：const Scalar类型的borderType，一般不用填写，因为这个API已经有了默认值morphologyDefaultBorderValue()

2. getStructingElement的API

该函数的作用是返回一个卷积层

CV_EXPORTS_W Mat getStructuringElement(int shape, Size ksize, Point anchor = Point(-1,-1));

第一个参数：表示内核的形状，这里包括了：

1.矩形(MORPH_RECT)

2.交叉形(MORPH_CROSS)

3.椭圆形(MORPH_ELLIPSE)

常用的内核形状是矩形

第二个参数：内核的尺寸

第三个参数：锚点的位置，默认值Point(-1,-1)，表示的是位于中心点

查看全文

http://www.dtcms.com/a/238292.html

mac：大模型系列测试

STM32 低功耗设计全攻略：PWR 模块原理 + 睡眠 / 停止 / 待机模式实战（串口 + 红外 + RTC 应用全解析）

飞算 JavaAI 2.0.0：开启老项目迭代维护新时代

SpringBoot自定义EndPoint实现线程池动态管理

【C++系列】模板类型特例化

Kotlin REPL初探

多线程语音识别工具

【版本控制】Git 和 GitHub 入门教程

历史数据分析——辽港股份

Linux--vsFTP配置篇

Python 接口：从协议到抽象基类（Tombola子类的测试方法）

Razor编程中@Helper的用法大全

VSCode内网安装插件

【原创】基于视觉模型+FFmpeg+MoviePy实现短视频自动化二次编辑+多赛道

stm32-c8t6实现语音识别（LD3320）

【论文阅读29】区间预测CIPM(2025)

读红蓝攻防：技术与策略15手机攻击

华为OD机试-正整数到Excel编号之间的转换-逻辑分析（Java 2025 A卷 100分）

STM32[笔记]--1.前置准备

DQN算法（详细注释版）

实验三：VGA显示实验

《从零掌握MIPI CSI-2: 协议精解与FPGA摄像头开发实战》-- CSI-2 协议详细解析 (三）数据格式

JDK8新特性之Lambda表达式

《Windows 10下QT+OpenCV+Yolo11：AI视觉开发实战指南》

【AS32系列MCU调试教程】深度解析：使用 Eclipse 调试AS32系列MCU芯片的工程搭建

虚拟机时间同步

【MySQL系列】MySQL 导出表数据到文件

消除垃圾技术文档的思维探索

leetcode 10. 正则表达式匹配

gitcode与github加速计划

一.膨胀的原理

二.膨胀的API讲解：

1.dilate的API

2. getStructingElement的API

相关文章：