当前位置: 首页 > news >正文

OpenCV CUDA模块设备层-----在GPU 上高效地执行两个 uint 类型值的最大值比较函数vmax2()

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

OpenCV 的 CUDA 模块(cudev) 中的一个设备端内联函数,用于在 GPU 上高效地执行两个 uint 类型值的最大值比较。
该函数返回两个无符号整数 a 和 b 中的较大值:

return (a > b) ? a : b;

函数原型

__device__ __forceinline__ uint cv::cudev::vmax2 	( 	uint  	a,uint  	b ) 		

参数

  • a uint 第一个无符号整数(通常表示像素值)
  • b uint 第二个无符号整数(另一个像素值或参考值)

返回值

返回 a 和 b 中较大的那个值,类型为 uint。

使用场景

这个函数常用于以下图像/视频处理任务中:

  • 图像增强(如取最大邻域值)
  • 多帧合成中的最大值投影(如天文摄影、医学成像)
  • 构建自定义滤波器(如最大值滤波)
  • GPU 并行像素级比较与选择操作

代码


#include <opencv2/cudev.hpp>
#include <opencv2/cudev/util/simd_functions.hpp>using namespace cv::cudev;// CUDA kernel
template <typename T>
__global__ void computeMaxKernel(const PtrStep<T> src1,const PtrStep<T> src2,PtrStep<T> dst,int width,int height)
{int x = blockIdx.x * blockDim.x + threadIdx.x;int y = blockIdx.y * blockDim.y + threadIdx.y;if (x < width && y < height) {uint a = static_cast<uint>(src1(y, x));uint b = static_cast<uint>(src2(y, x));dst(y, x) = static_cast<T>(vmax2(a, b));  // 取最大值}
}int main() {// 加载两张图像cv::Mat h_src1 = cv::imread("/media/dingxin/data/study/OpenCV/sources/images/img0.jpg", cv::IMREAD_GRAYSCALE);cv::Mat h_src2 = cv::imread("/media/dingxin/data/study/OpenCV/sources/images/img1.jpg", cv::IMREAD_GRAYSCALE);if (h_src1.empty() || h_src2.empty()) {std::cerr << "Failed to load images!" << std::endl;return -1;}// 上传到 GPUcv::cuda::GpuMat d_src1, d_src2, d_max;d_src1.upload(h_src1);d_src2.upload(h_src2);d_max.create(h_src1.size(), h_src1.type());// 设置 kernel 参数dim3 block(16, 16);dim3 grid((d_src1.cols + block.x - 1) / block.x,(d_src1.rows + block.y - 1) / block.y);// 启动 kernel(显式指定模板参数 uchar)computeMaxKernel<uchar><<<grid, block>>>(d_src1, d_src2, d_max, d_src1.cols, d_src1.rows);// 下载结果并显示cv::Mat h_max;d_max.download(h_max);cv::imshow("Max Image", h_max);cv::waitKey(0);return 0;
}

运行结果

在这里插入图片描述

http://www.dtcms.com/a/265461.html

相关文章:

  • Frida:配置自动补全 in VSCode
  • 搭建VirtualBox-6+vagrant_2+docker+mysql5.7的步骤
  • 客户案例 | 某新能源车企依托Atlassian工具链+龙智定制开发服务,打造符合ASPICE标准的研发管理体系
  • 云原生系统DOCKER中容器系统搭建
  • Python字符与ASCII转换方法
  • Ubuntu Gnome 安装和卸载 WhiteSur-gtk-theme 类 Mac 主题的正确方法
  • vue2+elementui使用compressorjs压缩上传的图片
  • Euler2203安装.NetCore6.0环境操作步骤
  • python安装虚拟环境
  • Python 物联网(IoT)与边缘计算开发实战(1)
  • 优雅草蜻蜓R实时音视频会议系统云原生私有化部署方案深度解析-优雅草卓伊凡|贝贝|clam|麻子|夜辰
  • Docker 容器资源限制
  • 9.Docker的容器数据卷使用(挂载)
  • ATE FT ChangeKit学习总结-20250630
  • 网络的封包与拆包
  • 基于Java的企业项目管理与协作系统设计与实现
  • Dataset Distillation by Matching Training Trajectories(2203.11932)
  • Eclipse主题拓展
  • mysql索引的底层原理是什么?如何回答?
  • Go语言的sync.Once和sync.Cond
  • Redis 源码 tar 包安装 Redis 哨兵模式(Sentinel)
  • Go调度器的抢占机制:从协作式到异步抢占的演进之路|Go语言进阶(7)
  • 价值实证:数字化转型标杆案例深度解析
  • 网络地址与子网划分:一次性搞清 CIDR、VLSM 和子网掩码
  • 分类树查询性能优化:从 2 秒到 0.1 秒的技术蜕变之路
  • 如何在 IDEA 中设置类路径
  • 探索具身智能新高度——机器人在数据收集与学习策略中的优势和机会
  • Objective-C UI事件处理全解析
  • c++中的绑定器
  • 如何使用AI改进论文写作 ---- 引言篇(2)