当前位置: 首页 > news >正文

OpenCV CUDA模块中矩阵操作------降维操作

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

cv::cuda::reduce 函数用于对 GPU 上的矩阵沿某个维度进行降维操作,例如求和、取最大值等。此函数支持多种降维操作,并允许指定输出数据类型以及使用 CUDA 流进行异步处理。

函数原型

void cv::cuda::reduce
(InputArray mtx,      // 输入矩阵OutputArray vec,     // 输出向量int dim,             // 降维维度:0表示按列,1表示按行int reduceOp,        // 降维操作类型(如SUM, AVG, MAX, MIN)int dtype = -1,      // 输出数组的数据类型,默认为输入相同类型Stream &stream = Stream::Null() // 可选 CUDA 流
);

参数

  • mtx: 输入 GPU 矩阵。

  • vec: 输出 GPU 向量。

  • dim: 指定沿哪个维度进行降维:

    • 0: 按列降维(结果为行向量)。
    • 1: 按行降维(结果为列向量)。
  • reduceOp: 降维操作类型:

    • REDUCE_SUM: 求和。
    • REDUCE_AVG: 平均值。
    • REDUCE_MAX: 最大值。
    • REDUCE_MIN: 最小值。
  • dtype: 输出数组的数据类型。默认为与输入相同类型。

  • stream: 可选 CUDA 流对象,用于异步执行。

代码示例

#include <iostream>
#include <opencv2/cudaarithm.hpp>
#include <opencv2/opencv.hpp>int main()
{// 创建一个测试矩阵cv::Mat h_mat = ( cv::Mat_< float >( 3, 3 ) << 1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f, 9.0f );// 上传到 GPUcv::cuda::GpuMat d_mat;d_mat.upload( h_mat );// 存储降维结果的 GpuMatcv::cuda::GpuMat d_vec;// 创建 CUDA 流cv::cuda::Stream stream;// 沿列方向(dim=0)进行 SUM 操作cv::cuda::reduce( d_mat, d_vec, 0, cv::REDUCE_SUM, -1, stream );stream.waitForCompletion();// 下载结果并显示cv::Mat host_vec_sum_col;d_vec.download( host_vec_sum_col );std::cout << "Sum along columns: \n" << host_vec_sum_col << std::endl;// 沿行方向(dim=1)进行 AVG 操作cv::cuda::reduce( d_mat, d_vec, 1, cv::REDUCE_AVG, -1, stream );stream.waitForCompletion();// 下载结果并显示cv::Mat host_vec_avg_row;d_vec.download( host_vec_avg_row );std::cout << "Average along rows: \n" << host_vec_avg_row << std::endl;return 0;
}

运行结果

Sum along columns: 
[12, 15, 18]
Average along rows: 
[2;5;8]
http://www.dtcms.com/a/194225.html

相关文章:

  • 22、能源监控与优化 - 数据中心模拟 - /能源管理组件/data-center-energy-monitoring
  • OCCT知识笔记之OCAF框架详解
  • CVE-2017-8046 漏洞深度分析
  • 【学习笔记】机器学习(Machine Learning) | 第七章|神经网络(1)
  • C语言水仙花数
  • 多通道电源管理芯片在分布式能源系统中的优化策略
  • 敏捷-第二章 敏捷宣言与原则
  • AI神经网络降噪算法在语音通话产品中的应用优势与前景分析
  • 我用 Appuploader绕过 Mac,成功把 iOS 应用上线了 App Store
  • 兰亭妙微设计:为生命科技赋予人性化的交互语言
  • duxapp 2025-03-29 更新 编译结束的复制逻辑等
  • 机器学习模型(4/4课时):超参数
  • Zephyr OS Nordic芯片的Flash 操作
  • idea启用lombok
  • 罗杰斯高频板技术解析:低损耗基材如何定义 5G 通信未来
  • Java 后端给前端传Long值,精度丢失的问题与解决
  • Java—— Stream流
  • 前端批量下载文件打包为zip
  • 机器学习知识自然语言处理入门
  • 基于PXIE 总线架构的Kintex UltraScale 系列FPGA 高性能数据预处理板卡
  • 黑马k8s(九)
  • 链表的中间结点数据结构oj题(力扣876)
  • 容器化-k8s-介绍及下载安装教程
  • python的家教课程管理系统
  • 等离子模块【杀菌消毒】
  • MIPI接口设计
  • 【Linux】ssh命令 – 安全的远程连接服务
  • Vue3项目,子组件默认加载了两次,使用 defineAsyncComponent 引入组件后只加载一次
  • InfluxDB 2.7 连续查询实战指南:Task 替代方案详解
  • 几个正整数常用的位运算操作