当前位置: 首页 > news >正文

C++——调用OpenCV和NVIDIA Video Codec SDK库实现使用GPU硬解码MP4视频文件

系列文章目录

参考博客
参考博客
参考博客


文章目录

  • 系列文章目录
  • 前言
  • 一、下载安装NVIDIA Video Codec SDK
    • 1、下载NVIDIA Video Codec SDK
    • 2、安装NVIDIA Video Codec SDK
  • 二、下载编译安装OpenCV
    • 1、下载OpenCV
    • 2、编译安装OpenCV
    • 3、配置环境变量
    • 4、报错解决
      • 报错一:
  • 三、测试代码
    • 1、测试一
    • 2、测试二
    • 3、makefile文件参考


前言

NVIDIA Video Codec SDK‌是一个用于视频编码和解码的开发工具包,它允许开发人员利用NVIDIA GPU的硬件加速功能来处理视频流。该SDK提供了一套全面的API集,支持在Windows和Linux平台上进行硬件加速视频编码和解码‌。

功能和特性:

‌硬件加速‌:NVIDIA Video Codec SDK包含基于硬件的视频编码器和解码器,这些组件独立于CUDA核心,能够提供全加速的视频编码和解码功能。这不仅可以提高处理速度,还能减少CPU和计算引擎的负担,使得它们可以执行其他操作‌。

‌支持的编解码器‌:该SDK支持多种编解码器,包括H.264、HEVC(H.265)和AV1。其中,HEVC支持最高8K的编码,而AV1编码则提供了超高质量(UHQ)模式,进一步提升了编码质量‌。

‌性能优化‌:SDK中的NVENC和NVDEC引擎支持比实时更快的视频处理速度,适用于视频转码、视频数据压缩/解压缩、游戏直播、虚拟桌面、云游戏等多种应用。此外,最新的GPU架构如Blackwell进一步增强了NVENC和NVDEC的性能和质量‌。

NVIDIA Video Codec SDK广泛应用于多种场景,包括:

‌视频转码‌:快速转换视频格式和分辨率。

‌视频直播‌:在直播平台上实现高效的视频编码和解码。

‌游戏和虚拟现实‌:优化游戏和虚拟现实应用的视频处理。

‌安全视频播放‌:在安全监控和视频会议中提供高质量的视频处理。

通过使用NVIDIA Video Codec SDK,开发人员可以充分利用NVIDIA GPU的硬件加速功能,提高视频处理效率和质量,满足各种应用的需求。
在这里插入图片描述


一、下载安装NVIDIA Video Codec SDK

1、下载NVIDIA Video Codec SDK

NVIDIA Video Codec SDK下载路径

NVIDIA Video Codec SDK库的不同版本需要严格对应当前使用的NVIDIA驱动版本和CUDA版本。

如果你的NVIDIA驱动和CUDA版本很新,可以下载最新版本的NVIDIA Video Codec SDK库。
在这里插入图片描述
下载得到Video_Codec_SDK_xxx.zip的压缩包,解压后的目录有Read_Me.pdf文档,文档中有该版本SDK对驱动与CUDA最低版本的要求,从而检查这个NVIDIA Video Codec SDK库是否符合你的要求。
在这里插入图片描述

如果你的NVIDIA驱动和CUDA是旧版本,可以下载旧版的NVIDIA Video Codec SDK库。

在这里插入图片描述
在这里插入图片描述
下载得到Video_Codec_SDK_xxx.zip的压缩包,解压后的目录有Read_Me.pdf文档,文档中有该版本SDK对驱动与CUDA最低版本的要求,从而检查这个NVIDIA Video Codec SDK库是否符合你的要求。

在这里插入图片描述
如果驱动版本或者CUDA不满足要求,可更新版本或者下载更低版本的nvidia-video-codec-sdk。

2、安装NVIDIA Video Codec SDK

安装nvidia-video-codec-sdk,其实在GPU驱动安装过程中,已经将nvidai-video-codec-sdk的库文件进行了安装,一般安装在/usr/lib/x86_64-linux-gnu/目录下,存在libnvcuvid.so、libnvidia-encode.so等库文件。在这里插入图片描述

将头文件拷贝至cuda头文件目录下:

cp Video_Codec_SDK_xxx/Interface/* /usr/local/cuda/include/

注意:上述只用了nvidia-video-codec-sdk中的头文件,而没有使用nvidia-video-codec-sdk中的libnvcuvid.so、libnvidia-encode.so库,原因是在安装显卡驱动的时候会默认安装与驱动版本兼容的libnvcuvid.so、libnvidia-encode.so,而nvidia-video-codec-sdk中的库很可能与我们安装的显卡驱动版本不一致,如果使用了nvidia-video-codec-sdk中的libnvcuvid.so、ibnvidia-encode.so编译的时候,可能不会有问题,但是运行时很可能会因为与驱动版本不兼容而报错,因此不需要将nvidia-video-codec-sdk中的libnvcuvid.so、ibnvidia-encode.so库复制到cuda库中,在配置opencv时会另外把这些库编译进去的。这个可谓是Nvidia的天坑,一定要注意。


二、下载编译安装OpenCV

1、下载OpenCV

如果是首次下载编译安装opencv库,大部分可以参考以下博客链接,但是有小部分需要修改:

下载编译安装OpenCV参考博客

注意,与以上参考博客不同的是,在cmake-gui编译阶段,需要增加一些对应的CUDA选项以正确启用CUDA支持。​​

如果已经有下载编译安装好的opencv库,也不需要删除重新安装,只需要重复cmake-gui编译,补上CUDA选项以正确启用CUDA支持,重新安装即可。

2、编译安装OpenCV

打开cmake-gui可视化界面。

如果之前没有安装过就根据以上参考博客完成基础配置,再增加CUDA配置即可。

如果已经安装过,那么cmake-gui应该会有你之前的配置记录,直接增加CUDA配置即可。
在这里插入图片描述

# 需要增加的CUDA配置-D ENABLE_FAST_MATH=1 \-D CUDA_FAST_MATH=1 \-D WITH_CUDA=ON \-D WITH_CUDNN=ON \-D WITH_CUDEV=ON \-D WITH_NVCUVID=ON \-D CUDA_ARCH_BIN=3.0;3.5;3.7;5.0;5.2;6.0;6.1;7.0;7.5 \

然后点击configure按键,如果没有错误那就继续,有就参考下面的报错解决。

在这里插入图片描述

最后点击Generate按键,写入build文件夹生成配置文件。

在build目录下打开终端,输入:

make -j4

编译成功之后,再输入:

sudo make install

3、配置环境变量

终端打开

sudo gedit  ~/.bashrc

文件底部写入

export PKG_CONFIG_PATH=/usr/local/opencv/opencv.xxx/lib/pkgconfig
export LD_LIBRARY_PATH=/usr/local/opencv/opencv.xxx/lib 

使配置文件生效

source ~/.bashrc

如果想使用之前的版本,在~/.bashrc中注释掉增加的内容,然后source ~/.bashrc即可。

查询OpenCV版本

pkg-config --modversion opencv
pkg-config --modversion opencv4

4、报错解决

报错一:

error: (-213:The function/feature is not implemented) The called functionality is disabled for current build or platform in function 'throw_no_cuda'

可能是OpenCV编译时未正确启用CUDA支持​​,或运行时环境配置不完整。需要注意cmake-gui阶段是否配置正确,比如WITH_NVCUVID=ON是否打开等。


三、测试代码

1、测试一

测试opencv GPU解码和CPU解码

#include <iostream>
#include <string>
#include <opencv2/opencv.hpp>
#include <opencv2/core/cuda.hpp>
#include <opencv2/cudacodec.hpp>
#include <chrono>int gpu_test() 
{cv::cuda::printCudaDeviceInfo(cv::cuda::getDevice());int count = cv::cuda::getCudaEnabledDeviceCount();printf("GPU Device Count : %d \n", count);const std::string filename = "/xxx.mp4";cv::Ptr<cv::cudacodec::VideoReader> reader = cv::cudacodec::createVideoReader(filename);cv::cuda::GpuMat gpu_frame;int frame_id = 0;std::chrono::steady_clock::time_point start = std::chrono::steady_clock::now();while (reader->nextFrame(gpu_frame)) {frame_id = frame_id + 1;}std::chrono::steady_clock::time_point end = std::chrono::steady_clock::now();std::chrono::duration<double> time_useds = std::chrono::duration_cast<std::chrono::duration<double>>(end - start);double time_ms = time_useds.count() * 1000.0f;double fps = double(frame_id) / time_ms * 1000.0f;printf("GPU test took time: %f ms, frames: %d , FPS: %f\n", time_ms, frame_id, fps);reader.release();return 0;
}int cpu_test()
{const std::string filename = "/xxx.mp4";cv::VideoCapture capture;capture.open(filename);if (!capture.isOpened()){printf("Open video failed !!! \n");return -1;}int width = (int)capture.get(cv::CAP_PROP_FRAME_WIDTH);int height = (int)capture.get(cv::CAP_PROP_FRAME_HEIGHT);printf("src video width: %d , %d \n", width, height);cv::Mat frame;int frame_id = 0;std::chrono::steady_clock::time_point start = std::chrono::steady_clock::now();while (capture.read(frame)){frame_id = frame_id + 1;}std::chrono::steady_clock::time_point end = std::chrono::steady_clock::now();std::chrono::duration<double> time_useds = std::chrono::duration_cast<std::chrono::duration<double>>(end - start);double time_ms = time_useds.count() * 1000.0f;double fps = double(frame_id) / time_ms * 1000.0f;printf("CPU test took time: %f ms, frames: %d , FPS: %f\n", time_ms, frame_id, fps);capture.release();return 0;
}int main(int argc, char const *argv[])
{gpu_test();cpu_test();return 0;
}

在这里插入图片描述

2、测试二

测试GPU解码与图片显示

#include <iostream>
#include <string>
#include <opencv2/opencv.hpp>
#include <opencv2/core/cuda.hpp>
#include <opencv2/cudacodec.hpp>int main() {// MP4文件路径std::string video_path = "/xxx.mp4";try {// 创建GPU解码器cv::Ptr<cv::cudacodec::VideoReader> d_reader = cv::cudacodec::createVideoReader(video_path);// 初始化一个GpuMat对象用于检查视频是否可读cv::cuda::GpuMat d_frame;if (!d_reader->nextFrame(d_frame)) {std::cerr << "无法打开视频文件或视频文件为空: " << video_path << std::endl;return -1;}// 获取视频信息cv::cudacodec::FormatInfo format_info = d_reader->format();std::cout << "视频宽度: " << format_info.width << std::endl;std::cout << "视频高度: " << format_info.height << std::endl;// 获取帧率需要使用VideoCapturecv::VideoCapture cap(video_path);double fps = cap.get(cv::CAP_PROP_FPS);std::cout << "帧率: " << fps << std::endl;// 获取总帧数double total_frames = cap.get(cv::CAP_PROP_FRAME_COUNT);std::cout << "总帧数: " << total_frames << std::endl;cap.release();// 创建窗口cv::namedWindow("GPU解码视频", cv::WINDOW_NORMAL);// 解码循环int frame_count = 0;while (true) {// 读取下一帧到GPU内存if (!d_reader->nextFrame(d_frame)) {std::cout << "视频结束或解码完成" << std::endl;break;}frame_count++;std::cout << "解码帧: " << frame_count << std::endl;// 如果需要CPU处理,将帧从GPU下载到CPUcv::Mat frame;d_frame.download(frame);// 显示帧cv::imshow("GPU解码视频", frame);// 按ESC退出if (cv::waitKey(1) == 27) {break;}}// 关闭窗口cv::destroyAllWindows();} catch (const cv::Exception& e) {std::cerr << "OpenCV异常: " << e.what() << std::endl;return -1;} catch (const std::exception& e) {std::cerr << "标准异常: " << e.what() << std::endl;return -1;} catch (...) {std::cerr << "未知异常" << std::endl;return -1;}return 0;
}

在这里插入图片描述

3、makefile文件参考

# 定义编译器
CXX=g++# 定义编译选项
CXXFLAGS=-std=c++11 -Wall -I/usr/local/opencv/opencv4.4/include/opencv4# 定义链接器选项
# 添加了cudacodec、cudaarithm、cudafilters等CUDA相关库
LDFLAGS=-L/usr/local/opencv/opencv4.4/lib \-lopencv_core -lopencv_imgproc -lopencv_imgcodecs \-lopencv_highgui -lopencv_videoio \-lopencv_cudacodec -lopencv_cudaarithm -lopencv_cudafilters \-lopencv_cudaimgproc -lopencv_cudawarping \-L/usr/local/cuda/lib64 \-lnvcuvid -lnvidia-encode -lcudart# 定义目标文件名
TARGET=main# 定义源文件
SRCS=$(wildcard opencv_gpu_decode.cpp)# 定义对象文件
OBJS=$(SRCS:.cpp=.o)# 默认目标
all: $(TARGET)# 链接对象文件生成目标文件
$(TARGET): $(OBJS)$(CXX) -o $@ $^ $(LDFLAGS)# 编译源文件生成对象文件
%.o: %.cpp$(CXX) $(CXXFLAGS) -c $< -o $@# 清理编译生成的文件
clean:rm -f $(OBJS) $(TARGET)

相关文章:

  • Go 1.25为什么要废除核心类型
  • 后验概率最大化(MAP)估计算法原理以及相具体的应用实例附C++代码示例
  • 设计模式 | 详解常用设计模式(六大设计原则,单例模式,工厂模式,建造者模式,代理模式)
  • 最新的30个Android Kotlin面试题
  • Python程序开发,麒麟系统模拟电脑打开文件实现
  • <c++>使用detectMultiScale的时候出现opencv.dll冲突
  • EtherCAT 分布式时钟(DC)补偿技术解析
  • 【今日半导体行业分析】2025年4月29日
  • Missashe考研日记-day30
  • 1.3 点云数据获取方式——ToF相机
  • windows如何使用cmd命令翻转屏幕
  • 高可用、高并发、高性能架构设计深度解析
  • 数据编辑器中变量的精妙计算与灵动转换​
  • 如何在 Android 上恢复已删除的照片?:简短指南
  • python3语言基础语法整理
  • 第四节:权限管理
  • verdi使用tcl脚本批量添加波形
  • 基于STM32的中点圆算法,画空心圆的函数
  • 【数据结构】图论存储结构深度解析:邻接多重表如何实现无向图O(1)删边?邻接矩阵/链表/十字链对比
  • 【Prometheus-Mongodb Exporter安装配置指南,开机自启】
  • 解放日报社论:只争朝夕、不负重托,加快建成具有全球影响力的科技创新高地
  • 五大国有银行明确将撤销监事会
  • 民生访谈|规范放生活动、提升供水品质……上海将有这些举措
  • 对谈|李钧鹏、周忆粟:安德鲁·阿伯特过程社会学的魅力
  • 港理大公布多项AI+医工成果,助港建设国际医疗创新枢纽
  • 大家聊中国式现代化|陶希东:打造高水平安全韧性城市,给群众看得见的安全感