OpenCV的cv2.VideoCapture如何加GStreamer后端
1、OpenCV的后端是什么?
在 OpenCV 里,“后端”通常指Video I/O(VideoCapture
、VideoWriter
)或 GUI(HighGUI)真正依赖的底层实现,而不是说整个 OpenCV 库本身有一个统一的“后端”。换句话说,OpenCV 把“怎么读摄像头/视频文件/网络流”以及“怎么把图像显示到窗口”抽象成统一的 API,但底层到底用 FFmpeg、GStreamer、V4L2、DirectShow、MSMF、AVFoundation 还是 Qt、GTK、Win32,就由“后端”决定。
下面把常见“后端”按场景拆开说:
-
VideoCapture / VideoWriter 的后端
-
CAP_FFMPEG:用 FFmpeg 解码/编码,功能最全,跨平台。
-
CAP_GSTREAMER:用 GStreamer Pipeline,灵活、可接硬件编解码、网络流。
-
CAP_V4L2 / CAP_V4L:Linux 下直接访问摄像头或 V4L2 设备。
-
CAP_MSMF:Windows Media Foundation,Win10/11 默认。
-
CAP_DSHOW:老 Windows DirectShow。
-
CAP_AVFOUNDATION:macOS / iOS 的 AVFoundation。
-
CAP_OPENCV_MJPEG:内置 MJPEG 编解码,轻量但功能有限。
使用时通过cv::VideoCapture cap(0, cv::CAP_GSTREAMER);
或cv::VideoCapture cap("rtsp://...", cv::CAP_FFMPEG);
指定后端,也可以让 OpenCV 自动探测。
-
-
HighGUI(窗口、事件、OpenGL)的后端
-
GTK / GTK3 / GTK4:Linux 下默认,用 X11/Wayland。
-
Qt:跨平台,支持 OpenGL、高 DPI。
-
Win32:Windows 原生。
-
Cocoa:macOS 原生。
编译时通过 CMake 变量WITH_GTK
、WITH_QT
、WITH_WIN32UI
等打开/关闭。
-
-
深度神经网络推理后端(DNN 模块)
-
DNN_BACKEND_OPENCV:用 OpenCV 自带实现。
-
DNN_BACKEND_INFERENCE_ENGINE:Intel OpenVINO。
-
DNN_BACKEND_CUDA:用 cuDNN。
-
DNN_BACKEND_TIMVX / NPU / NNAPI:嵌入式芯片专用。
-
-
GPU 加速后端
-
CUDA:Nvidia GPU,需编译
opencv_contrib
里的 cuda 模块。 -
OpenCL:OpenCV 的 OCL 模块。
-
Vulkan:正在实验阶段。
-
OpenCV 的后端就是 OpenCV 在运行时真正调用的底层库/驱动/框架,决定了功能、性能、兼容性和可移植性。
OpenCV的cv2.VideoCapture
的“后端”(backend) 在底层实际调用哪个库或 API 来完成视频的采集、解码和读取。
不同操作系统、不同 OpenCV 版本编译时启用的选项不同,可用的后端也不同。选择正确的后端可以解决摄像头打不开、帧率过低、格式不支持、延迟高等问题。
2、Python如何查看OpenCV-python包支持的后端
import cv2
print(cv2.getBuildInformation())
得到的输出结果如下(内容过长有删减),OpenCV是4.12.0,是由发布方通过VS2022和CMake编译好的,重点看Video I/O这一块,可以看到多种后端,但是不支持Gtreamer后端。
General configuration for OpenCV 4.12.0 =====================================Version control: 4.12.0Platform:Timestamp: 2025-07-04T16:40:32ZHost: Windows 10.0.26100 AMD64CMake: 3.24.2CMake generator: Visual Studio 17 2022CMake build tool: C:/Program Files/Microsoft Visual Studio/2022/Enterprise/MSBuild/Current/Bin/amd64/MSBuild.exeMSVC: 1944Configuration: Debug ReleaseAlgorithm Hint: ALGO_HINT_ACCURATEVideo I/O:FFMPEG: YES (prebuilt binaries)avcodec: YES (58.134.100)avformat: YES (58.76.100)avutil: YES (56.70.100)swscale: YES (5.9.100)avresample: YES (4.0.0)GStreamer: NODirectShow: YESMedia Foundation: YESDXVA: YES
-----------------------------------------------------------------
在构造 VideoCapture
时,把后端枚举作为第二个参数传入,但并不是所有的后端都可以用,要看当前的Opencv-python包支持哪些后端。不支持的后端cv2.CAP_GSTREAMER
、cv2.CAP_V4L2
、cv2.CAP_INTEL_MFX
等枚举虽然存在,但调用会报错或退化为默认行为,因为编译时没把它们编进来。
import cv2# 常用枚举速查
# cv2.CAP_FFMPEG, cv2.CAP_GSTREAMER, cv2.CAP_V4L2, cv2.CAP_DSHOW,
# cv2.CAP_MSMF, cv2.CAP_AVFOUNDATION, cv2.CAP_OPENCV_MJPEG 等cap = cv2.VideoCapture(0, cv2.CAP_DSHOW) # 强制使用 DirectShow(Windows)
3、Python如何查看和修改OpenCV-python包默认的后端
cv2.VideoCapture
的默认后端是 cv2.CAP_ANY
,即 OpenCV 会根据编译配置自动选择第一个可用的后端。 在大多数官方预编译的 OpenCV 版本中(如通过 pip 安装的),默认通常是 FFmpeg (cv2.CAP_FFMPEG
)。
import cv2
cap = cv2.VideoCapture(0) # 0 表示默认摄像头
print(cap.getBackendName()) # 输出可能是 'MSMF'
输出的结果是MSMF,MSMF 是 Microsoft Media Foundation 的缩写,它是 Windows 平台上 OpenCV 的一个后端实现。这个返回值说明,当前系统使用的默认后端是 Media Foundation (cv2.CAP_MSMF
),而不是我之前提到的 FFmpeg。
在 Windows 系统 上,OpenCV 官方预编译的 Python 包(如通过 pip install opencv-python
安装的版本)默认启用了 MSMF 作为优先后端,特别是对于摄像头输入(VideoCapture(0)
)。这是因为:
- MSMF 是 Windows 原生的多媒体框架,兼容性更好,尤其适合摄像头。
- FFmpeg 虽然功能强大,但在 Windows 上处理摄像头时可能不如 MSMF 稳定。
import cv2
cap = cv2.VideoCapture(0) # 或视频文件路径
print(cap.getBackendName()) # 输出当前使用的后端名称
cap = cv2.VideoCapture(0, cv2.CAP_FFMPEG) # 强制 FFmpeg
print(cap.getBackendName()) # 输出当前使用的后端名称
这个会报错,是因为FFmpeg 后端在 Windows 官方预编译的 opencv-python
包里只支持文件/流输入,不支持本地摄像头(VideoCapture(0)
),对摄像头可用的后端只有:
cv2.CAP_MSMF
(默认)cv2.CAP_DSHOW
- (个别版本还有
cv2.CAP_VFW
、cv2.CAP_GSTREAMER
,但一般未启用)
import cv2
cap = cv2.VideoCapture(0) # 或视频文件路径
print(cap.getBackendName()) # 输出当前使用的后端名称
cap = cv2.VideoCapture(0, cv2.CAP_DSHOW) # 强制 DSHOW
print(cap.getBackendName()) # 输出当前使用的后端名称
4、Opencv为什么要加GStreamer后端?
OpenCV 把 GStreamer 做进 VideoCapture / VideoWriter
的后端,并不是为了“多一个选择”这么简单,而是因为它能在下面几个关键场景里把 FFmpeg、MSMF、V4L2 等“传统后端”做不到或做不好的事情一次性解决掉。
GStreamer 后端让 OpenCV 从“能打开视频”升级为“能把整条视频链路(采集→解码→加速→算法→编码→推流/存盘)用几行字符串就串起来”。在边缘计算、多路 RTSP、GPU 硬解/硬编、或需要跟厂商私有相机接口对接时,它比 FFmpeg/MSMF/V4L2 的组合更简洁、更高效、也更易维护。
5、OpenCV加GStreamer的方案对比?
表格的意思就是GStreamer要优于常规的后端,根据你的硬件是否有NVIDIA显卡,又会有CPU和GPU两种不同的方案,若没有NVIDIA GPU硬件:前两种方案(传统OpenCV 或 OpenCV + GStreamer CPU)是你的主要选择,或者考虑其他硬件平台的加速方案。至于第4种DeepStream方案:
- 原生 Windows 不支持 DeepStream(包括 OpenCV 与 DeepStream 的完整组合)。
- 想在 Windows 机器上用 DeepStream,只能用 WSL2(Windows Subsystem for Linux 2)方式。
- OpenCV 本身在 Windows 下当然能用,但“OpenCV+DeepStream”这套组合必须落在 Linux 环境——不管是裸机 Linux 还是 WSL2 里的 Linux。
6、FFMPEG和GStreamer都可以借助NVIDIA进行加速,如何选择?
OpenCV 的 cv2.VideoCapture
支持通过 FFmpeg 和 GStreamer 进行视频采集,两者都能利用 NVIDIA GPU 进行硬件加速。但选择哪一个,取决于你的使用场景、硬件平台、开发复杂度和性能需求。
7、OpenCV加GStreamer后端为什么要源码编译?
OpenCV 使用 GStreamer 后端时通常需要源码编译,主要原因如下:
- 官方预编译版本通常未启用 GStreamer 支持:官方提供的二进制版本(如
opencv-python
包)往往为了兼容性和体积考虑,不会默认启用 GStreamer 后端。 - 依赖项和版本差异:GStreamer 本身有多个版本(如 1.0 和旧版 0.10),且依赖系统安装的插件库(如
libgstreamer1.0-dev
、libgstreamer-plugins-base1.0-dev
等),不同系统环境可能版本不一致。源码编译能根据当前系统环境动态链接正确的 GStreamer 版本,避免因版本不匹配导致的功能缺失或崩溃。 - 硬件加速与性能优化:在嵌入式设备(如 Jetson 系列、RK3588 等)上,GStreamer 常用于硬件编解码加速(如 NVDEC、V4L2 插件),但这些功能需要特定编译选项和驱动支持。预编译版本通常未针对特定硬件优化,而源码编译可启用 CUDA、OpenCL 等加速选项,配合 GStreamer 的硬件插件提升性能。
- 自定义功能需求:需要启用 OpenCV 的扩展模块(如
opencv_contrib
中的 CNN 推理模块dnn
或视频处理模块videoio
),或裁剪不需要的模块以减小库体积。 - 调试与兼容性:某些平台(如 ARM 架构或定制 Linux 系统)的预编译库可能存在兼容性问题,源码编译可解决架构相关的依赖冲突。
8、OpenCV3文件夹介绍
本小节内容转载自https://www.jianshu.com/p/193a6d15ffe0
OpenCV 3 的源代码文件夹:
-
3rdparty/: 包含第三方库,如用视频解码用的 ffmpeg、jpg、png、tiff 等图片的解码库。
-
apps/: 包含进行 Haar 分类器训练的工具,OpenCV 进行人脸检测便是基于 Haar 分类器。如果你想检测人脸以外的图片,千万不要错过这几个工具。
-
cmake/: 包含生成工程项目时 cmake 的依赖文件,用于只能搜索第三方库,普通开发者不需要关心这个文件夹的内容。
-
data/: 包含 OpenCV 库及范例中用到的资源文件,Haar 物体检测的分类器位于 haarcascades 子文件中。
-
doc/: 包含生成文档所需的源文件及辅助脚本。
-
include/: 包含入口头文件。OpenCV 子文件夹中是 C 语言风格的 API,也就是《学习 OpenCV》中描述的 API 函数,官方将逐渐淘汰 C 风格函数,因此我不推荐大家使用该文件夹中的头文件。OpenCV 2 子文件夹中只有一个 opencv.hpp 文件,这是 OpenCV 2 及 OpenCV 3 推荐使用的头文件。
-
modules/: 包含核心代码,OpenCV 真正的代码都在这个文件夹中。OpenCV 从 2.0 开始以模块的方式组织各种功能,近两年模块的数量增长得很快。
-
platforms/: 包含交叉编译所需的工具链及额外的代码,交叉编译指的是在一个操作系统中编译供另一个系统使用的文件。
-
samples/: 这是大家最喜欢的范例文件夹。
CPU模块:
-
androidcamera/: 仅用于 Android 平台,使得可以通过与其他平台相同的接口来控制 Android 设备的相机。
-
core/: 核心功能模块,定义了基本的数据结构,包括最重要的 Mat 类、XML 读写、OpenGL 三维渲染等。
-
imgproc/: 全称为 Image Processing,即图像处理,包括图像滤波、集合图像变换、直方图计算、形状描述子等。图像处理是计算机视觉的重要工具。
-
highgui/: 高级图形界面及多媒体文件读写,包括用户界面、Qt、对图像及视频文件的读写操作。
-
video/: 视频分析模块,包括背景提取、光流跟踪、卡尔曼滤波等,做视频监控的开发者会经常使用这个模块。
-
calib3d/: 相机标定及三维重建。相机标定用于取出相机自身缺陷导致的画面形变,还原真实的场景,确保计算的准确性。三维重建通常用在双目视觉(立体视觉),即两个标定后的摄像头观察同一个场景,通过计算两幅画面中的相关性来估计像素深度。
-
features2d/: 包含 2D 特征值检测的框架。包含各种特征值检测器及描述子,如 FAST、MSER、OBRB、BRISK 等。各类特征值拥有统一的算法接口,因此在不影响程序逻辑的情况下可以替换替换。
-
objdetect/: 物体检测模块,包括 Haar 分类器、SVM 检测器及文字检测。
-
ml/: 全称为 Machine Learning,即机器学习。包括统计模型、K 最近邻、支持向量机、决策树、神经网络等经典的机器学习算法。
-
flann/: 用于在多维空间内聚类及搜索的近似算法,做图像检索的开发者对它不会陌生。
-
photo/: 计算摄影学,包括图像修补、去噪、HDR 成像、非真实感渲染等。如果读者想实现 Photoshop 的高级功能,那么这个模块必不可少。
-
stitching:/ 图像拼接,可用于制作全景图。
-
nonfree/: 受专利保护的算法,包括 SIFT 和 SURF。从功能上来说,这两个算法属于 features2d 模块,但由于它们都是受专利保护的,相拥在项目中可能需要专利方的许可。
-
contrib:/ 包含新添加的实验性质的代码。开发者期待已久的人脸识别功能便位于这个模块内,名为 FaceRecognizer。
-
legacy/: 英文含义为遗产,即废弃已久的代码,官方不推荐使用这个模块中的功能。
-
optim/: 全称为 Optimization,这个模块包含通用的数值优化。包含线性规划等算法。
-
shape/: 形状匹配算法模块,用于描述形状、比较形状。
-
softcascade/: 另一种物体检测算法,Soft Cascade 分类器,包含检测模块和训练模块。
-
superres/: 全称为 Super Resolution,用于增强图像的分辨率。
-
videostab/: 全称为 Video Stabilization,用于解决相机移动拍摄时视频不够稳定的问题。
-
viz/: 三维可视化模块。可以认为这个模块实现了一个简单的三维可视化引擎,有各种 UI 空间和键盘、鼠标交互方式。底层实现基于 CTK 这个第三方库。
CUDA模块
-
这些模块的名称都以 cuda 开始,cuda 是显卡制造商 NVIDIA 推出的通用计算语言,在 OpenCV 3 中有大量的模块已经被移植到了 cuda 语言。让我们依次看一下。
-
cuda/: CUDA- 加速的计算机视觉算法,包括数据结构 cuda::GpuMat、基于 cuda 的相机标定及三维重建等。
-
cudaarithm/: CUDA- 加速的矩阵运算模块。
-
cudabgsegm/: CUDA- 加速的背景分割模块,通常用于视频监控。
-
cudacodec/: CUDA- 加速的视频编码与解码。
-
cudafeatures2d/: CUDA- 加速的特征检测与描述模块,与 features2d/ 模块功能类似。
-
cudafilters/: CUDA- 加速的图像滤波。
-
cudaimgproc/: CUDA- 加速的图像处理算法,包含直方图计算、霍夫变换等。
-
cudaoptflow/: CUDA- 加速的光流检测算法。
-
cudastereo/: CUDA- 加速的立体视觉匹配算法。
-
cudawarping/: 实现 CUDA- 加速的快速图像变换,包括透视变换、旋转、改变尺寸等。
samples/ 文件夹
-
android/: Android 平台的范例。既有完全是 Java 的工程,也有完全是 C++ 的工程,也有更为常见的 Java 与 C++ 共存的工程。
-
c/: 使用 C API 的范例。在 C API 逐渐退出历史舞台后,这个文件夹也应该会随之消失吧。
-
cpp/: 由于 OpenCV 是一款 C++ 库,因此 C++ 的返利是最多的。
-
directx/: directx (d3d) 是微软的私有三维图像 API,这个文件夹中的范例覆盖了 d3d9、d3d10、d3d11.
-
gpu/: 利用 cuda 加速的范例。
-
java/: OpenCV 3 官方支持 Java 语言绑定,因此这里演示如何使用 Java 版本的 OpenCV。
-
python2/: OpenCV 3 官方支持 Python 语言绑定,因此这里演示使用 Python 2 版本的范例。
-
tapi/: tapi 是 OpenCV 3 的一个新特性,使用 cv::UMat 替代 cv::Mat,实现 CPU 和 GPU 的运算使用统一的接口,不再需要显式地在 CPU 和 GPU 之间传递数据,方便开发人员。
-
winrt/: Windows RT 平台的范例,开发语言是微软的 C++ “方言”.
samples/cpp/ 文件夹中的范例介绍
-
3calibration.cpp/: 同时标定三台水平放置的相机。
-
bagofwords_classification.cpp/: 使用图像检测实现简易的图像搜索功能。
-
bgfg_gmg.cpp/: 演示 GMG 背景检测算法的使用方式。
-
bgfg_segm.cpp/: 演示高斯混合背景检测算法的使用方式。
-
brief_match_test.cpp/: 使用 BRIEF 特征值来匹配两张图像。
-
build3dmodel.cpp/: 演示如何使用基础矩阵和特征值来创建三维模型。
-
calibration.cpp/: 完整的多用途标定程序。
-
calibration_artificial.cpp/: 在程序中生成一个虚拟的相机,并进行标定。
-
camshiftdemo.cpp/: 读取实时的摄像头数据,并演示基于均值偏移算法的视频跟踪。
-
chamfer.cpp/: 使用 Chamfer 算法匹配两副边缘图像。
-
cloning_demo.cpp/: 命令行模式的图像克隆。
-
cloning_gui.cpp/: 图形界面交互的图像克隆。
-
connected_components.cpp/: 查找并绘制图像中的连通区域。
-
contours2.cpp/: 查找并绘制图像中的轮廓。
-
convexhull.cpp/: 查找并绘制由点的集合组成的凸包。
-
cout_mat.cpp/: 使用 cout 来输出各种格式化的 Mat 对象。
-
create_mask.cpp/: 演示如何创建黑白掩码图像。
-
dbt_face_detection.cpp/: 基于检测的人脸跟踪代码。
-
delaunay2.cpp/: 通过鼠标交互式地生成 Delaunay 三角形。
-
demhist.cpp/: 演示直方图的用法。
-
descriptor_extractor_matcher.cpp/: 演示 features2d 检测框架的用法。
-
detection_based_tracker_sample.cpp/: 与 dbt_face_detection.cpp 类似。
-
detector_descriptor_evaluation.cpp/: 评估各种特征检测器和描述子。
-
detector_descriptor_matcher_evaluation.cpp/: 评估各种特征检测器和匹配器。
-
dft.cpp/: 演示一幅图像的离散傅里叶变换。
-
distrans.cpp/: 显示边缘图像的距离变换值。
-
drawing.cpp/: 演示绘画和文字显示功能。
-
edge.cpp/: 演示 Canny 边缘检测。
-
em.cpp/: 对随机生成的数据点进行 EM 聚类。
-
fabmap_sample.cpp/: 演示 FAB-MAP 图像检索算法。
-
facerec_demo.cpp/: 人脸识别。
-
fback.cpp/: 实时的 Farneback 光流跟踪。
-
ffilldemo.cpp/: 演示 floodFill() 像素填充算法。
-
filestorage.cpp/: 演示序列化到外部文件,如yml、xml等。
-
fitellipse.cpp/: 将轮廓点匹配到椭圆。
-
freak_demo.cpp/: 演示 FREAK 特征值的用法。
-
gencolors.cpp/: 演示 generateColors()。
-
generic_descriptor_match.cpp/: 基于 SURF 的两幅图像间的匹配。
-
grabcut.cpp/: 演示 GrabCut 分割算法。
-
houghcircles.cpp/: 用霍夫算法检测圆。
-
houghlines.cpp/: 用霍夫算法检测直线。
-
hybridtrackingsample.cpp/: 混合跟踪算法(Hybrid Tracker)的演示。
-
image.cpp/: 来回转换 cv::Mat 和 IplImage。
-
image_alignment.cpp/: 演示 findTransformECC() 函数。
-
image_sequence.cpp/: 使用 VideoCapture 对象读取序列帧。
-
imagelist_creator.cpp/: 创建图像列表到 xml 文件。
-
inpaint.cpp/: 使用鼠标交互地进行图像修补。
-
intelperc_capture.cpp/: Intel 感知计算设备相关的函数。
-
kalman.cpp/: 使用卡尔曼滤波进行二维跟踪。
-
kmeans.cpp/: Kmeans 聚类算法的演示。
-
laplace.cpp/: 拉普拉斯边缘检测。
-
latentsvm_multidetect.cpp/: latentSVM 检测器。
-
letter_recog.cpp/: 字母识别。
-
linemod.cpp/: 基于 OpenNI 的体感设备应用。
-
lkdemo.cpp/: 演示Lukas-Kanade 光流法。
-
logpolar_bsm.cpp/: 演示 LogPolar 盲点模型。
-
lsd_lines.cpp/: LSD 线段检测。
-
matcher_simple.cpp/: SURF 特征检测。
-
matching_to_many_images.cpp/: 一对多的特征检测。
-
meanshift_segmentation.cpp/: 演示基于均值漂移的色彩分割函数——meanShiftSegmentation()。
-
minarea.cpp/: 寻找最小包围盒、包围圆。
-
morphology2.cpp/: 形态学图像处理。
-
npr_demo.cpp/: 演示各种非真实感渲染效果。
-
opencv_version.cpp/: 输出 OpenCV 库的版本号。
-
openni_capture.cpp/: 演示 OpenNI 相关的体感设备。
-
pca.cpp/: 基于 PCA 的人脸识别。
-
peopledetect.cpp/: 基于 cascade 或 hog 进行物体(人)检测。
-
phase_corr.cpp/: 演示 phaseCorrelate() 函数。
-
points_classifier.cpp/: 演示各种机器学习算法。
-
rgbdodometry.cpp/: 对深度传感器如 Kinect 的数据进行处理。
-
segment_objects.cpp/: 实时地在视频或相机画面中检测前景物体。
-
shape_example.cpp/: 比较并检索形状。
-
shape_transformation.cpp/: 用 SURF 特征值检测形状并进行变换。
-
squares.cpp/: 检测图像中的方块形状。
-
starter_imagelist.cpp/: 一个 “hello worl” 性质的入门范例。
-
starter_video.cpp/: 另一个 “hello worl” 性质的入门范例。
-
stereo_calib.cpp/: 双目视觉的标定。
-
stereo_match.cpp/: 计算左右视觉的图像的差异,生成点云文件。
-
stitching.cpp/: 演示图像拼接算法。
-
stitching_detailed.cpp/: 演示更多参数的图像拼接算法。
-
textdetection.cpp/: 实时场景中的文字定位与识别。
-
train_HOG.cpp/: 训练 HOG 分类器。
-
ufacedetect.cpp/: 人脸检测。
-
video_homography.cpp/: 使用 FAST 特征值来跟踪平面物体。
-
videostab.cpp/: 演示 videostab 中各个参数的用法。
-
watershed.cpp/: 演示著名的分水岭图像分割算法。
9、如何重新编译OpenCV源码?
9.1、获取源码,去github或利用git工具下载opencv和opencv-contirb源文件
git clone https://github.com/opencv/opencv/releases/tag/4.9.0
git clone https://github.com/opencv/opencv_contrib/releases/tag/4.9.0
但一般速度很慢,考虑用别的镜像
git clone --depth 1 https://gitee.com/mirrors/opencv.git -b 4.9.0
git clone --depth 1 https://gitee.com/mirrors/opencv_contrib.git -b 4.9.0cd opencv && git checkout 4.9.0
cd ../opencv_contrib && git checkout 4.9.0另外也可以借助浏览器下载zip,手动解压
https://github.com/opencv/opencv/archive/4.9.0.zip
https://github.com/opencv/opencv_contrib/archive/4.9.0.zip
解压后得到opencv、opencv_contrib两个文件夹
我是把下载下的opencv和opencv_contrib两个文件夹放到了D:/opencv_o文件夹下面。
9.2、创建构建目录,用于存放编译后的源码
手动在opencv文件夹下面再创建一个build空文件夹,路径为D:/opencv_o/opencv/build。
9.3、安装GStreamer,https://gstreamer.freedesktop.org/download/#windows
选择MSVC 64-bit下面的,runtime和development都要下载,得到两个msi文件:
gstreamer-1.0-msvc-x86_64-1.xx.msi
gstreamer-1.0-devel-msvc-x86_64-1.xx.msi
全部双击安装,路径默认即可,我装在D盘,D:\GStreamer\1.0\msvc_x86_64。安装完,把D:\GStreamer\1.0\msvc_x86_64\bin这个路径添加到系统环境变量。
9.4、下载安装Visual Studio 2022免费版,https://visualstudio.microsoft.com/zh-hans/downloads/
工作负载勾选“使用C++的桌面开发”(MSVC v143 + Windows 11 SDK)。
9.5、下载安装编译需要用到的工具CMAKE,https://cmake.org/
官网下 Windows x64 Installer,安装时记得把 “Add CMake to the system PATH” 打勾。
9.6、启动cmake-gui,进行配置
- 在Where is the source code填D:/opencv_o/opencv
- 在Where to build the binaries填D:/opencv_o/opencv/build
-
点Configure,弹出的对话框里Generator选“Visual Studio 17 2022”,Platform选x64,Optional toolset 填
cuda=C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v12.4
,点击Finish,第一次Configure会跑1-2分钟,出现一片红色是正常的 - 然后对选项中搜索关键词,进行如下操作:
- WITH_GSTREAMER,打勾
- BUILD_opencv_world,取消打勾
- OPENCV_EXTRA_MODULES_PATH,填D:/opencv_o/opencv_contrib/modules
- CMAKE_INSTALL_PREFIX,填D:/opencv_o/opencv/build/install
- BUILD_TESTS / BUILD_PERF_TESTS / BUILD_EXAMPLES,取消打勾
- OPENCV_ENABLE_NONEFREE,打勾
- 看看有没有GSTREAMER_DIR,没有的话,需要Add Entry,Name填GSTREAMER_DIR,Value填D:/GStreamer/1.0/msvc_x86_64
- 如果有NVIDIA的话,WITH_CUDA也可以打勾,但是要安装提前安装好CUDA和cuDNN(https://blog.csdn.net/csdn122345/article/details/147346003,注意安装CUDA时选择完整版,不要选精简版)。要能看到如下CUDA被检测到,才能确定没问题
- 再次点击Configure,等着提示“Configuring done”,看看上面表格中是否还有红色条目。没有的话执行下一步
- 点击Generate,等着提示“Generating done”
- 点击Open Project,或者直接去双击D:/opencv_o/opencv/build/OpenCV.sln
- VS打开后,顶部工具栏把“Debug”改为“Release”,平台保持x64
- 在右侧Solution Explore(解决方案资源管理器)的CMakeTargets中找到ALL_BUILD,右键选择Build / 生成 / 生成解决方案,要一段时间才能完成
- 如果编译报错,一般是xfeatures2d相关的报错,去D:\opencv_o\opencv\build\CMakeDownloadLog.txt查看哪些资源下载失败,一般是https://raw.githubusercontent.com/......,拷贝链接到浏览器,将githubusercontent改成gitmirror,即可下载缺少的资源,部分文件是没法下载的,是文本格式由服务器返回的,点击右键另存为文本即可。下载的东西一定要看放到哪个地方,正常是D:\opencv_o\opencv\.cache下面,看看是否需要额外创建文件夹,如ippicv,ffmpeg,data之类的
- 然后重新Configure、Generate,再接着在VS里面,ALL_BUILD,右键选择清理,清理完,再右键选择重新生成,知道最后显示没有失败条目
- 在右侧Solution Explore(解决方案资源管理器)的CMakeTargets中找到INSTALL(作用是把文件拷贝到CMAKE_INSTALL_PREFIX指定目录下),右键选择Build,编译完成的文件架构:D:\opencv_o\opencv\build\install,bin下面是各种dll,lib下面是各种lib,include/opencv2下面是各种hpp
- 还有一个要注意的点,最后生成的opencv的python库在哪里?查看CMake的Configure下面的日志可以看出,最后生成的cv2文件夹以及pyd文件并不在build/install文件夹下,而是在下面的install path路径下。
Python 3:
Interpreter: D:/Software/anaconda3/python.exe (ver 3.11.5)
Libraries: D:/Software/anaconda3/libs/python311.lib (ver 3.11.5)
numpy: D:/Software/anaconda3/Lib/site-packages/numpy/core/include (ver 1.24.3)
install path: D:/Software/anaconda3/Lib/site-packages/cv2/python-3.11
Python (for build): D:/Software/anaconda3/python.exe