当前位置：首页 > news >正文

OpenCV结合深度学习进行图像分类

news 2025/7/26 12:27:52

文章目录

- 1. 支持的深度学习框架和模型格式
- 2. 模型加载方式
- - 加载预训练模型示例：
- 3. 图像预处理流程
- 4. 前向传播与推理
- 5. 结果解析与后处理
- 6. 性能优化技巧
- - 启用GPU加速：
  - 批量处理：

代码示例在资源中有上传

1. 支持的深度学习框架和模型格式

OpenCV的DNN模块支持多种主流深度学习框架训练的模型：

TensorFlow: 支持冻结图(.pb)和SavedModel格式
Caffe: 支持.prototxt和.caffemodel文件
ONNX: 开放神经网络交换格式
Darknet: YOLO系列模型
Torch: PyTorch导出模型

2. 模型加载方式

加载预训练模型示例：

import cv2
import numpy as np# 方法1: 加载Caffe模型 (如CaffeNet, VGG等)
net = cv2.dnn.readNetFromCaffe('deploy.prototxt', 'model.caffemodel')# 方法2: 加载TensorFlow模型
net = cv2.dnn.readNetFromTensorflow('frozen_inference_graph.pb')# 方法3: 加载ONNX模型
net = cv2.dnn.readNetFromONNX('model.onnx')# 方法4: 加载Darknet模型 (YOLO)
net = cv2.dnn.readNetFromDarknet('yolo.cfg', 'yolo.weights')

3. 图像预处理流程

深度学习模型对输入图像有特定要求，需要进行标准化处理：

# 读取原始图像
image = cv2.imread('input_image.jpg')
(h, w) = image.shape[:2]# 创建blob对象 - OpenCV的标准化处理函数
blob = cv2.dnn.blobFromImage(image,                    # 输入图像scalefactor=1.0,         # 缩放因子 (通常为1/255.0进行归一化)size=(224, 224),         # 目标尺寸 (根据模型要求调整)mean=(104, 117, 123),    # 减去的均值 (RGB格式)swapRB=True,             # 是否交换R和B通道 (BGR转RGB)crop=False               # 是否中心裁剪
)# blob的形状为 (1, 3, 224, 224) - (batch, channels, height, width)

4. 前向传播与推理

# 设置网络输入
net.setInput(blob)# 可选：设置计算后端和目标设备
net.setPreferableBackend(cv2.dnn.DNN_BACKEND_OPENCV)
net.setPreferableTarget(cv2.dnn.DNN_TARGET_CPU)  # 或DNN_TARGET_CUDA# 执行前向传播获得预测结果
predictions = net.forward()
# 输出形状通常为 (1, num_classes) 或 (1, num_classes, 1, 1)

5. 结果解析与后处理

# 压缩多余维度
predictions = predictions.flatten()# 获取前N个最可能的类别
top_indices = np.argsort(predictions)[::-1][:5]  # Top-5分类结果# 加载类别标签 (如ImageNet的1000个类别)
classes = open('synset_words.txt').read().strip().split("\n")# 显示分类结果
for i, idx in enumerate(top_indices):label = classes[idx]confidence = predictions[idx]print(f"{i+1}. {label}: {confidence:.4f}")

6. 性能优化技巧

启用GPU加速：

# CUDA加速 (需要编译支持CUDA的OpenCV)
net.setPreferableBackend(cv2.dnn.DNN_BACKEND_CUDA)
net.setPreferableTarget(cv2.dnn.DNN_TARGET_CUDA)

批量处理：

# 处理多张图像
images = [cv2.imread(f'image_{i}.jpg') for i in range(batch_size)]
blob = cv2.dnn.blobFromImages(images, 1.0, (224, 224), (104, 117, 123))

查看全文

http://www.dtcms.com/a/298538.html

暑期自学嵌入式——Day08（C语言阶段）

用单片机怎么控制转速

嵌入式学习-（李宏毅）机器学习（3）-day30

操作系统：操作系统的结构（Structures of Operating System）

AI面试与传统面试的核心差异解析——AI面试如何提升秋招效率？

RAG架构原理和LangChain方式实现RAG

【正点原子K210连载】第二十一章 machine.UART类实验摘自【正点原子】DNK210使用指南-CanMV版指南

MyBatis-Plus 指南

网络安全入门第一课：信息收集实战手册（3）

@ControllerAdvice相关知识点，和@Controller有什么区别

“八卦”简读

手语式映射：Kinova Gen3 力控机械臂自适应控制的研究与应用

Python HTML模块详解：从基础到实战

率先通过自动制冰性能认证，容声冰箱推动行业品质升级

TDengine 转化函数 TO_TIMESTAMP 用户手册

原创-大型嵌入式软件架构设计指南：从理论到实践的完整方法论

WinUI3开发_过渡动画

数据结构（3）单链表

机器学习之knn算法保姆级教学

（三）Python基础入门-流程控制结构

航段导航计算机 (Segment_Navigator) 设计与实现

深入解析 ArkUI 触摸事件机制：从点击到滑动的开发全流程

协作机器人掀起工厂革命：码垛场景如何用数据重塑制造业命脉？

SEO实战派白杨SEO：SEO中说的框计算、知心搜索（知识图谱）是什么？有什么用处？

SpringBoot配置外部Servlet

TQZC706开发板教程：创建PCIE项目

LoRA、ControlNet与T2I Adapter的区别

HTTP 请求方法有哪些？

如何用豆包一键P图，一键生成装修图

Qt 与 C++11/14/17 新特性结合应用