当前位置: 首页 > news >正文

Python OpenCV图像处理与深度学习:Python OpenCV对象检测入门-Haar级联分类器与人脸检测

使用OpenCV进行对象检测:从基础到实践

学习目标

通过本课程,学员们将了解对象检测的基本概念,特别是如何使用OpenCV中的Haar级联分类器进行对象检测。同时,学员将能够掌握人脸检测的实现方法,并能够将这些技术应用到其他对象检测任务中。

相关知识点

  • Python OpenCV对象检测

学习内容

1 Python OpenCV对象检测

1.1 对象检测基础

对象检测是计算机视觉领域的一个重要分支,它涉及识别图像或视频中特定类别的对象,并确定它们的位置。对象检测技术在多个领域都有广泛的应用,如自动驾驶、安全监控、医疗图像分析等。在对象检测中,一个常见的任务是人脸检测,即在图像中找到人脸的位置。

对象检测算法通常包括以下几个步骤:

  1. 预处理:对输入图像进行预处理,如调整大小、灰度化等,以减少计算量并提高检测精度。
  2. 特征提取:从图像中提取有用的特征,这些特征可以是边缘、纹理、颜色等。
  3. 分类:使用训练好的分类器对提取的特征进行分类,判断是否为感兴趣的对象。
  4. 后处理:对检测结果进行后处理,如非极大值抑制(NMS)等,以去除重复的检测框。
1.2 OpenCV中的Haar级联分类器

OpenCV提供了一个强大的工具——Haar级联分类器,用于对象检测。Haar级联分类器是一种基于Haar特征的机器学习方法,它通过训练大量的正样本(包含对象的图像)和负样本(不包含对象的图像)来学习对象的特征。

1.2.1 Haar特征

Haar特征是一种简单而有效的图像特征,它通过计算图像中不同区域的像素值差异来描述图像的局部特征。常见的Haar特征包括边缘特征、线特征、中心特征等。这些特征可以捕捉图像中的边缘、线条和纹理信息。

1.2.2 级联分类器

级联分类器是一种多阶段的分类器,每个阶段都包含一个简单的分类器。图像首先通过第一个阶段的分类器,如果通过,则继续进入下一个阶段,否则被拒绝。这种结构可以快速排除大量非对象区域,从而提高检测速度。

1.2.3 训练Haar级联分类器

训练Haar级联分类器需要大量的正样本和负样本。正样本是包含对象的图像,负样本是不包含对象的图像。训练过程通常包括以下步骤:

  1. 特征提取:从正样本和负样本中提取Haar特征。
  2. 特征选择:使用AdaBoost算法选择最有效的特征。
  3. 训练分类器:使用选定的特征训练每个阶段的分类器。
  4. 级联:将多个阶段的分类器级联起来,形成最终的级联分类器。
1.2.4 使用OpenCV进行对象检测

执行以下指令获取测试图片。

wget https://model-community-picture.obs.cn-north-4.myhuaweicloud.com/ascend-zone/notebook_datasets/aeab04a22fab11f0ae31fa163edcddae/data.zip
cp notebook_datasets/aeab04a22fab11f0ae31fa163edcddae/data.zip .
unzip data.zip

OpenCV提供了cv2.CascadeClassifier类,用于加载训练好的Haar级联分类器模型,并进行对象检测。以下是一个简单的示例代码,演示如何使用OpenCV进行人脸检测:

import cv2
from matplotlib import pyplot as plt# 加载Haar级联分类器模型
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')# 读取图像
image = cv2.imread('face.jpg')# 转换为灰度图像
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 进行人脸检测
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))# 绘制检测框
for (x, y, w, h) in faces:cv2.rectangle(image, (x, y), (x+w, y+h), (255, 0, 0), 2)
# 显示结果
plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))
plt.title('Face Detection'), plt.xticks([]), plt.yticks([])
plt.show()

在这里插入图片描述

1.3 实战:人脸检测

在本课程中,学员将通过一个完整的实战项目,学习如何使用OpenCV进行人脸检测。学员将从图像预处理、特征提取、分类到后处理的每一个步骤进行详细讲解,并提供相应的代码示例。

1.3.1 图像预处理

图像预处理是对象检测的第一步,它包括调整图像大小、灰度化等操作。这些操作可以减少计算量并提高检测精度。

import cv2# 读取图像
image = cv2.imread('face.jpg')# 调整图像大小
resized_image = cv2.resize(image, (640, 480))# 转换为灰度图像
gray = cv2.cvtColor(resized_image, cv2.COLOR_BGR2GRAY)# 显示预处理后的图像
plt.imshow(cv2.cvtColor(gray, cv2.COLOR_BGR2RGB))
plt.title('Preprocessed Image'), plt.xticks([]), plt.yticks([])
plt.show()

在这里插入图片描述

1.3.2 特征提取

特征提取是对象检测的关键步骤,它从图像中提取有用的特征。在OpenCV中,使用Haar特征进行特征提取。

# 加载Haar级联分类器模型
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')# 进行人脸检测
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))# 打印检测到的人脸数量
print(f'Number of faces detected: {len(faces)}')
Number of faces detected: 1
1.3.3 分类

分类是将提取的特征输入到训练好的分类器中,判断是否为感兴趣的对象。在OpenCV中,使用cv2.CascadeClassifier类进行分类。

# 绘制检测框
for (x, y, w, h) in faces:cv2.rectangle(resized_image, (x, y), (x+w, y+h), (255, 0, 0), 2)# 显示结果
plt.imshow(cv2.cvtColor(resized_image, cv2.COLOR_BGR2RGB))
plt.title('Face Detection'), plt.xticks([]), plt.yticks([])
plt.show()

在这里插入图片描述

1.3.4 后处理

后处理是对检测结果进行进一步处理,以去除重复的检测框。常见的后处理方法包括非极大值抑制(NMS)等。

import numpy as np# 非极大值抑制
def non_max_suppression(boxes, overlapThresh):if len(boxes) == 0:return []# 转换为numpy数组boxes = np.array(boxes)# 获取边界框的坐标x1 = boxes[:, 0]y1 = boxes[:, 1]x2 = boxes[:, 2]y2 = boxes[:, 3]# 计算边界框的面积area = (x2 - x1 + 1) * (y2 - y1 + 1)# 按照y2坐标排序idxs = np.argsort(y2)# 初始化保留的边界框索引pick = []while len(idxs) > 0:# 获取最后一个索引last = len(idxs) - 1i = idxs[last]pick.append(i)# 计算最大(x, y)和最小(x, y)xx1 = np.maximum(x1[i], x1[idxs[:last]])yy1 = np.maximum(y1[i], y1[idxs[:last]])xx2 = np.minimum(x2[i], x2[idxs[:last]])yy2 = np.minimum(y2[i], y2[idxs[:last]])# 计算交集的宽度和高度w = np.maximum(0, xx2 - xx1 + 1)h = np.maximum(0, yy2 - yy1 + 1)# 计算交集的面积inter = w * h# 计算重叠率overlap = inter / area[idxs[:last]]# 删除重叠率大于阈值的边界框idxs = np.delete(idxs, np.concatenate(([last], np.where(overlap > overlapThresh)[0])))return boxes[pick].astype("int")# 应用非极大值抑制
faces = non_max_suppression(faces, 0.3)# 绘制检测框
for (x, y, w, h) in faces:cv2.rectangle(resized_image, (x, y), (x+w, y+h), (255, 0, 0), 2)
# 显示结果
plt.imshow(cv2.cvtColor(resized_image, cv2.COLOR_BGR2RGB))
plt.title('Face Detection with NMS'), plt.xticks([]), plt.yticks([])
plt.show()

在这里插入图片描述

http://www.dtcms.com/a/361990.html

相关文章:

  • LeetCode刷题-top100( 除自身以外数组的乘积)
  • MATLAB 实现同步压缩小波变换
  • C++ 虚继承:破解菱形继承的“双亲困境”
  • 拆解期货交易所:清算交收体系!
  • 配置sscms时被sql server处处刁难
  • 从 Skip Take 到 Keyset:C# 分页原理与实践
  • 考研复习-计算机网络-第一章-计算机网络概述
  • Parasoft C/C++test解析:覆盖率与可追溯性的软件测试协同方案
  • 免费GIS服务器方案:OGC标准3DTiles服务发布与跨平台渲染实践
  • 安全等保复习笔记
  • flume接收处理器:构建高可用与高性能的数据链路
  • Python 人工智能深度学习系统学习(附视频教程)
  • PowerPoint和WPS演示如何在放映PPT时用鼠标划重点
  • C++ STL序列容器-------list
  • 无人设备遥控器之安全加密体系
  • 【收藏级】Windows AI 本地开发「完全体」环境搭建清单
  • 多校区学校押金原路退回系统之免安装使用教程——东方仙盟
  • 计算机三级嵌入式填空题——真题库(28)原题附答案速记
  • matlab-神经网络的语音识别
  • 神经网络2——使用Keras实现MLP
  • 深度学习中常用的激活函数
  • 玩转OurBMC第二十二期:OurBMC之PCIe接口应用(上)
  • Triton Linalg编译
  • 系统性学习数据结构-第二讲-顺序表与链表
  • K8S-etcd数据库的相关操作
  • DHT11-温湿度传感器
  • 基于单片机智能饮水机/智能热水壶
  • Redis 如何实现分布式锁,以及redis的适应场景分析
  • 【跨平台编译】【树莓派】在x86上编译树莓派上运行的CC++代码,搭建树莓派4B的跨平台编译环境
  • ccache编译加速配置