当前位置：首页 > news >正文

基于OpenCV的人脸微笑检测实现

news 2025/9/8 16:51:35

文章目录

- 引言
- 一、技术原理
- 二、代码实现
- - 2.1 关键代码解析
  - - 2.1.1 模型加载
    - 2.1.2 图像翻转
    - 2.1.3 人脸检测 + 微笑检测
  - 2.2 显示效果
- 三、参数调优建议
- 四、总结

引言

在计算机视觉领域，人脸检测和表情识别一直是热门的研究方向。今天我将分享一个使用Python和OpenCV实现的实时人脸微笑检测系统。这个系统能够通过摄像头捕捉视频流，实时检测人脸并识别微笑表情，非常适合初学者学习计算机视觉的基础应用。

一、技术原理

本实现主要基于OpenCV提供的Haar级联分类器，使用了两个预训练模型：

haarcascade_frontalface_default.xml - 用于人脸检测
haarcascade_smile.xml - 用于微笑检测

Haar级联分类器是一种基于机器学习的物体检测方法，由Paul Viola和Michael Jones在2001年提出。它通过训练大量正负样本，学习物体的特征模式，从而实现快速检测。

二、代码实现

import cv2# 加载预训练模型
faceCascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
smile = cv2.CascadeClassifier("haarcascade_smile.xml")
cap = cv2.VideoCapture('smile.mp4') #初始化摄像头while True:     #处理每一帧ret,image = cap.read()   #读取一帧image = cv2.flip(image,1)    #图片翻转，水平翻转（镜像）# 没有读到，直接退出if ret is None:break# 转换为灰度图像gray = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)# 人脸检测faces = faceCascade.detectMultiScale(gray, scaleFactor=1.1,minNeighbors=15,minSize=(5,5) )# 处理每个人脸for (x,y,w,h) in faces:cv2.rectangle(image,(x,y),(x + w,y + h),(0,255,0),2)# 提取人脸ROI区域(灰度)roi_gray_face = gray[y:y+h,x:x+w]cv2.imshow('Face ROI',roi_gray_face)# 微笑检测，仅在人脸区域内检测smiles = smile.detectMultiScale(roi_gray_face,scaleFactor=1.5,minNeighbors=2,minSize=(50,50))for (sx,sy,sw,sh) in smiles:# 绘制微笑区域a = x + sxb = y + sycv2.rectangle(image,(a,b),(a+sw,b+sh),(255,0,0),2)# 显示"smile"文字cv2.putText(image,"smile",(x,y),cv2.FONT_HERSHEY_COMPLEX_SMALL,1,(0,255,255),thickness=2)# 显示结果cv2.imshow("Smile Detection",image)key = cv2.waitKey(25)if key ==27:  # ESC键退出break# 释放资源
cap.release()
cv2.destroyAllWindows()

2.1 关键代码解析

2.1.1 模型加载

faceCascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
smile = cv2.CascadeClassifier("haarcascade_smile.xml")

这两行代码加载了OpenCV提供的预训练Haar级联分类器模型。

2.1.2 图像翻转

image = cv2.flip(image, 1)

cv2.flip()函数
- 作用：翻转输入图像（水平、垂直或同时翻转）。
- 参数：
  - 第1个参数 image：输入的图像（NumPy数组）。
  - 第2个参数 1：翻转模式的标志。
    - 0：垂直翻转（沿x轴翻转）。
    - 1：水平翻转（沿y轴翻转，即镜像效果）。
    - -1：同时水平和垂直翻转。
flipCode=1 的效果
假设原图为：

			原图：    [A B C]   → 翻转后： [C B A][D E F]             [F E D]

每一行的元素顺序被反转，但行的顺序不变。

2.1.3 人脸检测 + 微笑检测

for (x,y,w,h) in faces:cv2.rectangle(image,(x,y),(x + w,y + h),(0,255,0),2)# 提取人脸所在区域，多通道形式# roiColorFace = image(y:y+h,x:x+w)# 提取人脸所在区域，单通道形式roi_gray_face = gray[y:y+h,x:x+w]cv2.imshow('lian',roi_gray_face)# 微笑检测，仅在人脸区域内检测smiles = smile.detectMultiScale(roi_gray_face,scaleFactor=1.5,minNeighbors=2,minSize=(50,50))for (sx,sy,sw,sh) in smiles:# 绘制微笑区域a = x + sxb = y + sycv2.rectangle(image,(a,b),(a+sw,b+sh),(255,0,0),2)# 显示文字“smile” 表示微笑了cv2.putText(image,"smile",(x,y),cv2.FONT_HERSHEY_COMPLEX_SMALL,1,(0,255,255),thickness=2)

这段代码是一个 人脸检测 + 微笑检测 的程序，主要使用了 OpenCV 的 Haar 级联分类器（detectMultiScale）来检测人脸和微笑。以下是详细解析：

代码功能概述

检测人脸（在 faces 中存储的人脸矩形框）。
提取人脸区域（灰度图 roi_gray_face）。
在人脸区域内检测微笑（smiles）。
绘制人脸框和微笑框，并标注文字“smile”。

代码逐行解析

1. 遍历检测到的人脸

for (x, y, w, h) in faces:

faces 是一个包含人脸矩形框的列表，每个框由 (x, y, w, h) 表示：
- (x, y)：人脸左上角坐标。
- (w, h)：人脸的宽度和高度。

2. 绘制人脸矩形框

cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)

在原始图像 image 上绘制绿色矩形框（RGB (0,255,0)），线宽为 2。

3. 提取人脸区域（灰度图）

roi_gray_face = gray[y:y+h, x:x+w]
cv2.imshow('lian', roi_gray_face)

gray 是灰度图像（单通道）。
roi_gray_face 是从 gray 中截取的人脸区域。
cv2.imshow('lian', roi_gray_face) 显示人脸区域的灰度图（窗口名 'lian'）。

4. 在人脸区域内检测微笑

smiles = smile.detectMultiScale(roi_gray_face,scaleFactor=1.5,minNeighbors=2,minSize=(50, 50)
)

smile 是一个训练好的 Haar 级联分类器（用于微笑检测）。
参数说明：
- scaleFactor=1.5：每次图像缩放的比例（越大检测越快，但可能漏检）。
- minNeighbors=2：候选框至少需要多少个邻近检测才被确认（越小误检越多）。
- minSize=(50, 50)：微笑区域的最小尺寸（小于该尺寸的忽略）。

5. 遍历检测到的微笑区域

for (sx, sy, sw, sh) in smiles:

smiles 包含微笑矩形框 (sx, sy, sw, sh)，坐标是相对于 roi_gray_face（人脸区域）的。

6. 绘制微笑框（蓝色）

a = x + sx  # 转换到原始图像的坐标
b = y + sy
cv2.rectangle(image, (a, b), (a + sw, b + sh), (255, 0, 0), 2)

(a, b) 是微笑框在原始图像 image 中的左上角坐标。
绘制蓝色矩形框（RGB (255,0,0)），线宽 2。

7. 标注文字“smile”

cv2.putText(image, "smile", (x, y), cv2.FONT_HERSHEY_COMPLEX_SMALL, 1, (0, 255, 255), 2)

在人脸框左上角 (x, y) 处显示黄色文字“smile”：
- 字体：cv2.FONT_HERSHEY_COMPLEX_SMALL。
- 字号：1。
- 颜色：(0, 255, 255)（黄色）。
- 线宽：2。

代码执行流程

输入图像 → 检测人脸 → 绘制绿色人脸框。
提取人脸区域 → 检测微笑 → 绘制蓝色微笑框。
标注“smile”文字 → 显示结果。

注意事项

依赖 Haar 级联分类器：

faces 和 smiles 是由 cv2.CascadeClassifier 检测得到的。

通常需要加载预训练模型：

face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
smile_cascade = cv2.CascadeClassifier('haarcascade_smile.xml')

参数调优：
- scaleFactor 和 minNeighbors 影响检测精度和速度，需根据实际场景调整。
坐标转换：
- 微笑检测是在人脸区域 (roi_gray_face) 内进行的，绘制时需要转换回原始图像坐标。

2.2 显示效果

    # 显示结果cv2.imshow("dect",image)key = cv2.waitKey(25)if key ==27:break
cap.release()
cv2.destroyAllWindows()

显示效果如下，我们插入一段视频，在视频中对人物进行微笑检测，并画出检测框：

在这里插入图片描述

三、参数调优建议

人脸检测参数：
- minNeighbors值越大，检测越严格，但可能漏检
- scaleFactor通常在1.01-1.5之间
微笑检测参数：
- 由于微笑区域相对较小，minSize不宜设置过大
- minNeighbors可以适当调小以避免漏检

四、总结

本文介绍了一个基于OpenCV Haar级联分类器的实时微笑检测系统。虽然Haar级联分类器在复杂场景下可能表现不佳，但它的计算效率高，非常适合初学者学习和快速原型开发。通过调整参数和优化流程，可以在实际应用中获得不错的效果。

文章转载自：

http://rRKJuAX6.jthjr.cn
http://U8hRnhDK.jthjr.cn
http://1uvn7xf1.jthjr.cn
http://2YW1PsnK.jthjr.cn
http://GmCUqith.jthjr.cn
http://KQJctfRI.jthjr.cn
http://NVUpKxWU.jthjr.cn
http://HYScMn3k.jthjr.cn
http://hwHMSMlX.jthjr.cn
http://8y0NuqWj.jthjr.cn
http://36BkLaS5.jthjr.cn
http://GYHT5rq1.jthjr.cn
http://m4BLrMmh.jthjr.cn
http://RrKLJ28M.jthjr.cn
http://H4v56R54.jthjr.cn
http://xPRJJleu.jthjr.cn
http://08rPNyiA.jthjr.cn
http://ct0bb4Sg.jthjr.cn
http://s9JRJcN9.jthjr.cn
http://3hERIZV6.jthjr.cn
http://Wm2GyoO9.jthjr.cn
http://X9NyUloS.jthjr.cn
http://mAhjChKO.jthjr.cn
http://1TzzN0Cv.jthjr.cn
http://rehf1udz.jthjr.cn
http://wVHULTCw.jthjr.cn
http://tOkLn4ZG.jthjr.cn
http://7AzrJBUY.jthjr.cn
http://xdflxaz1.jthjr.cn
http://1CeEte2r.jthjr.cn

查看全文

http://www.dtcms.com/a/192029.html

除了GC哪些地方有用到安全点

本地部署私有云网盘 Nextcloud 并实现外部访问

智慧化系统安全分析报告

[训练和优化] 3. 模型优化

亚马逊，temu测评采购低成本养号策略：如何用一台设备安全批量管理买家账号

16-看门狗和RTC

西门子 Teamcenter13 Eclipse RCP 开发 1 工具栏

PyTorch循环神经网络（Pytotch）

基于Rust语言的Rocket框架和Sqlx库开发WebAPi项目记录（一）

青少年编程与数学 02-019 Rust 编程基础 14课题、并发编程

系统集成项目管理工程师学习笔记

深度学习框架对比---Pytorch和TensorFlow

C++23 新增的查找算法详解：ranges::find_last 系列函数

AWS CloudHSM：金融级密钥安全管理实战，如何通过FIPS 140-2认证守护数据生命线？

aws 实践创建policy + Role

W1R3S: 1.0.1靶场

从卡顿到丝滑：JavaScript性能优化实战秘籍

（C语言）超市管理系统（正式版）（指针）（数据结构）（清屏操作）（文件读写）

【数据挖掘笔记】兴趣度度量Interest of an association rule

FastAPI使用@app.get/@app.post等装饰器注册路由无效404 Not Found

Kotlin并发请求的一些知识记录

掌握Multi-Agent实践(七)：基于AgentScope分布式模式实现多智能体高效协作[并行加速大模型辅助搜索、分布式多用户协同辩论赛]

详细分析python 中的deque 以及和list 的用法区别

【深度剖析】安踏体育的数字化转型（上篇1）

嵌入式学习的第二十一天-数据结构-双向链表

js关于number类型的计算问题

RabbitMQ工作流程及使用方法

c/c++消息队列库RabbitMQ的使用

动态库和静态库的区别

以项目的方式学QT开发（二）