当前位置：首页 > news >正文

从图片到实时摄像头：OpenCV EigenFace 人脸识别实战教程

news 2025/9/23 7:22:59

在计算机视觉领域，人脸识别是一个兼具趣味性与实用性的技术方向。借助 OpenCV 库提供的 EigenFace 算法，我们无需深入理解复杂的机器学习理论，就能快速搭建起从静态图片识别到实时摄像头识别的完整流程。本文将通过三段递进式代码，带大家逐步掌握人脸识别技术，从基础原理到实际应用，手把手教你实现属于自己的人脸识别系统。

一、人脸识别基础：核心概念与环境准备

在开始编写代码前，我们需要先明确几个关键概念，了解人脸识别的基本原理，同时做好环境搭建工作。

1.1 核心算法：EigenFace（特征脸）

EigenFace 是基于主成分分析（PCA）的人脸识别算法，其核心思想是降维与特征提取：

将多张人脸图像（灰度图）转化为高维向量，通过 PCA 算法提取最能区分不同人脸的 “特征脸”（主成分）；
训练阶段：将每个人的人脸图像映射到 “特征脸” 构成的低维空间，形成该人的特征模板；
预测阶段：将待识别的人脸图像同样映射到低维空间，与训练好的模板计算相似度（置信度），匹配最接近的标签。

OpenCV 的cv2.face.EigenFaceRecognizer_create()接口已封装好该算法，我们只需传入参数即可直接使用。

1.2 关键参数解析

在后续代码中，以下参数需要重点关注：

threshold（阈值）：判断 “是否识别成功” 的临界值。若预测时的置信度低于阈值，认为识别成功；高于阈值则视为 “无法识别”（需根据实际数据调整，本文示例中设为 5000）；
image size（图像尺寸）：所有训练图像和待识别图像必须保持一致（本文统一设为 120×180 像素），否则无法进行向量映射；
灰度图：人脸识别算法通常基于灰度图进行计算，减少颜色通道的干扰，OpenCV 中通过cv2.IMREAD_GRAYSCALE或参数0读取灰度图。

1.3 环境搭建

需安装两个核心库：OpenCV（用于图像处理与识别）和 NumPy（用于数值计算）：

pip install opencv-python opencv-contrib-python numpy

注意：opencv-contrib-python包含了cv2.face模块（人脸识别相关接口），仅安装opencv-python会导致模块缺失。

二、实战一：静态图片人脸识别（基础版）

首先从最简单的静态图片识别入手，核心目标是：用少量训练图片训练模型，然后识别单张待预测图片属于哪个人。

2.1 代码实现与解析

import cv2
import numpy as np# 1. 准备训练数据：读取图片并统一尺寸（120×180）
images = []  # 存储训练图像
# 读取4张训练图（2张“dlrb”，2张“manyu”），转为灰度图并调整尺寸
a = cv2.imread('dlrb1.jpg', 0)  # 参数0表示读取灰度图
a = cv2.resize(a, (120, 180))
b = cv2.imread('dlrb2.jpg', 0)
b = cv2.resize(b, (120, 180))
c = cv2.imread('manyu1.jpg', 0)
c = cv2.resize(c, (120, 180))
d = cv2.imread('manyu2.jpg', 0)
d = cv2.resize(d, (120, 180))# 将处理好的图片加入训练集
images.append(a)
images.append(b)
images.append(c)
images.append(d)# 2. 准备标签：与训练图片一一对应（0代表dlrb，1代表manyu）
labels = [0, 0, 1, 1]# 3. 准备待预测图片：同样处理为120×180灰度图
pre_image = cv2.imread('manyu.jpg', 0)
pre_image = cv2.resize(pre_image, (120, 180))# 4. 创建EigenFace识别器并训练
# threshold=5000：置信度低于5000则认为识别成功
recognizer = cv2.face.EigenFaceRecognizer_create(threshold=5000)
# 训练：传入训练图像列表和标签数组（需用np.array转为数值数组）
recognizer.train(images, np.array(labels))# 5. 预测：输出标签和置信度
label, confidence = recognizer.predict(pre_image)
# 标签映射为具体人名
name_dict = {0: 'dlrb', 1: 'manyu'}
print(f'识别结果：{name_dict[label]}')
print(f'置信度：{confidence:.1f}')  # 置信度越低，匹配度越高# 6. 可视化结果：在原图上添加识别标签
original_img = cv2.imread('manyu.jpg').copy()  # 避免修改原图
# 参数：图像、文本、坐标、字体、字号、颜色（BGR）、线条粗细
cv2.putText(original_img, name_dict[label], (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 0, 255), 2)
# 显示结果窗口
cv2.imshow('Recognition Result', original_img)
cv2.waitKey(0)  # 等待按键关闭窗口
cv2.destroyAllWindows()  # 释放窗口资源

2.2 关键注意事项

图片路径：确保dlrb1.jpg、manyu.jpg等图片与代码在同一文件夹，或使用绝对路径（如C:/images/dlrb1.jpg）；
尺寸统一：训练图和预测图必须保持相同尺寸（本文 120×180），否则会报 “输入尺寸不匹配” 错误；
置信度解读：EigenFace 的置信度是 “待识别图与模板的距离”，数值越低，匹配越准确。若置信度高于threshold，识别器会返回标签-1（需在name_dict中添加-1: '无法识别'）。

三、实战二：静态图片人脸识别（优化版）

在基础版的基础上，我们优化了代码结构，同时增加了 “单一人脸多图训练” 的场景（比如识别特定人物 “wjw”），为后续实时摄像头识别做铺垫。

3.1 代码实现

import cv2
import numpy as npdef prepare_training_data(image_paths, target_size=(120, 180)):"""封装训练数据准备函数：读取多张图片，统一尺寸并转为灰度图:param image_paths: 图片路径列表:param target_size: 目标尺寸（宽×高）:return: 处理后的训练图像列表"""images = []for path in image_paths:# 读取灰度图并调整尺寸img = cv2.imread(path, 0)img_resized = cv2.resize(img, target_size)images.append(img_resized)return images# 1. 定义训练图片路径（4张“wjw”的图片）
train_image_paths = ['img.png', 'img_1.png', 'img_2.png', 'img_3.png']
# 调用函数准备训练数据
train_images = prepare_training_data(train_image_paths)# 2. 准备标签（4张图均属于“wjw”，标签统一为0）
train_labels = [0, 0, 0, 0]# 3. 创建并训练EigenFace识别器
recognizer = cv2.face.EigenFaceRecognizer_create(threshold=5000)
recognizer.train(train_images, np.array(train_labels))# 4. 预测（此处可替换为任意待识别图片路径）
test_img_path = 'test_wjw.jpg'
test_img = cv2.imread(test_img_path, 0)
test_img_resized = cv2.resize(test_img, (120, 180))# 5. 执行预测并处理结果
label, confidence = recognizer.predict(test_img_resized)
name_dict = {0: 'wjw', -1: '无法识别'}
# 判断是否识别成功（置信度低于阈值）
result_name = name_dict[label] if confidence < 5000 else name_dict[-1]
print(f'识别结果：{result_name}')
print(f'置信度：{confidence:.1f}')# 6. 可视化
original_img = cv2.imread(test_img_path).copy()
cv2.putText(original_img, result_name, (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)
cv2.imshow('Result', original_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

3.2 优化点说明

函数封装：将 “读取图片→调整尺寸” 的重复逻辑封装为prepare_training_data，提高代码复用性；
结果容错：增加了 “置信度判断”，当置信度高于阈值时，明确返回 “无法识别”，避免错误标签；
扩展性：若需识别多个人，只需增加图片路径和标签（如train_labels = [0,0,1,1]，对应两个人）。

四、实战三：实时摄像头人脸识别（终极版）

静态图片识别的局限性在于 “只能处理单张图”，而实时摄像头识别能捕捉动态画面，真正实现 “实时身份验证”。核心新增功能是：人脸检测（从画面中定位人脸）+ 实时预测。

4.1 代码实现与详细解析

import cv2
import numpy as npdef prepare_training_data(image_paths, target_size=(120, 180)):"""训练数据准备函数（复用实战二的封装）"""images = []for path in image_paths:img = cv2.imread(path, 0)img_resized = cv2.resize(img, target_size)images.append(img_resized)return images# ---------------------- 1. 训练阶段：准备模型 ----------------------
# 训练图片路径（4张“wjw”的图片）
train_image_paths = ['img.png', 'img_1.png', 'img_2.png', 'img_3.png']
train_images = prepare_training_data(train_image_paths)
train_labels = [0, 0, 0, 0]  # 标签0对应“wjw”# 创建并训练EigenFace识别器
recognizer = cv2.face.EigenFaceRecognizer_create(threshold=5000)
recognizer.train(train_images, np.array(train_labels))# ---------------------- 2. 人脸检测：使用Haar级联分类器 ----------------------
# 加载OpenCV自带的人脸检测模型（无需自己训练）
# haarcascade_frontalface_default.xml：正面人脸检测模型
face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')# ---------------------- 3. 实时摄像头捕捉与识别 ----------------------
# 打开摄像头（0表示默认摄像头，1表示外接摄像头）
cap = cv2.VideoCapture(0)
# 检查摄像头是否成功打开
if not cap.isOpened():print("错误：无法打开摄像头")exit()  # 退出程序# 人名映射字典
name_dict = {0: 'wjw', -1: '无法识别'}# 循环读取摄像头帧（实时处理）
while True:# 读取一帧画面：ret为“是否读取成功”，frame为画面数据ret, frame = cap.read()if not ret:print("错误：无法获取摄像头帧")break  # 读取失败则退出循环# 水平翻转画面（避免“镜像反转”，更符合人眼习惯）frame = cv2.flip(frame, 1)# 转为灰度图（人脸检测和识别均基于灰度图）gray_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)# ---------------------- 4. 检测画面中的人脸 ----------------------# detectMultiScale：检测画面中所有人脸，返回人脸的坐标（x,y）和尺寸（w,h）faces = face_cascade.detectMultiScale(gray_frame,scaleFactor=1.1,  # 缩放因子（每次缩小10%，提高检测率）minNeighbors=5,   # 最小邻居数（过滤误检，值越大误检越少）minSize=(30, 30)  # 最小人脸尺寸（过滤过小的误检区域）)# ---------------------- 5. 对每个检测到的人脸进行识别 ----------------------for (x, y, w, h) in faces:# 1. 绘制人脸框：在原画面上用蓝色矩形框出人脸cv2.rectangle(frame, (x, y), (x + w, y + h), (255, 0, 0), 2)# 2. 提取人脸区域（ROI：Region of Interest）face_roi = gray_frame[y:y + h, x:x + w]  # 从灰度图中截取人脸try:# 3. 调整人脸尺寸（与训练图一致：120×180）face_resized = cv2.resize(face_roi, (120, 180))# 4. 预测：获取标签和置信度label, confidence = recognizer.predict(face_resized)# 5. 确定识别结果（根据置信度判断）if confidence < 5000:result_name = name_dict[label]# 在人脸框上方显示“人名（置信度）”cv2.putText(frame, f"{result_name} ({confidence:.1f})",(x, y - 10),  # 文本坐标（在人脸框上方）cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 255, 0), 2)else:# 置信度过高，视为“无法识别”cv2.putText(frame, name_dict[-1],(x, y - 10),cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 0, 255), 2)except Exception as e:# 捕获异常（如人脸尺寸过小导致调整失败）print(f"识别过程出错：{str(e)}")# ---------------------- 6. 显示实时画面 ----------------------cv2.imshow('Real-Time Face Recognition', frame)# 退出条件：按下“q”键关闭窗口（waitKey(1)表示1ms刷新一次）if cv2.waitKey(1) & 0xFF == ord('q'):break# ---------------------- 7. 释放资源 ----------------------
cap.release()  # 关闭摄像头
cv2.destroyAllWindows()  # 关闭所有OpenCV窗口

4.2 核心功能拆解

人脸检测（Haar 级联分类器）：
- OpenCV 自带了预训练的 Haar 模型（haarcascade_frontalface_default.xml），能快速定位画面中的人脸；
- detectMultiScale参数调整技巧：若误检多（如把背景当成人脸），可增大minNeighbors；若漏检多，可减小scaleFactor。
实时处理逻辑：
- 循环读取摄像头帧（cap.read()），每帧画面都经历 “翻转→转灰度→人脸检测→人脸识别→绘制结果” 的流程；
- cv2.flip(frame, 1)实现水平翻转，解决摄像头 “镜像” 问题，让画面更自然。
异常处理：
- 用try-except捕获 “人脸尺寸过小导致调整失败” 等异常，避免程序崩溃；
- 置信度判断：明确区分 “识别成功” 和 “无法识别”，并用不同颜色文本标注（绿色为成功，红色为失败）。