当前位置: 首页 > news >正文

使用OpenCV和MediaPipe库——实现人体姿态检测

目录

准备工作如何在Windows系统中安装OpenCV和MediaPipe库?

安装Python

安装OpenCV

安装MediaPipe

验证安装

代码逻辑

整体代码

效果展示


准备工作如何在Windows系统中安装OpenCV和MediaPipe库?

安装Python

    可以通过命令行运行python --version来检查版本号。如果没有安装,可以从Python官方网站下载并安装。

安装OpenCV

  1. 打开命令提示符(Command Prompt)。

  2. 输入以下命令来安装OpenCV-python:

    pip install opencv-python

    如果你也需要OpenCV的额外模块(如SIFT、SURF等),可以运行:

    pip install opencv-contrib-python

安装MediaPipe

安装MediaPipe同样简单,只需要在命令提示符下运行:

pip install mediapipe

验证安装

为了验证OpenCV和MediaPipe是否成功安装,可以在命令提示符中启动Python解释器,然后尝试导入这两个库:

import cv2
import mediapipe as mp
print(cv2.__version__)
print(mp.__version__)

如果打印出了版本号,安装成功。


代码逻辑

  1. 导入必要的库:

    • cv2: OpenCV库,用于处理图像和视频。
    • mediapipe as mp: MediaPipe库,提供了一种简单的方法来访问先进的机器学习模型,这里用于人体姿态估计。
    • time: 用于时间相关的操作,比如计算FPS。
  2. 初始化MediaPipe姿势检测对象:

    • 使用mp_pose.Pose()创建了一个姿势检测器对象,设置了最小检测置信度和跟踪置信度为0.5。
  3. 打开摄像头获取视频流:

    • 使用cv2.VideoCapture(0)打开默认摄像头。
  4. 主循环开始:

    • while cap.isOpened():循环中不断读取摄像头数据。
  5. 处理每一帧图像:

    • 首先检查是否成功读取图像。
    • 然后计算当前帧的FPS。
    • 将BGR格式的图像转换为RGB格式,因为MediaPipe需要RGB格式的输入。
    • 使用姿势检测器对象对图像进行处理,得到关键点位置。
  6. 绘制关键点和连接线:

    • 如果检测到了关键点(results.pose_landmarks),则使用mp_drawing.draw_landmarks()函数在图像上绘制这些关键点及其连接线。
    • 可以自定义关键点和连线的颜色、粗细等属性。
  7. 显示FPS信息:

    • 在图像上显示当前帧的FPS值,帮助用户了解程序运行的流畅度。
  8. 展示结果并监听退出指令:

    • 使用cv2.imshow()展示处理后的图像。
    • 监听键盘事件,当按下'q'键时退出循环,释放资源并关闭所有窗口。


整体代码

import cv2  # 导入 OpenCV 库,用于图像处理和显示
import mediapipe as mp  # 导入 MediaPipe 库,用于姿势检测
import time  # 导入时间模块,用于计算 FPS

# 初始化 MediaPipe 的绘图工具和姿势检测模型
mp_drawing = mp.solutions.drawing_utils  # 用于绘制关键点和连接线
mp_pose = mp.solutions.pose  # 用于姿势检测

# 打开摄像头
cap = cv2.VideoCapture(0)  # 0 表示默认摄像头,如果有多个摄像头可以尝试 1, 2, 等

# 初始化 FPS 计算相关变量
prev_time = 0  # 用于存储上一帧的时间戳

# 使用 MediaPipe 的姿势检测模型
with mp_pose.Pose(
    min_detection_confidence=0.5,  # 检测置信度阈值,高于此值才认为检测到姿势
    min_tracking_confidence=0.5    # 跟踪置信度阈值,高于此值才继续跟踪
) as pose:
    # 进入主循环,持续读取摄像头画面
    while cap.isOpened():
        success, image = cap.read()  # 读取一帧画面
        if not success:  # 如果读取失败(如摄像头断开)
            print("无法读取摄像头画面。")
            break

        # --- 计算 FPS ---
        curr_time = time.time()  # 获取当前帧的时间戳
        dt = curr_time - prev_time  # 计算与上一帧的时间间隔(秒)
        fps = 1 / dt if dt != 0 else 0  # 计算帧率(FPS),避免除以零错误
        prev_time = curr_time  # 更新上一帧的时间戳

        # 将图像从 BGR 格式转换为 RGB 格式(MediaPipe 需要 RGB 格式)
        image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

        # 使用姿势检测模型处理图像
        results = pose.process(image_rgb)

        # 如果检测到姿势关键点,绘制关键点和连接线
        if results.pose_landmarks:
            mp_drawing.draw_landmarks(
                image,  # 要绘制的图像
                results.pose_landmarks,  # 检测到的姿势关键点
                mp_pose.POSE_CONNECTIONS,  # 定义关键点之间的连接线
                landmark_drawing_spec=mp_drawing.DrawingSpec(color=(0, 255, 0), thickness=2),  # 关键点的颜色和粗细
                connection_drawing_spec=mp_drawing.DrawingSpec(color=(0, 0, 255), thickness=2)  # 连接线的颜色和粗细
            )

        # --- 在画面上显示 FPS ---
        fps_text = "FPS: {:.2f}".format(fps)  # 格式化 FPS 值,保留两位小数
        cv2.putText(
            image,  # 要绘制的图像
            fps_text,  # 显示的文本内容
            (10, 30),  # 文本位置(左上角,距离左边 10 像素,距离顶部 30 像素)
            cv2.FONT_HERSHEY_SIMPLEX,  # 字体类型
            1,  # 字体大小
            (0, 255, 0),  # 字体颜色(绿色)
            2  # 字体粗细
        )

        # 显示处理后的图像
        cv2.imshow('Real-Time Pose Detection', image)

        # 检测按键输入,如果按下 'q' 键则退出循环
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break

# 释放摄像头资源
cap.release()

# 关闭所有 OpenCV 窗口
cv2.destroyAllWindows()

效果展示

 

相关文章:

  • 【高并发】深入解析 Netty:3W 学习法 + Java 实战 + 开源项目推荐
  • 【leetcode hot 100 240】搜索二维矩阵Ⅱ
  • flutter环境最新踩坑
  • 什么是TiDB,什么是分布式数据库?它和 MySQL 比优缺点是什么?
  • 【大模型学习】第十一章 什么是算力
  • vue实现日历签到效果
  • 代码随想录算法训练营第三十二天 | 509. 斐波那契数 70. 爬楼梯 746. 使用最小花费爬楼梯
  • Cryptography 与 PyCryptodome 源码级解析
  • 爬虫逆向:脱壳工具BlackDex的详细使用
  • 发行思考:全球热销榜的频繁变动
  • [UE C++]实现自己的事件分发机制
  • Swift系列02-Swift 数据类型系统与内存模型
  • thinkphp5.1 在fetch模版就超时
  • Spring AI简单使用
  • 【JAVA架构师成长之路】【Spring生态】第1集:Spring生态核心
  • 使用QT + 文件IO + 鼠标拖拽事件 + 线程 ,实现大文件的传输
  • 在 macOS 上使用 CLion 进行 Google Test 单元测试
  • Van Uploader解决Android11及以下系统上传图片无反应问题
  • 【机械视觉】C#+visionPro联合编程———【一、C# + VisionPro 联合编程详解以及如何将visionPro工具加载到winform】
  • Web3 与跨链技术:如何实现不同区块链的互操作性
  • 政府网站建设问题形成原因分析/磁力猫torrentkitty官网
  • 邯郸市人力资源和社会保障局/宁波seo推广优化公司
  • 中文企业网站设计欣赏/提高关键词排名的软文案例
  • 查询网站备案密码是什么样的/seo排名工具哪个好
  • 上海整站优化公司/为什么打开网址都是站长工具
  • 网站本地被劫要怎么做/深圳市企业网站seo营销工具