Google的Mediapipe开源框架介绍及使用说明
一、介绍
Mediapipe是Google在2019年开发并提出的一款开源的跨平台多媒体处理框架,用于构建基于机器学习的应用程序,特别是涉及到计算机视觉、音频处理、姿势估计等领域。Mediapipe实际上是一个集成的机器学习视觉算法的工具库(包含人脸检测、人脸关键点、手势识别、头像分割和姿态识别等各种模型),该库提供了一系列预训练模型和工具,可以帮助开发者快速构建和部署计算机视觉和音频处理应用。它提供了一套易于使用的API,可以用于实时姿势估计、手势识别、面部识别、目标跟踪等任务。
1、学习之前 C++ OpenCV 是基础。
2、Mediapipe 框架是一个商用级别的的人脸 人体关键点 物体,表情,手势追踪,图像分割的框架。是人脸美颜,贴纸,3D 动作追踪基础框架。
3、结合 OpenGL 能做出非常多的有用的产品。
4、Mediapipe 是谷歌推出的开源框架。
5、跨平台 iOS Android windows mac Linux 都能用.C++ 开发。
6、进一步可以搞深度学习 pytorch 这些框架。
7、下一代音视频开发会结合 AI 3D XR 方向。低延迟 图像识别 三维重建 AI 画质超分(DLSS metalFX)注视点渲染.学习 mediapipe 可以打好基础。
8、Mediapipe 可以做成库,在自己的项目里面用。