当前位置：首页 > news >正文

AI学习笔记三十四：基于yolov5+deepsort+slowfast的视频实时行为检测测试

news 2025/8/2 20:29:30

若该文为原创文章，转载请注明原文出处。

打算做一个目标行为检测的项目，翻阅了大量资料，于是打算通过yolov5实现目标检测，deepsort实现目标跟踪以及slowfast实现动作识别，最终实现端到端的目标行为检测模型。

一、简介

SlowFast网络的基本思想是通过两个独立但相互连接的流来处理视频数据。Slow路径负责捕获空间语义信息，它以较低的帧率处理输入视频。Fast路径则以较高的帧率处理视频，能够捕捉快速运动信息。

slowfast 的核心结构包括：

1、慢路径网络（Slow）：慢路径网络接收较少的帧数作为输入，用于捕捉空间语义信息

2、快路径网络（Fast）：快路径网络接收更多的帧，以较好的时间分辨率捕捉运动。可以通过减少Fast路径的通道容量，使其变得非常轻，同时学习有用的时间信息用于视频识别

这两个网络通过特定的层进行信息交互，在每个阶段结束时进行。二者通过横向连接（lateral connection）进行融合。

二、源码

gitee：https://gitee.com/YFwinston/yolov5-slowfast-deepsort-PytorchVideo

ckpt.t7，yolov5l6.pt等文件下载：

https://share.weiyun.com/xCgma1LG
https://share.weiyun.com/EUi4NvnM

三、环境搭建

源码使用的是linux环境，没测试过，这里使用的是win10,cpu版本

1、创建环境

conda create -n yolo_slowfast_env python=3.7.11

2、激活

conda activate yolo_slowfast_env

3、安装依赖

pip install pytorchvideo -i https://pypi.tuna.tsinghua.edu.cn/simple      pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simplepip install ultralytics     pip install torch torchvision            pip install gitpython>=3.1.30

到此环境搭建完成

四、测试

测试前需要把模型文件放到源码下。

yolov5l6.pt文件放在工程目录下

ckpt.t7文件放在 deep_sort/deep/checkpoint/目录下

SLOWFAST_8x8_R50_DETECTION.pyth文件放到cache/torch/hub/checkpoints目录下。

第三个文件如果没有，程序会在下载缓存。

接下来准备一个测试视频，执行下面命令：

python yolo_slowfast.py --input .\test.mp4 --device cpu --output result.mp4

执行会一直在处理，没有显示，只能看保存的视频。

测试正常，在执行时，会下在一些文件，请耐心等待。

如有侵权，或需要完整代码，请及时联系博主。

查看全文

http://www.dtcms.com/a/308619.html

【源力觉醒创作者计划】文心大模型4.5体验：技术跃迁，拥抱AI新时代

Coze是什么？能做什么？

MySQL 9 INNODB Cluster部署

Qt之CJSON：从基础到进阶的 JSON 数据处理指南

MySQL 8.0 OCP 1Z0-908 题目解析(41)

节目预告：工程师张仰彪在相对论学习中的九个疑问

【Kubernetes 指南】基础入门——Kubernetes 集群（一）

python每日一题练习---简单题目

基于STM32设计的景区便民服务系统(NBIOT)_261

IDEA识别lombok注解问题

MySQL常用命令完整指南

systmctl的作用，使用场景和用法

硬件-音频学习DAY1——音箱材料选择：密度板为何完胜实木

动手学习深度学习-深度学习知识大纲

云迁移技术深度解析：核心原理与最佳实践

Python删除字符串的3种高效方法

Spring Boot + MinIO + KKFile：三步搭建企业级文件预览系统

Mysql索引失效问题及其原因

【Leetcode】2683. 相邻值的按位异或

五、cv::SparseMat的介绍和使用

是采用示例模板，还是采用json的结构化数据，哪种方式会让llm的输出更加稳定？

查询目前服务器所占的带宽的命令（上传和下载）

CNN卷积神经网络之LeNet和AlexNet经典网络模型（三）

c语言的编译链接

Winform PathGradientBrush类使用

C#程序本地运行正常，通过网络下载报错：FileLoadException:“未能加载文件或程序集“xxx.dll”或它的某一个依赖项。

【pycharm的使用】

Qwen3-30B-A3B-Thinking-2507 推理模型深度评测

250721脑电分析课题进展——手工特征总结

lsof命令