当前位置: 首页 > news >正文

基于C#部署YoloV5目标检测模型

C# YOLOv5目标检测代码详细分析

概述

使用C#和OpenCvSharp库部署YOLOv5目标检测模型,可以对静态图像和视频流(包括摄像头和视频文件)进行目标检测。
在这里插入图片描述
![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/d1cf3e24c9fc472db766689c59800905.png

依赖库

using OpenCvSharp;           // OpenCV的C#封装库
using OpenCvSharp.Dnn;       // 深度神经网络模块
using OpenCvSharp.Extensions; // 扩展方法
using System.Drawing;        // .NET图像处理
using System.Windows.Forms;  // Windows窗体应用

数据结构定义

DetParam 结构体

检测参数配置结构体,用于控制模型推理行为:

public struct DetParam
{public int modelWidth;           // 模型输入宽度(通常320, 416, 640等)public int modelHeight;          // 模型输入高度(通常320, 416, 640等)public double confidenceThreshold; // 置信度阈值(0.0-1.0)public bool outResultBmp;       // 是否输出带检测框的结果图像
}

DetResult 结构体

检测结果结构体,存储单个检测目标的信息:

public struct DetResult
{public int index;        // 类别索引public string label;     // 类别标签名称public double confidence; // 检测置信度public Rect box;         // 边界框坐标(x, y, width, height)
}

CvDet 核心检测类

类成员变量

private Net net;                    // OpenCV DNN网络对象
public List<string> classNames;     // 类别名称列表
int inpHeight = 320;               // 默认输入高度
int inpWidth = 320;                // 默认输入宽度

模型加载方法

ReadModel 方法负责加载ONNX模型和类别标签文件:

public bool ReadModel(string modelPath, string classesPath)

功能流程:

  1. 使用 CvDnn.ReadNetFromOnnx() 加载ONNX格式的YOLOv5模型
  2. 从文本文件中逐行读取类别名称
  3. 异常处理确保加载过程的稳定性

注意事项:

  • 模型文件必须是ONNX格式
  • 类别文件每行一个类别名称,顺序对应模型输出的类别索引

图像检测方法

Detect 方法是核心的目标检测功能:

输入验证和预处理
Mat srcImage = BitmapConverter.ToMat(inputBmp);
if(srcImage.Channels() == 1)
{Cv2.CvtColor(srcImage, srcImage, ColorConversionCodes.GRAY2BGR);
}
  • 将Bitmap转换为OpenCV的Mat格式
  • 确保图像为3通道BGR格式
图像尺寸调整
Mat resizeMat = ResizeImage(srcImage, out newHeight, out newWidth, out paddingHeight, out paddingWidth);

调用自定义的 ResizeImage 方法,保持长宽比的同时调整到模型输入尺寸。

创建输入Blob
Mat blob = CvDnn.BlobFromImage(resizeMat, 1/255.0, new OpenCvSharp.Size(detParam.modelWidth, detParam.modelHeight), new Scalar(0, 0, 0), true, false);

参数说明:

  • 1/255.0: 像素值归一化到[0,1]范围
  • true: 交换R和B通道(BGR转RGB)
  • false: 不进行图像裁剪
模型推理
net.SetInput(blob);
Mat[] outBlobs = new Mat[3] { new Mat(), new Mat(), new Mat() };
string[] outBlobNames = net.GetUnconnectedOutLayersNames().ToArray();
net.Forward(outBlobs, outBlobNames);
  • 设置网络输入
  • 获取输出层名称
  • 执行前向推理
输出处理和解析
int numProposal = outBlobs[0].Size(0);
int nout = outBlobs[0].Size(1);
if (outBlobs[0].Dims > 2)
{numProposal = outBlobs[0].Size(1);nout = outBlobs[0].Size(2);outBlobs[0] = outBlobs[0].Reshape(0, numProposal);
}

适配不同版本YOLOv5的输出格式。

候选框提取(核心算法)
unsafe
{float* pdata = (float*)outBlobs[0].Data;for (int n = 0; n < numProposal; n++){float boxScore = pdata[4];  // 目标存在概率if (boxScore >= detParam.confidenceThreshold){// 获取类别概率Mat scores = outBlobs[0].Row(rowIndex).ColRange(5, nout);Cv2.MinMaxLoc(scores, out minVal, out maxVal, out minLoc, out maxLoc);maxVal = maxVal * boxScore;  // 最终置信度if (maxVal >= detParam.confidenceThreshold){// 坐标还原float cx = (pdata[0] - paddingWidth) * Math.Max(ratiow, ratioh);float cy = (pdata[1] - paddingHeight) * Math.Max(ratiow, ratioh);float w = pdata[2] * Math.Max(ratiow, ratioh);float h = pdata[3] * Math.Max(ratiow, ratioh);int left = (int)(cx - 0.5 * w);int top = (int)(cy - 0.5 * h);// 保存检测结果confidences.Add((float)maxVal);boxes.Add(new Rect(left, top, (int)w, (int)h));classIds.Add(classIndex);}}pdata += nout;  // 指针移动到下一个候选框}
}

YOLOv5输出格式解析:

  • pdata[0], pdata[1]: 中心点坐标 (cx, cy)
  • pdata[2], pdata[3]: 宽度和高度 (w, h)
  • pdata[4]: 目标存在概率 (objectness score)
  • pdata[5:]: 各类别概率分布
非极大值抑制(NMS)
float nmsThreshold = 0.5f;
CvDnn.NMSBoxes(boxes, confidences, (float)detParam.confidenceThreshold, nmsThreshold, out indices);

消除重叠的检测框,保留最优结果。

结果可视化
if(detParam.outResultBmp)
{Cv2.Rectangle(resultImage, /* 绘制边界框 */);Cv2.PutText(resultImage, /* 添加标签文本 */);
}

视频检测方法

DetectVedio 方法与图像检测基本相同,主要区别:

  • 输入参数为 Mat 而非 Bitmap
  • 输出为 Mat 类型的结果图像
  • 适用于视频流的实时处理

图像预处理方法

ResizeImage 方法实现保持长宽比的图像缩放:

核心算法
float hw_scale = (float)srch / srcw;
if (hw_scale > 1)  // 图像高度大于宽度
{newh = inpHeight;neww = (int)(inpWidth / hw_scale);// 左右填充left = (int)((inpWidth - neww) * 0.5);Cv2.CopyMakeBorder(dstimg, dstimg, 0, 0, left, inpWidth - neww - left, BorderTypes.Constant);
}
else  // 图像宽度大于高度
{newh = (int)(inpHeight * hw_scale);neww = inpWidth;// 上下填充top = (int)((inpHeight - newh) * 0.5);Cv2.CopyMakeBorder(dstimg, dstimg, top, inpHeight - newh - top, 0, 0, BorderTypes.Constant);
}

填充策略:

  • 计算长宽比例
  • 按比例缩放到合适尺寸
  • 使用黑色像素填充剩余区域
  • 确保输出尺寸符合模型要求

使用示例

// 初始化检测器
CvDet detector = new CvDet();// 加载模型
bool success = detector.ReadModel("yolov5s.onnx", "coco.names");// 设置检测参数
DetParam param = new DetParam
{modelWidth = 640,modelHeight = 640,confidenceThreshold = 0.5,outResultBmp = true
};// 执行检测
Bitmap inputImage = new Bitmap("test.jpg");
List<DetResult> results = detector.Detect(inputImage, param, out Bitmap resultImage);// 处理检测结果
foreach(var result in results)
{Console.WriteLine($"类别: {result.label}, 置信度: {result.confidence:F2}");
}

关键技术要点

1. 坐标变换

代码实现了从模型输出坐标到原图坐标的正确变换,考虑了:

  • 图像缩放比例
  • 填充偏移量
  • 中心点坐标转换为左上角坐标

2. 内存安全

使用 unsafe 代码块直接操作内存指针,提高了数据访问效率。

3. 异常处理

在模型加载和推理过程中都有适当的异常处理机制。

4. 性能优化

  • 使用指针直接访问输出数据
  • 避免不必要的数据拷贝
  • 合理的内存管理

后续优化

  1. 批处理支持: 当前实现为单张图像处理,可扩展支持批量处理
  2. GPU加速: 可配置使用CUDA或OpenCL后端加速推理
  3. 多线程: 对于视频处理场景,可实现多线程并行处理
  4. 动态模型尺寸: 支持运行时调整模型输入尺寸
  5. 更多后处理选项: 添加跟踪、计数等高级功能

总结

上述代码提供了一个完整、高效的YOLOv5 C#部署方案,适用于Windows平台的目标检测应用。代码结构清晰,功能完整。

http://www.dtcms.com/a/251515.html

相关文章:

  • 【系统分析师】2010年真题:综合知识-答案及详解
  • 6月15日星期日早报简报微语报早读
  • Babylon引擎(三)
  • 基于Ultralytics的RT-DETR改进思考
  • BEV 感知算法评价指标简介
  • Appium框架下载时卡主的解决办法(ERR_TLS_CERT_ALTNAME_INVALID)
  • 基于根茎式思维深化后的提示词设计案例
  • 【精选】计算机毕业设计基于SpringBoot高校社团管理系统 社团信息维护 活动发布报名 成员审核与公告发布平台源码+论文+PPT+讲解
  • 智能土木通 - 土木工程专业知识问答系统01:项目简介
  • 4.es、kibana容器的下载安装
  • C#最佳实践:为何应减少方法参数
  • 【python】 args和kwargs区别
  • 【git】有两个远程仓库时的推送、覆盖、合并问题
  • HarmonyOS Grid 网格拖拽完全指南
  • Vue 3 路由跳转全面指南(Composition API + <script setup>)
  • 高效便捷版,多功能一键直达!
  • 行为设计模式之Strategy(策略)
  • 深入理解滑动窗口算法:原理、应用与 C++ 实现
  • 行列式的性质 线性代数
  • Go语言--语法基础5--基本数据类型--输入输出(2)
  • 自主学习-《Absolute Zero: Reinforced Self-play Reasoning with Zero Data》
  • 用Jmeter进行接口测试
  • HarmonyOSNext性能核弹:用Node-API引爆ArkTS/C++跨语言
  • MySQL事务:从原理到实践
  • 软件测试用例(一)
  • 私域到底怎么做?
  • 【分析学】 从确界定理出发——实数系完备定理
  • 第十七章:SD如何制作三视图(基础)
  • 如何写一个简单的python类class
  • Gartner《Reference Architecture for Federated Analytics》学习心得