当前位置: 首页 > wzjs >正文

获取网站访客qq号码程序下载wordpress相同字段调用

获取网站访客qq号码程序下载,wordpress相同字段调用,电子商务营销方法有哪些,小程序嵌套wordpress序言:最近在整理Yolo v5的流程,我发现网上写的大多很零碎,把推理过程和训练过程混淆。经过我长达三天的整理终于对照代码将Yolo v5详细训练过程,和Yolo v5详细训推理过程总结如下。如果有什么细节问题,根据本篇文章在询问ai。或者…

序言:最近在整理Yolo v5的流程,我发现网上写的大多很零碎,把推理过程和训练过程混淆。经过我长达三天的整理终于对照代码将Yolo v5详细训练过程,和Yolo v5详细训推理过程总结如下。如果有什么细节问题,根据本篇文章在询问ai。或者需要手写推理代码也可参考推理的后处理来进行参照。希望能帮到需要的人,如果有什么错误,也欢迎指正。

(ps:由于不同版本的Yolo 5也有差别,请大家记得甄别仔细)

Yolo v5网络结构图

Yolo v5详细训练过程

训练过程主要关注特征提取和正样本选择

1.前处理:(较为琐碎,此处只是大框架)

1.1数据增强:

①Mosaic数据增强随机选取4张图像拼接为单张图像(1280×1280)提升小目标检测能力,增加背景复杂度。

②自适应图像缩放:保持原图长宽比缩放至最长边=640

③归一化与通道转换:像素值归一化至 [0,1], 维度转换:H×W×C → C×H×W

1.2自适应锚框计算:k-means聚类生成9个先验框(3个尺度×3种长宽比)

2.模型的前向传播:

2.1Backbone(主干网络提取特征):

①采用Focus 结构 (v6.0 之前): 早期版本在输入后使用 Focus 模块(本质是高效的切片操作 slice切片(2) + concat)。

1将输入图像的空间分辨率(H, W)减少到 1/4(H/2, W/2),同时将通道数增加 4 倍。

2这相当于一个高效的、无参数的“下采样”,保留了更多信息。

②特征提取主干 CSPDarknet53核心包含多个 C3 模块 (本质是CSP Bottleneck )。将特征图分成两部分:一部分直接传递到下一阶段,另一部分经过密集块处理后再与之前传递的部分融合。

1.融合浅层,中层,高层,不同尺寸的特征, 丰富梯度信息。

2.采用C3模块内部有残差过程,只有部分特征经过密集计算,减少了计算量。

3.多处跨阶段直连路径, 增强梯度流减缓梯度消失。

③SPPF(v6.0前SPP):三层池化(5,9,13)然后ConvModule,再concat。多尺度池化融合,适应不同尺寸目标,保留更多细节。串行复用设计减少计算量,提高推理速度。(SPP:是 三个池化层独立计算 → 重复计算严重,运算过慢。)

2.2Neck部分(特征融合)

①采用改进的PANNet:

1.接收了80×80×256(来自第3阶段C3),40×40×512(来自第4阶段C3),20×20×512(SPPF输出)的输出,

2.拥有自上而下,自下而上的过程,融合高层语义特征 和 低层细节特征,提升目标的检测能力。

3.与SPP模块互补,提取多尺度的全局特征,增强模型对不同尺度目标的适应性。

2.3Head(检测头):

①Yolo v5是耦合头(4边界框坐标+1目标置信度+85类别概率),分类回归共享卷积特征,参数量较少,推理更快,但是小目标检测略弱。

②小目标,中目标,大目标.对应输出的数据是后处理中的list={0:{Tensor:1,255,80,80} 1:{Tensor:1,255,40,40} 2:{Tensor:1,2555,20,20}},对应(1, 3, 85, 80, 80)

# [batch, anchor box, (85=4(边界框偏移量 dx,dy,dw,dh)+1 (目标置信度 )+80 num_classes), grid_h网格高,grid_w网格宽]

3.模型的反向传播:

3.1多正样本选择:

为每个真实目标(Ground Truth Box, GT)分配足够多的、高质量的正样本 Anchor

多gird:使用三个不同尺度的特征图(80×80, 40×40,20×20)每个网格点都负责预测。显著提升了多尺度物体检测.

多Anchor:每个网格点又预测 3 个不同长宽比和大小的 Anchor Boxes。现实世界物体的形状多种多样. 提高模型对不同长宽比物体的适应能力。

多正样本ATSS:(一个目标匹配多个网格Anchor)

①初步筛选(基于 Anchor 中心): 对于每个 GT Box:计算 GT Box 的中心点 (gx, gy)。找该中心点落在哪个Grid Cell。

②候选 Anchor 选择:考虑该 Grid Cell (i, j) 以及其相邻的 Grid Cells内的所有 Anchor Template。

③计算这个 GT Box 与步骤 2 中选出的所有候选 Anchor Boxes 的 IoU。选择 IoU超过阈值的Anchor。

④基于GT BOX与Anchor宽高比例的匹配策略(Anchor Template的边*0.25和*4能把GTBox 包起来为正样本,既形状相似度)

3.2构建loss

①边界框回归损失: CIoU Loss。CIoU Loss 比传统的 IoU Loss 或 GIoU Loss 能更全面地衡量框的相似度,收敛更快,定位更精准。

②目标置信度损失:二元交叉熵损失 Focal Loss通过 obj 和 cls 的 BCE 函数的 pos_weight 和 fl_gamma 参数实现)来降低大量负样本对总损失的贡献.

③类别损失:每个类别独立使用 Sigmoid 激活 + BCE Loss ,只对正样本计算此损失。

Yolo v5详细推理过程

推理过程主要关注数据形状和后处理部分。

1.前处理:

1.1数据增强

1.2图像缩放 (Letterbox Resizing)

1.3维度扩展与对齐(BCHW)

2.模型的前向传播:

2.1 Backbone(特征提取[1, 3, 640, 640]):Focus,CSPDarknet53,SPPF/SPP

2.2 Neck (特征融合)改进的PANNet: output ( [1, 256, 80, 80], [1, 512, 40, 40], [1, 1024, 20, 20])

2.3Head (耦合检测头):num_classes=80

1output_p3 = [1, 3, (5+num_classes), 80, 80] -> 变形 为 [1, 3*80*80, (5+num_classes)] = [1, 19200, (5+num_classes)]

2output_p4 = [1, 3, (5+num_classes), 40, 40] -> 变形为 [1, 3*40*40, (5+num_classes)] = [1, 4800, (5+num_classes)]

3output_p5 = [1, 3, (5+num_classes), 20, 20] -> 变形为 [1, 3*20*20, (5+num_classes)] = [1, 1200, (5+num_classes)]

4拼接 (Concatenate):torch.cat([output_p3, output_p4, output_p5], dim=1) -> [1, (19200+4800+1200), (5+num_classes)] = [1, 25200,85]

3.后处理:

A. 解码边界框 (Decode Boxes):

1.Sigmoid 激活: 对 dx, dy, obj 应用 sigmoid 函数,将其约束到 (0, 1) 范围。

2.计算网格中心坐标: 对于每个预测位置 (i, j) (网格坐标),计算其对应的特征图上的中心坐标

3.计算预测框中心: bx = sigmoid(dx) + cx, by = sigmoid(dy) + cy。(sigmoid(dx), sigmoid(dy)) 是相对于网格单元中心的偏移量。

4.计算预测框宽高: bw = anchor_w * exp(dw), bh = anchor_h * exp(dh)。(anchor_w, anchor_h) 是与该预测位置关联的 anchor 模板的宽度和高度。

5.计算绝对坐标 (像素): 将中心坐标 (bx, by) 和宽高 (bw, bh) 转换为图像坐标系下的边界框表示:

B. 应用置信度阈值

1.计算每个预测框的 最终置信度:conf = obj * max(cls_score)。max(cls_score) 是该预测框在所有类别上经过 sigmoid 后的最大类别概率。

2.丢弃所有 conf < conf_thres 的预测框。(大幅减少了候选框数量)

C. 类别概率处理

1.直接使用最大类别概率: 如上所述,在计算最终置信度 conf 时已经用了 max(cls_probs)

2.(可选)多标签模式 (Multi-label): 对每个类别单独设置一个阈值 multi_label_thres (例如 0.25),允许一个框同时属于多个类别

D. 非极大值抑制(NMS)

首先:按类别 class_id 对所有框进行分组(*max_value)然后对于每个类别进行下面过程

1.将该类别的所有框按置信度 conf 从高到低排序。

2.选取置信度最高的框 A 作为保留框。

3.计算框 A 与剩余所有框的 IoU

4.移除所有与框 A 的 IoU 超过设定阈值 iou_thres的框

5.从剩余框中再选取置信度最高的框 B 作为下一个保留框。循环以上操作。

输出:[batch_index, x1, y1, x2, y2, conf, class_id]

E. 尺度还原

1.当前检测框坐标 (x1, y1, x2, y2) 是基于 640x640 Letterbox 图像的。

2.将它们映射回原始未缩放、未填充的图像坐标系。

F. 输出 (Output)

最终输出格式1: list :[x1, y1, x2, y2, confidence, class_id] (绝对坐标)

最终输出格式2: list : [x_center, y_center, width, height, confidence, class_id]


文章转载自:

http://XfvE7J8a.cLyhq.cn
http://QYXdQUuD.cLyhq.cn
http://VEtTbxTq.cLyhq.cn
http://tCjbPQrD.cLyhq.cn
http://GcRhOpSc.cLyhq.cn
http://AlnZACIF.cLyhq.cn
http://4piDqreE.cLyhq.cn
http://J2sN6jgD.cLyhq.cn
http://yNcagd5S.cLyhq.cn
http://t4ja2oXU.cLyhq.cn
http://80te1fIq.cLyhq.cn
http://yIzM9slK.cLyhq.cn
http://lf5z13KN.cLyhq.cn
http://HBqYGvLP.cLyhq.cn
http://o6vXrh14.cLyhq.cn
http://qv3stXDz.cLyhq.cn
http://67ymODyk.cLyhq.cn
http://7yDcMOxQ.cLyhq.cn
http://muIRT9lm.cLyhq.cn
http://neVaWhds.cLyhq.cn
http://G22k7uw8.cLyhq.cn
http://bzYcNPLF.cLyhq.cn
http://p70Fq3Q3.cLyhq.cn
http://Pb0KXLX1.cLyhq.cn
http://xTNs9Omi.cLyhq.cn
http://Xwgxcdxe.cLyhq.cn
http://nSIrWTVB.cLyhq.cn
http://tmJ0e5bU.cLyhq.cn
http://OCMtHVUE.cLyhq.cn
http://K5K7kZNs.cLyhq.cn
http://www.dtcms.com/wzjs/752865.html

相关文章:

  • 网站除了域名还要什么如何做ppt的模板下载网站
  • js动效网站免费简约ppt模板
  • 网站搭建书籍推荐网站建设管理情况自查报告
  • 宣传网站怎么做的天河网站建设哪个好
  • 网站建设结构分布提供购物网站建设
  • 个人网站建设俄文网站推广
  • 网站备案更改做网站开发哪里可以接单
  • 做网站用笔记本做服务器吗整站seo优化一般多少钱
  • 纪检网站建设计划凉州区住房城乡建设局网站
  • 阿里云做的网站误删了射洪哪里可以做网站
  • 广告公司简介简短手机卡顿优化软件
  • 织梦网站最下面的网站建设去除英文定机票网站建设
  • 什么语言开发网站国外平面设计网站有哪些
  • 微信与与网站建设个人网站酷站赏析
  • 网站视频主持人短视频seo客短
  • wordpress和the7主题的关系昆明网站seo外包
  • 大连专业零基础网站建设教学培训涿州吧
  • 文化推广网站建设心得linux怎么下载wordpress
  • 广州制作网站哪家专业怎么自己做网站
  • 免费做网站公司哪家好网站建设的注意事项
  • 一键免费做网站开发区人才网招聘信息
  • 房地产网站建设与优化分析宣传网站建设背景
  • 劳务派遣技术支持 东莞网站建设wordpress 自适应cms主题
  • 网站建设属于什么经济科目无经验培训 网页设计学员
  • wordpress打开网页慢生产企业网站如何做seo
  • 建网站需要什么程序深圳企业网站建设服务好
  • 中国网站为什么做的那么丑郑州做网站便宜
  • 更改各网站企业信息怎么做广州网站建设新锐
  • 玉溪市城乡建设局网站灌云网站制作
  • dedecms做资源下载网站手游做网站推广应该怎么做