当前位置: 首页 > news >正文

YOLO系列

问题梳理

(1)当输入图片非方形时YOLO会自动调整输入图片大小,以适应模型的固定输入尺寸。

模型的输入尺寸原始图片的尺寸是相关的,但它们的关系需要通过预处理来协调。

①缩放

②填充

③归一化

④边界框调整

(2)训练时数据增强(调整大小之后):

  • 随机裁剪(Random Crop)
  • 随机旋转(Random Rotation)(不适用)
  • 颜色抖动(Color Jittering)
  • 随机翻转(Random Flip)

(3)为什么需要固定输入尺寸?

  • 网络结构要求:YOLO的网络结构是基于固定输入尺寸设计的,输入尺寸的变化会导致网络参数不匹配。
  • 计算效率:固定输入尺寸可以提高计算效率,因为卷积操作在固定尺寸下更容易优化。
  • 硬件限制:固定输入尺寸可以更好地利用GPU的并行计算能力。

(4)输入尺寸对检测结果的影响

  • 大尺寸输入:可以保留更多细节,适合检测小目标,但计算量较大,速度较慢。
  • 小尺寸输入:计算速度快,但可能丢失细节,适合检测大目标或实时性要求高的场景。

核心函数:letterbox函数

  • 功能:对输入图像进行缩放和填充,使其适应指定的目标尺寸 new_shape(默认640x640),并保持图像的纵横比。

处理后图像:

相关文章:

  • 嵌入式电量与功耗优化:从理论到实战
  • Linux:环境变量
  • LLaMA-Factory大模型微调全流程指南
  • 【rabbitmq基础】
  • Nature Communications上交、西湖大学、复旦大学研发面向机器人多模式运动的去电子化刚弹耦合高频自振荡驱动单元
  • 从零开始学Rust:结构体(struct)详解
  • leetcode每日一题:数组美丽值求和
  • 【重点】文件摆渡系统如何简化跨平台跨网络的文件传输?
  • 使用Python构建Kafka示例项目
  • 视频设备轨迹回放平台EasyCVR综合智能化,搭建运动场体育赛事直播方案
  • es8实现向量检索与关键词匹配混合搜索
  • 算法题(114):矩阵距离
  • 计算机网络 3-1 数据链路层
  • 从零开始开发HarmonyOS应用并上架
  • AI 防口误指南_LLM 输出安全实践
  • 问题:tomcat下部署eureka双重路径
  • Laraver SQL日志 服务开发
  • wsl2配置proxy
  • git配置github
  • [c语言日寄]文件操作
  • 山东恒正建设有限公司 网站/百度云
  • 国际学院网站建设的意义/阿里云模板建站
  • 老师做家教的网站/googleplay官网
  • 做网站有回扣拿吗/关键词如何排名在首页
  • 合肥的网站建设剂屏/网络外包运营公司
  • 简约大气网站设计欣赏/在百度上怎么发布信息