当前位置：首页 > news >正文

YOLO系列

news 2025/10/9 9:34:46

问题梳理

（1）当输入图片非方形时，YOLO会自动调整输入图片大小，以适应模型的固定输入尺寸。

模型的输入尺寸和原始图片的尺寸是相关的，但它们的关系需要通过预处理来协调。

①缩放

②填充

③归一化

④边界框调整

（2）训练时数据增强（调整大小之后）：

随机裁剪（Random Crop）
随机旋转（Random Rotation）（不适用）
颜色抖动（Color Jittering）
随机翻转（Random Flip）

（3）为什么需要固定输入尺寸？

网络结构要求：YOLO的网络结构是基于固定输入尺寸设计的，输入尺寸的变化会导致网络参数不匹配。
计算效率：固定输入尺寸可以提高计算效率，因为卷积操作在固定尺寸下更容易优化。
硬件限制：固定输入尺寸可以更好地利用GPU的并行计算能力。

（4）输入尺寸对检测结果的影响

大尺寸输入：可以保留更多细节，适合检测小目标，但计算量较大，速度较慢。
小尺寸输入：计算速度快，但可能丢失细节，适合检测大目标或实时性要求高的场景。

核心函数：letterbox函数

功能：对输入图像进行缩放和填充，使其适应指定的目标尺寸 new_shape（默认640x640），并保持图像的纵横比。

处理后图像：

http://www.dtcms.com/a/110889.html

相关文章：

嵌入式电量与功耗优化：从理论到实战

Linux:环境变量

LLaMA-Factory大模型微调全流程指南

【rabbitmq基础】

Nature Communications上交、西湖大学、复旦大学研发面向机器人多模式运动的去电子化刚弹耦合高频自振荡驱动单元

从零开始学Rust：结构体（struct）详解

leetcode每日一题：数组美丽值求和

【重点】文件摆渡系统如何简化跨平台跨网络的文件传输？

使用Python构建Kafka示例项目

视频设备轨迹回放平台EasyCVR综合智能化，搭建运动场体育赛事直播方案

es8实现向量检索与关键词匹配混合搜索

算法题（114）：矩阵距离

计算机网络 3-1 数据链路层

从零开始开发HarmonyOS应用并上架

AI 防口误指南_LLM 输出安全实践

问题：tomcat下部署eureka双重路径

Laraver SQL日志服务开发

wsl2配置proxy

git配置github

[c语言日寄]文件操作

OpenAI发布PaperBench，AI代理复现研究能力面临新考验

Ubuntu 22.04 一键部署openManus

轻量级搜索接口技术解析：快速实现关键词检索的Java/Python实践

最新全开源码支付系统，赠送3套模板

深度学习基础

在线Pdf文档转换成Excel文档,无需下载,快速转换,批量转换

再来1章linux 系列-0. C语言过、Java半静对、Python纯动和C++对+C

代码随想录算法训练营第三十五天 | 416.分割等和子集

32、web前端开发之JavaScript(一)

烈火烹油的金三银四