当前位置: 首页 > news >正文

Python----目标检测(训练YOLOV8网络)

一、数据集标注

        在已经采集的数据中,使用labelImg进行数据集标注,标注后的txt与原始 图像文件同名且在同一个文件夹(data)即可。

二、制作数据集

        在data目录的同目录下,新建dataset目录,以存放制作好的YOLO的数据 集,执行以下代码,完成数据划分(dataloader.py)

import os
import random
import shutil# # 定义数据集目录和分割比例
source_root = 'data'
target_root = 'dataset'
train_ratio = 0.85
valid_ratio = 0.1
test_ratio = 0.05# 创建目标文件夹及其子文件夹
train_dir = os.path.join(target_root, "train")
valid_dir = os.path.join(target_root, "valid")
test_dir = os.path.join(target_root, "test")
print(train_dir)
print(valid_dir)
print(test_dir)
for phase in ['train', 'test', 'valid']:os.makedirs(os.path.join(target_root, phase, 'images'), exist_ok=True)os.makedirs(os.path.join(target_root, phase, 'labels'), exist_ok=True)# 获取所有文件列表
files = os.listdir(source_root)
print(files)
png_files = [f for f in files if f.endswith(".png")]
print(png_files)# 随机打乱文件列表
random.shuffle(png_files)# 计算分割点
num_files = len(png_files)
num_train = int(train_ratio * num_files)
num_valid = int(valid_ratio * num_files)# 移动文件到目标位置
# 将文件复制到相应目录
for i, file in enumerate(png_files):file = file.split('/')[-1].split('.')[-2]image_path = os.path.join(source_root, file + '.png')label_path = os.path.join(source_root, file + '.txt')print(image_path)print(label_path)if i < num_train:dst_dir = train_direlif i < num_train + num_valid:dst_dir = valid_direlse:dst_dir = test_dirshutil.copy(image_path, os.path.join(dst_dir, 'images'))shutil.copy(label_path, os.path.join(dst_dir, 'labels'))
├─test│  ├─images│  └─labels├─train│  ├─images│  └─labels└─valid├─images└─labels

         在dataset目录下新建mydata.yaml得到最终数据集:

# Train/Val/Test paths 
train: D:/目标检测/dataset/train 
val: D:/目标检测/dataset/valid
test: D:/目标检测/dataset/test# Number of classes
nc: 3# Class names (as a list)
names: ['ripe', 'half-ripe', 'raw']

三、快速训练

        在图像大小为 640 的数据集上对YOLOv8n 进行3次训练。可以使用 device 参数。如果没有传递参数,GPU 要指定),否则 device=0 将被使用(多GPU需 device='cpu' 将被使用。

from ultralytics import YOLOmodel = YOLO("./yolov8n.pt"
)  # 加载预训练模型(建议用于训练)。这行代码创建了一个YOLO对象,并加载了预训练的YOLOv8n模型。模型文件位于"./yolov8n.pt"。if __name__ == "__main__":  # 确保这段代码只在脚本作为主程序运行时执行,而不是被导入为模块时执行。#   单GPU训练   #model.train(data="./dataset/mydata.yaml", epochs=3, imgsz=640)  # 训练模型。使用指定的数据集配置文件("./dataset/mydata.yaml"),训练3个epoch,图像大小为640x640。#   多GPU训练   ##   results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=[0, 1])   #metrics = model.val()  # 在验证集上评估模型性能。计算各种指标,如精度、召回率等。success = model.export(format="onnx")  # 将模型导出为ONNX格式。ONNX是一种开放的深度学习模型交换格式,便于在不同平台和推理引擎上部署模型。results = model("./dataset/test/images/00002.png")  # 对图像进行预测。使用加载的模型对指定的图像文件进行推理。#   Process results list   ##   处理预测结果列表   #for result in results:  # 遍历每个预测结果。如果输入是多张图像,`results`将是一个列表,每个元素对应一张图像的预测结果。boxes = result.boxes  # Boxes对象, 用于存储边界框输出。包含了检测到的物体的边界框信息。masks = result.masks  # Masks对象, 用于存储分割掩模输出。包含了图像分割任务中,每个物体实例的像素掩膜。keypoints = result.keypoints  # Keypoints对象, 用于存储姿态关键点输出。包含了人体姿态估计任务中,检测到的关键点坐标。probs = result.probs  # Probs对象, 用于存储分类概率输出。包含了图像分类任务中,每个类别的预测概率。result.show()  # display to screen   #   显示结果到屏幕上   

四、恢复中断的训练

        在使用深度学习模型时,从先前保存的状态恢复训练是一项至关重要的功 能。这在各种情况下都能派上用场,比如当训练过程意外中断时,或者当 你希望用新数据或更多的历时继续训练模型时。

        恢复训练时,Ultralytics YOLO 会加载上次保存模型的权重,并恢复优化器 状态、学习率调度器和历时编号。这样,您就可以从上次中断的地方无缝 地继续训练过程。

        Ultralytics YOLO 您可以通过设置 resume 参数 True 在调用 的路径,并指定 train 方法 .pt 文件,其中包含经过部分训练的模型权重。

        使用Python 和通过命令行恢复中断的训练(注意:需要 是中途停掉的训练才可以继续训练,如果训练时epoch=3,训练完了,是 不可以继续训练的):

from ultralytics import YOLO
model = YOLO("./runs/detect/train/weights/last.pt")  # 加载预训练模型(建议用于训练)
if __name__ == '__main__':
# 单GPU训练model.train(resume=True)  # 训练模型

        通过设置 resume=True,"...... train 函数将使用存储在 "./runs/detect/train/weights/last.pt"文件中的状态,从中断处继续训练。

        如果 resume 参数被省略或设置为 False, train 功能将开始新的

        请记住,默认情况下,检查点会在每个epoch结束时保存,或者使用 save_period 参数,因此您必须至少完成一个epoch才能恢复训练运行。 

五、训练参数 

        YOLO 模型的训练设置包括训练过程中使用的各种超参数和配置。这些设 置会影响模型的性能、速度和准确性。关键的训练设置包括批量大小、学 习率、动量和权重衰减。此外,优化器、损失函数和训练数据集组成的选 择也会影响训练过程。对这些设置进行仔细的调整和实验对于优化性能至 关重要。

论据默认值说明
modelNone指定用于训练的模型文件。接受指向预训练模型 .pt 文件或 .yaml 配置文件的路径。对于定义模型结构或初始化权重至关重要。
dataNone数据集配置文件的路径(例如 coco8.yaml)。该文件包含特定于数据集的参数,包括训练数据和验证数据的路径、类名和类数。
epochs100训练历元总数。每个历元代表对整个数据集进行一次完整的训练。调整该值会影响训练时间和模型性能。
timeNone最长训练时间(小时)。如果设置了该值,则会覆盖 epochs 参数,允许训练在指定的持续时间后自动停止。对于时间有限的训练场景非常有用。
patience0在验证指标没有改善的情况下,提前停止训练所需的历元数。当性能趋于平稳时停止训练,有助于防止过拟合。
batch16Batch size, with three modes: set as an integer (e.g., batch=16), auto mode for 60% GPU memory utilization (batch=-1), or auto mode with specified utilization fraction (batch=0.70).
imgsz640用于训练的目标图像尺寸。所有图像在输入模型前都会被调整到这一尺寸。影响模型精度和计算复杂度。
saveTrue可保存训练检查点和最终模型权重。这对恢复训练或模型部署非常有用。
save_period-1保存模型检查点的频率,以 epochs 为单位。值为 -1 时将禁用此功能。该功能适用于在长时间训练过程中保存临时模型。
cacheFalse在内存中缓存数据集图像 (True/ram)、磁盘 (disk),或禁用它 (False)。通过减少磁盘 I/O 提高训练速度,但代价是增加内存使用量。
deviceNone指定用于训练的计算设备:单个 GPU (device=0)、多个 GPU (device=0,1)、CPU (device=cpu),或苹果芯片的 MPS (device=mps).
workers8加载数据的工作线程数(每个 RANK 多 GPU 训练)。影响数据预处理和输入模型的速度,尤其适用于多 GPU 设置。
projectNone保存训练结果的项目目录名称。允许有组织地存储不同的实验。
nameNone训练运行的名称。用于在项目文件夹内创建一个子目录,用于存储训练日志和输出结果。
exist_okFalse如果为 True,则允许覆盖现有的项目/名称目录。这对迭代实验非常有用,无需手动清除之前的输出。
pretrainedTrue决定是否从预处理模型开始训练。可以是布尔值,也可以是加载权重的特定模型的字符串路径。提高训练效率和模型性能。
optimizer'auto'为培训选择优化器。选项包括 SGD, Adam, AdamW, NAdam, RAdam, RMSProp 等, 或 auto 用于根据模型配置进行自动选择。影响收敛速度和稳定性。
verboseFalse在训练过程中启用冗长输出,提供详细日志和进度更新。有助于调试和密切监控培训过程。
seed0为训练设置随机种子,确保在相同配置下运行的结果具有可重复性。
deterministicTrue强制使用确定性算法,确保可重复性,但由于对非确定性算法的限制,可能会影响性能和速度。
single_clsFalse在训练过程中将多类数据集中的所有类别视为单一类别。适用于二元分类任务,或侧重于对象的存在而非分类。
rectFalse可进行矩形训练,优化批次组成以减少填充。这可以提高效率和速度,但可能会影响模型的准确性。
cos_lrFalse利用余弦学习率调度器,根据历时的余弦曲线调整学习率。这有助于管理学习率,实现更好的收敛。
close_mosaic10在训练完成前禁用最后 N 个历元的马赛克数据增强以稳定训练。设置为 0 则禁用此功能。
resumeFalse从上次保存的检查点恢复训练。自动加载模型权重、优化器状态和历时计数,无缝继续训练。
ampTrue启用自动混合精度 (AMP) 训练,可减少内存使用量并加快训练速度,同时将对精度的影响降至最低。
fraction1.0指定用于训练的数据集的部分。允许在完整数据集的子集上进行训练, 这对实验或资源有限的情况非常有用。
profileFalse在训练过程中, 可对 ONNX 和 TensorRT 速度进行剖析, 有助于优化模型部署。
freezeNone冻结模型的前 N 层或按索引指定的层, 从而减少可训练参数的数量。微调或迁移学习非常有用。
lr00.01初始学习率 (即 SGD=1E-2, Adam=1E-3). 调整这个值对优化过程至关重要, 会影响模型权重的更新速度。
lrf0.01最终学习率占初始学习率的百分比 = (lr0 * lrf), 与调度程序结合使用, 随着时间的推移调整学习率。
momentum0.937用于 SGD 的动量因子, 或用于 Adam 优化器的 beta1, 用于将过去的梯度纳入当前更新。
weight_decay0.0005L2 正则化项, 对大权重进行惩罚, 以防止过度拟合。
warmup_epochs3.0学习率预热的历元数, 学习率从低值逐渐增加到初始学习率, 以在早期稳定训练。
warmup_momentum0.8热身阶段的初始动力, 在热身期间逐渐调整到设定动力。
warmup_bias_lr0.1热身阶段的偏置参数学习率,有助于 稳定初始历元的模型训练。
box7.5损失函数中边框损失部分的权重,影 响对准确预测边框坐标的重视程度
cls0.5分类损失在总损失函数中的权重,影 响正确分类预测相对于其他部分的重 要性。
dfl1.5分布焦点损失权重,在某些YOLO 版 本中用于精细分类。
pose12.0姿态损失在姿态估计模型中的权重, 影响着准确预测姿态关键点的重点。
kobj2.0姿态估计模型中关键点对象性损失的 权重,平衡检测可信度与姿态精度。
label_smoothing0.0应用标签平滑,将硬标签软化为目标 标签和标签均匀分布的混合标签,可 以提高泛化效果。
nbs64用于损耗正常化的标称批量大小。
overlap_maskTrue决定在训练过程中分割掩码是否应该 重叠,适用于实例分割任务。
mask_ratio4分割掩码的下采样率,影响训练时使用的掩码分辨率。
dropout0.0分类任务中正则化的丢弃率,通过在 训练过程中随机省略单元来防止过拟 合。
valTrue可在训练过程中进行验证,以便在单 独的数据集上对模型性能进行定期评 估。
plotsFalse生成并保存训练和验证指标图以及预 测示例图,以便直观地了解模型性能 和学习进度。

batch大小设置方案: 

        固定 Batch Size:设置固定值 (例如: batch=16)。

        自动模式 (60%的GPU显存占用):使用 batch=-1 自动调整batch 大小,实现大约60%的CUDA内存占用。

        带有使用分数值的自动模式:通过设置一个分数值(例如, batch=0.70),来根据指定的GPU内存使用分数调整批处理大小

六、增强设置和超参数

        增强技术通过在训练数据中引入可变性,帮助模型更好地泛化到未见数据 中,对提高YOLO 模型的稳健性和性能至关重要。下表概述了每种增强参 数的目的和效果:

论据默认值说明
hsv_h0.015图像色调中的最大变化。
hsv_s0.7图像饱和度的最大变化。
hsv_v0.4图像值 (亮度) 的最大变化。
degrees0.0图像旋转的最大角度。
translate0.1图像平移的最大比例 (按图像尺寸)。
scale0.5图像比例的最大变化。
shear0.0图像剪切的最大量。
perspective0.0图像透视变换的最大失真。
mosaic1.0启用马赛克数据增强,这是一种将多个训练图像组合成一个图像以提高对象变化的方法。
mixup0.0启用 mixup 数据增强,这是一种将图像和标签混合在一起以正则化模型的方法。
copy_paste0.0启用复制粘贴数据增强,这是一种将对象从一个图像随机复制到另一个图像的方法。

        这些设置可根据数据集和手头任务的具体要求进行调整。试验不同的值有 助于找到最佳的增强策略,从而获得最佳的模型性能。 

七、val验证参数

        在 COCO8 数据集上验证训练有素的YOLOv8n 模型的准确性。无需传递参 数,因为 model 保留其培训 data 和参数作为模型属性。

from ultralytics import YOLO# 加载模型
model = YOLO("yolov8n.pt")  # 加载官方预训练模型
model = YOLO("path/to/best.pt")  # 加载自定义训练模型# 验证模型
metrics = model.val()  # 无需提供额外参数,数据集和配置已保存metrics.box.map  # 平均精度均值 (mAP) @ IoU=0.5:0.95
metrics.box.map50  # 平均精度均值 (mAP) @ IoU=0.5
metrics.box.map75  # 平均精度均值 (mAP) @ IoU=0.75
metrics.box.maps  # 包含每个类别的 mAP@0.5:0.95 的列表

        在验证YOLO 模型时,可以对几个参数进行微调,以优化评估过程。这些 参数可控制输入图像大小、批处理和性能阈值等方面。以下是每个参数的 详细说明,可帮助您有效地自定义验证设置。

论据类型默认值说明
datastrNone数据集配置文件的路径 (例如 coco8.yaml)。该文件包含特定于数据集的参数,包括训练数据和验证数据的路径、类名和类数。
batchint16Batch size, with three modes: set as an integer (e.g., batch=16), auto mode for 60% GPU memory utilization (batch=-1), or auto mode with specified utilization fraction (batch=0.70).
imgszint640用于训练的目标图像尺寸。所有图像在输入模型前都会被调整到这一尺寸。影响模型精度和计算复杂度。
save_jsonBoolFalse如果 True此外,还可将结果保 存到 JSON 文件中,以便进一步 分析或与其他工具集成。
save_hybridboolFalse如果 True,保存混合版本的标 签,将原始注释与额外的模型预 测相结合。
conffloat0.001设置检测的最小置信度阈值。置 信度低于此阈值的检测将被丢弃
ioufloat0.6设置非最大抑制 (NMS) 的交叉 重叠 (IoU) 阈值。有助于减少重复检测
max_detint300限制每幅图像的最大检测次数。 在密度较高的场景中非常有用, 可以防止检测次数过多。
halfboolTrue可进行半精度(FP16)计算, 减少内存使用量,在提高速度的 同时,将对精度的影响降至最 低。
devicestrNone指定验证设备 (cpu, cuda:0 等)。可灵活利用 CPU 或 GPU 资源。
dnnboolFalse如果 True它使用 OpenCV DNN 模块进行ONNX 模型推 断,为PyTorch 推断方法提供了 一种替代方法。
plotsboolFalse当设置为 True此外,它还能生 成并保存预测结果与地面实况的 对比图,以便对模型的性能进行 可视化评估。
rectboolFalse如果 True该软件使用矩形推理 进行批处理,减少了填充,可能 会提高速度和效率。
splitstrval确定用于验证的数据集分割 (val, test或 train).可灵活选 择数据段进行性能评估。

        这些设置中的每一个都在验证过程中起着至关重要的作用,可以对YOLO 模型进行可定制的高效评估。根据您的具体需求和资源调整这些参数,有 助于实现准确性和性能之间的最佳平衡。

带参数的验证示例

from ultralytics import YOLOmodel = YOLO("yolov8n.pt")validation_results = model.val(data="coco8.yaml", imgsz=640, batch=16, conf=0.25, iou=0.6, device="0")

        下表详细介绍了将YOLO 模型导出为不同格式时可用的配置和选项。这些 设置对于优化导出模型的性能、大小以及在不同平台和环境中的兼容性至 关重要。正确的配置可确保模型以最佳效率部署到预定应用中。

论据类型默认值说明
formatstr'torchscript'导出模型的目标格式,例如 'onnx', 'torchscript', 'tensorflow' 或其他,定义与各种部署环境的兼容性。
imgszint 或 tuple640模型输入所需的图像尺寸。对于正方形图像,可以是一个整数,或者是一个元组 (height, width) 了解具体尺寸。
kerasboolFalse启用导出为 Keras 格式的 TensorFlow SavedModel,提供与 TensorFlow serving 和 API 的兼容性。
optimizeboolFalse在导出到 TorchScript 时,应用针对移动设备的优化,可能会减小模型大小并提高性能。
halfboolFalse启用 FP16(半精度)量化,在支持的硬件上减小模型大小并可能加快推理速度。
int8boolFalse激活 INT8 量化,进一步压缩模型并加快推理速度,同时将精度损失降至最低,主要用于边缘设备。
dynamicboolFalse允许 ONNX 和 TensorRT 导出动态输入尺寸,提高了处理不同图像尺寸的灵活性。
simplifyboolFalseSimplifies the model graph for ONNX exports with onnxslim, potentially improving performance and compatibility.
opsetintNone指定 ONNX opset 版本,以便与不同的 ONNX 解析器和运行时兼容。如果未设置,则使用最新的支持版本。
workspacefloat4.0为 TensorRT 优化设置最大工作区大小(GiB),以平衡内存使用和性能。
nmsboolFalse在 CoreML 导出中添加非最大值抑制 (NMS),这对精确高效的检测后处理至关重要。
batchint1指定导出模型的批量推理大小,或导出模型将同时处理的图像的最大数量。 predict 模式。

        调整这些参数可自定义导出过程,以满足特定要求,如部署环境、硬件限 制和性能目标。选择适当的格式和设置对于实现模型大小、速度和准确性 之间的最佳平衡至关重要。

八、导出格式

        YOLOv8 可用的导出格式如下表所示

格式format论据模型元数据参数
PyTorch-yolov8n.pt-
TorchScripttorchscriptyolov8n.torchscriptimgsz, optimize, batch
ONNXonnxyolov8n.onnximgsz, half, dynamic, simplify, opset, batch
OpenVINOopenvinoyolov8n_openvino_model/imgsz, half, int8, batch
TensorRTengineyolov8n.engineimgsz, half, dynamic, simplify, workspace, int8, batch
CoreMLcoremlyolov8n.mlpackageimgsz, half, int8, nms, batch
TF SavedModelsaved_modelyolov8n_saved_model/imgsz, keras, int8, batch
TF GraphDefpbyolov8n.pbimgsz, batch
TF Litetfliteyolov8n.tfliteimgsz, half, int8, batch
TF Edge TPUedgetpuyolov8n_edgetpu.tfliteimgsz
TF.jstfjsyolov8n_web_model/imgsz, half, int8, batch
PaddlePaddlepaddleyolov8n_paddle_model/imgsz, batch
NCNNncnnyolov8n_ncnn_model/imgsz, half, batch

相关文章:

  • SpringBoot手动实现流式输出方案整理以及SSE规范输出详解
  • JavaSE知识总结(集合篇) ~个人笔记以及不断思考~持续更新
  • 学习经验分享【40】目标检测热力图制作
  • [HTML5]快速掌握canvas
  • (Python网络爬虫);抓取B站404页面小漫画
  • 智慧零工平台前端开发实战:从uni-app到跨平台应用
  • uniapp路由跳转toolbar页面
  • 通俗易懂解析:@ComponentScan 与 @MapperScan 的异同与用法
  • Java连接Redis和基础操作命令
  • 微软markitdown PDF/WORD/HTML文档转Markdown格式软件整合包下载
  • GODOT引擎学习日志
  • Gartner《Emerging Patterns for Building LLM-Based AIAgents》学习心得
  • 线程间和进程间是如何进行通信
  • 复变函数 $w = z^2$ 的映射图像演示
  • 端到端的导航技术NeuPAN论文讲解
  • 《AI Agent项目开发实战》DeepSeek R1模型蒸馏入门实战
  • 达梦数据库 Windows 系统安装教程
  • HTML 中 class 属性介绍、用法
  • 【学习笔记】On the Biology of a Large Language Model
  • ffmpeg 的视频格式转换 c# win10
  • 武汉网站制作 费用/外贸推广有哪些好的方式
  • 做阿里巴巴的网站的费用/seo黑帽培训
  • 微信小程序开发介绍/seo搜索引擎优化
  • 做商铺最好的网站/国际军事新闻最新消息
  • 网站单独页面如何做301跳转/免费做网站自助建站
  • web网站扫描/开发网站的流程