yolo命令行-训练篇(三)
官网训练篇
https://docs.ultralytics.com/zh/modes/train/#why-choose-ultralytics-yolo-for-training
训练数据集data
yolo detect train data=coco8.yaml model=yolo11n.pt epochs=100 imgsz=640 device=0,1
采集数据
COCO 数据集
最常用的通用目标检测数据集,包含 80 个类别(人、车、动物等),超过 33 万张图片。
YOLO 官方提供简化版(如 coco8.yaml 含 8 张图,用于快速测试)和完整版配置。
下载:通过 yolo data=coco.yaml download=True 命令自动下载,或手动从 COCO 官网 获取。
Pascal VOC 数据集包含 20 个常见类别(如人、猫、狗、汽车),约 1.6 万张图片,适合中小规模训练。
配置文件:YOLO 支持 voc.yaml,可直接指定使用。
其他领域数据集
如用于人脸检测的 WIDER Face、用于交通目标的 KITTI、用于遥感目标的 DOTA 等,需手动下载并适配 YOLO 格式。综合数据集平台:
Kaggle Datasets:网址为https://www.kaggle.com/datasets,这是数据科学竞赛的领先平台,也是一个丰富的数据集资源库,有超过 5 万个公开数据集,涵盖金融、医疗、社交媒体等各种主题。此外,Kaggle 社区的活跃用户还经常分享对这些数据集的处理和分析代码。UCI Machine Learning Repository:网址是https://archive.ics.uci.edu/ml,这是学术研究中常用的数据集资源之一,包含 500 多个经典数据集,涵盖从生物信息学到市场营销等多个领域。
Google Dataset Search:网址为https://datasetsearch.research.google.com,这是一个专门用于查找在线数据集的搜索引擎,可索引超过 2500 万个数据集,能帮助用户快速找到发布在全球不同平台上的公开数据集。领域专项数据集平台:
图像与视频领域:如 ImageNet(http://www.image-net.org)、COCO Dataset(https://cocodataset.org)、Open Images(https://storage.googleapis.com/openimages/web/index.html)等,其中 Open Images 是 Google 提供的 900 万张图像数据集。文本与 NLP 领域:包括 HuggingFace Datasets(https://huggingface.co/datasets)、Common Crawl(https://commoncrawl.org)、Wikipedia Dumps(https://dumps.wikimedia.org)等,HuggingFace Datasets 汇集了大量自然语言处理相关的数据集。政府与组织开放数据平台:
中国政府开放数据平台:提供经济、人口、区域统计等数据。
NASA Open Data:网址是https://earthdata.nasa.gov,提供卫星影像、气候等数据。
European Union Open Data Portal:提供欧盟相关的各种开放数据。
操作实例
从前一篇生成的模型库(13G)中复制几张图片
新建文件夹
开始训练
yolo train data=my_dataset.yaml model=yolo11n.pt epochs=50
训练完成
50 epochs completed in 0.737 hours. Optimizer stripped from runs\detect\train10\weights\last.pt, 5.5MB Optimizer stripped from runs\detect\train10\weights\best.pt, 5.5MB
best.pt为生成后模型
使用模型进行预测(测试模型效果)
# 对单张图片预测
yolo predict model=../runs/detect/train10/weights/best.pt source=test_image.jpg# 对视频预测
yolo predict model=../runs/detect/trainxx/weights/best.pt source=test_video.mp4# 对文件夹内所有图片预测
yolo predict model=../runs/detect/trainxx/weights/best.pt source=test_images/
导出
# 导出为 ONNX 格式(支持大多数部署框架)
yolo export model=runs/detect/trainxx/weights/best.pt format=onnx# 其他常用格式:TensorRT(加速GPU推理)、TensorFlow SavedModel、CoreML(苹果设备)等
yolo export model=... format=engine # TensorRT
yolo export model=... format=pb # TensorFlow
参考 coco模型⭐⭐⭐⭐⭐