当前位置: 首页 > news >正文

使用YOLO11训练鸟类分类模型

使用YOLO11训练鸟类分类模型

图像分类

图像分类是计算机视觉中最简单的任务,涉及将图像分类为预定义的类别之一。 输出结果是一个单一的类别标签和一个置信分数。

当我们不需要知道图像中对象的位置,只需要知道图像属于哪个类别时,就可以使用图像分类模型来完成任务。图像分类在社会生活中是非常有用的。

环境准备

要进行深度学习模型训练,可以使用GPU或者CPU,但使用GPU效率更高。

我们可以使用Conda准备训练环境。

首先,创建一个新的 Conda 环境。打开终端,运行以下命令

conda create --name ultralytics-env python=3.13 -y

激活新环境:

conda activate ultralytics-env

从 conda-forge 频道安装Ultralytics 软件包。执行以下命令

conda install -c conda-forge ultralytics

如果您在CUDA 环境中工作,最好一起安装 ultralytics, pytorchpytorch-cuda 以解决任何可能的冲突:

conda install -c pytorch -c nvidia -c conda-forge pytorch torchvision pytorch-cuda=11.8 ultralytics

对于具体需要安装那个CUDA版本,可以使用nvidia-smi命令查看。

准备数据集

我们这里使用一个包括12种鸟类的数据集,我们不需要知道图片中鸟的具体位置,只需要知道图片中的鸟是哪个类别即可。

这个数据集中的鸟类包括:

家燕 (Barn Swallow)
普通火冠戴菊鸟 (Common Firecrest)
夜莺 (Common Nightingale)
欧亚苍头燕雀 (Eurasian Chaffinch)
欧亚岩燕 (Eurasian Crag Martin)
欧洲金翅雀 (European Goldfinch)
欧洲绿雀 (European Greenfinch)
欧洲黄雀 (European Serin)
家麻雀 (House Sparrow)
西班牙麻雀 (Spanish Sparrow)
西方家燕 (Western House Martin)
白鹡鸰 (White Wagtail)

数据集的混淆矩阵:

请添加图片描述

部分图片:

在这里插入图片描述

开始训练

我们使用ultralytics提供的预训练模型进行训练,

ultralytics提供的预训练分类模型包括以下5种。

Model size (pixels) acc top1 acc top5 Speed CPU ONNX (ms) Speed T4 TensorRT10 (ms) params (M) FLOPs (B) at 224
YOLO11n-cls 224 70.0 89.4 5.0 ± 0.3 1.1 ± 0.0

文章转载自:

http://JvZNTtL7.mhpmw.cn
http://ChaC1PLD.mhpmw.cn
http://pV7i7FnW.mhpmw.cn
http://Yh7f77g4.mhpmw.cn
http://o5Ei3nm7.mhpmw.cn
http://1Nhtf4Lr.mhpmw.cn
http://fAsoBUWu.mhpmw.cn
http://2yrCr70t.mhpmw.cn
http://8AI1Gzmh.mhpmw.cn
http://9NswVCqh.mhpmw.cn
http://ov4itLoD.mhpmw.cn
http://Nx0cSie6.mhpmw.cn
http://s40hYkMy.mhpmw.cn
http://icbwpnlG.mhpmw.cn
http://MzLOe3Dm.mhpmw.cn
http://L3jcfKqF.mhpmw.cn
http://hW9CkKUo.mhpmw.cn
http://3s7k8otB.mhpmw.cn
http://s2ElSB5B.mhpmw.cn
http://lTgoGtC2.mhpmw.cn
http://jp403ho1.mhpmw.cn
http://ujHSHma8.mhpmw.cn
http://1UGTJfaE.mhpmw.cn
http://50tqcum7.mhpmw.cn
http://KCMP6s4P.mhpmw.cn
http://3YYQrEgH.mhpmw.cn
http://3g9pvDnN.mhpmw.cn
http://oHyK5dnG.mhpmw.cn
http://hSjNRlH0.mhpmw.cn
http://5HiX3UZZ.mhpmw.cn
http://www.dtcms.com/a/369453.html

相关文章:

  • 打开Fiddler,浏览器就不能访问网页了
  • 低空飞行安全“把关人”,MH/T 4055.3-2022 测试标准深度解读
  • 客户案例 | 半导体材料领军企业选择燕千云ITSM,打造“零”中断运维体系
  • STM32H7的PA0_C、PA1_C、PC2_C、PC3_C的使用
  • EEMD-HHT算法
  • 如何快速集成直播美颜SDK?人脸美型功能开发全流程详解
  • 3D设计软件终极对决:从建模到渲染,哪款才是你的本命神器?
  • 【Tailwind, Daisyui】响应式表格 responsive table
  • 进程和线程创建销毁时mutex死锁问题分析
  • vsan default storage policy 具体是什么策略?
  • 整理了几道前端面试题
  • 点控云智能客服:以AI重塑服务体验,登顶行业第一的革新之路
  • 餐饮营销:不是 “烧钱”,是 “递价值” 的落地术
  • 解释一下roberta,bert-chinese和bert-case有啥区别还有bert-large这些
  • ZeroMQ 编译 项目使用流程文档
  • 零知开源——基于STM32F103RBT6的智能风扇控制系统设计与实现
  • (GeSCD)Towards Generalizable Scene Change Detection论文精读(逐段解析)
  • A股大盘数据-20250905 分析
  • 代码版本控制
  • 学习心得分享
  • 【Cell Systems】SpotGF空间转录组去噪算法文献分享
  • 「数据获取」《中国包装业发展研究报告(2008)》
  • 禁止浏览器自动填充密码的方法
  • Vue 3 项目中引入 Iconify
  • 混合架构大型语言模型(Jamba)
  • Redis 的相关文件作用
  • Vulkan进阶系列11 - RenderPass 设置对渲染性能的影响
  • Java IO 流深度剖析:原理、家族体系与实战应用
  • Redis实战-附近的人实现的解决方案
  • MySQL数据库——事务、索引和视图