当前位置: 首页 > news >正文

SCI精读: 利用YOLO深度学习模型增强植物病害识别能力

前言:

**SCI精读是一项高投入、高回报的科研投资。 它初期看似缓慢,但从长远看,它是构建你深厚学术功底、敏锐科研嗅觉和强大创新能力的唯一捷径。将精读养成习惯,它最终会从一项“任务”变成一种能带给你巨大成就感和乐趣的“能力”,介于此,本Up主开设sci领读课程,旨在让小伙伴们在快乐中快速具备论文写作能力!**本专栏为视频课程中的文章翻译!

B站干货戳这里!!!

解读视频戳这里!!!!

原文链接戳这里!!!

利用YOLO深度学习模型增强植物病害识别能力

尤瑟夫·阿尔瓦伊提(Yousef Alhwaiti)¹、蒙塔兹尔·汗(Muntazir Khan)²、穆罕默德·阿西姆(Muhammad Asim)²、穆罕默德·哈米德·西迪基(Muhammad Hameed Siddiqi)¹、穆罕默德·伊沙克(Muhammad Ishaq)²、马达拉·阿尔鲁瓦伊利(Madallah Alruwaili)¹

¹沙特阿拉伯王国焦夫省萨卡卡市焦夫大学计算机与信息科学学院;²巴基斯坦白沙瓦市农业大学计算机科学与信息技术学院
邮箱:ysalhwaiti@ju.edu.sa

摘要

植物病害的早期自动化识别对于精准作物保护至关重要。植物病害对农业依赖型国家构成重大威胁,常导致显著的作物损失和经济困难,在发展中国家尤为严重。这些病害的典型症状包括褪绿、结构畸形和萎蔫,但由于症状相似,早期识别难度较大。研究人员利用人工智能(AI)进行植物病害分类时,数据不平衡、症状变异性、实时性能不足以及标注成本高等问题,严重影响了识别准确率和技术落地。本研究提出一种基于“你只看一次(You Only Look Once, YOLO)”深度学习模型的创新方法——该模型因兼具超高准确率和速度而被选中。研究重点分析YOLO系列模型(具体为YOLOv3和YOLOv4)在果树病害识别中的应用,具体研究对象包括健康桃树叶片、健康草莓叶片、感染细菌性斑点病的桃树叶片以及感染叶焦病的草莓叶片。研究人员使用公开可用的“植物村(Plant Village)”数据集对上述模型进行了充分训练,仿真结果极具应用前景:从数值上看,YOLOv3模型的准确率达97%,平均精度均值(Mean Average Precision, mAP)为92%,总检测时间为105秒;相比之下,YOLOv4模型性能更优,准确率达98%,平均精度均值高达98%,且检测时间仅为29秒。YOLOv4模型复杂度更低、速度更快、精度更高,在多目标检测任务中表现尤为突出。作为一种高效的实时检测器,YOLOv4有望革新植物病害诊断与防控策略,最终提高农业生产力,并改善发展中国家的农业经济收益。

关键词:植物病害检测;YOLO模型;深度学习;实时检测器;图像分类;平均精度均值

1 引言

农业是各国经济的重要支柱,而水果种植是农业的基础性组成部分。作为高价值作物,水果对任何国家的经济格局都具有重要影响。尽管水果几乎是每个人日常生活的必需品,但仍有大量水果产量因各种病害而损失。许多果树(尤其是叶片)常出现病害症状,因此在病害初期进行识别至关重要——因为这一阶段的治疗效果最为显著。植物的叶片和茎秆是病害的关键指示部位,这些病害通常由细菌、真菌和病毒感染引起¹²。植物病害的影响远超园艺领域,还会导致植株死亡、作物减产和重大经济损失³⁴。植物病害的表现形式多样,包括结构、生理和颜色变化等明显特征⁵⁶。鉴于病害可能造成的巨大经济损失和农业产量下降风险,精准诊断这些病害具有重要意义⁷⁻⁹。因此,植物病害的精准识别仍是一项复杂且关键的挑战。

细菌、病毒和真菌感染是叶片病害的主要诱因。这些病害会在植物叶片或茎秆上表现出多种可见症状,为病害诊断提供依据¹⁰¹¹。病害的影响已对作物生产造成不利影响,使得扩大作物种植规模的目标难以实现。植物病害形态多样,若无专业辅助,识别难度较大——尤其是在发展中国家,由于基础设施不完善、认知水平有限,农民获取专业支持的途径十分匮乏。传统机器学习和深度学习方法在植物病害实时识别中面临挑战,主要原因是这些方法性能有限且计算需求较高。因此,若无法充分应对各类植物病害,将导致严重的产量损失。此外,叶片和茎秆上的症状重叠问题,进一步增加了病害早期检测的难度。农村地区的农民因缺乏必要的专业知识,往往难以有效应对这些病害。而一个能够在病害早期识别病害的自动化系统,将为农业界带来巨大益处¹²⁻¹⁵。早期诊断是有效治疗的关键:传统上,农民依赖人工经验进行病害检测,但近年来机器学习和人工智能等技术的进步,已能实现病害的早期识别¹⁶。不过,实现这种早期检测需要细致的作物监测与护理。

历史上,植物病害研究主要集中在植物生物学领域。传统上,专家依赖自身知识进行病害诊断——这种人工方法不仅耗时费力,还容易出现效率低下和误诊问题。鉴于这些挑战,病害的早期识别与检测变得至关重要¹⁷。因此,能够提供高效、客观分析的自动化方法,已成为实现植物病害高准确率检测的重要工具¹⁸⁻²⁰。已有大量研究采用深度学习方法(尤其是卷积神经网络(Convolutional Neural Networks, CNN))和机器学习模型来检测各类植物病害。深度学习方法因其在多种应用中能实现卓越准确率的特性,引起了研究人员的广泛关注²¹⁻²⁵。尽管已有诸多研究利用不同数据集进行植物病害分类,但在实现高精度植物病害检测方面,相关研究仍存在明显缺口。因此,目前仍迫切需要一种快速、高效、实时且支持多特征的检测技术。

本研究采用“你只看一次(YOLO)”目标检测模型——该模型以实时高效性著称,用于解决果树病害识别问题。在YOLO的多个版本中,本研究的创新之处在于:针对果树叶片病害检测,对YOLOv3和YOLOv4模型进行了全面的性能分析。研究人员从准确率、F值(F-measure)、精度(Precision)、召回率(Recall)和平均精度均值(mAP)等多个指标,对所提模型在不同植物叶片病害检测任务中的性能进行了严格评估;同时,还探究了模型的计算效率及其对病害区域的精准定位能力。尽管已有相关研究,但此前尚未有研究提出如此稳健的高精度植物病害检测方案。此外,本研究还为未来YOLO模型的迭代提出了潜在改进方向,以进一步提升其在农业领域的应用效果。

本研究提出了一种基于YOLO框架的创新方法,用于改进果树病害检测。YOLO模型的实时性、超高速度和准确率使其成为研究人员在各类目标检测任务中的首选工具。本研究的主要贡献包括:

  • 提出一种自动化定位技术,用于识别整个图像集中的病害区域;利用先进的深度学习模型(即YOLOv3和YOLOv4)进行病害检测与分类。
  • 研究仅选取“植物村(Plant Village)”数据集中的4个类别——该数据集包含9种不同植物的25个健康与病害类别,涵盖数千张图像样本。
  • 通过准确率、F值、精度、召回率和平均精度均值(mAP)等多个指标,评估模型在多种植物叶片病害识别任务中的有效性。

本文其余部分结构如下:“相关工作”部分对相关文献进行全面综述;“方法与材料”部分阐述本研究采用的方法与技术;“数值结果”部分详细介绍研究方法,并呈现结果与分析;最后,“结论”部分总结研究发现,并指出未来研究的潜在方向。

2 相关工作

深度学习模型是计算机视觉应用(如目标检测和图像分类)的核心组成部分,因其能快速高效地解析视觉数据²⁶⁻²⁸。已有研究表明,深度学习和机器学习模型的性能优于人类,且得出的结果比人工专家更准确²⁹⁻³⁴。这类模型利用人工神经网络的优势,从图像数据集中学习复杂特征。本节将综述利用深度学习技术进行植物病害检测与分类的相关研究。

文献[4]采用深度卷积神经网络方法诊断水稻病害,所用数据集包含健康叶片和病叶图像,共500张。实验结果显示,该研究提出的模型准确率达95.48%,收敛速度更快,病害检测效果更优。

文献[5]采用循环神经网络(RNN)进行病害检测,并结合模糊K均值聚类(FUZZY k-mean clustering)模型进行分类,以识别香蕉叶片病害。研究人员自主收集数据(包括香蕉斑点病和香蕉黄条叶斑病两种主要香蕉病害),用于评估所提模型的有效性。为测试模型效果并确保检测性能优良,研究人员使用香蕉叶片和果实图像对模型进行训练;同时,为加快流程,还设计了一种数据集存储方法。仿真结果表明,该研究提出的模型效果优异。类似地,文献[9]采用基于YOLO(你只看一次)的卷积神经网络模型进行叶片病害检测——选择YOLO的原因是其能在单张图像中识别多种病害。此外,文献[19]提出一种基于ResNet-50残差网络的番茄叶片病害识别模型,该模型利用卷积层提取叶片病害特征,并通过反复学习实现番茄叶片病害分类。

文献[35]采用卷积神经网络(CNN)对“植物村”数据集进行研究,模型准确率达85.3%,但存在局限性:训练时间长,且仅能对背景单一、叶片朝上的单张叶片进行分类。另一项研究(文献[36])提出一种创新方法,结合4种深度学习模型和堆叠分类器进行植物叶片病害识别。该研究使用的数据集包含10个类别(涵盖健康和病害植物叶片),共36258张图像;通过Python 3实现所提卷积神经网络模型(包括Inception、ResNet、DenseNet和Inception-ResNet),用于特征提取,并采用堆叠方法进行分类。综合仿真结果显示,该模型准确率达87%。

文献[37]采用图像处理和遗传算法进行植物叶片病害识别:遗传算法用于作物病害诊断和图像分割,多种图像分割算法用于病害分类与自动检测。仿真结果表明,该模型性能优良。文献[38]提出一种基于卷积神经网络(CNN)的YOLO模型,用于识别甜椒叶片中的细菌性斑点病;为评估模型性能,从私人菜园收集约100张甜椒叶片图像作为数据集;利用基于TensorFlow和Keras的Python库进行仿真。所有仿真结果显示,该模型对甜椒叶片细菌性斑点病的检测准确率达96.78%。

另一项研究(文献[39])提出一种结合ReLU激活函数的卷积神经网络(CNN)模型,并搭配K近邻(K-Nearest Neighbors, KNN)和支持向量机(Support Vector Machine, SVM)算法,用于多种植物病害的识别与分类。该研究使用的数据集包含19个类别,共20000张图像,用于评估模型性能;同时,还引入人工标注方法,并结合逻辑回归进行数据预处理。仿真结果显示,该模型对多种植物病害的识别准确率达98%。此外,文献[40]提出一种基于LeNet等深度学习模型的创新技术,用于茶树叶片病害识别。表1对利用各类机器学习和深度学习模型进行植物病害检测的现有文献进行了全面总结,涵盖香蕉(叶片和果实)、水稻、番茄、甜椒、通用植物叶片和茶树等多种植物的病害研究,并指出了各研究的局限性。

表1 相关工作总结

参考文献数据集模型结果局限性
[5]香蕉叶片和果实病害数据集人工神经网络(ANN)准确率较高不适合实时检测
[15]基于高光谱反射率的植物病害数据集支持向量机(SVM)准确率97%自定义数据集,多类别检测准确率低
[19]番茄病害数据集ResNet-50准确率98.0%训练/测试比例过高(90/10)
[20]植物病害数据集YOLO-无数值结果
[35]植物村数据集卷积神经网络(CNN)准确率85.3%准确率较低
[36]植物村数据集Inception、ResNet、DenseNet准确率87%复杂度高,不适合实时检测
[37]植物叶片病害数据集遗传算法性能较低不适合实时分析
[38]LabelStoma(气孔检测数据集)YOLOv3准确率较高测试/训练比例过高(85/15)
[39]甜椒数据集YOLOv5性能较高无数值结果

值得注意的是,部分模型已实现极高的准确率,例如ResNet-50的准确率达98.0%,支持向量机(SVM)和K近邻(KNN)在植物叶片病害检测中的准确率也均达98%。

此外,部分研究还展示了机器学习模型在植物病害检测领域的性能提升潜力。例如,LeNet在茶树叶片病害识别中取得了良好效果,而YOLO则在多种应用中有效提高了准确率。在这些模型中,YOLO因兼具高准确率和实时性能,成为植物叶片检测的理想选择。本研究提出采用基于深度学习的YOLO模型,用于草莓和桃树叶片病害识别——该模型在文献中已被广泛认可,适用于各类目标检测任务。

本研究旨在从多个指标评估所提模型的性能,重点关注草莓和桃树叶片病害识别,并认为YOLOv4模型是有效检测水果、植物和叶片病害的有力工具。

3 方法与材料

不同研究人员采用不同技术进行植物病害检测,这些技术在不同应用场景中表现出不同性能。本研究提出基于深度学习的YOLOv3和YOLOv4模型,用于果树叶片病害检测,具体内容将在以下小节中阐述。图1展示了本研究的方法概述,呈现了所提研究的流程图。

3.1 数据收集

本研究采用“植物村(Plant Village)”数据集[41]训练模型,重点关注两类果树叶片的4个不同类别:健康桃树叶片、感染细菌性斑点病的桃树叶片、健康草莓叶片以及感染叶焦病的草莓叶片。用于模型训练和评估的数据集共包含4222张图像,其中桃树叶片图像2657张,草莓叶片图像1565张。健康和感染病害叶片的图像数量详情如表2所示。

3.2 类别定义

本研究仅选取“植物村”数据集[42]中的4个特定类别,但需强调的是,该数据集涵盖更广泛的37个类别,包含多种水果和蔬菜的叶片类型。这一庞大的数据集为探索多种植物病害检测与分类的自动化提供了宝贵资源。以下简要介绍数据集中选取的类别:

3.2.1 桃树细菌性斑点病

桃树、油桃、杏树和李树易受一种严重的细菌感染——桃树细菌性斑点病,其致病菌为野油菜黄单胞菌李致病变种(Xanthomonas campestris pv. pruni)。该病害表现为多种症状,包括果实斑点、叶片枯斑和枝条溃疡;受感染的果实还可能出现凹陷、开裂、流胶和水渍状组织等症状,从而更易感染褐腐病、根霉病等真菌病害。严重的叶片斑点感染会导致早期落叶,而过度落叶则可能造成果实开裂、萎缩或日灼;此外,早期落叶还会削弱树势,降低树木的抗寒性。桃树细菌性斑点病的叶片图像如图2所示,可供参考。

3.2.2 健康桃树叶片

桃树(Prunus persica)是一种落叶果树,起源于中国东部的浙江省,最早在该地区被驯化和种植。这种果树能结出多种美味果实(多数称为桃子,部分称为油桃)。其种加词“persica”暗示了它在伊朗的广泛种植历史——桃子正是从伊朗传入欧洲的。桃树属于蔷薇科(Rosaceae)李属(Prunus),该属还包括樱桃、坚果、杏和李等植物。健康桃树叶片的图像如图3所示。

3.2.3 草莓叶焦病

草莓叶焦病是影响草莓植株的一种病害,尤其对广泛种植的草莓品种(Fragaria × ananassa,以其香甜多汁的果实著称)影响较大。该病害由草莓黄单胞菌(Xanthomonas fragariae)引起,典型识别症状包括红色病斑、边缘坏死、叶片卷曲和果实减产。草莓种植者需定期监测植株是否出现病害迹象,一旦发现草莓叶焦病,应立即采取措施。早期干预和预防措施对于病害防控和草莓作物保护至关重要。草莓叶焦病的叶片图像如图4所示。

3.2.4 健康草莓叶片

草莓属(Fragaria)隶属于蔷薇科,包含100多种不同的开花植物,其中许多种类能结出可食用果实。栽培草莓因其受欢迎度在全球范围内广泛种植,且自然生长于北半球温带地区。健康草莓叶片的图像如图5所示,可供参考。

3.3 数据处理与选择

本研究使用公开可用的“植物村”数据集[41](可在Kaggle平台获取)。为确保与模型的兼容性,所有图像在训练和测试前均调整为统一的416×416尺寸。通过以下数据预处理步骤对数据进行增强:

  • 利用强大的深度学习库Keras——该库提供的“图像数据生成器(Image Data Generator)”可通过缩放、剪切、缩放和水平翻转等标准技术实现图像增强。
  • 为确保所有图像的一致性,采用1/255的缩放因子,将所有数据图像的像素值归一化到0-1范围。
  • 将4222张增强后的图像划分为训练集和测试集。
  • 通过从GitHub克隆相应YOLO版本的代码库,搭建YOLO环境,随后配置必要的数据和目录结构。
  • 准备YAML配置文件——这些文件包含训练和测试文件路径、模型训练所需的类别数量等关键信息。通过上述全面的预处理步骤,确保数据充分准备,满足模型训练和评估的需求。

3.4 模型训练

本研究考虑采用YOLO框架的两个版本(即YOLOv3和YOLOv4)进行植物病害检测,具体如下:

3.4.1 YOLOv3

YOLOv3是“你只看一次(YOLO)”系列模型的迭代版本,于2018年推出[43]。它是一种深度神经网络模型,专为图像或视频流中的实时快速精准目标检测设计。YOLOv3在其前身模型的基础上进行了改进,采用更强大的骨干网络、特征金字塔网络和多尺度预测技术,能够有效检测不同尺寸的目标;同时,还整合了批量归一化、 shortcut连接和空间注意力等技术,进一步提升准确率和鲁棒性。该通用框架已被广泛应用于计算机视觉领域,如监控、自动驾驶、机器人技术,甚至在自然灾害后建筑损坏评估等新兴应用中也有使用。

YOLOv3的核心架构分为三个部分:骨干网络(backbone network)、检测头(detection head)和后处理模块(post-processing module)。其中,骨干网络的初始任务是从输入图像中提取特征,采用改进的DarkNet-53架构;该骨干网络通过一系列卷积层(中间插入批量归一化和Leaky ReLU激活函数)增强学习能力,防止过拟合;同时,策略性地融入最大池化层,逐步减小特征图的空间维度,从而聚焦关键特征。

检测头用于估计图像中的边界框和类别概率,通过一系列卷积层处理骨干网络生成的多尺度特征图——这种多尺度方法使模型能更有效地检测不同尺寸的目标。每个检测层负责预测固定数量的边界框(通常由锚框数量决定)。

后处理模块在优化检测结果方面发挥关键作用:它根据置信度分数筛选检测结果,并采用非极大值抑制(Non-Maximum Suppression, NMS)消除重叠和冗余结果;同时,丢弃置信度分数较低的检测结果,确保输出结果既准确又简洁。非极大值抑制算法仅保留最相关的边界框,减少重复检测的可能性。此外,骨干架构中融入的残差块(residual blocks)有助于改善训练过程中的梯度流动,使深层网络避免梯度消失问题。YOLOv3结合残差块和检测模块的流程图如图6所示——这种先进的后处理组合使YOLOv3成为一种强大的实时目标检测模型。

3.4.2 YOLOv4

YOLOv4是YOLOv3目标检测模型的升级版本,是该领域的一项显著成果。该模型于2020年推出[44],以其超高精度和速度著称。YOLOv4的架构由三个关键部分组成:骨干网络、颈部(neck)和检测头,每个部分都具有独特的特征和设计考量。

YOLOv4的骨干网络基于CSPDarknet53(YOLOv3中使用的DarkNet架构的变体)构建。值得注意的是,CSPDarknet53融入了跨阶段局部连接(Cross-Stage Partial Connections),在减少网络参数的同时,增强了特征复用能力。该网络的主要作用是从输入图像中提取特征并降低空间分辨率,通过一系列卷积层和下采样技术实现。

YOLOv4的颈部融入了空间注意力模块(spatial attention modules),其设计目的是聚焦图像的关键区域,同时抑制无关细节。这些空间注意力模块在骨干网络的多个层之后引入,通过通道注意力和空间注意力机制增强特征图。

YOLOv4的检测头负责预测图像中目标的边界框和类别概率,由多个检测层组成。每个检测层根据该层预设的锚框数量,预测固定数量的边界框;此外,检测头还整合了多个卷积层,用于分析颈部和骨干网络生成的特征图。模型的最终输出包括检测到的目标的边界框及其对应的类别概率。

除上述核心组件外,YOLOv4还整合了先进的训练技术,包括混合切割(cut mix)和马赛克(mosaic)数据增强——这些技术有助于提升模型的准确率和鲁棒性;同时,YOLOv4还采用了一种改进版的非极大值抑制算法,即加权框融合(Weighted Box Fusion, WBF)。

为实现实时目标识别,YOLOv4采用了一种经过大规模图像数据集训练的深度神经网络。该模型将输入图像划分为网格,并为每个网格单元预测多个边界框(每个边界框具有不同的置信度分数,但不直接进行类别预测)。模型的输出是一组边界框,每个边界框都带有置信度分数和类别标签。YOLOv4的另一关键特性是其检测小目标的能力——这一能力通过空间金字塔池化(Spatial Pyramid Pooling, SPP)技术实现,该技术使模型能捕获不同尺度和分辨率的特征。因此,YOLOv4在机器人技术、自动驾驶和监控等领域具有显著优势。

边界框预测:YOLOv4采用基于网格的方法解析输入图像,每个网格单元对应多个边界框。对于每个边界框,模型会预测其置信度分数和类别标识;具体而言,YOLOv4会预测每个边界框内目标的位置、尺寸和类别标签。YOLO中边界框“b”的计算遵循公式(1):

[
\begin{array}{c}
b_{x}=\sigma (t_{x})+c_{x} \
b_{y}=\sigma (t_{y})+c_{y} \
b_{w}=p_{w}e^{t_{w}} \
b_{h}=p_{h}e^{t_{h}}
\end{array}
]

其中,(b_{x})和(b_{y})表示边界框中心坐标,(b_{w})和(b_{h})分别表示边界框的宽度和高度。如图7所示,每个边界框的宽度和高度通过相对于预定义聚类中心(锚框)的偏移量预测;边界框的中心坐标则相对于检测到目标的网格单元确定,并通过sigmoid函数确保坐标落在网格单元范围内。这种方法使YOLO能够精准预测图像中目标的位置。

非极大值抑制:YOLOv4采用非极大值抑制(NMS)方法避免重复检测。该方法会移除与高置信度边界框存在显著重叠的边界框,最终得到一组极有可能包含目标的边界框,如公式(2)所示:

[
\mu_{t, k}{-l}\left(ø_{t}\right)=\frac{1}{k}{\sum_{T}}{k-1} \mu_{t-T}^{l}\left(ø_{t}\right) \quad (2)
]

输出:YOLOv4的输出中,每个边界框都带有类别标签和置信度值。这些边界框可绘制在输入图像上,以突出模型识别出的目标。本研究采用的模型的分步流程如算法1所示。

图1 基于YOLO模型的果树病害检测研究方法
(流程:文献综述→数据收集→数据选择→数据预处理→模型训练→模型评估;数据来源:植物村数据集;研究对象:桃树(健康、细菌性斑点病)、草莓(健康、叶焦病);数据量:共4222张图像(训练集2955张、测试集1267张);数据预处理:标注格式转换为.txt、配置文件转换为.yaml;模型:YOLOv3、YOLOv4;评估指标:准确率、精度、召回率、F1分数)

表2 模型训练与测试所用数据的类别图像分布

序号水果类型类别(健康/病害)图像数量
1桃树健康360
细菌性斑点病2297
2草莓健康456
叶焦病1109
总计4222

图2 桃树细菌性斑点病叶片

图3 健康桃树叶片

图4 草莓叶焦病叶片

图5 健康草莓叶片

图6 用于植物病害检测的YOLOv3模型框图
(输入:图像;骨干网络:DarkNet-53;特征处理:多尺度特征;输出预测:边界框与类别(如“细菌性斑点病,置信度0.90”))

图7 带有尺寸先验和位置预测的边界框
(标注:(c_x)、(c_y)为网格单元坐标;(p_w)、(p_h)为锚框宽高;(t_x)、(t_y)、(t_w)、(t_h)为预测偏移量;(b_x)、(b_y)、(b_w)、(b_h)为边界框最终坐标与尺寸)

算法1 所提YOLO叶片病害检测模型伪代码
输入:植物村数据集
输出:病害分类结果(草莓:叶焦病、健康;桃树:细菌性斑点病、健康)

  1. 开始
  2. 初始化DarkNet网络
  3. 将数据输入所提模型
  4. 设定目标权重文件、图像尺寸和置信度值
  5. 开始训练:
    当(当前迭代次数 ≤ 最大迭代次数)时:训练所提模型当前图像 = 调用readImage()函数读取图像对于i从0到网格单元数量-1:对于j从0到网格单元数量-1:当前网格单元 = 当前图像中坐标为(i:i+步长, j:j+步长)的区域生成新的权重文件当前迭代次数 = 当前迭代次数 + 1
    
  6. 从之前保存的状态继续训练:
    若(当前迭代次数 ≥ 最大迭代次数):预测类别数组[i,j] = 调用class_predictor()函数预测当前网格单元类别预测边界框数组[i,j] = 调用bounding_box_predictor()函数预测当前网格单元边界框预测结果 = 整合预测边界框数组与预测类别数组将预测结果添加到最终预测列表输出最终预测列表
    否则:使用新设定的权重返回步骤5继续训练
    
  7. 测试数据
  8. 结束

4 实验结果

本研究的实验在一台Windows 10计算机上进行,该计算机配备英特尔酷睿i7处理器(主频2.0 GHz)和16 GB内存。数据集用于训练和测试机器学习算法,通过Keras Python库实现;模型训练在Google Colab Pro平台上进行,并利用图形处理器(GPU)的计算能力。研究人员分别采用YOLOv4和YOLOv3两种模型进行果树叶片病害检测,并从准确率、F值、召回率和精度等指标评估模型性能。

本研究采用多种性能指标评估所提模型的有效性,以下简要介绍这些评估指标:

4.1 混淆矩阵

本研究采用混淆矩阵表示特定条件下的分类一致性,矩阵维度记为(M=n×n)(其中(n)为类别数量)。因此,所有正确识别结果(包括真阳性(TP)和真阴性(TN))的总和是识别准确率的最精准衡量标准。真阳性指样本被正确归类到其实际所属类别的情况;假阳性(FP)指样本被错误归类到某一特定类别的情况;不属于上述类别的情况(包括错误的假阴性(FN)和假阳性(FP))均归为“未识别”。混淆矩阵的格式如表3所示。

4.2 准确率

准确率反映模型的有效性,体现模型在检测阴性和阳性样本时的可靠性和通用性,以及模型输出结果与真实值的接近程度。所提模型的准确率通过公式(3)计算:

[
\text{准确率}=\frac{\text{TP}+\text{TN}}{\text{TP}+\text{TN}+\text{FP}+\text{FN}} \quad (3)
]

4.3 精度

精度统计被正确提取的阳性样本数量,即成功识别出的、真正属于某一类别的样本总数。精度通过真阳性数量除以所有正确检测到的样本和类别的总数计算,如公式(4)所示:

[
\text{精度}=\frac{\text{TP}}{\text{TP}+\text{FP}} \quad (4)
]

4.4 召回率

召回率通常也称为真阳性率(True Positive Rate, TPR),通过真阳性数量除以真阳性与假阴性数量之和计算。召回率是衡量结果完整性的量化指标,反映正确检测到的样本数量;高召回率表明数据能被高效且准确地提取。召回率通过公式(5)计算:

[
\text{召回率}=\frac{\text{TP}}{\text{TP}+\text{FN}} \quad (5)
]

4.5 F值

在比较两个模型时,很难直接比较“高精度-低召回率”模型与“低精度-高召回率”模型。因此,本研究采用F分数(F-score)或F值来实现这一比较。F值采用调和平均数(而非算术平均数)计算,如公式(6)所示:

[
\text{F值}=\frac{2 \times \text{召回率} \times \text{精度}}{\text{召回率}+\text{精度}} \quad (6)
]

4.6 平均精度均值

mAP@0.5表示交并比(Intersection over Union, IoU)阈值为0.5时的平均精度均值(mAP);而mAP@0.5:0.95表示在IoU阈值从0.5到0.95的范围内计算的平均mAP。其计算方式如公式(7)所示:

[
\text{mAP}=\frac{1}{n} \sum_{k=1}^{n} \text{AP}_{k} \quad (7)
]

其中,(n)为类别数量,(\text{AP}_{k})为第(k)个类别的平均精度(Average Precision, AP)。

5 数值结果

5.1 YOLOv3模型的性能评估

YOLOv3模型的性能评估结果详细展示于图8和表4中,其中图8呈现了每个类别的单独评估结果,表4则对评估结果进行了详细说明;同时,图9(a)-(d)展示了YOLOv3模型的边界框预测结果。结合图8、表4以及前文讨论的性能指标可知,YOLOv3模型表现出色:精度、准确率、召回率和F值均达97%,损失率仅为0.075。

表4从细粒度角度对YOLOv3模型的性能进行了类别级评估。例如,“健康草莓”类别的平均精度(AP)达92.39%,该类别对应的真阳性(TP)检测数量为986,假阳性(FP)数量仅为24;“草莓叶焦病”类别的平均精度达92.68%,真阳性检测数量为647,假阳性数量仅为19;“健康桃树”类别的平均精度达92.92%,真阳性检测数量为872,假阳性数量仅为18;“桃树细菌性斑点病”类别的平均精度达92.73%,真阳性检测数量为802,假阳性数量仅为15。

图10和图11展示了YOLOv3模型达到特定准确率或损失阈值所需的迭代次数。YOLOv3模型仅需少量迭代即可快速达到最高准确率,随后在后续批次中保持稳定收敛;从图10中损失函数的变化趋势也可得出类似结论。

5.2 YOLOv4模型的性能评估

YOLOv4模型的性能评估结果如图12和表5所示,清晰呈现了测试阶段产生的真阳性和假阳性结果;下文将对这些结果进行全面讨论和总结。

此外,图12对YOLOv4模型的性能进行了全面评估,并按类别细分结果。由表6可知,所提模型在所有类别中的精度均达98%。从更广泛的性能指标(包括准确率、召回率、精度、F1分数和平均精度均值(mAP))来看,所提模型的结果如下:精度98%、准确率98%、召回率99%、F值99%、损失率0.00534。

表5从类别级角度评估了YOLOv4模型的性能。例如,“健康草莓”类别的平均精度达98.89%,真阳性(TP)值为980,假阳性(FP)值为9;“草莓叶焦病”类别的平均精度达98.73%,真阳性值为640,假阳性值为11;“健康桃树”类别的平均精度达98.93%,真阳性值为865,假阳性值为7;“桃树细菌性斑点病”类别的平均精度达98.88%,真阳性值为795,假阳性值为10。

为进一步说明研究发现:YOLOv4模型因学习率较高,失败率较低。图13(a)-(d)展示了所提YOLOv4模型的图像识别可视化结果,涵盖“健康草莓”“草莓叶焦病”“桃树细菌性斑点病”和“健康桃树”等类别。

图14和图15展示了YOLOv4模型达到特定准确率或损失阈值所需的迭代次数。YOLOv4模型仅需少量迭代即可快速达到最高准确率,随后在后续批次中保持稳定收敛;从图14中损失函数的变化趋势也可得出类似结论——模型损失值极低。模型的损失率随准确率的提高而降低,反之亦然。

5.3 YOLOv3与YOLOv4模型的性能对比

研究结果表明,两种模型均表现出优异性能,具有极高的准确率和极低的损失率:其中,YOLOv3模型的准确率达97%,损失率为0.075;而所提YOLOv4模型的性能更优,准确率达98%,损失率仅为0.00534。这一显著差异凸显了YOLOv4模型的优越性——不仅精度更高,准确率也更优,且损失率极低。

此外,YOLOv4模型在召回率方面表现出色,达99%,F值达98%;相比之下,YOLOv3模型的召回率为97%,F值为96%。这些指标进一步证实了YOLOv4模型在多个参数上的优势,彰显其更优的性能。关键在于,YOLOv4模型的平均精度均值(mAP)高达98%,而YOLOv3模型的mAP仅为92%——这一显著差距凸显了YOLOv4模型在精度上的巨大优势。

此外,在总检测时间方面,YOLOv4模型同样表现出色,仅需29秒,而YOLOv3模型则需要105秒。

表6从准确率、F值、精度、召回率和mAP等指标,对各类目标检测模型进行了对比分析。文献[45]报道,YOLOv5模型的精度为86.5%,mAP为70%;文献[46]中,DBA_SSD、Faster R-CNN和YOLOv4模型的准确率分别为91%、89%和92%,对应的mAP分别为92.20、90.10和87.57;文献[47]指出,ResNet-50模型的准确率为97.84%,YOLOv5模型的mAP为95.17%;优化后的YOLOv5模型[48]的F值为92.97%,精度为93.73%,召回率为92.94%。

相比之下,本研究提出的YOLOv3和YOLOv4模型性能优于现有方法:YOLOv3模型的准确率达97%,F值为96%,精度和召回率均为97%,mAP为92%;而YOLOv4模型的性能进一步提升,准确率、F值和召回率均达98%,精度达96%,mAP高达98%。尽管这些研究使用相同的数据集,但类别数量不同,因此结果仍能为模型性能提供公平对比。上述发现凸显了本研究提出的基于YOLO的模型(尤其是YOLOv4)的优越性——其在关键指标上均优于其他方法。高准确率、高召回率和高mAP值证实了YOLOv4模型的有效性,使其成为实际目标检测应用的可靠选择。

本研究将重点拓展YOLOv4模型的应用场景,计划利用其能力对多种果树叶片的各类病害进行全面检测与分类(例如番茄叶片病害检测与分类[49])。作为创新努力的一部分,研究人员还计划开发一款用户友好的Android/iOS移动应用——该应用将成为农民的宝贵工具,助力其快速精准地识别病害,从而改进农业生产实践。

此外,本研究的愿景还延伸至硬件集成领域,计划采用深度学习方法实现更高准确率与更低计算复杂度的平衡[42,50]。研究团队的共同目标是推进病害防控策略,为农业可持续发展做出贡献。

表3 混淆矩阵

实际类别\预测类别相关(阳性,P)无关(阴性,N)
相关(阳性,P)真阳性(TP)假阴性(FN)
无关(阴性,N)假阳性(FP)真阴性(TN)

图8 YOLOv3模型的混淆矩阵数值结果
(计算平均精度均值(mAP)…
检测层:139-类型=28
检测层:150-类型=28
检测层:161-类型=28;检测总数=4295,真实目标总数=985
类别ID=0,名称=健康草莓,AP=92.39%(TP=986,FP=24)
类别ID=1,名称=草莓叶焦病,AP=92.68%(TP=647,FP=19)
类别ID=2,名称=健康桃树,AP=92.92%(TP=872,FP=18)
类别ID=3,名称=桃树细菌性斑点病,AP=92.73%(TP=802,FP=15)
置信度阈值=0.25时:精度=0.97,召回率=0.97,F1分数=0.97;TP=3307,FP=76,FN=69,平均IoU=89.22%
IoU阈值=50%,对每个独特召回率计算曲线下面积(AUC)
平均精度均值(mAP@0.50)=0.465674,即46.56%
总检测时间:105秒)

表4 YOLOv3模型的类别级性能评估

类别假阳性(FP)真阳性(TP)平均精度(AP,%)
健康草莓2498692.39
草莓叶焦病1964792.68
健康桃树1887292.92
桃树细菌性斑点病1580292.73

图9 YOLOv3模型对草莓和桃树病害的边界框预测结果
(a)健康草莓叶片;(b)草莓叶焦病叶片;(c)健康桃树叶片;(d)桃树细菌性斑点病叶片)

图10 YOLOv3模型达到特定准确率所需的迭代次数

图11 YOLOv3模型的损失曲线(按迭代次数)

图12 YOLOv4模型的混淆矩阵数值结果
(计算平均精度均值(mAP)…
检测层:139-类型=28
检测层:150-类型=28
检测层:161-类型=28;检测总数=4295,真实目标总数=985
类别ID=0,名称=健康草莓,AP=98.89%(TP=980,FP=9)
类别ID=1,名称=草莓叶焦病,AP=98.73%(TP=648,FP=11)
类别ID=2,名称=健康桃树,AP=98.93%(TP=865,FP=7)
类别ID=3,名称=桃树细菌性斑点病,AP=98.88%(TP=795,FP=10)
置信度阈值=0.25时:精度=0.98,召回率=0.99,F1分数=0.99;TP=328,FP=37,FN=28,平均IoU=89.22%
IoU阈值=50%,对每个独特召回率计算曲线下面积(AUC)
平均精度均值(mAP@0.50)=0.495674,即49.56%
总检测时间:29秒)

表5 YOLOv4模型的类别级性能评估

类别假阳性(FP)真阳性(TP)平均精度(AP,%)
健康草莓998098.89
草莓叶焦病1164098.73
健康桃树786598.93
桃树细菌性斑点病1079598.88

表6 不同研究中YOLOv3和YOLOv4模型在各类指标上的结果对比

参考文献准确率(%)F值(%)精度(%)召回率(%)mAP(%)
[45]--86.5-YOLOv5=70
[46]DBA_SSD=91;Faster R-CNN=89;YOLOv4=92---DBA_SSD=92.20;Faster R-CNN=90.10;YOLOv4=87.57
[47]ResNet-50=97.84---YOLOv5=95.17
[48](优化YOLOv5)-92.9793.7392.94-
本研究(YOLOv3)9796979792
本研究(YOLOv4)9899989998

图13 YOLOv4模型对草莓和桃树叶片病害的边界框预测结果
(a)健康草莓叶片;(b)草莓叶焦病叶片;(c)桃树细菌性斑点病叶片;(d)健康桃树叶片)

图14 YOLOv4模型达到特定准确率所需的迭代次数

图15 YOLOv4模型的损失曲线(按迭代次数)

6 结论

农业仍是发展中国家的经济支柱,但面临着植物病害日益严重的威胁——这些病害会严重影响作物健康和产量。病害的早期检测至关重要,但传统方法往往缺乏精度和可扩展性。为应对这些挑战,本研究提出将深度学习模型(具体为YOLOv3和YOLOv4)应用于果树病害的精准高效检测。本研究对每个类别的性能进行了严格评估,并通过使用相同数据集确保对比的公平性。

研究结果表明,这些模型(尤其是YOLOv4)显著提高了检测准确率和平均精度均值,性能优于现有方法:YOLOv4模型的准确率达98%,损失率仅为0.00534;而YOLOv3模型的准确率为97%,损失率为0.075。此外,YOLOv4模型的平均精度均值(mAP)达98%(YOLOv3模型为92%),且效率极高,检测时间从YOLOv3的105秒缩短至29秒。

这些结果凸显了深度学习在革新农业病害检测领域的潜力,有望提供更快、更精准且可扩展的解决方案。未来的研究将重点拓展YOLOv4模型及更新YOLO版本在多类别检测中的应用,实现病害检测自动化,并对各类果树叶片和病害定位进行分类;此外,还计划将这些模型集成到嵌入式平台中,进一步推进农业实践和实时病害防控技术的发展。

http://www.dtcms.com/a/546020.html

相关文章:

  • 天津做网站报价《设计》在线观看
  • 7.1.2.2 大数据方法论与实践指南-数仓中指标和 报表中指标的区别与联系
  • 引力与惯性力等效性的物理机制:张祥前统一场论的空间动力学解释
  • 网站界面设计简单百度域名注册官网
  • 佛山网站快照优化公司中国焊接外包加工网
  • VMamba: Visual State Space Model学习笔记
  • 设计排版优秀网站邯郸市口碑网络技术有限公司
  • Win11配置VMware-workstation以及Ubuntu环境
  • 网站建设开题报告wordpress is电影主题
  • 网络营销怎么做网站邢台泰尚网络科技有限公司
  • 多级缓存系统设计:从本地到分布式,打造高性能利器
  • 网站建设企业建站哪家好wordpress 红包广告
  • VS的Qt项目在Git拉取后丢失QT的项目设置
  • 北京公司建网站要多少费用电脑网站生成手机网站
  • 怎么做盗版电影网站吗免费做网站哪里有
  • erd-editor:一款免费开源的ERD设计工具
  • 如何查看一个网站是什么程序做的住宅装饰装修工程施工规范
  • 网站空间企业个人网页设计需要考什么证书
  • 2025青科会启幕,网易伏羲携游戏AI前沿实践共话未来
  • 网站建设领先广州代做网站
  • 聊网站推广免费下载一个app
  • 深圳电商网站制作公司郑州二七区做网站
  • vue路径大小写引入检查与修复;配置git大小写敏感
  • 赣州网站开发公司网站开发的重难点
  • dvadmin开发文档(第一版)
  • 设计网站视频教程长沙网站推广优化
  • 淘宝电子面单API集成中的常见技术难点与解决方案
  • 高端网站制作要多少钱河北网站开发公司
  • 电脑制作网站的软件免费发布信息平台网
  • 西宁网站seo价格永康企业网站建设公司