欢迎您访问《智慧农业(中英文)》官方网站! English

基于改进YOLOv8的苹果叶病害检测算法

  • 罗友璐 ,
  • 潘勇浩 ,
  • 夏顺兴 ,
  • 陶友志
展开
  • 四川农业大学 信息工程学院,四川 雅安 625014,中国
潘勇浩,副教授,研究方向为计算机应用、农业信息化。E-mail:

罗友璐,研究方向为计算机应用、深度学习和图像处理。E-mail:

LUO Youlu, E-mail:

收稿日期: 2024-06-25

  网络出版日期: 2024-09-23

基金资助

四川省科技厅区域创新合作项目(24QYCX0185)

雅安市数字农业工程中心建设项目

Apple Leaf Disease Detection Algorithm Based on Improved YOLOv8

  • LUO Youlu ,
  • PAN Yonghao ,
  • XIA Shunxing ,
  • TAO Youzhi
Expand
  • College of Information Engineering, Sichuan Agricultural University, Ya'an 625014, China
PAN Yonghao, E-mail:

Received date: 2024-06-25

  Online published: 2024-09-23

Supported by

Regional Innovation Cooperation Project of the Sichuan Provincial Department of Science and Technology(24QYCX0185)

Ya'an Digital Agriculture Engineering Center Construction Project

Copyright

copyright©2024 by the authors

摘要

目的/意义 苹果是中国重要的农产品之一,为了保障苹果的健康生长,降低其患病率,研发苹果叶病害检测技术具有重要意义。本研究旨在应对苹果生长过程中出现的病害问题,提出一种基于改进YOLOv8的苹果叶病害检测算法。 方法 选用YOLOv8n模型对苹果在生长期间的多种病害(褐腐病、褐纹病、黑星病和锈病)进行识别。一方面引入SPD-Conv来替代传统卷积层,降低模型参数量和运算量的同时提高检测精度。另一方面,在Neck层中添加多尺度空洞注意力机制(Multi-Scale Dilated Attention, MSDA),使模型通过动态感受野自适应地聚焦于图像中的关键区域,从而增强病害特征提取能力。此外,参考重参数化卷积神经网络(Reparameterized Convolutional Neural Network, RepVGG)架构,优化了原有检测头,实现检测和推理过程的架构分离,这一改进不仅加快了模型的推理速度,还提升了其特征学习能力。最后,构建了一个包含上述病害的苹果叶片数据集,并在此数据集上进行试验。 结果和讨论 改进后的模型在运算量降低0.1 G的同时,mAP50和mAP50∶95分别达到了88.2%和37.0%,较原模型分别提高了2.7%和1.3%,模型大小仅为7.8 MB。准确率和召回率分别为83.1%和80.2%,较原模型分别提升了0.9%和1.1%。 结论 改进后的模型能够实现对苹果叶病害的准确检测,该方法不仅提高了检测精度,还通过轻量化设计有效减少了模型的运算量,为后续的苹果生长和果实收集提供可靠的数据支持,并为进一步苹果叶病害研究和探索提供了有利的参考。

本文引用格式

罗友璐 , 潘勇浩 , 夏顺兴 , 陶友志 . 基于改进YOLOv8的苹果叶病害检测算法[J]. 智慧农业, 2024 : 1 -11 . DOI: 10.12133/j.smartag.SA202406012

Abstract

Objective As one of China's most important agricultural products, apples hold a significant position in cultivation area and yield. However, during the growth process, apples are prone to various diseases that not only affect the quality of the fruit but also significantly reduce the yield, impacting farmers' economic benefits and the stability of market supply. To reduce the incidence of apple diseases and increase fruit yield, developing efficient apple leaf disease detection technology is of great significance. An improved YOLOv8 algorithm was proposed to identify the leaf diseases that occurred during the growth of apples. Methods The YOLOv8n model was selected to detect various leaf diseases such as brown rot, rust, apple scab, and sooty blotch that apples might encounter during growth. On one hand, SPD-Conv was introduced to replace the original convolutional layers. By converting depth to space and using non-stride convolution operations, the model not only retained fine-grained information, but also reduced model parameters and computational costs, thereby improving the accuracy of disease detection. On the other hand, the multi-scale dilated attention (MSDA) attention mechanism was added at appropriate positions in the Neck layer to enhance the model's feature representation capability. This allowed the model to learn the receptive field dynamically and adaptively focus on the most representative regions and features in the image, thereby enhancing its ability to extract disease-related features. Finally, inspired by the RepVGG architecture, the original detection head was optimized to achieve a separation of detection and inference architecture, which not only accelerated the model's inference speed but also enhanced feature learning capability. Additionally, a dataset of apple leaf diseases containing the aforementioned diseases was constructed, and experiments were conducted based on it. Results and Discussions Compared to the original model, the improved model showed significant improvements in various performance metrics. Specifically, the improved model achieved 88.2% and 37.0% in mAP50 and mAP50:95, respectively, which were 2.7% and 1.3% higher than the original model. In terms of precision and recall, the improved model also performed outstandingly, increasing to 83.1% and 80.2%, respectively, representing an improvement of 0.9% and 1.1% over the original model. Additionally, the size of the improved model was only 7.8 MB, and the computational cost was reduced by 0.1 G FLOPs. To optimize the detection of small target diseases, this study adjusted the position where the attention mechanism was added, placing it before the second Concat operation in the Neck layer, compared to other studies. The impact of the MSDA placement on model performance was analyzed by adding it at different positions in the Neck layer, and relevant experiments were designed to verify this. The experimental results showed that adding MSDA at the small target layer in the Neck layer achieved the best effect, not only improving model performance but also maintaining low computational cost and model size, providing important references for the optimization of the MSDA mechanism. To further verify the effectiveness of the improved model, it was compared with various mainstream models such as YOLOv7-tiny, YOLOv9-c, RetinaNet, and Faster-RCNN. The experimental results showed that the improved model outperformed these models by 1.4%, 1.3%, 7.8%, and 11.6% in mAP50. By 2.8%, 0.2%, 3.4%, and 5.6% in mAP50:95. Moreover, the improved model showed significant advantages in terms of floating-point operations, model size, and parameter count, with a parameter count of only 3.7 MB, making it more suitable for deployment on hardware-constrained devices such as drones. In addition, to assess the model's generalization ability, this study used a stratified sampling method, selecting 20% of the images from the dataset as the test set. The results showed that the improved model could still maintain a high detection accuracy in complex and variable scenes, with mAP50 and mAP50:95 increasing by 1.7% and 1.2%, respectively, compared to the original model. Considering the differences in the number of samples for each disease in the dataset, a class balance experiment was also designed. Synthetic samples were generated using oversampling techniques to increase the number of minority-class samples. The experimental results showed that the class-balanced dataset significantly improved the model's detection performance, with overall accuracy increasing from 83.1% to 85.8%, recall from 80.2% to 83.6%, mAP50 from 88.2% to 88.9%, and mAP50:95 from 37.0% to 39.4%. The class-balanced dataset significantly enhanced the model's performance in detecting minority diseases, thereby improving the overall performance of the model. Conclusions In summary, the improved model demonstrated significant advantages in apple leaf disease detection. By introducing SPD-Conv and MSDA attention mechanisms, the model achieved noticeable improvements in both precision and recall while effectively reducing computational costs, leading to more efficient detection capabilities. In practical applications, this improved model could provide continuous health monitoring throughout the apple growth process and offer robust data support for farmers' scientific decision-making before fruit harvesting.

0 引 言

四川省是中国西南地区最大的苹果生产基地,苹果种植面积超过16 000 hm2。然而,苹果易受病害侵袭,尤其是叶部病害,传染性强,叶片的破坏会严重影响苹果的正常生理代谢和光合作用,从而直接影响苹果的生长和产量1。在苹果整个生长周期中,可能遭遇多种叶部病害,主要包括褐纹病、黑星病、锈病和褐腐病等。
相比果实病害,叶部病害更早出现,且较易监测,及时检测和防控叶部病害可以降低病害扩散,减少经济损失,是近年来苹果产业发展的关键研究方向之一。
在此之前,很多研究都已将深度学习应用于苹果叶病害识别,并通过早期的措施干预苹果的生长,降低其患病率,减少病害带来的经济损失。Wang等2提出了一个轻量级的单级网络,使用Ghost模块3, 4替代YOLO(You Only Look Once)中的卷积模块,同时添加卷积注意力机制(Convlutional Block Attention, CBAM)5, 6以提高其在特征提取上的能力,还额外添加了一个预测头检测超大物体,试验结果表明,该模型在检测健康叶片、锈病、黑星病和褐腐病上表现出色,模型大小仅为10.34 MB,GPU服务器上的每秒最高帧数(Frames Per Second, FPS)为84.1FPS,通过在数据集上应用图像增强技术,平均精度(Mean Average Precision, mAP)进一步提高到94.0%。Zhang等7使用Siamese扩张Inception网络,提出了一种少训练样本下的苹果叶片病害识别方法,利用并行多尺度扩张Inception模块作为子网络来构建Siamese网络,减小了模型的大小和网络训练参数,加快了网络收敛速度,试验结果表明,当训练样本与测试样本的比例为10∶90时,孪生膨胀Inception网络(Siamese Dilated Inception Network, SDINet)在识别褐纹病、锈病、褐斑病、灰斑病和花叶病方面准确率达到了91.16%。Zhu等8针对现有的苹果叶病害检测模型缺乏对病害多样性和识别准确性的考虑,提出基于YOLOv5添加特征增强模块(Feature Enrichment Module, FEM)9和通道注意力机制(Coordinate Attention for Efficient Mobile Network Design, CA)10等方法提高模型的精确度,试验表明,该模型在识别褐纹病、锈病、褐斑病、灰斑病和花叶病方面比原模型效果更好,mAP50提高了6.1个百分点。Mathew和Mahesh11将YOLO网络与无人机硬件设备结合,通过无人机硬件设备采集数据,YOLO网络进行识别,为了提高识别的精确度,提出了基于YOLOv3构建用于检测苹果叶病害并找到剩余健康部分的检测算法,该模型的mAP值达到96.04%,推理速度为34 FPS。Liu等12针对现有模型固定感受野的局限性,提出了一种新的检测方法,通过双约束变形卷积模型,动态调整感受野,同时,设计的新型特征融合模块可以自动选择感兴趣的几何形状和尺度,增强特征表达能力,试验结果表明,在复杂自然环境下,该模型对褐纹病、苹果绵蚜、褐斑病、花叶病和锈病的准确率可达66.8%。
虽然以上提到的种种苹果叶病害检测算法已取得较大进展,但是仍有问题需要解决。首先,苹果叶病害数据特征小,识别精确度低,检测时容易忽略细节信息。其次,真实状况下的数据存在复杂背景的干扰。最后,如果要部署到无人机等硬件设备上,可能还会因为模型运算量大而导致硬件资源受限。因此,为了解决上述问题,借鉴重参数化卷积神经网络(Reparameterized Convolutional Neural Network, RepVGG)13中重参数化的特点,对原有检测头实现架构分离,在运算量几乎不变的情况下提高模型的特征提取能力。同时,结合注意力机制的特点,在主干网络中适当位置添加多尺度空洞注意力机制(Multi-Scale Dilated Attention, MSDA)模块14,增强局部和稀疏图像块之间的交互,优化网络结构。最后,使用空间深度转换卷积(Space To Depth Convolution, SPD-Conv)15替换原有的Conv卷积模块,将空间深度转换(Space to Depth, SPD)层和Conv层串联起来,保留通道内细粒度信息的同时,减少空间维度,提高对较小病状和低分辨率下苹果叶病害的识别效果。

1 材料与方法

1.1 数据集的构建

本研究构建了一个包括褐腐病、褐纹病、黑星病和锈病共4种类型的苹果叶病害数据集,数据集来源于3部分,以四川德阳种植的苹果树为观测对象的实地数据采集照片为主,共1 133张,占总数据集比重的66.3%;百度照片450张,占总数据集比重的26.3%,以及各种书籍文件图片126张,占总数据集比重的7.4%,共计1 709张。采集设备为IQOO Neo5手机,拍摄图像分辨率像素为4 000×3 000。为了减少计算资源需求和加快训练速度,将图像分辨率像素预处理为640×640。选用LabelImg软件对上述的苹果叶片进行目标标注,按照7∶2∶1划分为训练集、测试集和验证集,最终形成可用于训练和测试的数据集,具体标注过程如下。
1)启动LabelImg,在LabelImg界面中,点击“Open Dir”按钮,选择存放叶病害图片的文件夹。点击“Change Save Dir”按钮,选择标签存放文件夹。
2)点击界面左侧工具栏中的“Create RectBox”按钮,使用鼠标在图片上绘制矩形框。绘制完矩形框后,在弹出的对话框中输入标签名称。
3)点击“OK”按钮保存标注文件。保存的文件将是与图片同名的*.txt文件。
标注标签有褐腐病(Black_Rot)、褐纹病 (AlternariaBoltch)、黑星病(Scab)、锈病 (Rust),苹果叶病害数据集如表1所示。
表 1 苹果叶病害数据集

Table 1 Apple Leaf Disease Datasets

苹果叶病害类别 训练集样本数量/张 验证集样本数量/张 测试集样本数量/张

样本总

数量/张

褐腐病 256 36 77 369
褐纹病 372 54 106 532
黑星病 277 40 79 396
锈病 288 42 82 412
在实地考察过程中发现,四类疾病都频发于潮湿和湿润的环境下,且四类疾病都为苹果高发性疾病,具体特征见表2
表 2 四种苹果叶病害的具体特征

Table 2 Specific features of four types of apple leaf diseases

病害类别 特征 病害表现
褐腐病 叶片上形成病斑,通常呈现为不规则褐色或黑色斑点,随着时间推移病斑逐渐扩大,会融合成较大病斑
褐纹病 叶片上形成病斑,通常开始作为小的、淡褐色的斑点,随着病害的发展逐渐扩大,颜色逐渐变为深褐色或黑褐色,伴有灰色的霉层
黑星病 病斑呈现为小而圆形的黑褐色斑点,病斑的颜色逐渐变为黑色或暗褐色,边缘通常呈锐利的环状或不规则状
锈病 叶片上形成病斑,呈现为黄色或橙色的小斑点,呈圆形或半圆形,并且在叶片上形成突起

1.2 检测模型构建

YOLOv8n模型是YOLOv8系列中一种适用于边缘设备的较小模型。YOLOv8n采用了较小的深度和宽度,这种设计是为了在资源受限的边缘设备上实现高效的目标检测。由于YOLOv8n具有快速检测和高效的性能特点,因此选择在其基础上进行改进。

1.2.1 MSDA模块

由于苹果叶病害数据集特征关系复杂,传统的卷积神经网络(Convolutional Neural Networks, CNN)仅能建模局部像素依赖,忽略了远距离像素关系。全局注意力机制虽然有一定效果,但计算复杂性较高,不满足轻量化的要求。因此,在原有的YOLOv8n模型中,通过添加MSDA模块,利用自注意力机制在不同尺度上的稀疏性特征来建模远距离像素之间的依赖,提升模型在苹果叶病害识别中的多尺度特征捕捉能力。这样不仅保持了计算效率,还扩大了感受野的范围,使模型能够更好地捕捉复杂特征。此外,MSDA模块能有效抑制背景干扰,自适应聚合多尺度特征,增强对小目标和变形目标的感知能力,减少漏检和误检,提高检测精度和鲁棒性,显著提升复杂场景下的识别效果,确保苹果叶病害的精准识别。

1.2.2 SPD-Conv模块

传统的卷积神经网络在处理低分辨率图像或小物体时表现不佳,因为现有的CNN架构中存在着一种缺陷设计,即使用步长卷积和池化层,这些操作会导致细粒度信息丢失和特征表示能力下降。在苹果叶病害研究中,许多病害的早期特征表现为较小症状,随着症状的扩散,病害往往会进入严重阶段而错过最佳防治时期。为解决这个问题,引入SPD-Conv模块替换YOLOv8n中的传统步长卷积层。
SPD-Conv模块包含SPD层和Conv层,SPD层通过下采样操作重新排列特征图,将空间信息转换为更高维度。非步长卷积层与传统的步长卷积不同,它的卷积核在特征图上滑动时不会跳过像素,而是以步长为1的方式进行滑动。这种处理方式确保在后续任务中能从原始特征图中提取重要的特征信息,特别适用于小目标和低分辨率下的苹果叶病害识别。通过这种方式,模型能更好地捕捉病害早期的小症状,提升检测精度,及时进行防治,避免病害扩散。

1.2.3 检测头创新

苹果叶病害数据集具有小尺寸病斑、低对比度、遮挡、不规则形状等特点。原有的YOLOv8n检测头在模型推理时表现不佳。受RepVGG网络结构启发,本研究对检测头进行修改,引入RepVGG结构中重参数化的特点,实现训练和推理阶段的架构分离。训练阶段采用多分支辅助训练,推理阶段则转为串行结构,增强特征学习能力并加快推理速度。这种架构改进提升了模型在苹果叶病害数据集中困难样本的识别准确度,改善了检测结果的质量和准确性。RepVGG的结构设计如图1所示。
图1 RepVGG架构示意图

Fig. 1 Sketch of RepVGG architecture

图1中,提到了RepVGG(training)和RepVGG(inference)两种结构,可以清晰看出RepVGG在训练阶段引入了跳跃链接和1×1卷积的残差分支,在推理阶段将跳跃连接和1×1的卷积重参数化合并到主分支,使用单路推理的方式减少推理时间。这种对检测头结构的改进,相较于传统YOLOv8n模型,不仅提高了推理速度,还能更有效地检测苹果叶片中的困难样本,从而提高检测精度。此外,与其他检测头相比,使用该检测头只增加了少量的浮点运算次数。

1.2.4 苹果叶病害识别算法模型

为了提高苹果叶病害检测的精确度,结合上文所提到的模块和对原有检测头的改进,本研究提出了一种新的网络模型架构——YOLOv8n-SMR。模型主要以YOLOv8n为基础,并在其上进行优化,具体如下。
1)Backbone:使用改进后的SPD-Conv卷积模块替换掉原有网络中的Conv卷积,在卷积过程中动态调整局部感受野的形状和大小,提高模型对不同尺度和形状物体的感知能力,并增强特征表示的多样性。
2)Neck:引入MSDA空洞注意力机制。这一机制能够自动调整不同尺度特征的权重,使模型能够更精准地关注苹果叶病害数据集中不同尺度和形状的病症。通过增强对重要目标区域的感知能力,进一步提升了模型在检测和识别复杂苹果叶病害时的表现。
3)Head:受RepVGG架构启发,对原有检测头做出修改,使其推理和训练的架构分离,引入结构重参数化特点,将三分支合并为单分支,通过简化推理过程来提高模型的实用性和效率。这种结构能抑制复杂环境干扰,提高对困难样本的检测准确度,具备较强的泛化能力。
经过对原有算法的改进,成功地实现了在保持轻量化优势的同时提升模型性能和准确率。这种设计方式不仅优化了算法的效率,还增强了模型对复杂环境和多样化病害的检测能力,提升算法的稳定性和鲁棒性。改进后的算法可以部署到无人机系统等硬件设备中,快速识别和定位苹果叶病害,及时采取对应的防控措施实现对苹果种植区域的实时监测。通过此模型能够为果园和专业人士提供更好的病害检测诊断。YOLOv8n-SMR算法流程如图2所示。
图2 YOLOv8n-SMR结构

Fig.2 The structure of the YOLOv8n-SMR

1.3 模型训练与测试

1.3.1 试验平台

试验所用操作系统为64位 Windows Server 2023,CPU 为 Intel(R) Core(TM) i5-13500H @2.60 GHz,GPU为8G NVIDIA GeForce RTX 4060。试验环境为Pytorch 2.1.2和Python 3.9以及CUDA 12.2。使用YOLOv8n作为基准模型进行改进。

1.3.2 模型训练

在本研究中,为了统一训练集图像的处理,所有图像的分辨率像素被转换为640×640,并配合使用Mosaic数据增强16,在模型训练过程中,使用了SGD优化器对模型的参数进行更新,将批量(batch-size)设置为4。权值的衰减速率(weight-decay)设为0.000 5,动量(momentum)设为0.937,模型的总epoch数设为200,并自动保存模型识别精度最高的权重,训练时初始学习率为0.01,并使用余弦退火法来调整每一个epoch的学习率。预测的结果采用非极大值抑制(Nonmaximum Suppression, NMS)17,并且NMS的IoU阈值18设为0.7。

1.3.3 评价指标

使用均值mAP作为评估模型性能的指标。mAP与召回率(Recall, R)、精确率(Precision, P)之间存在关联,可以用公式(1)~公式(4)表示。
R = T P T P + F N × 100 %
P = T P T P + F P × 100 %
A P = 0 1 P ( R ) d R × 100 %
m A P = 1 C i = 1 C A P i × 100 %
式中:TP表示正确检测为某一类苹果叶病害检测到的数量;FP表示错误划分为某一类苹果叶病害检测到的数量;FN表示实际为某一类苹果叶病害但未被检测到的数量;TN表示正确检测为非某一类苹果叶病害的数量。

2 结果与分析

2.1 验证MSDA在不同位置的效果

在其他改进YOLOv8的研究中,通常在检测头之前添加注意力机制,帮助模型有效提取和聚焦于有价值的特征,从而提升整体特征表达能力。然而,这种方法可能使模型更倾向于检测大目标,而忽视小目标。因此,本研究调整了注意力机制的添加位置,将其引入颈部的第二个Concat操作之前,以更好地捕捉小目标的特征。
该位置位于特征提取的中间层次,在这个层次上,特征图既保留了较多的细节信息,又具有一定的抽象能力,能有效增强特征图中的价值信息,并抑制无关或噪声特征,使得模型在后续检测过程中更能集中注意力于重要特征,因此在处理小目标时更加敏感和精准。不过,如果在检测头的多个位置都添加注意力机制,在多次卷积操作的过程中可能会导致部分小物体信息的丢失,降低检测精度。
为了验证本研究提到的二号位置效果最优的说法,针对检测头中Concat操作前的四个位置进行了试验,结果如表3所示。当在二号位置添加注意力机制时,mAP50和mAP50∶95分别达到88.2%和37.0%。综合四个指标而言,将MSDA注意力机制添加到第二个位置的效果最佳。
表 3 苹果叶病害研究中 MSDA 注意力机制在不同位置添加的效果对比

Table 3 Effects of adding MSDA attention mechanism at different positions in apple leaf disease research

试验 添加位置 mAP50/% mAP50:95/% 浮点运算次数 FLOPs / G 模型大小/MB
0 无添加 86.7 36.6 7.7 7.6
1 一号位置 88.0 37.0 8.1 8.2
2 二号位置 88.2 37.0 8.0 7.8
3 三号位置 87.1 36.8 8.0 7.7
4 四号位置 86.6 36.4 8.0 7.8

注:粗体数据表示在该指标下效果最好。

2.2 消融实验

为了证明每种方式的改进对模型产生的影响,本研究设计了消融试验,表4展示的是消融试验的结果。在表4中,试验1为使用SPD-Conv模块替换掉Conv模块,在运算量和模型大小分别降低0.7 G和0.7 MB的同时,mAP50提高了0.4%,mAP50∶95提高了0.6%。试验2中在原有的模型中添加MSDA注意力机制,充分利用多尺度感受野和上下文建模的能力,在浮点运算次数略微增加的情况下,召回率、mAP50和mAP50∶95指标都有所上涨。试验3改进了原有检测头,将训练和推理的架构分离,以提高模型的特征学习能力和对困难样本的检测性能,从而使得模型的mAP50得分较原有模型上涨1.0%。试验4是加入SPD-Conv和MSDA模型,降低运算量和模型大小的同时,mAP50和mAP50∶95都有所提升。试验5是引入SPD-Conv和改进原有检测头,抑制苹果叶片病害中复杂背景的干扰,提升了对困难样本的识别效果,同时又降低模型在卷积操作中的运算量。试验6是引入MSDA和改进原有检测头,在浮点运算次数和模型大小略微增加的基础上,模型精确度显著上涨。在最后一个试验中,将上述三项改进措施全部融合到YOLOv8n模型中。试验结果显示,该方法在保持较低浮点运算次数和模型参数量的同时,准确率达到83.1%,显著优于原始YOLOv8n。此外,mAP50和mAP50∶95指标分别提升至88.2%和37.0%。
表 4 苹果叶病害目标检测消融实验

Table 4 Ablation experiments on apple leaf disease object detection

试验 SPD-Conv MSDA RepHead 准确率/% 召回率/% mAP50/% mAP50:95/% 浮点运算次数FLOPs/ G 模型大小/MB
1 82.9 78.5 85.9 36.3 7.4 5.6
2 83.6 81.7 87.3 36.6 8.4 8.3
3 84.2 78.7 86.5 35.9 8.4 8.2
4 82.9 83.0 87.7 37.7 7.9 5.9
5 81.9 80.4 86.7 36.6 7.7 7.6
6 84.0 80.1 87.5 37.0 8.8 8.6
7 83.1 80.2 88.2 37.0 8.0 7.8

注:粗体数据表示在该指标下效果最好。

2.3 YOLOv8n-SMR与其他模型的性能对比试验

为了更好地验证YOLOv8n-SMR模型的有效性,在实验中采用同样的数据集分别在YOLOv7-tiny19、YOLOv9-c20、RetinaNet21、Faster-RCNN22, 23等多个模型中进行试验,结果如表5所示,改进后的模型在mAP50上分别比这些模型高出1.4%、1.3%、7.8%和11.6%;在mAP50∶95上分别高出2.8%、0.2%、3.4%和5.6%。此外,改进后的模型在浮点运算、模型大小和参数量方面也有着显著优势,参数量仅为3.7 MB。相比之下,YOLOv9-c在准确率和召回率上略高于YOLOv8n-SMR,但是浮点运算次数,模型大小,mAP50和参数量四个指标都不及YOLOv8n-SMR,YOLOv7-tiny是YOLOv7的轻量化版本,除了召回率略高于YOLOv8n-SMR,其余指标也都逊色于YOLOv8n-SMR,RetinaNet和Faster-RCNN模型不仅在模型大小和浮点运算次数上远高于YOLOv8n-SMR,参数量也明显更多。
表 5 不同网络模型的苹果叶病害检测实验结果

Table 5 Experimental results of apple leaf disease detection using different network models

模型 准确率/% 召回率/% mAP50/% mAP50:95/% 浮点运算次数FLOPs/G 模型大小/MB 参数量/M
YOLOv8n-SMR 83.1 80.2 88.2 37.0 8.0 7.8 3.7
YOLOv9-c 83.8 81.0 86.9 36.8 102.3 51.6 25.5
YOLOv7-tiny 82.8 81.8 86.8 34.2 13.2 12.3 6.0
RetinaNet 78.3 78.2 80.4 33.0 191.4 139.0 36.3
Faster-RCNN 73.5 74.3 76.6 31.4 370.2 108.0 136.7

注:粗体数据表示在该指标下效果最好。

综上所述,提出的YOLOv8n-SMR模型表现出优异性能,有效控制了计算复杂度和参数量。优化后的网络结构在模型大小,浮点运算次数和参数量上均保持较低水平,适合在无人机系统等硬件资源受限设备上高效部署。改进后的YOLOv8n-SMR在苹果叶病害检测任务上表现更为精准,mAP50和mAP50∶95分别达到88.2%和37.0%,显著优于YOLOv8n模型。这种设计兼顾了检测精度和轻量化,非常适合实际果园病害监测场景,为果园管理者和专业人士提供准确及时的病害识别服务,有助于及时采取防治措施,降低苹果患病率,提高采收质量和产量,从而带来显著的经济效益。

2.4 YOLOv8n模型改进前后的性能对比试验

2.4.1 综合评比

为了更好地验证YOLOv8n和YOLOv8n-SMR之间的效果,本研究使用训练后的模型在验证集上进行测试,结果如表6所示。改进后的模型相对于原模型,在计算量降低0.1 G的情况下,mAP50和mAP50∶95分别提升了2.7%和1.3%,准确率和召回率分别提升了0.9%和1.1%,尽管模型大小和参数量略有增加,但仍然达到了轻量化标准。
表 6 苹果叶病害研究中YOLOv8n模型改进前后的结果对比

Table 6 Comparison of YOLOv8n model results before and after improvements for apple leaf disease

模型 准确率/% 召回率/% mAP50/% mAP50:95/% 浮点运算次数FLOPs/ G 模型大小/MB 参数量/M
YOLOv8n 82.2 79.1 85.5 35.7 8.1 6.3 3.0
YOLOv8n-SMR 83.1 80.2 88.2 37.0 8.0 7.8 3.7

注:粗体数据表示在该指标下效果最好。

图3 苹果叶病害检测中YOLOv8n改进前后的mAP50、mAP50:95结果可视化

a. 模型mAP50值对比 b. 模型mAP50:95值对比

Fig.3 Visualization of mAP50 and mAP50:95 before and after YOLOv8n improvement in apple leaf disease detection

改进前后的模型在验证集上对不同苹果叶病害的检测效果如图4所示。总体而言,YOLOv8n-SMR在整体表现上优于YOLOv8n,具体分析如下。
图4 YOLOv8n改进前后在验证集上对苹果叶病害的检测效果

Fig.4 Detection performance of YOLOv8n on apple leaf diseases before and after improvements on the validation set

1)褐腐病:YOLOv8n-SMR在精确度上略低于YOLOv8n,但在召回率、mAP50和mAP50∶95上表现更好。
2)黑星病和褐纹病:YOLOv8n-SMR在所有指标上均优于YOLOv8n,尤其是在精确度和mAP50上的表现差异显著。
3)锈病:两个模型在精确度和mAP50上的表现相近,但YOLOv8n-SMR在召回率指标上略有优势。

2.4.2 混淆矩阵

混淆矩阵是一个二维结构,提供了分类模型性能的可视化表示。矩阵中记录了真正例、真负例、假正例和假负例的数量,用于全面评估模型的准确率、精确率、召回率和F 1值,其中行代表实际类别,列代表模型预测类别,从混淆矩阵中可以看出,褐腐病的准确率较高,达到90%,褐纹病、锈病的准确率分别为88%和89%,黑星病由于病害样本性状差异大、背景复杂,导致误检率稍高,但整体精确度仍在正常范围内。
图5 苹果叶病害检测中YOLOv8n-SMR模型的混淆矩阵

Fig.5 Confusion matrix of the YOLOv8n-SMR model in apple leaf disease detection

2.4.3 泛化测试

为了验证模型的泛化能力,本研究采用分层抽样的方法,从数据集中选取了20%的图像作为测试集,并在测试集上对多个模型进行了测试。结果显示,改进后的模型YOLOv8n-SMR在病害检测的准确性和可靠性方面显著优于其他模型,且在复杂多变的场景中依然保持了较高的检测精度,mAP50和mAP50∶95分别较原模型提升了1.7%和1.2%。试验结果见表7。此外,图6展示了改进前后模型在测试集上的效果,通过柱状图比较了两种模型在不同病害检测情况下的性能差异。
表 7 苹果叶病害检测研究中不同模型在测试集上总体结果对比

Table 7 Comparison of different models' results on the apple leaf disease test set

模型 准确率/% 召回率/% mAP50/% mAP50:95/%
YOLOv8n 83.9 81.7 84.6 38.2
YOLOv8n-SMR 84.1 82.0 86.3 39.4
YOLOv9-c 86.5 80.6 85.0 38.1
YOLOv7-tiny 84.2 80.5 85.7 36.5

注:粗体数据表示在该指标下效果最好。

图6 YOLOv8n改进前后在测试集上对苹果叶不同病害的检测效果

Fig. 6 Performance of YOLOv8n before and after improvements on the test set for different diseases.

改进前后的模型测试效果对比如图7所示,经分析,具体效果如下。
图7 YOLOv8n和YOLOv8n-SMR对不同病害识别效果

Fig. 7 The recognition performance of YOLOv8n and YOLOv8n-SMR for different diseases

1)黑星病:原模型在识别黑星病时存在一定程度的漏检,而改进后的模型能够准确识别黑星病。
2)锈病:原模型常将其误检为褐纹病,但改进后的模型能够准确区分。
3)褐纹病:原模型在识别褐纹病时,受到地面背景干扰,未能正确识别病害,而改进后的模型能够准确识别。
4)褐腐病:在识别褐腐病时,原模型无法识别小目标病症且识别置信度较低,而改进后的模型不仅能识别出小目标病症,且识别置信度普遍较高。

2.4.4 数据类别不平衡试验

表1显示了苹果叶病害类别样本数量的不平衡情况,其中褐腐病、黑星病和锈病的训练集样本数量明显少于褐纹病。为了验证数据不平衡对模型训练的影响,本研究采用了过采样技术,通过在特征空间中选择样本点之间的随机点进行插值生成合成样本,增加少数类样本数量。
在试验中,通过预处理将四类苹果病害样本中的训练集数量都扩充至372张,实现样本数量的均衡。扩充数据后,使用YOLOv8n-SMR模型对数据集进行了试验,结果如表8所示。
表8 苹果叶病害检测中数据类别平衡前后模型训练结果

Table 8 Model training results before and after data class balancing in apple leaf disease detection

类别

准确率

(平衡前)

准确率

(平衡后)

召回率

(平衡前)

召回率

(平衡后)

mAP50

(平衡前)

mAP50

(平衡后)

mAP50:95

(平衡前)

mAP50:95

(平衡后)

总体 83.1 85.8 80.2 83.6 88.2 88.9 37.0 39.4
褐纹病 91.3 90.2 86.6 95.7 96.2 97.1 39.2 50.3
褐腐病 79.9 92.2 85.6 82.5 89.9 93.4 39.6 39.2
黑星病 74.7 77.3 62.7 69.9 74.8 76.6 30.8 32.0
锈病 86.5 83.5 85.7 86.2 91.9 88.7 38.4 36.3

注:粗体数据表示在该指标下效果最好。

在应用过采样技术后,模型在整体性能和各类病害的检测能力上均有显著提升。总体准确率从83.1%提高到了85.8%,召回率从80.2%提高到了83.6%,mAP50从88.2%提升至88.9%,mAP50∶95从37.0%提升至39.4%。特别是在少类样本数据中,诸如黑星病和褐腐病的检测效果显著改善。这表明过采样技术有效地缓解了数据不平衡问题,提升了模型对少数类样本的检测能力。
通过这些措施,本研究成功地减轻了类别不平衡对模型性能的负面影响,为模型训练提供了更加均衡的数据支持。

3 讨论与结论

3.1 讨论

针对苹果叶病害特征小,识别精确度低,自然环境下存在复杂背景的干扰等问题,本研究基于YOLOv8n模型提出一种苹果叶病害目标检测模型YOLOv8n-SMR。该模型使用SPD-Conv替换掉原模型主干网络中Conv层,在保持轻量化设计的同时提高检测精度。而Zhang等24则提出使用BCTNet模型来提高真实场景下苹果叶部病害检测精度,该模型使用了一个增强区块卷积模块(Bole Convolution Module, BCM)的主干网络,虽然有一定程度上的效果,但浮点运算次数高达109.9 G,而在本研究中,通过选取轻量化的模型设计,使得模型浮点运算次数仅为8.0 G,模型大小仅为7.8 MB,更适合于实际应用场景的硬件化部署。杨锋和姚晓通25为了提高叶片病害检测模型的轻量化程度,使用轻量级提取网络ShuffleNetV2替换YOLOv8的主干部分。相较于本研究中的主干网络轻量化,前者网络结构相对复杂,在处理复杂图像任务时表现不佳,对不同病害特征学习程度不够会导致精确度降低。本研究则是通过SPD-Conv模块改进原有Conv层中的缺陷,在降低运算量的同时,提高模型对细粒度信息的提取能力,从而改善漏检和误检的情况。郑宇达等26与陈禹等27在原有模型基础上分别增添动态检测头(Dynamic Head, DYHEAD)和小目标检测头以实现对小目标病害的检测能力,相较于本研究而言,这两种改进方式不仅会增大模型的运算量,同时也会增加模型复杂度,降低训练和推理速度,本研究则是通过优化原有检测头,使训练和推理架构分离,从而提高模型推理能力,同时保持模型浮点运算次数基本不变。

3.2 结论

本研究针对苹果叶病害特征小,识别精确度低,自然环境下存在复杂背景的干扰等问题,首先,提出了一种苹果叶病害目标检测模型YOLOv8n-SMR,通过在第二个Concat操作前添加MSDA模块,增大模型的全局感受野和上下文建模能力,更好地提取苹果叶病害数据集中的深层次特征。然后,引入SPD-Conv替换YOLOv8n中的Conv,降低运算量和模型大小,通过空间到深度的转换及非步长卷积提取细粒度信息,提高对苹果叶病害目标的检测能力。最后,对检测头进行改进,引入重参数化实现训练和推理阶段的架构分离,增强特征学习能力,增加推理速度,提高对困难样本的识别精度。通过此模型,果园和专业人士能够更好地检测和诊断苹果叶病害。使用自然环境下构建的苹果叶病害数据集进行训练和测试,试验结果表明,YOLOv8n-SMR模型检测性能更佳,准确率达到83.1%,mAP50达到88.2%,mAP50∶95达到37.0%,模型大小仅7.8 MB,浮点运算次数仅8.0 G,适合部署到嵌入式移动设备中。未来工作中,将丰富数据集,使用更多自然条件下的数据样本,进一步优化模型,减少复杂背景的干扰。

利益冲突声明

本研究不存在研究者以及与公开研究成果有关的利益冲突。

1
田有文, 程怡, 王小奇, 等. 基于高光谱成像的苹果虫害检测特征向量的选取[J]. 农业工程学报, 2014, 30(12): 132-139.

TIAN Y W, CHENG Y, WANG X Q, et al. Feature vectors determination for pest detection on apples based on hyperspectral imaging[J]. Transactions of the Chinese society of agricultural engineering, 2014, 30(12): 132-139.

2
WANG Y, WANG Y, ZHAO J. MGA-YOLO: A lightweight one-stage network for apple leaf disease detection[J]. Frontiers in plant science, 2022, 13: ID 927424.

3
王帅, 王利众, 朱丽平, 等. 基于改进YOLOv5s的苹果病害检测技术研究[J]. 山西农业大学学报(自然科学版), 2024, 44(4): 118-129.

WANG S, WANG L Z, ZHU L P, et al. Research on apple disease detection technology based on improved YOLOv5s[J]. Journal of Shanxi agricultural university (natural science edition), 2024, 44(4): 118-129.

4
HAN K, WANG Y H, TIAN Q, et al. GhostNet: more features from cheap operations[C]// 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2020: 1580-1589.

5
YANG R T, HE Y B, HU Z W, et al. CA-YOLOv5: A YOLO model for apple detection in the natural environment[J]. Systems science & control engineering, 2024, 12(1): ID 2278905.

6
WOO S, PARK J, LEE J Y, et al. CBAM: convolutional block attention module[M]// Lecture Notes in Computer Science. Cham: Springer International Publishing, 2018: 3-19.

7
ZHANG S W, WANG D W, YU C Q. Apple leaf disease recognition method based on Siamese dilated Inception network with less training samples[J]. Computers and electronics in agriculture, 2023, 213: ID 108188.

8
ZHU R, ZOU H, LI Z, et al. Apple-net: A model based on improved YOLOv5 to detect the apple leaf diseases[J]. Plants (basel, Switzerland), 2022, 12(1): ID 169.

9
LIU H F, PENG P, CHEN T, et al. FECANet: Boosting few-shot semantic segmentation with feature-enhanced context-aware network[J]. IEEE transactions on multimedia, 2023, 25: 8580-8592.

10
HOU Q B, ZHOU D Q, FENG J S. Coordinate attention for efficient mobile network design[C]// 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey: IEEE, 2021: 13713-13722.

11
MATHEW M P, MAHESH T Y. Determining the region of apple leaf affected by disease using YOLOv3[C]// 2021 International conference on communication, control and information sciences (ICCISc). Piscataway, New Jersey, USA: IEEE, 2021, 1: 1-4.

12
LIU B, HUANG X L, SUN L M, et al. MCDCNet: Multi-scale constrained deformable convolution network for apple leaf disease detection[J]. Computers and electronics in agriculture, 2024, 222: ID 109028.

13
DING X H, ZHANG X Y, MA N N, et al. RepVGG: making VGG-style ConvNets great again[C]// 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2021: 13733-13742.

14
JIAO J Y, TANG Y M, LIN K Y, et al. DilateFormer: Multi-scale dilated transformer for visual recognition[J]. IEEE transactions on multimedia, 2023, 25: 8906-8919.

15
SUNKARA R, LUO T. No more strided convolutions or Pooling: A new CNN building block for Low-resolution images and Small objects[M]// Lecture Notes in Computer Science. Cham: Springer Nature Switzerland, 2023: 443-459.

16
JIAO L C, ZHANG F, LIU F, et al. A survey of deep learning-based object detection[J]. IEEE access, 2019, 7: 128837-128868.

17
CAI D L, ZHANG Z Y, ZHANG Z. Corner-point and foreground-area IoU loss: Better localization of small objects in bounding box regression[J]. Sensors, 2023, 23(10): ID 4961.

18
SHEPLEY A J, FALZON G, KWAN P, et al. Confluence: A robust non-IoU alternative to non-maxima suppression in object detection[J]. IEEE transactions on pattern analysis and machine intelligence, 2023, 45(10): 11561-11574.

19
WANG C Y, BOCHKOVSKIY A, LIAO H Y M. YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors[C]// 2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2023: 7464-7475.

20
WANG C Y, YEH I H, LIAO H Y M. YOLOv9: Learning what you want to learn using programmable gradient information[EB/OL]. arXiv: 2402.13616, 2024.

21
LIN T Y, GOYAL P, GIRSHICK R, et al. Focal loss for dense object detection[C]// 2017 IEEE International Conference on Computer Vision (ICCV). Piscataway, New Jersey, USA: IEEE, 2017: 2980-2988.

22
REN S, HE K, GIRSHICK R, et al. Faster R-CNN: Towards real-time object detection with region proposal networks[J]. IEEE transactions on pattern analysis and machine intelligence, 2017, 39(6): 1137-1149.

23
石展鲲, 杨风, 韩建宁, 等. 基于Faster-RCNN的自然环境下苹果识别[J]. 计算机与现代化, 2023(2): 62-65.

SHI Z K, YANG F, HAN J N, et al. Apples recognition in natural environment based on faster-RCNN[J]. Computer and modernization, 2023(2): 62-65.

24
ZHANG Y K, ZHOU G X, CHEN A B, et al. A precise apple leaf diseases detection using BCTNet under unconstrained environments[J]. Computers and electronics in agriculture, 2023, 212: ID 108132.

25
杨锋, 姚晓通. 基于改进YOLOv8的小麦叶片病虫害检测轻量化模型[J].智慧农业(中英文), 2024, 6(1): 147-157.

YANG Feng, YAO Xiaotong. Lightweighted Wheat Leaf Diseases and Pests Detection Model Based on Improved YOLOv8[J]. Smart agriculture, 2024, 6(1): 147-157.

26
郑宇达, 陈仁凡, 杨长才, 等. 基于改进YOLOv5s模型的柑橘病虫害识别方法[J]. 华中农业大学学报, 2024, 43(2): 134-143.

ZHENG Y D, CHEN R F, YANG C C, et al. Improved YOLOv5s based identification of pests and diseases in citrus[J]. Journal of Huazhong agricultural university, 2024, 43(2): 134-143.

27
陈禹, 吴雪梅, 张珍, 等. 基于改进YOLOv5s的自然环境下茶叶病害识别方法[J]. 农业工程学报, 2023, 39(24): 185-194.

CHEN Y, WU X M, ZHANG Z, et al. Method for identifying tea diseases in natural environment using improved YOLOv5s[J]. Transactions of the Chinese society of agricultural engineering, 2023, 39(24): 185-194.

文章导航

/