欢迎您访问《智慧农业(中英文)》官方网站! English

基于深度网络集成的复杂背景甘蔗叶片病害识别

  • 马巍巍 ,
  • 陈悦 ,
  • 王咏梅
展开
  • 合肥师范学院 计算机与人工智能学院,安徽 合肥 230061,中国
马巍巍,硕士研究生,讲师,研究方向为智慧农业,高性能计算。E-mail:

收稿日期: 2024-11-25

  网络出版日期: 2025-02-20

基金资助

2024年安徽省大学生创新创业训练计划项目(S202414098181)

安徽省社会科学创新发展研究课题(2023KY016)

合肥师范学院校级科研项目(2024KYJX44)

Recognition of Sugarcane Leaf Diseases in Complex Backgrounds Based on Deep Network Ensembles

  • MA Weiwei ,
  • CHEN Yue ,
  • WANG Yongmei
Expand
  • School of Computer Science and Artificial Intelligence, Hefei Normal University, Hefei 230061, China
MA Weiwei, E-mail:

Received date: 2024-11-25

  Online published: 2025-02-20

Supported by

2024 Anhui Province College Students Innovation and Entrepreneurship Training Program Project(S202414098181)

Anhui Province Social Science Innovation and Development Research Project(2023KY016)

Hefei Normal University Scientific Research Project(2024KYJX44)

Copyright

copyright©2025 by the authors

摘要

目的/意义 针对自然条件下甘蔗叶片病害识别难题,本研究提出XEffDa模型。 方法 该模型利用色调、饱和度、亮度(Hue-Saturation-Value, HSV)颜色空间的图像分割与边缘处理技术去除背景干扰,根据特征融合策略,集成高效网络 B0 版本(Efficient Network B0, EfficientNetB0)、深度可分离卷积网络(Extreme Inception, Xception)和密集连接卷积网络201 (Dense Convolutional Network 201, DenseNet201)作为特征提取器,采用预训练权重,通过贝叶斯优化确定顶层超参数,改进弹性网络(ElasticNet)正则化方法并加入随机失活(Dropout)层,以双重机制遏制过拟合现象。在甘蔗叶片病害数据集上训练并完成分类任务。 结果和讨论 模型集成后的识别准确率为97.62%,对比EfficientNetB0、Xception单模型及EfficientNetB0与其他深度网络结合模型识别准确率分别提高了9.96、6.04、8.09、4.19、1.78个百分点。融合实验进一步表明,加入改进ElasticNet正则化后的网络较主干网络其准确率、精确度、召回率及F1值分别提高了3.76、3.76、3.67及3.72个百分点。最大概率散点图结果显示预测最大概率值不低于0.5的比例高达99.4%。 结论 XEffDa模型具有更好的鲁棒性和泛化能力,能为农作物叶片病害精准防治提供参考。

本文引用格式

马巍巍 , 陈悦 , 王咏梅 . 基于深度网络集成的复杂背景甘蔗叶片病害识别[J]. 智慧农业, 2025 : 1 -10 . DOI: 10.12133/j.smartag.SA202411026

Abstract

Objective In agricultural production, sugarcane is an important cash crop, and its health status affects crop yields and farmers' incomes. However, under natural environmental conditions, the identification of sugarcane leaf diseases is a challenging problem in the agricultural field. There are various issues such as disease spots on sugarcane leaves being blocked and interference from lighting, which make it extremely difficult to comprehensively obtain disease information, thus significantly increasing the difficulty of disease identification. Traditional manual judgment is not only inefficient but also highly susceptible to subjective factors, making it difficult to ensure the accuracy and consistency of judgment results. Early image recognition algorithms cannot accurately extract disease features and are prone to misjudgment and missed judgment in practical applications. To solve the problem of identifying sugarcane leaf diseases under natural conditions and break through the limitations of traditional methods, a novel identification model, XEffDa is proposed. Methods The XEffDa model proposed in this paper implemented a series of improvement measures based on the ensemble learning framework, aiming to significantly improve the accuracy of classifying and identifying sugarcane leaf diseases. Firstly, the images in the sugarcane leaf disease dataset under natural conditions were pre - processed. Real-time data augmentation techniques were used to expand the scale of the dataset. Meanwhile, HSV image segmentation and edge-processing techniques were adopted to effectively remove redundant backgrounds and interference factors in the images. Considering that sugarcane leaf disease images were fine-grained images, in order to fully extract the semantic information of the images, the transfer learning strategy was employed. The pre-trained models of EfficientNetB0, Xception, and DenseNet201 were loaded respectively, and with the help of the pre-trained weight parameters based on the ImageNet dataset, the top layers of the models were frozen. The performance of the validation set was monitored through the Bayesian optimization method, and the parameters of the top-layer structure were replaced, thus achieving a good balance between optimizing the number of model parameters and the overall performance. In the top-layer structure, the improved ElasticNet regularization and Dropout layer were integrated. These two mechanisms cooperated with each other to double-suppress overfitting and significantly enhance the generalization ability of the model. During the training process, the MSprop optimizer was selected and combined with the sparse categorical cross - entropy loss function to better adapt to the multi-classification problem of sugarcane disease identification. After each model completed training independently, an exponential weight-allocation strategy was used to organically integrate the prediction features of each model and accurately map them to the final disease categories. To comprehensively evaluate the model performance, the accuracy indicator was continuously monitored, and an early-stopping mechanism was introduced to avoid overfitting and further strengthen the generalization ability of the model. Through the implementation of this series of refined optimization and integration strategies, the XEffDa model for sugarcane leaf diseases was finally successfully constructed. Results and Discussions The results of the confusion matrix showed that the XEffDa model performed very evenly across various disease categories, and all indicators achieved excellent results. Especially in the identification of red rot disease, its F1-Score was as high as 99.09%. This result was not only higher than that of other single models (such as EfficientNetB0 and Xception) but also superior to the combination of EfficientNetB0 and other deep networks (such as DenseNet121 and DenseNet201). This indicated that the XEffDa model significantly improved the ability to extract and classify features of complex pathological images by integrating the advantages of different network architectures. The comparison experiments of different models showed that the recognition accuracy of the XEffDa model reached 97.62%. Compared with the single models of EfficientNetB0 and Xception, as well as the combined models of EfficientNetB0 and other deep networks, the recognition accuracy increased by 9.96, 6.04, 8.09, 4.19, and 1.78 percentage points, respectively. The fusion experiments further showed that the accuracy, precision, recall, and F1-Score of the network improved by ElasticNet regularization increased by 3.76, 3.76, 3.67, and 3.72 percentage points respectively compared with the backbone network. The results of the maximum-probability scatter plot showed that the proportion of the maximum prediction probability value not lower than 0.5 was as high as 99.4%. Conclusions The XEffDa model demonstrated stronger robustness and stability. In the identification task of small sugarcane leaf disease datasets, it showed good generalization ability. This model can provide a powerful reference for the accurate prevention and control of crop leaf diseases in practical scenarios, and it has positive significance for promoting the intelligent and precise management of agricultural production and the sustainable development of the agricultural industry.

(登录www.smartag.net.cn免费获取电子版全文)

0 引 言

甘蔗作为全球第五大广泛种植的农作物,不仅滋养了全球超过100个国家和地区的经济命脉,还占据了全球食糖市场的80%份额,以及燃料乙醇市场的40%份额1。中国不仅植蔗制糖在世界占有重要的一席之地,在世界蔗糖贸易中也发挥着引领作用。甘蔗有生长周期长和宿根栽培的特点,当气候条件适宜时各种病虫草害容易快速蔓延。目前,甘蔗病虫害防控主要以预防为主,极易出现用药过量、不合理用药等情况,因此,实现对甘蔗病害的早期、精准识别,成为保障甘蔗产业可持续发展的关键环节2
随着人工智能技术的飞速发展,特别是在智慧农业领域的深入应用,利用人工智能识别农作物病害已成为研究热点3。稠密卷积网络(Dense Convolutional Network, Densenet)4、视觉几何组网络(Visual Geometry Group Network, VGG)5、残差网络(Residual Network, ResNet)6, 7和调控网络(Regulated Networks, RegNet)8等现代卷积神经网络的不断涌现与迭代,为农业生产中的病害识别提供了强有力的技术支持9-11。众多学者已在这一领域取得了显著成果,如吕宗旺等12提出基于改进YOLOv5s(You Only Look Once v5 s)的轻量化检测方法来检测储粮害虫,采用加权双向特征金字塔结构,在储粮害虫小目标检测上取得了较好的精度;冀常鹏等13在番茄叶面病害识别问题上提出了一种基于深度卷积神经网络的番茄叶面病害识别模型,引入Ghost模块替换常规卷积层,采用空间金字塔池化提取病害多尺度信息,在实验室场景下获得了较高的识别率;彭玉寒和李书琴14基于移动卷积神经网络V2(MobileNetV2)利用重参数化倒残差模块并结合注意力机制构建农作物叶片病害识别模型,成功构建了轻量级农作物叶片病害识别模型;纪元浩等15基于ResNet50模型加入基于卷积块的注意机制(Convolutional Block Attention Module, CBAM)对咖啡生豆筛选,模型准确率达到91.1%;项新建等16基于YOLOv5s并结合特征金字塔网络对水稻叶病检测,提高目标检测的准确度。在实际应用中,农作物病害识别分类面临诸多问题,如光照条件变化、背景复杂、图像数据采集环境的非标准性,以及后续处理过程中的技术局限。上述方法在提高识别准确率方面取得了有效的进展,但对农作物病害分类的研究多局限于实验室环境,因此存在实用性较差的问题。随着深度学习算法的不断推进,有研究者开始研究背景和光照干扰下的病害识别,并取得了一定的进展17-19。然而,在实际应用中,农作物病害图像的随机性和复杂性仍给病害识别带来诸多挑战,因此,对基础框架进行创新与优化显得尤为关键。
在深入对比和分析前人文献与研究的基础上,本研究基于EfficientNetB0深度学习模型进行了改进。首先,采用了数据增强技术,并实施了色调(Hue, H)、饱和度(Saturation, S)、亮度(Value, V)(HSV)颜色空间图像分割与边缘处理技术,以有效去除多余背景,进而增强图像的关键特征;其次,为使模型可接近最优解,使用贝叶斯优化后的分类层替换了模型的顶层(即全连接层);然后,引入了弹性网络(ElasticNet)正则化方法并加以算法改进,降低了模型的泛化误差;最后,对EfficientNetB0基础模型与其他模型进行模型集成,构建了XEffDa分类模型,集成策略融合了不同模型和算法的优势,有效减少误差,从而全面提升模型的整体性能。

1 实验数据

1.1 数据集准备

本研究所使用的数据集来自Mendeley Data数据集仓库的“2022年甘蔗叶病数据集”20,为人工采集的甘蔗叶病图像数据集,共包含2 569张图像。数据集涵盖了多种常见病害类型,包括健康、花叶病、赤腐病、锈病和黄斑病,并包含了健康叶片的图像作为对比。图1显示了数据集五种类别的原始图像示例。数据集中甘蔗叶片病害复杂且症状多样,样本数量相对较少且自然图像背景复杂,给识别工作带来了一定的难度。部分病害在初期症状不明显,难以被及时发现和识别,从而错过了最佳防治时机。如赤腐病,早期叶片中脉被侵染,初生红色小斑,之后向上、下扩展成纺锤形或长条病斑。后期病斑中央组织变枯白色,散生黑色小点,叶片常至病斑处折断。早期和后期叶片病害的外形和状态都发生了较大的改变。且甘蔗叶片病害传播速度往往较快,尤其是在高温高湿条件下,病害可迅速扩散至整个蔗田,对甘蔗产量与品质构成威胁。因此对甘蔗叶片病害的有效识别要求较高。
图1 不同病害类别的甘蔗叶片

a.黄斑病 b.花叶病 c.健康 d.赤腐病 e.锈病

Fig.1 Sugarcane leaves of different disease categories

1.2 数据预处理

甘蔗叶片的病害区域并不总是以清晰的边缘形式出现,而是表现为颜色、纹理或形状的变化。针对这一特点,在对数据预处理时,通过实时数据增强技术来扩展数据集,包括在宽度和高度上随机平移(幅度为-20%至20%)、调整随机错切变换的强度、在-40°至40°的范围内随机旋转图像、将图像随机缩放至80%~120%的大小、随机进行水平翻转,以及进行归一化处理等。此外,还对数据集进行以下调整,以增强模型对自然复杂背景下甘蔗叶病害识别的泛化能力。
1)图像分割。首先使用颜色分割技术将绿色背景与前景对象分离。HSV颜色空间21是由A. R. Smith创建的一种颜色模型,也被称为六角锥体模型(Hexcone Model)22。与RGB颜色空间相比,HSV颜色空间对光照变化具有更好的鲁棒性。在HSV空间中,光照变化主要影响亮度Value通道,而对Hue和Saturation通道的影响较小,从而有利于在光照变化条件下进行颜色检测和处理。由于HSV空间对于颜色分割更为直观和有效,将图像从RGB颜色空间转换到HSV颜色空间。公式(1)~公式(3)分别为RGB到HSV的转换公式中对V、S、H的计算(假设已对R、G、B三个通道归一化到0—1)。
V = m a x ( R , G , B )
S = V - m i n ( R , G , B ) V                    V > 0 0                                                       V = 0
H = 60 × ( G - B ) S V                            V = R 60 × 2 + ( B - R ) S V                    V = G 60 × 4 + ( B - G ) S V                    V = B 0                                                        V = 0 H + 360                                          H < 0
2)掩模生成。在HSV空间中,通过设定合适的Hue和Saturation阈值,生成一个绿色掩模。这个掩模是一个二值图像,其中绿色背景部分被标记为1(或白色),而前景对象部分被标记为0(或黑色)。
3)背景替换。最后,使用生成的绿色掩模将原始图像中的绿色背景替换为所需的背景图像。
图2显示了数据集中赤腐病的数据预处理情况。为确保模型的有效训练和性能评估,根据一般性数据集划分原则,将数据集以6∶2∶2的比例分割为训练集、验证集和测试集,如表1所示。
图2 甘蔗数据集预处理示例(赤腐病)

a.原始图像 b.HSV色调通道 c.绿色掩模 d.裁剪并缩放

Fig.2 Example of pretreatment of sugarcane data set (red rot)

表1 甘蔗病叶数据集划分

Table 1 Classification of sugarcane diseased leaf data sets

甘蔗病叶类别 训练集/张 验证集/张 测试集/张
健康 316 113 93
花叶病 281 81 100
赤腐病 307 102 109
锈病 315 100 99
黄斑病 293 108 104
总计 1 512 504 505

2 XEffDa分类模型

EfficientNet23作为轻量级网络,利用AutoML24技术优化配置,对网络深度 d、宽度 w和输入数据分辨率 r这三个维度进行平衡优化,相比于单维度精度提升,具有参数少、泛化能力强等特点。三个维度的约束如公式(4)公式(5)所示。
d = α ϕ , w = β ϕ , r = γ ϕ
α β 2 γ 2 2 ( α 1 , β 1 , γ 1 )
式中: α β γ为缩放基数,公式(5)为约束条件。通过在三个维度上的迭代搜索,提出了B0—B7的缩放尺度。EfficientNetB0是EfficientNet系列中的基准模型。其核心参数量为4.97 M左右,在多个标准数据集上仍实现了较高的分类准确率。
甘蔗叶病害的图像属于细粒度图像,为使图像的语义信息得到充分提取,本研究首先选取EfficientNetB0作为基础模型。在此基础上,经多次实验对比,最终确定将Xception25和DenseNet20126模型纳入,将他们也作为模型集成的基础组成部分。Xception模型运用深度可分离卷积技术,在显著降低参数数量和计算复杂度的同时,确保了病害特征的充分提取。而DenseNet模型则通过密集连接策略,极大地促进了信息流动与特征复用,进一步提升了模型性能。根据迁移学习27-29的思想,采用基于ImageNet数据集的预训练权重参数,同时冻结顶层,采用贝叶斯优化方法通过监控验证集上的性能替换顶层结构参数,从而在优化模型参数数量和整体性能之间取得了良好平衡。在顶层结构中加入改进后的ElasticNet正则化与Dropout层,通过这两种机制的有效结合,形成了对过拟合现象的双重遏制,显著提高了模型的泛化能力。在训练过程中,采用了MSprop优化器并将其与稀疏分类交叉熵损失函数相结合,以更好地适应甘蔗病害识别的多分类问题需求。在对每个模型进行独立训练后,利用指数型权重分配策略,将各模型的预测特征进行有机融合,并准确映射到最终的病害类别上。为全面评估模型的性能,持续监控了准确率指标,并引入了早停机制,以防止模型过拟合,进一步提高其泛化能力。经过一系列精细的优化与集成策略的实施,最终构建了甘蔗叶病XEffDa模型。该模型在复杂背景下展现出了甘蔗病害识别的更高准确率、更强稳健性和更优越性能,为甘蔗病害的智能化识别与精准防控提供了有力的技术支撑。图3显示了XEffDa模型的基本结构,第一个虚线框为迁移学习,相当于分别使用三个模型的ImageNet参数作为甘蔗叶病的特征提取;第二个虚线框为自主学习部分,主要用来对顶层部分即全连接层进行设计,共三个全连接层,最后使用Softmax层进行分类。
图3 XFffDa模型结构

Fig.3 Model structure of XFffDa

2.1 改进弹性网络(ElasticNet)正则化

正则化是一种防止神经网络过拟合的技术,它通过对模型的复杂度进行惩罚,从而降低模型在训练数据上的表现,以提高模型在未知数据上的泛化能力。在全连接层中,正则化通常应用于权重和偏置上,以减少模型的复杂度,避免模型学习到训练数据中的噪声和细节。ElasticNet正则化30是一种结合了L1和L2正则化的线性回归方法,旨在处理具有多重共线性(特征之间高度相关)的数据集。通过同时利用L1的稀疏化能力和L2的正则化能力来克服各自单独使用时的缺点,实现ElasticNet的正则化计算。本研究基于ElasticNet正则化方法,并添加自定义的正则化项作为正则化器以缓解这一问题。首先给出ElasticNet 的正则化如公式(6)公式(7)所示。
L 1 _ r e g = α l 1 _ r a t i o i x i
L 2 _ r e g = 1 2 α ( 1 - l 1 _ r a t i o ) i x i 2
式中: x i是模型权重(或参数)的第 i个元素; α是正则化强度; l 1 _ r a t i o是L1和L2正则化之间的平衡参数。
接着自定义正则化项:假设有一个输入矩阵 X m × n m是样本数量, n是特征数量。自定义正则化项 R e g是正则化误差 R乘以系数 γ,如公式(8)所示。
R e g = γ R
式中: γ系数决定了正则化项对模型损失函数的影响程度。 R是估计矩阵 X ^ X之间的均方误差,计算如公式(9)所示。
R = 1 m i = 1 m X ^ i - X i 2 2
式中: X ^ i X i分别是 X ^ X的第i行。 · 2是欧几里得范数(即 L 2范数)。
这个正则化项旨在惩罚那些使得 X ^ X之间差异较大的权重,通过这种方式,自定义正则化项 R e g鼓励模型学习那些能够较好地保持输入数据结构的特征。
总正则化项可以表示为公式(10)公式(11)
T o t a l _ r e g = l 1 _ r e g + l 2 _ r e g + R e g
T o t a l _ r e g = α l 1 _ r a t i o i x i + 1 2 α ( 1 - l 1 _ r a t i o )            i x i 2 + 1 m i = 1 m X ^ i - X i 2 2

2.2 顶层优化

采用迁移学习,对多个深度学习模型(EfficientNetB0、Xception、DenseNet201)的ImageNet预训练模型进行甘蔗叶图像的特征提取,不采用最后的全连接层而是替换为自定义的顶层结构。通过贝叶斯优化搜索31得到顶层结构的最佳超参数组合。表2显示了贝叶斯优化后的搜索结果:网络共三层,第一、二、三层神经元的最优取值分别为256、128、64,学习率为0.001,Dropout丢弃率为0.29,ElasticNet正则化强度为3.11e-5。相较于传统的网格搜索或随机搜索,贝叶斯优化能够在有限的试验次数内,更精确地定位到最优或接近最优的超参数组合。根据优化后的结果,替换后的顶层结构共包含三层,每一层分别为全连接层、批量归一化层和Dropout层。在全连接层中加入改进后的ElasticNet正则化,对权重进行约束,以减少模型的复杂度。全连接层作为特征转换的关键环节,其神经元数量的选择至关重要,直接影响了模型的学习容量和复杂性。而批量归一化层的引入,则有效缓解了内部协变量偏移的问题,加速了训练过程,并提升了模型的稳定性。Dropout层通过随机丢弃部分神经元的激活输出,降低了模型在训练数据上过拟合的风险。最后,添加一个具有5个神经元的全连接层作为输出层,并使用Softmax激活函数进行多分类预测。
表2 XFffDa模型超参数设置

Table 2 Hyperparameter settings of the XFffDa model

超参数名称 搜索范围 最终取值
第一层神经元数 整数范围: 128~512,步长:128,默认值:128 256
第二层神经元数 整数范围: 64~256,步长:32,默认值:64 128
第三层神经元数 整数范围: 16~64,步长:16,默认值:32 64
丢弃率 浮点数范围: 0.2~0.8,默认值:0.5 0.29
学习率 选择范围: [1e-2,1e-3,1e-4],默认值:1e-3 1e-3
ElasticNet alpha值 浮点数范围: 1e-5至1e-1,采用对数采样,默认值:1e-3 3.11e-5
ElasticNet l1比率 浮点数范围: 0.0至1.0,默认值:0.5 0.258

2.3 模型集成权重分配策略

为有效结合多个模型的预测能力,采用一种基于验证准确率的指数型权重分配策略。该策略的核心思想是根据每个模型在验证集上的表现(即验证准确率)来分配其在最终预测中的贡献权重。首先,针对每个训练好的模型,使用独立的验证数据集进行预测,并计算其在验证集上的准确率。这些准确率被存储在一个NumPy数组中,其中每个元素对应一个模型的验证准确率。接下来,利用指数函数来增强验证准确率之间的差异。通过将每个模型的验证准确率转换为指数值,得到了一个新的数组,其中性能更好的模型将具有更高的指数值。指数函数是单调递增的,且当输入值增加时,输出值的增长速度会逐渐加快。然后,为确保这些指数值能够作为权重使用(即它们的和必须为1),对它们进行归一化处理。将每个模型的指数值除以所有模型指数值之和,从而得到了每个模型的归一化指数权重(即exp_weights),见公式(12)
e x p _ w e i g h t s i = e x p ( a c c u r a c i e s i ) j e x p ( a c c u r a c i e s j )
式中: a c c u r a c i e s i i第个模型的验证准确率; e x p _ w e i g h t s i是对应的归一化指数权重。
通过这种指数型权重分配策略,确保了性能更好的模型在最终预测中能够拥有更高的权重。高准确率的模型在转换为指数值后会更加突出,从而在归一化过程中获得更大的权重份额。这种方法不仅考虑了模型之间的性能差异,还通过指数函数放大了这种差异,使得高性能模型的贡献更加显著。最后,利用计算得到的权重来集成不同模型在测试集上的预测结果。为每个模型在测试集上的预测结果分配了相应的权重,并将这些加权后的预测结果相加,得到了最终的预测结果。

3 结果与分析

3.1 甘蔗叶病识别实验结果

本实验软件环境为Tensorflow2.0,CUDA 11.0,Keras3.4.1,使用Keras.applications导入EfficientNetB0、Xception、DenseNet201预训练模型。实验硬件配置包括GPU TESLA P100(16 G显存)和Inter Xeon CPU(运行内存13 GB RAM)。
基于对甘蔗叶病害的分类,图4的混淆矩阵显示了集成模型XEffDa在测试集上的识别结果。混淆矩阵中对角线上的数值普遍较高,表明模型能够准确地将大部分样本归类到其真实病害类别中。非对角线上的数值相对较低,意味着模型在不同病害类别之间的误分类情况较少。表明模型具有良好的区分能力,能够有效地区分具有相似特征的病害类别,减少误判。同时模型在多个病害类别上的表现相对均衡,没有出现明显的偏倚,表明模型在训练过程中成功地学习到了各类病害的关键特征,并能够在测试集上稳定地复现这些特征,从而实现对不同病害的准确识别。“赤腐病”和“黄斑病”等类别的识别准确率尤为突出,显示了模型在处理复杂病害特征时的能力。
图4 甘蔗叶病害XEffDa模型的混淆矩阵

Fig.4 Confusion matrix of XEffDa model for sugarcane leaf diseases

XEffDa模型的识别效果如表3所示。平均准确率、平均精确度、平均召回率和平均F 1值均在97%以上,表明模型具有较好的识别能力。同时,模型的总推理时间为37.21 s,由于集成模型涉及多个模型的预测和结果的合并,推理时间通常会比单个模型要长,但这一时间仍处于可接受的范围内,较好地实现了自然环境下对甘蔗叶病害的有效识别。
表3 XEffDa模型对5类甘蔗叶病害的评价指标结果

Table 3 Evaluation index results of the XEffDa model for five types of sugarcane leaf diseases

甘蔗叶病类别 精确度/% 召回率/% F 1值/% 平均准确率/% 平均精确度/% 平均召回率/% 平均F 1值/% 推理时间/s
健康 93.81 97.85 95.79 97.62 97.68 97.58 97.62 37.21
花叶病 99.99 94.00 96.91
赤腐病 98.20 99.99 99.09
锈病 98.98 97.98 98.48
黄斑病 97.14 98.08 97.61
图5以散点图形式展示了XEffDa模型在包含505个甘蔗叶片图像的测试集上的病害识别结果,揭示了模型预测的最大概率值与样本索引的关系,反映了模型的整体识别效能。可以看出,有少数散点共计3个样本位于纵轴的较低区域(即预测概率低于0.5),这些低概率样本可能代表了一些具有挑战性的病例,如病害特征不明显、图像质量较差或存在其他干扰因素的情况。但绝大多数散点聚集在纵轴(预测概率)的较高区域,预测的最大概率值不低于0.5的样本占比达到了99.4%,体现了模型具有的鲁棒性和稳定性。
图5 XEffDa模型最大预测概率散点图

Fig.5 Scatter plot of the maximum prediction probabilities of the XEffDa model

3.2 消融实验结果

为测试模型引入的正则化方法对甘蔗叶病识别的有效性,设计消融实验,结果如表4所示。在XEffDa模型上采用ElasticNet正则化后,可以看到各项指标均有所提高,较主干网络准确率提高了0.99个百分点,精确度提高了1.04个百分点,召回率和F 1值提高了0.94个百分点。改进ElasticNet正则化将L1正则化、L2正则化和自定义正则化三种正则化策略相结合,在保持模型稀疏性的同时减少过拟合风险,并通过引入的额外灵活性,针对特定任务进行更精细的正则化调整。在实验中观察到,改进ElasticNet后的正则化方法在数据集上展现出了更优的性能,较主干网络准确率提高了3.76个百分点,精确度提高了3.76个百分点,召回率提高了3.67个百分点,F 1值提高了3.72个百分点。验证了其有效性和实用性。
表4 甘蔗叶病害识别研究消融实验结果

Table 4 Results of ablation experiment for sugarcane leaf disease identification study

模型 准确率/% 精确度/% 召回率/% F 1值/%
XEffDa(无正则化) 93.86 93.92 93.91 93.90
XEffDa(弹性网ElasticNet正则化) 94.85 94.96 94.85 94.84
XEffDa(改进ElasticNet正则化) 97.62 97.68 97.58 97.62

3.3 不同模型对比实验结果

表5为不同模型在测试集上的对比实验结果。总体显示,与EfficientNetB0,Xception以及EfficientNetB0+MobileNetV2、EfficientNetB0+DenseNet121、EfficientNetB0+DenseNet201模型进行对比,XEffDa模型的准确率分别提升了9.96、6.64、8.09、4.19、1.78 个百分点。具体来说,EfficientNetB0的准确率为87.66%,Xception的准确率略高,为90.98%。Xception模型在特定病害的诊断上表现出了独特的优势,尤其是在纹理和颜色特征较为明显的病理图像中,锈病的F 1值达到了94.18%。但仅从单一模型和集成后模型来看,模型集成整体优于单模型的表现。
表5 不同模型的甘蔗叶病害识别性能表现

Table 5 Performance comparison of different classic networks of sugarcane leaf disease recognition

模型 F 1值/% 准确率/%
健康 花叶病 赤腐病 锈病 黄斑病
EfficientNetB0 87.86 81.00 90.48 83.78 94.63 87.66
Xception 92.22 91.26 89.55 94.18 88.03 90.98
EfficientNetB0+MobileNetV2 90.71 85.32 93.58 87.15 90.57 89.53
EfficientNetB0+DenseNet121 96.22 93.60 90.64 92.82 94.29 93.43
EfficientNetB0+DenseNet201 96.84 94.58 95.37 95.92 96.59 95.84
XEffDa模型 95.79 96.91 99.09 98.48 97.61 97.62
对EfficientNetB0模型增加MobileNetV2、DenseNet121和DenseNet201后,可以看到EfficientNetB0+DenseNet201模型表现最好,相较EfficientNetB0模型准确率提高了8.18个百分点。这主要得益于DenseNet201更深的网络层次和密集的连接机制,使得模型能够学习到更加复杂和抽象的特征表示,从而提高了疾病诊断的准确性。将Xception纳入XEffDa模型后,XEffDa模型在多种疾病(如花叶病、赤腐病、锈病和黄斑病)的诊断中均达到了较好的指标值,特别是在赤腐病的识别上,其F 1值高达99.09%,这一结果不仅高于其他单一模型(如EfficientNetB0和Xception),也优于EfficientNetB0与其他深度网络(如DenseNet121、DenseNet201)的结合体。这表明XEffDa模型通过融合不同网络架构的优点,有效提升了模型对复杂病理图像特征的提取和分类能力。图6显示了图像预测结果的部分示例。
图6 甘蔗叶病预测结果

a.真实值:健康,预测:健康 b.真实值:黄斑病,预测值:黄斑病 c.真实值:赤腐病,预测值:赤腐病 d.真实值:锈病,预测值:锈病 e.真实值:健康,预测值:健康

Fig.6 Prediction results of sugarcane leaf disease

4 结 论

本研究通过对目前流行的多种深度学习模型进行实验比对,最终选择EfficientNetB0、Xception、DenseNet201作为基础模型,通过迁移策略在ImageNet数据集上分别进行预训练,并对顶层结构采用贝叶斯优化方法确定超参数组合,加入改进后的弹性网正则化方法,再对三个基础模型进行基于指数型权重分配策略的模型集成,最终构建出XEffDa模型。得出以下结论:1)消融实验中改进后的正则化方法使模型的精确度提高了3.76个百分点,F 1值提高了3.72个百分点,表明改进后的模型具有更好的泛化能力。2)与EfficientNetB0,Xception以及融合其他模型的模型进行对比,XEffDa模型的准确率分别提升了9.96、6.64、8.09、4.19、1.78个百分点。模型在甘蔗叶病害识别任务中展现出了较高的准确率、低误判率和均衡的性能,为农作物田间病害的图像识别研究提供了有效参考。
在下一步的工作中,将积极探索并整合更多先进的优化策略,提升模型的训练效率和推理速度,从而推动甘蔗叶病害识别技术的实用化进程。

利益冲突声明

本研究不存在研究者以及与公开研究成果有关的利益冲突。

1
赵婷婷, 孙婷婷, 王俊刚, 等. 甘蔗育种研究进展[J]. 中国科学: 生命科学, 2024, 54(10): 1814-1832.

ZHAO T T, SUN T T, WANG J G, et al. The research progress on sugarcane breeding[J]. Scientia sinica (vitae), 2024, 54(10): 1814-1832.

2
张帅, 王文棣. 甘蔗高产栽培技术与病虫害防治探讨[J]. 热带农业工程, 2022, 46(5): 88-90.

ZHANG S, WANG W D. Discussion on sugarcane high-yield cultivation technology and pest control[J]. Tropical agricultural engineering, 2022, 46(5): 88-90.

3
兰玉彬, 王天伟, 陈盛德, 等. 农业人工智能技术: 现代农业科技的翅膀[J]. 华南农业大学学报, 2020, 41(6): 1-13.

LAN Y B, WANG T W, CHEN S D, et al. Agricultural artificial intelligence technology: Wings of modern agricultural science and technology[J]. Journal of south China agricultural university, 2020, 41(6): 1-13.

4
DESHPANDE R, PATIDAR H. Tomato plant leaf disease detection using generative adversarial network and deep convolutional neural network[J]. The imaging science journal, 2022, 70(1): 1-9.

5
RAJPOOT V, TIWARI A, JALAL A S. Automatic early detection of rice leaf diseases using hybrid deep learning and machine learning methods[J]. Multimedia tools and applications, 2023, 82(23): 36091-36117.

6
LI X, RAI L. Apple leaf disease identification and classification using ResNet models[C]// 2020 IEEE 3rd International Conference on Electronic Information and Communication Technology (ICEICT). Piscataway, New Jersey, USA: IEEE, 2020: 738-742.

7
THENMOZHI K, SRINIVASULU REDDY U. Crop pest classification based on deep convolutional neural network and transfer learning[J]. Computers and electronics in agriculture, 2019, 164: ID 104906.

8
杜甜甜, 南新元, 黄家興, 等. 改进RegNet识别多种农作物病害受害程度[J]. 农业工程学报, 2022, 38(15): 150-158.

DU T T, NAN X Y, HUANG J X, et al. Identifying the damage degree of various crop diseases using an improved RegNet[J]. Transactions of the Chinese society of agricultural engineering, 2022, 38(15): 150-158.

9
刘合兵, 鲁笛, 席磊. 基于MobileNetV2和迁移学习的玉米病害识别研究[J]. 河南农业大学学报, 2022, 56(6): 1041-1051.

LIU H B, LU D, XI L. The research of maize disease identification based on MobileNetV2 and transfer learning[J]. Journal of Henan agricultural university, 2022, 56(6): 1041-1051.

10
SUBRAMANIAN M, SHANMUGAVADIVEL K, NANDHINI P S. On fine-tuning deep learning models using transfer learning and hyper-parameters optimization for disease identification in maize leaves[J]. Neural computing and applications, 2022, 34(16): 13951-13968.

11
SZEGEDY C, LIU W, JIA Y Q, et al. Going deeper with convolutions[C]// 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2015: 1-9.

12
吕宗旺, 邱帅欣, 孙福艳, 等. 基于改进YOLOv5s的轻量化储粮害虫检测方法[J]. 中国粮油学报, 2023, 38(8): 221-228.

LYU Z W, QIU S X, SUN F Y, et al. Lightweight grain storage pest detection method based on improved YOLOv5s[J]. Journal of the Chinese cereals and oils association, 2023, 38(8): 221-228.

13
冀常鹏, 陈浩楠, 代巍. 基于GSNet的番茄叶面病害识别研究[J]. 沈阳农业大学学报, 2021, 52(6): 751-757.

JI C P, CHEN H N, DAI W. Tomato leaf disease recognition based on GSNet[J]. Journal of Shenyang agricultural university, 2021, 52(6): 751-757.

14
彭玉寒, 李书琴. 基于重参数化MobileNetV2的农作物叶片病害识别模型[J]. 农业工程学报, 2023, 39(17): 132-140.

PENG Y H, LI S Q. Recognizing crop leaf diseases using reparameterized MobileNetV2[J]. Transactions of the Chinese society of agricultural engineering, 2023, 39(17): 132-140.

15
纪元浩, 许金普, 严蓓蓓, 等. 基于改进ResNet50模型的咖啡生豆质量和缺陷检测方法[J]. 中国农机化学报, 2024, 45(4): 237-243.

JI Y H, XU J P, YAN B B, et al. A method for detecting quality and defects in raw coffee beans based on improved ResNet50 model[J]. Journal of Chinese agricultural mechanization, 2024, 45(4): 237-243.

16
项新建, 郑雨, 曹光客, 等. 基于改进YOLOv5s的水稻叶病检测方法[J]. 中国农机化学报, 2024, 45(3): 212-218.

XIANG X J, ZHENG Y, CAO G K, et al. Detection method of rice leaf disease based on improved YOLOv5s[J]. Journal of Chinese agricultural mechanization, 2024, 45(3): 212-218.

17
WANG X W, LIU J, LIU G X. Diseases detection of occlusion and overlapping tomato leaves based on deep learning[J]. Frontiers in plant science, 2021, 12: ID 792244.

18
LI Z B, YANG Y B, LI Y, et al. A Solanaceae disease recognition model based on SE-Inception[J]. Computers and electronics in agriculture, 2020, 178: ID 105792.

19
SALMI A, BENIERBAH S, GHAZI M. Low complexity image enhancement GAN-based algorithm for improving low-resolution image crop disease recognition and diagnosis[J]. Multimedia tools and applications, 2022, 81(6): 8519-8538.

20
SWAPNILDAPHAL, SANJAYKOLI. Sugarcane leaf disease dataset[DB/OL]. Version 1.0. Mendeley. (2022-08-20)[2025-01-25].

21
丁灿, 王文胜, 黄小龙. 基于改进HSV空间的机器视觉花生霉变检测方法[J]. 粮油食品科技, 2024, 32(4): 178-184.

DING C, WANG W S, HUANG X L. Machine vision detection method for peanut mold based on improved HSV space[J]. Science and technology of cereals, oils and foods, 2024, 32(4): 178-184.

22
SMITH A R. Color gamut transform pairs[J]. ACM siggraph computer graphics, 1978, 12(3): 12-19.

23
TAN M X, LE Q V. EfficientNet: Rethinking model scaling for convolutional neural networks[EB/OL]. arXiv: 1905.11946, 2019.

24
HE X, ZHAO K Y, CHU X W. AutoML: A survey of the state-of-the-art[J]. Knowledge-based systems, 2021, 212: ID 106622.

25
CHOLLET F. Xception: Deep learning with depthwise separable convolutions[C]// 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2017: 1251-1258.

26
张国忠, 吕紫薇, 刘浩蓬, 等. 基于改进DenseNet和迁移学习的荷叶病虫害识别模型[J]. 农业工程学报, 2023, 39(8): 188-196.

ZHANG G Z, LYU Z W, LIU H P, et al. Model for identifying Lotus leaf pests and diseases using improved DenseNet and transfer learning[J]. Transactions of the Chinese society of agricultural engineering, 2023, 39(8): 188-196.

27
PAN S J, YANG Q. A survey on transfer learning[J]. IEEE transactions on knowledge and data engineering, 2010, 22(10): 1345-1359.

28
马睿, 王佳, 赵威, 等. 基于卷积神经网络与迁移学习的玉米籽粒图像分类识别[J]. 中国粮油学报, 2023, 38(5): 128-134.

MA R, WANG J, ZHAO W, et al. Classification and recognition of corn kernel image based on convolution neural network and transfer learning[J]. Journal of the Chinese cereals and oils association, 2023, 38(5): 128-134.

29
王亚鹏, 曹姗姗, 李全胜, 等. 融合迁移学习和集成学习的自然背景下荒漠植物识别方法[J]. 智慧农业(中英文), 2023, 5(2): 93-103.

WANG Y P, CAO S S, LI Q S, et al. Desert plant recognition method under natural background incorporating transfer learning and ensemble learning[J]. Smart agriculture, 2023, 5(2): 93-103.

30
吴家葆, 曾国辉, 张振华, 等. 基于K-means分层聚类的TCN-GRU和LSTM动态组合光伏短期功率预测[J]. 可再生能源, 2023, 41(8): 1015-1022.

WU J B, ZENG G H, ZHANG Z H, et al. Dynamic combination of TCN-GRU and LSTM photovoltaic short-term power prediction based on K-means hierarchical clustering[J]. Renewable energy resources, 2023, 41(8): 1015-1022.

31
SHAHRIARI B, SWERSKY K, WANG Z Y, et al. Taking the human out of the loop: A review of Bayesian optimization[J]. Proceedings of the IEEE, 2016, 104(1): 148-175.

文章导航

/