欢迎您访问《智慧农业(中英文)》官方网站! English
专刊--光智农业创新技术与应用

基于DCC-YOLOv10n的玉米叶片病害小目标检测方法

  • 党珊珊 1 ,
  • 乔世成 , 1, 3 ,
  • 白明宇 1 ,
  • 张明月 2 ,
  • 赵晨雨 1 ,
  • 潘春宇 1 ,
  • 王国忱 1
展开
  • 1. 内蒙古民族大学 计算机科学与技术学院,内蒙古 通辽 028043,中国
  • 2. 中国联合网络通信有限公司通辽市分公司,内蒙古 通辽 028007,中国
  • 3. 牧草智能装备创新中心,内蒙古 通辽 028043,中国
乔世成,博士,副教授,研究方向为智能检测与控制技术。E-mail:

党珊珊,硕士研究生,研究方向为智能检测与控制技术。E-mail:

收稿日期: 2025-04-23

  网络出版日期: 2025-08-18

基金资助

国家自然科学基金项目(62162049)

内蒙古民族大学博士科研启动资金(BS658)

人兽共患病自治区高等学校重点实验室开放基金项目(MDK2022019)

内蒙古自治区牧草智能装备创新中心开放基金项目(MDK2025050)

内蒙古自治区自然科学基金项目(2025LHMS06012)

Small Target Detection Method of Maize Leaf Disease Based on DCC-YOLOv10n

  • DANG Shanshan 1 ,
  • QIAO Shicheng , 1, 3 ,
  • BAI Mingyu 1 ,
  • ZHANG Mingyue 2 ,
  • ZHAO Chenyu 1 ,
  • PAN Chunyu 1 ,
  • WANG Guochen 1
Expand
  • 1. School of Computer Science and Technology, Inner Mongolia Minzu University, Tongliao 028043, China
  • 2. China United Network Communications Corporation Tongliao Branch, Tongliao 028007, China
  • 3. Innovation Center for Intelligent Forage Equipment, Tongliao 028043, China
QIAO Shicheng, E-mail:

DANG Shanshan, E-mail:

Received date: 2025-04-23

  Online published: 2025-08-18

Supported by

National Natural Science Foundation Project(62162049)

Doctoral Research Startup Fund of Inner Mongolia Minzu University(BS658)

Open Fund Project of Key Laboratory of Zoonosis of Autonomous Region Higher Education Institutions(MDK2022019)

Open Fund Project of Inner Mongolia Autonomous Region Forage Intelligent Equipment Innovation Center(MDK2025050)

Natural Science Foundation of Inner Mongolia Autonomous Region of China(2025LHMS06012)

Copyright

copyright©2025 by the authors

摘要

[目的/意义] 玉米叶片病害的精准检测对保障玉米产量和农业可持续发展至关重要。针对目前玉米叶片病害检测没有充分考虑病害的形状及细节特征等问题,提出一种适用于小目标场景的玉米叶片病害检测算法,以提升病害区域的识别精度。 [方法] 在可变核卷积(Arbitrary Kernel Convolution, AKConv)的基础上设计DRPAKConv替换网络中参数量较大的3×3卷积,通过动态采样和静态卷积两个分支自动调整采样形状和卷积核大小,提高对较小病斑的检测能力;在特征融合部分设计CBVoVGSCSP替换传统C2f特征融合模块,改善梯度流失现象,保持特征丰富性的同时减少计算冗余;在颈部网络中引入卷积和注意力融合模块(Convolutional Attention-based Feature Map, CAFM),将提取的特征进行交互和融合,提高模型的表示能力和检测性能。 [结果和讨论] 通过消融实验和不同算法对比实验可知,DCC-YOLOv10n算法在玉米叶片病害数据集上展现出了良好的检测精度。与YOLOv10n相比,改进后的算法计算复杂度减少了0.5 GFLOPs,模型参数仅为2.99 M,精确度、召回率、平均精度均值分别提高了1.7、2.6和1.7个百分点,分别达到了96.2%、90.3%、94.1%。通过精确率-召回率曲线进行对比,DCC-YOLOv10n算法的综合表现效果更稳定,模型总体平均精度均值从原来的92.4%提升至94.1%,提升了1.7个百分点,满足了对玉米叶片病害小目标的检测需求。 [结论] 提出的DCC-YOLOv10n算法能够实现对玉米叶片病害小目标的精准检测与识别,为推动农业生产中玉米叶片病害检测提供了参考依据。

本文引用格式

党珊珊 , 乔世成 , 白明宇 , 张明月 , 赵晨雨 , 潘春宇 , 王国忱 . 基于DCC-YOLOv10n的玉米叶片病害小目标检测方法[J]. 智慧农业, 2025 , 7(5) : 124 -135 . DOI: 10.12133/j.smartag.SA202504017

Abstract

[Objective] Precise detection of maize leaf diseases plays a pivotal role in safeguarding maize yields and promoting sustainable agricultural development. However, existing detection algorithms often fall short in effectively capturing the intricate morphological details and shape characteristics of disease spots, particularly under challenging scenarios involving small disease targets. To overcome these challenges, a novel maize leaf disease detection algorithm, DCC-YOLOv10n, is presented in this research, which is specifically optimized for scenarios involving small-scale disease targets. [Methods] The core of the proposed method lay in three innovative architectural enhancements to the YOLOv10n detection framework. Firstly, a DRPAKConv module was designed, which built upon the arbitrary kernel convolution (AKConv). DRPAKConv replaced the conventional 3×3 convolutions that typically occupied a large proportion of the model's parameters. It featured two parallel branches: A dynamic sampling branch that adjusted the sampling shapes based on the spatial distribution of disease patterns, and a static convolution branch that adapted kernel sizes to retain spatial coverage and consistency. This design significantly enhanced the network's capability to recognize small-scale disease spots by dynamically modulating the receptive field and focusing on localized lesion details. Secondly, an improved feature fusion part was introduced by replacing the traditional C2f feature fusion module with a novel CBVoVGSCSP module. This redesigned module aimed to address the issue of gradient vanishing in deep feature fusion networks while reducing computational redundancy. CBVoVGSCSP preserved rich semantic information and improved the continuity of gradient flow across layers, which was critical for training deeper models. Furthermore, it enhanced multi-scale feature fusion and improved detection sensitivity for lesions of varying sizes and appearances. Thirdly, the convolutional attention-based feature map (CAFM) was incorporated into the neck network. This component enabled the model to effectively capture contextual relationships across multiple scales and enhanced the interaction between spatial and channel attention mechanisms. By selectively emphasizing or suppressing features based on their relevance to disease identification, the module allowed the model to more accurately distinguish between diseased and healthy regions. As a result, the model's representational capacity was improved, leading to enhanced detection accuracy in complex field environments. [Results and Discussions] Extensive experiments were conducted on a specialized maize leaf disease data set, which included annotated samples across multiple disease categories with diverse visual characteristics. Through ablation experiments and comparisons with different algorithms, it had been found that the DCC-YOLOv10n algorithm had exhibited good detection accuracy on the maize leaf disease dataset. Compared with YOLOv10n, the optimized algorithm demonstrated a reduction in computational complexity by 0.5 GFLOPs, with the model parameters compressed to merely 2.99 M. Significant improvements were observed in precision, recall, and mean average precision, which increased by 1.7, 2.6, and 1.7 percentage points respectively, and achieved 96.2%, 90.3%, and 94.1%. Based on the precision-recall curve comparison, the DCC-YOLOv10n algorithm had achieved more stable overall performance, with the mean average precision improved from 92.4% to 94.1% (an increase of 1.7 percentage points), which had fulfilled the detection requirements for small targets of maize leaf diseases. The findings underscored the robustness and adaptability of the DCC-YOLOv10n algorithm under challenging conditions. [Conclusions] The DCC-YOLOv10n algorithm presents a significant advancement in the field of agricultural disease diagnostics by addressing the limitations of existing methods with respect to small-target detection. The novel architectural components—DRPAKConv, CBVoVGSCSP, and CAFM integrated with attention fusion—not only significantly enhance the model's detection performance, but also advance the development of intelligent, data-efficient, and highly accurate disease monitoring systems tailored for modern agricultural applications. This research would serve as a valuable reference for future developments in lightweight, efficient, and accurate maize disease detection models, and offer practical significance for intelligent maize management.

0 引 言

“洪范八政,食为政首。”中国玉米的年播种面积 稳定在4 000万hm2左右,占全国播种面积的三分之一以上,提高玉米单位面积产量对保障中国粮食安全尤为重要1。玉米生长发育过程中易受叶斑病、锈病、灰斑病等病害的侵染,因此高效、精准、实时的病害检测技术对玉米农业生产具有重要意义。
无损检测技术在计算机视觉、光谱分析,以及高光谱成像等领域广泛应用2。国内外学者依托计算机视觉和图像处理方法,实现了玉米病害的自动化诊断,再结合农业知识进行防治,有效减轻了病害造成的损失3。随着计算机技术的进一步发展,许多学者开始对玉米病害检测开展深入研究,并取得了一定的研究成果4。深度学习的发展为农作物病害检测开辟了新的研究方向,卷积神经网络(Convolutional Neural Network, CNN)凭借检测精度高、提取能力强、易扩展等特点,在该领域备受关注5。基于CNN的目标检测算法通过自动提取多层次特征,对病害区域进行精准定位与识别,显著提升了病害检测的效率与准确性6。一类是先生成候选区域,再进行分类和位置回归的双阶段目标检测,常用算法有R-CNN(Region-based Convolutional Neural Networks)7、Fast R-CNN(Fast Region-based Convolutional Neural Network)8、Faster R-CNN9,这类方法候选框质量高、适应能力强、检测精度高,运行速度慢。一类是直接从输入图像中回归预测目标类别和位置信息的单阶段目标检测10。常用算法有YOLO(You Only Look Once)11系列、SSD(Single Shot Multibox Detector)12系列等。这类方法检测速度快、消耗低、易于部署。例如,Hu等13以PlantVillage中的玉米叶片图像为研究对象,使用数据增强和迁移学习技术建立卷积神经网络模型,实验结果表明,玉米病害的平均识别准确率可达97.6%。Wang等14使用ResNeXt模型来解决玉米病害斑点较小病害程度难以识别的问题,模型识别准确率达到了90.22%。施杰等15使用轻量化网络GhostNet替换传统卷积层,引入NAM(Normalization-based Attention Module)和EIOU(Efficient Intersection Over Union)损失函数提升定位能力,使模型参数量减少52.9%。马中杰等16引入SPD-Conv(Spatially Separated and Deformable Convolution)和VanillaBlock模块,并添加ECA(Efficient Channel Attention)改进模型结构,提升了玉米雄穗检测精度。以上研究表明,学者通过改进网络结构、提升检测技术、优化数据集等方式提高检测能力,适应了玉米病害检测的实际生产需求。但这些检测方法还需进一步考虑玉米叶片病害的形状及细节特征,当面对病害受损严重、病斑较小、病害区域较分散时易出现漏检和误检现象,严重影响了玉米叶片病害的检测精度。因此,本研究以YOLOv10n为基线模型,针对玉米叶片病害的不规则形状及细节特征,提出一种适用于小目标检测的DCC-YOLOv10n(Dual-Channel Convolution-YOLOv10n)算法,改善玉米叶片病害检测精度低的问题,为智能农业领域病害检测提供了有力支持。本研究的主要贡献概述如下:
(1)在可变核卷积(Arbitrary Kernel Convolution, AKConv)的基础上设计DRPAKConv,赋予卷积核可变的参数和采样形状,轻量化网络的同时平衡网络开销和性能。
(2)在特征融合部分设计CBVoVGSCSP替换传统C2f特征融合模块,均衡融合低层和高层特征,改善梯度流失的情况下减少计算冗余。
(3)在颈部网络中引入卷积和注意力融合模块(Convolutional Attention-based Feature Map, CAFM),增强全局和局部特征的建模能力,更好地捕捉长距离依赖关系和邻域光谱相关性。

1 材料与方法

1.1 模型改进方法

YOLOv10在保持实时检测的基础上,进一步提升了检测精度与计算效率17。算法创新性地提出了双重标签分配策略来消除非极大值抑制带来的时间延迟18。主要分为YOLOv10n、YOLOv10s、YOLOv10m、YOLOv10b、YOLOv10l和YOLOv10x共6种类型19。本研究选用轻量化的YOLOv10n为基线模型,由骨干网络(Backbone)、颈部网络(Neck)和检测头(Head)3部分组成20。骨干网络逐层提取低级到高级的语义信息。21。颈部使用双向特征金字塔网络22(Bi-directional Feature Pyramid Network, BiFPN)整合不同层级的特征。检测头部分使用一对一和一对多检测头,在训练和推理过程中将融合后的特征转换为更精细的预测23
现阶段YOLOv10已被广泛应用于目标检测领域,DCC-YOLOv10n算法增强了对小目标的检测能力,满足了玉米叶片病害的实际检测需要。具体改进如下。
首先,设计DRPAKConv替换骨干和颈部网络中参数量较大的3×3卷积,在AKConv的基础上设计另一支静态卷积提升对小病斑的检测能力,为卷积核提供任意参数和采样形状。其次,在VoVGSCSP中3次嵌入卷积注意力模块(Convolutional Block Attention Module, CBAM)来替换传统C2f模块,避免梯度衰减的同时提高特征提取能力。最后,在特征融合部分引入卷积和注意力融合模块CAFM提升模型对全局和局部特征的关注度,从而提升对小物体的检测精度。DCC-YOLOv10n网络结构如图1所示。
图1 DCC-YOLOv10n算法网络结构图

Fig. 1 Network structure diagram of DCC-YOLOv10n algorithm

1.1.1 可变核卷积DRPAKConv

YOLOv10n的骨干和颈部网络包含多层普通卷积,主要用于特征提取、通道调整和特征融合等。普通卷积虽然在目标检测中被广泛应用,但其还存在一些缺点有待提高,如参数和计算复杂度高、易出现梯度消失或爆炸、特征重用不足等。一方面玉米叶片病害形状不规则、病害区域较分散,有的病害总体呈长梭形,有的呈斑点状,有的呈椭圆形;另一方面卷积操作受限于局部感受野,卷积核大小和采样形状固定,难以捕捉远距离位置之间的关联信息,因此玉米叶片病害检测工作较为困难。
基于此,本研究在骨干和颈部网络中设计DRPAKConv代替普通卷积,赋予卷积核任意参数和初始采样形状,通过不规则卷积运算完成高效特征提取,为卷积采样形态提供更丰富的探索空间24。在传统的卷积网络中,参数数量随内核大小呈二次方增加,而AKConv25允许根据特定需求对内核参数进行线性调整,通过可学习的偏移量使采样点适应输入特征的局部变化,从而提升模型的表达能力。AKConv初始采样坐标如图2所示。
图2 AKConv任意卷积计算的初始采样坐标

Fig. 2 Initial sampling coordinates for AKConv arbitrary convolution calculation

AKConv主要由偏移计算、自适应采样、插值计算、自适应卷积、后处理等部分组成。首先,使用1个C×H×W的特征图作为AKConv处理的原始数据,采用标准2D卷积(Conv2D)计算偏移量,生成2N×H×W的偏移量(2N表示每个采样点的XY方向的偏移量)。其次,通过添加偏移量来动态调整采样坐标,使用双线性插值计算新的特征值,使得卷积能够作用在连续空间上,计算如公式(1)。再次,使用调整后的采样点对输入特征图进行卷积计算,提取更具适应性的特征,从而得到增强后的特征图。最后引入归一化和激活函数来进一步增强特征并确保数值稳定性。
P ' n = P n + Δ P n
式中:Pn 表示原始采样点坐标;ΔP n表示偏移计算模块学习到的偏移量;Pn表示新的采样点坐标。
AKConv动态采样依赖反向传播中插值梯度,在数据集较小时不容易收敛。对于玉米叶片受损严重、病斑较小、病害区域较分散的特点,Offset可能采样不到关键区域,影响检测精度。本研究在原始动态采样分支基础上设计静态卷积分支。首先,C×H×W的原始数据经过标准3D卷积后,使用DWConv(Depthwise Convolution)对每个通道单独卷积,不进行通道融合,从而保留输入的空间结构,促使模型参数量更少,效率更高。其次,通过Norm和ReLU引入非线性表达能力,增强模型收敛稳定性。最后经过PWConv(Pointwise Conv, 1×1卷积)实现跨通道信息整合。模块最终将两个分支的特征沿通道维度进行融合,从而输出增强后的特征,更适用于病斑较小区域进行建模且模型移动端部署更加轻便。图3为DRPAKConv的结构图。
图3 DRPAKConv的结构图

Fig. 3 Structure of DRPAKConv

1.1.2 CBVoVGSCSP模块

YOLOv10n中传统C2f采用CSPNet(Cross Stage Partial Network)的部分特征传输策略,虽然有效减少冗余计算,但主要依赖通道分割和特征融合,特征表达能力有限且计算量较高。在C2f结构中,输入特征图(C1通道)被分割成多个子特征图,一部分特征直接跳跃连接到输出;另一部分经过卷积后再融合。由于特征分割的存在,部分梯度可能难以有效回传到深层卷积层,导致梯度更新不均匀、梯度流失。
为了改善模型梯度流失的现象,本研究在轻量化VoVGSCSP26模型的基础上3次嵌入CBAM,提出了新的CBVoVGSCSP模块。将其替换传统C2f特征融合模块,通过GSConv(Group Shuffle Convolution)+ Dense-like连接,更顺畅地传递梯度,避免梯度衰减,更好地平衡模型的准确性和速度,提高DCC-YOLOv10n对小目标的检测性能。
在原始GSConv中,首先使用标准卷积(Standard Convolution, SC)将输入的C1通道特征映射到C2/2个通道,减少计算量的同时提取图像中丰富的局部特征。其次,深度可分离卷积(Depthwise Separable Convolution, DSC)从SC的输出通道C2/2中提取新的特征,同样输出C2/2通道,提取额外特征。再次,将SC和DSC的输出通道合并,生成C2个通道的特征图。最后,引入通道洗牌将不同通道的特征进行融合。VoVGSCSP则结合GSConv和CSP的思想,将h×w的特征图通过1个普通卷积后通道数降低至C1/2。然后经过双层GSConv进一步提取深层特征。最后将初始卷积特征与GSConv提取的特征进行拼接,保持丰富信息流的同时提高梯度传播效果。拼接后的特征通过最终的Conv操作进行融合,调整通道数并生成C2个输出通道。本研究在第1次通道压缩后首次引入CBAM,使通道特征得到初步筛选,提高提取效率。经过GSConv对提取结果进行通道+空间加权后,第2次引入CBAM强化响应区域。经过两次CBAM+GSConv后,第3次引入CBAM作为最终引导,对输出特征进行最后1次注意力调整,增强显著区域表达能力。图4为CBVoVGSCSP的结构图。
图4 CBVoVGSCSP的结构图

a. GSConv b. CBVoVGSCSP

Fig. 4 Structure of CBVoVGSCSP

1.1.3 CAFM

在农作物病害检测任务中,病害并不会孤立地出现在某个像素点上,而是以区域形式呈现扩散趋势。为了改善玉米叶片病害检测小物体精确度不高的问题,在颈部网络中引入CAFM27,旨在融合CNN和Transformer优势,更好地捕捉长距离依赖和邻域光谱相关性。通过在特征提取时利用邻域信息,更好地区分玉米叶片细微的病害差异,抑制噪声,减少误判,更准确地捕捉叶片病斑边界和传播模式,提高病害检测的准确率。结合局部特征捕捉能力和全局特征提取能力,对图像的局部和全局特征进行有效建模,将空间结构信息(邻域)与语义信息(病斑类型)有机结合,以提升检测效果。
CAFM模块主要由局部分支和全局分支组成。在局部分支中,首先通过1×1通道进行降维,减少后续计算。然后使用Channel Shuffle提升跨通道信息交流能力,增强模型的表达性能。最后通过3×3×3卷积提取局部空间特征,关注邻近像素之间的局部关系。在全局分支中,首先通过1×1通道降维后,使用深度可分离卷积(3×3 Dconv)分别提取查询(Q)、键(K)、值(V),其次使用Softmax归一化得到Attention Map,再经过Attention Map加权V聚焦于关键信息位置。最后使用1×1 Conv恢复维度,同时将注意力输出与残差进行融合。CAFM将局部分支、全局分支、原始输入的空间细节(Local)、长程依赖(Global)、低级语义信息(Residual)进行逐元素加法融合。图5为CAFM的结构图。
图5 卷积和注意力融合模块

Fig. 5 CAFM convolution and attention fusion module

1.2 数据集构建

本研究采用开源Plant Village28数据集和自建数据集组成的玉米叶片病害数据集。
Plant Village数据集由来自多个国家和地区的科研机构、高校及企业共同建设与维护,涵盖了丰富的作物种类和多样的病害类型。本研究结合中国玉米常见病害类型,从中筛选出部分玉米病害图像作为研究对象,以开展相关研究工作。利用Roboflow软件标注原始数据集,设置类别为健康(Healthy)、叶斑病(Yeban)、灰斑病(Huiban)和锈病(Xiubing)4类,如图6所示。采用离线数据增强扩充训练集、测试集,具体包括亮度调整、图像去噪和旋转等,将原始数据集由1 337张扩充至3 738张,以8∶1比例划分训练集3 322张和测试集416张。验证集未进行数据增强,总计416张,总体数据集共4 154张。
a. 锈病 b. 叶斑病 c. 灰斑病 d. 健康
图6 玉米叶片的部分数据集图像

Fig. 6 Partial dataset images of maize leaf

a. 锈病 b. 叶斑病 c. 灰斑病 d. 健康

1.3 评估指标

本研究采用的评估指标主要有精确度(Precision, P)、召回率(Recall, R)、平均精度均值(Mean Average Precesion, mAP)、计算量(GFLOPs)、模型参数量(Parameters)、帧率(Frames Per Second, FPS)和模型大小。mAP为所有类别检测的平均正确率(Average Precision, AP)进行加权平均得到的。mAP、AP、PR的计算如公式(2)~公式(5)所示。
m A P = 1 n i = 1 n A P i
A P = 0 1 P ( r ) d r
P = T P T P + F P
R = T P T P + F N
式中:Pr)为精确度随召回率变化而变化的函数;TP为将样本正确识别为正类的数量;FP为错误地将负类样本判断为正类的数量;FN为未能识别出的正类样本数量;n为样本总量;AP i 为第i类检测平均精度;mAP为所有类别AP i 的均值。

2 实验与结果分析

2.1 实验环境与参数配置

为验证本研究的有效性,实验环境选用Ubuntu20.04操作系统,集成开发环境PyCharm专业版2022.1.3,CPU型号Intel(R) Xeon(R) Platinum 8352V CPU@2.10 GHz,GPU为NVIDIA GeForce RTX 4090。编程语言为Python3.10,深度学习框架PyTorch2.4.0,Cuda11.8,输入图像像素为640×640,Mosaic方式数据增强,训练轮数设为200,其余参数设为默认值。具体参数配置见表1
表1 玉米叶片病害检测参数配置

Table 1 Parameter configuration for maize leaf disease detection

参数名称 参数数值
输入尺寸 640×640
训练批次大小 16
训练轮数 200
初始学习率 0.01
最终学习率 0.01
动量参数 0.937
权重衰减 0.000 5
早停轮数 100
优化器 AdamW

2.2 注意力机制选择

注意力机制可提高模型对关键区域的关注度,让网络更有效地聚焦病害区域。本研究以YOLOv10n为基线模型,分别在VoVGSCSP模块中3次嵌入CBAM、ECA、SE(Squeeze-and-Excitation)、EMA(Efficient Multi-Scale Attention)、CA(Coordinate Attention)这5种注意力机制进行对比。YOLOv10n融入不同注意力机制前后的性能对比如表2所示。通过对比实验可知,在VoVGSCSP模块中引入注意力机制均不同程度地提升了玉米叶片病害的检测精度。与基线模型相比,加入ECA、SE、EMA、CA、CBAM后,模型平均精度均值分别提高了0.8、0.6、0.7、1.1和1.1个百分点,计算复杂度和参数量分别下降了0.4 GFLOPs、0.02 M,且FPS提升显著。综合对比可知,加入CBAM后提升效果更显著,检测精度更高。因此,本研究选用CBAM为研究对象,在VoVGSCSP中3次嵌入CBAM从而设计出CBVoVGSCSP模块。
表2 YOLOv10n玉米叶片病害检测注意力机制实验对比

Table 2 Experimental comparison of attention mechanisms for maize leaf disease detection using YOLOv10n

算法 P/% R/% mAP@0.5/% 计算量/GFLOPs 参数量/M 模型大小/Mb 帧率/(帧/s)
YOLOv10n 94.5 87.7 92.4 8.4 2.70 5.8 769
VoVGSCSP+ECA 94.0 88.3 93.2 8.0 2.68 5.8 1 429
VoVGSCSP+SE 93.5 87.2 93.0 8.0 2.68 5.8 1 429
VoVGSCSP+EMA 95.8 88.3 93.1 8.0 2.68 5.8 1 250
VoVGSCSP+CA 93.0 89.0 93.5 8.0 2.68 5.8 1 429
VoVGSCSP+CBAM 95.6 89.1 93.5 8.0 2.68 5.8 1 429

注:表中加粗数据表示最优结果。

2.3 消融实验

本研究对DCC-YOLOv10n算法进行消融实验,如表3所示。观察实验结果可知,各改进模块应用于基线模型均提升了检测性能,可见改进的有效性。
表3 基于DCC-YOLOv10n的玉米叶片病害检测消融实验结果

Table 3 The ablation experiment results of maize leaf disease detection based on DCC-YOLOv10n

算法 DRPAKConv CBVoVGSCSP CAFM P/% R/% mAP@0.5/% 计算量/GFLOPs 参数量/M 模型大小/Mb 帧率/(帧/s)
YOLOv10n × × × 94.5 87.7 92.4 8.4 2.70 5.8 769
改进模型A × × 95.5 89.6 93.9 8.5 3.05 6.5 1 429
改进模型B × × 95.1 89.3 93.3 7.8 2.66 5.7 123
改进模型C × × 95.6 89.1 93.5 8.0 2.68 5.8 1 429
改进模型D × 95.7 88.3 93.3 7.6 2.64 5.7 122
改进模型E × 95.9 88.5 93.0 8.1 3.01 6.4 114
改进模型F × 95.1 89.8 93.8 8.3 3.03 6.5 1 429
DCC-YOLOv10n 96.2 90.3 94.1 7.9 2.99 6.4 123

注:加粗数据表示最优结果;×表示未使用相应模块;√表示使用了该模块。

改进模型A:仅在原模型的骨干网络部分加入CAFM,对图像全局和局部特征更好地提取。与YOLOv10n算法相比,模型各个指标均有提升,精确度、召回率、平均精度均值分别提高了1.0、1.9和1.5个百分点。
改进模型B:仅在骨干和颈部网络中使用可变核卷积DRPAKConv替换参数量较大的普通卷积。与YOLOv10n算法相比,模型参数量、计算复杂度和模型大小分别下降了0.04 M、0.6 GFLOPs、0.1 Mb,精确度、召回率、平均精度均值分别提高了0.6、1.6和0.9个百分点。这表明DRPAKConv在轻量化网络的同时可显著提高对较小病斑的检测精度。
改进模型C:仅在原模型的颈部网络中使用CBVoVGSCSP来替换传统C2f模块。与YOLOv10n算法相比,模型参数量和计算复杂度分别下降了0.02 M、0.4 GFLOPs,精确度、召回率、平均精度均值分别提高了1.1、1.4和1.1个百分点。
改进模型D:将改进模型B与改进模型C结合,在骨干和颈部网络中引入DRPAKConv和CBVoVGSCSP模块。与YOLOv10n算法相比,模型参数量、计算复杂度和模型大小分别下降了0.06 M、0.8 GFLOPs、0.1 Mb,精确度、召回率、平均精度均值分别提高了1.2、0.6和0.9个百分点。这表明将DRPAKConv和CBVoVGSCSP同时加入模型中,模型轻量化效果更好,适用于轻量级模型部署。
改进模型E:将改进模型A与改进模型B结合。与YOLOv10n算法相比,模型各个指标略有提升,其中模型计算复杂度下降了0.3 GFLOPs,精确度、召回率、平均精度均值分别提高了1.4、0.8和0.6个百分点。
改进模型F:将改进模型A与改进模型C结合。与YOLOv10n算法相比,模型各个指标均有提升,计算复杂度降低了0.1 GFLOPs,精确度、召回率、平均精度均值分别提高了0.6、2.1和1.4个百分点。
DCC-YOLOv10n:将DRPAKConv、CBVoVGSCSP、CAFM这3部分改进点结合在一起。与YOLOv10n算法相比,计算复杂度降低了0.5 GFLOPs,模型参数仅为2.99 M,精确度、召回率、平均精度均值分别提高了1.7、2.6和1.7个百分点,分别达到了96.2%、90.3%、94.1%,FPS虽有所下降,但其总体检测效果最好。
结果表明,每种改进点均提升了模型检测精度,DCC-YOLOv10n将3种改进点融合在一起,针对玉米叶片病害受损严重、病斑较小、病害区域较分散的问题,在计算复杂度降低的同时可显著提升检测精度,为智能化农业生产提供了理论支撑。

2.4 与主流模型性能对比实验

本研究将DCC-YOLOv10n算法与目标检测算法进行对比,结果如表4所示。玉米叶片病害在不同算法下的精确度对比如表5所示。
表4 不同算法检测玉米叶片病害的对比结果

Table 4 Comparison results of different algorithms for detecting maize leaf diseases

算法 P/% R/% mAP@0.5/% GFLOPs Parameters/M
YOLOv8n 93.5 85.4 92.4 8.1 3.01
YOLOv9t 92.6 85.4 91.5 7.6 1.97
YOLOv10n 94.5 87.7 92.4 8.4 2.70
YOLOv10s 96.1 86.1 92.9 24.5 8.04
YOLOv10m 95.1 87.9 93.6 63.4 16.46
YOLOv11n 94.3 83.8 91.3 6.3 2.58
Faster R-Cnn 58.8 93.1 89.7 369.8 136.8
SSD 92.2 74.0 85.9 61.0 24.01
RT-DETR 91.6 83.3 88.8 103.4 31.99
DCC-YOLOv10n 96.2 90.3 94.1 7.9 2.99

注:加粗数据表示最优结果。

表5 玉米叶片病害在不同算法下的精确度对比结果 ( %)

Table 5 Comparison of the precision of maize leaf diseases under different algorithms

病害类型 Faster R-CNN SSD RT-DETR YOLOv8n YOLOv9t YOLOv10n YOLOv10s YOLOv10m YOLOv11n DCC-YOLOv10n
健康 70.6 92.3 95.5 91.5 86.2 96.1 95.9 94.1 90.4 97.7
灰斑病 53.5 93.1 89.0 92.1 91.3 92.1 97.6 95.0 91.3 97.4
锈病 50.0 89.5 87.9 91.6 95.4 92.6 95.3 94.6 97.8 93.1
叶斑病 60.9 93.8 94.1 98.8 97.3 97.4 95.7 96.6 97.7 96.8
实验结果表明,与同系列Y算法YOLOv8n、YOLOv9t、YOLOv10s、YOLOv10m、YOLOv11n相比,YOLOv10n更加轻量且检测精确度更高,模型总体性能更稳定。与传统单阶段算法SSD12相比,DCC-YOLOv10n算法各项指标检测精度优势显著,计算复杂度和参数量仅为其1/10。与传统双阶段算法Faster R-CNN8相比,DCC-YOLOv10n算法各项指标优势明显,召回率仅略微下降,但计算复杂度和参数量不足其1/10。与最近提出的RT-DETR(Real-Time DEtection TRansformer)29算法相比,DCC-YOLOv10n算法各项指标检测精度较高,计算复杂度和参数量不足其1/10。与YOLOv8n、YOLOv9t、YOLOv10n、YOLOv10s、YOLOv10m、YOLOv11n、Faster R-CNN、SSD、RT-DETR算法相比,DCC-YOLOv10n算法精确度分别提高了2.7、3.6、1.7、0.1、1.1、1.9、37.4、4.0和4.6个百分点,平均精度均值分别提高了1.7、2.6、1.7、1.2、0.5、2.8、4.4、8.2和5.3个百分点。由此可知,DCC-YOLOv10n算法在玉米叶片病害检测中效果更好,在保证参数量的同时检测精度也更高。与YOLOv10n算法相比,DCC-YOLOv10n算法的灰斑病精确度从原来的92.1%提升到了97.4%,提高了5.3个百分点,锈病精确度从原来的92.6%提升到了93.1%,这表明在面对病害受损严重、病斑较小、区域较分散时算法也能精准检测,适用于小目标场景下的病害检测任务。
本研究采用梯度加权类激活热力图(Gradient-weighted Class Activation Mapping, Grad-CAM)30方法分别对每种改进进行可视化分析,如图7所示。在类激活热力图中,病害区域的颜色越鲜亮,表示分配的权重越大、预测关注度越高。由实验结果可知,DRPAKConv模块通过增强模型对局部特征和小目标的感知能力,在检测玉米锈病这类斑点较小的病害时表现出较高的检测精度;CBVoVGSCSP模块则对病斑区域受损严重、形状不规则且较为分散的玉米灰斑病有更强的识别能力;而CAFM模块融合了空间结构信息(邻域)与语义信息(病斑类型),更好区分玉米叶片细微的病害差异,进一步提升了模型的检测精度。DCC-YOLOv10n算法融合了上述3种模块的特性,在保证模型轻量化的同时,兼顾了对小目标、复杂背景和细粒度病害的多尺度检测能力,为实现农业智能化提供了有力保障。
图7 YOLOv10n模型改进前后玉米叶片病害检测的热力图结果对比

a. 原图 b. YOLOv10n c. DRPAKConv-YOLOv10n d. CBVoVGSCSP-YOLOv10n e. CAFM-YOLOv10n f. DCC-YOLOv10n

Fig. 7 Comparison of heatmap results for maize leaf disease detection before and after the improvement of the YOLOv10n model

为了进一步验证CAFM对玉米叶片病害检测的有效性,本研究将其与CloFormer31、CoAtNet32、ACmix33进行对比,实验结果如表6所示。加入卷积和注意力融合模块后均不同程度地提升了检测精度。其中,ACmix模型参数量最少,但其检测精度不高,CoAtNet检测精确度最高,但其模型大小是基线模型的2倍。加入CAFM后,模型精确度、召回率、平均精度均值分别达到了95.5%、89.6%、93.9%,帧率优势显著且其计算复杂度和参数量略微提升。综合考虑,本研究选用精度提升更明显的CAFM来兼具局部特征提取与全局关系建模能力,以提升病害检测精度。
表6 玉米叶片病害检测卷积和注意力融合模块对比结果

Table 6 Comparison results of convolution and attention fusion modules for maize leaf disease detection

算法 P/% R/% mAP@0.5/% 计算量/GFLOPs 参数量/M 模型大小/Mb 帧率/(帧/s)
YOLOv10n 94.5 87.7 92.4 8.4 2.70 5.8 769
YOLOv10n+CloFormer 95.6 88.5 93.2 8.4 3.00 6.4 1 429
YOLOv10n+CoAtNet 96.7 87.1 93.4 9.2 5.99 12.4 1 429
YOLOv10n+ACmix 95.3 87.5 92.8 8.4 2.91 6.2 909
YOLOv10n+CAFM 95.5 89.6 93.9 8.5 3.05 6.5 1 429

注:加粗数据表示最优结果。

2.5 检测效果分析

在数据集相同的前提下,本研究将此算法与YOLOv10n的精确率-召回率曲线进行对比,检测结果如图8所示。
图8 玉米叶片病害检测研究YOLOv10n算法改进前后精确率-召回率曲线

Fig. 8 Precision-Recall curves of the YOLOv10n algorithm before and after improvement in maize leaf disease detection research

图8的实验结果可知,改进后模型的总体平均精度均值从原来的92.4%提升至94.1%,提升了1.7个百分点。其中,灰斑病平均精度均值提高了2.8个百分点,锈病平均精度均值提高了3.5个百分点,这表明DCC-YOLOv10n算法总体检测效果更好,性能更稳定,满足了对玉米叶片病害小目标的检测需求。为了更好地展示DCC-YOLOv10n算法的检测性能,本研究展示了改进前后算法的实际检测效果图,如图9所示。
图9 DCC-YOLOv10n玉米叶片病害检测的可视化结果图

a. 原图 b. YOLOv10n c. DCC-YOLOv10n

Fig. 9 Visualization result graph of DCC-YOLOv10n for maize leaf disease detection

3 结 论

DCC-YOLOv10n算法在骨干和颈部网络中设计DRPAKConv模块替换参数量较大的普通卷积,根据任务需求随时调动卷积核参数大小和任意采样形状,从而提高对较小病斑的检测能力;在颈部网络中设计CBVoVGSCSP替换传统C2f模块,在保证参数量下降的基础上改善梯度流失现象;在特征融合部分引入CAFM,融合局部与全局特征信息。DCC-YOLOv10n算法可有效解决玉米叶片病害检测受损严重、病斑较小、病害区域较分散的问题,为大田环境病害精准性、实时性、高效性检测奠定了坚实基础。
实验结果表明,与YOLOv10n相比,DCC-YOLOv10n算法计算复杂度降低了0.5 GFLOPs,模型参数仅为2.99 M,精确度、召回率、平均精度均值分别提高了1.7、2.6和1.7个百分点,分别达到了96.2%、90.3%、94.1%。DCC-YOLOv10n算法在检测精度和计算复杂度方面均优于原始基线模型,能够满足对复杂环境中病害自动化检测的需求。算法通过优化网络结构、引入卷积和注意力融合模块,有效改善了玉米叶片病害小目标检测效果不佳的问题。由于本研究算法参数量较基线模型略有提高,轻量化优势未完全显现出来,而实际检测场景大多为农田复杂环境。因此,下一步研究将根据实际应用场景对模型结构进行更有针对性的优化与改进,并将其嵌入到终端设备、无人机、农业传感系统中,实现对玉米病害的实时检测与智能预警,为智慧农业提供更加高效、精准的技术支撑,助力农业可持续发展。

本研究不存在研究者以及与公开研究成果有关的利益冲突。

[1]
王子阳, 刘升学, 杨志蕊, 等. 玉米抗旱性的遗传解析[J]. 植物学报, 2024, 59(6): 883-902.

WANG Z Y, LIU S X, YANG Z R, et al. Genetic dissection of drought resistance in maize[J]. Chinese bulletin of botany, 2024, 59(6): 883-902.

[2]
QIAO S C, TIAN Y W, SONG P, et al. Analysis and detection of decayed blueberry by low field nuclear magnetic resonance and imaging[J]. Postharvest biology and technology, 2019, 156: ID 110951.

[3]
苏俊楷, 段先华, 叶赵兵. 改进YOLOv5算法的玉米病害检测研究[J]. 计算机科学与探索, 2023, 17(4): 933-941.

SU J K, DUAN X H, YE Z B. Research on corn disease detection based on improved YOLOv5 algorithm[J]. Journal of frontiers of computer science and technology, 2023, 17(4): 933-941.

[4]
乔世成, 党珊珊, 何海祝, 等. 基于卷积神经网络的农作物病害检测研究综述[J]. 山西农业大学学报(自然科学版), 2025, 45(2): 113-127.

QIAO S C, DANG S S, HE H Z, et al. A review of crop disease detection research based on convolutional neural networks[J]. Journal of Shanxi agricultural university (natural science edition), 2025, 45(2): 113-127.

[5]
骆润玫, 王卫星. 基于卷积神经网络的植物病虫害识别研究综述[J]. 自动化与信息工程, 2021, 42(5): 1-10.

LUO R M, WANG W X. Review on plant disease and pest identification based on convolutional neural network[J]. Automation & information engineering, 2021, 42(5): 1-10.

[6]
李柯泉, 陈燕, 刘佳晨, 等. 基于深度学习的目标检测算法综述[J]. 计算机工程, 2022, 48(7): 1-12.

LI K Q, CHEN Y, LIU J C, et al. Survey of deep learning-based object detection algorithms[J]. Computer engineering, 2022, 48(7): 1-12.

[7]
ZOU L Z, WU D, LU L Q. Plant leaf recognition based on mask R-CNN[J]. Journal of research in science and engineering, 2025, 7(3): 55-58.

[8]
GIRSHICK R. Fast R-CNN[C]// 2015 IEEE International Conference on Computer Vision (ICCV). Piscataway, New Jersey, USA: IEEE, 2015: 1440-1448.

[9]
REN S Q, HE K M, GIRSHICK R, et al. Faster R-CNN: Towards real-time object detection with region proposal networks[J]. IEEE transactions on pattern analysis and machine intelligence, 2017, 39(6): 1137-1149.

[10]
范晓飞, 王林柏, 刘景艳, 等. 基于改进YOLOv4的玉米种子外观品质检测方法[J]. 农业机械学报, 2022, 53(7): 226-233.

FAN X F, WANG L B, LIU J Y, et al. Corn seed appearance quality estimation based on improved YOLOv4[J]. Transactions of the Chinese society for agricultural machinery, 2022, 53(7): 226-233.

[11]
REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: Unified, real-time object detection[C]// 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2016: 779-788.

[12]
LIU W, ANGUELOV D, ERHAN D, et al. SSD: Single shot MultiBox detector[M]// Computer Vision-ECCV 2016. Cham: Springer International Publishing, 2016: 21-37.

[13]
HU R J, ZHANG S, WANG P, et al. The identification of corn leaf diseases based on transfer learning and data augmentation[C]// Proceedings of the 2020 3rd International Conference on Computer Science and Software Engineering. New York, USA: ACM, 2020: 58-65.

[14]
WANG G W, WANG J X, YU H Y, et al. Research on identification of corn disease occurrence degree based on improved ResNeXt network[J]. International journal of pattern recognition and artificial intelligence, 2022, 36(2): ID 2250005.

[15]
施杰, 林双双, 张威, 等. 基于轻量化改进型YOLOv5s的玉米病虫害检测方法[J]. 江苏农业学报, 2024, 40(3): 427-437.

SHI J, LIN S S, ZHANG W, et al. A corn disease and pest detection method based on lightweight improved YOLOv5s[J]. Jiangsu journal of agricultural sciences, 2024, 40(3): 427-437.

[16]
马中杰, 罗晨, 骆巍, 等. 基于改进YOLOv7-tiny的玉米种质资源雄穗检测方法[J]. 农业机械学报, 2024, 55(7): 290-297.

MA Z J, LUO C, LUO W, et al. Tassel detection method of maize germplasm resources based on improved YOLOv7-tiny[J]. Transactions of the Chinese society for agricultural machinery, 2024, 55(7): 290-297.

[17]
党珊珊, 白明宇, 路扬, 等. 基于改进YOLOv10n的玉米叶片病害检测研究[J]. 内蒙古民族大学学报(自然科学版), 2025, 40(2): 69-76.

DANG S S, BAI M Y, LU Y, et al. Research on maize leaf disease detection based on improved YOLOv10n[J]. Journal of Inner Mongolia minzu university (natural sciences edition), 2025, 40(2): 69-76.

[18]
李军, 房志远, 周昊星. 改进YOLOv10的天台光伏涉电区域行为人预警算法[J]. 计算机工程与应用, 2025, 61(5): 211-221.

LI J, FANG Z Y, ZHOU H X. Improvement of early warning algorithm of YOLOv10 for actors in rooftop photovoltaic power-related area[J]. Computer engineering and applications, 2025, 61(5): 211-221.

[19]
高立鹏, 周孟然, 胡锋, 等. 基于REIW-YOLOv10n的井下安全帽小目标检测算法[J/OL]. 煤炭科学技术. [2025-08-08].

GAO L P, ZHOU M R, HU F, et al. Small target detection algorithm for underground helmet based on REIW-YOLOv 10n[J/OL]. Coal science and technology. [2025-08-08].

[20]
李金瑞, 杜建军, 张宏鸣, 等. 基于轻量化MLCE-RTMDet的人工去雄后玉米雄穗检测算法[J]. 农业机械学报, 2024, 55(11): 184-192, 503.

LI J R, DU J J, ZHANG H M, et al. Maize tassel detection algorithm after artificial emasculation based on lightweight MLCE-RTMDet[J]. Transactions of the Chinese society for agricultural machinery, 2024, 55(11): 184-192, 503.

[21]
YUAN W X, LAN L F, XU J Y, et al. Smart agricultural pest detection using I-YOLOv10-SC: An improved object detection framework[J]. Agronomy, 2025, 15(1): ID 221.

[22]
TAN M X, PANG R M, LE Q V. EfficientDet: Scalable and efficient object detection[C]// 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2020: 10778-10787.

[23]
SHI Y, WANG H, WANG F, et al. Efficient and accurate tobacco leaf maturity detection: An improved YOLOv10 model with DCNv3 and efficient local attention integration[J]. Frontiers in plant science, 2024, 15: ID 1474207.

[24]
ZHANG X, SONG Y, SONG T, et al. AKConv: Convolutional kernel with arbitrary sampled shapes and arbitrary number of parameters[EB/OL]. arXiv: 2311. 11587, 2023.

[25]
PAN W, CHEN J B, LV B J, et al. Lightweight marine biodetection model based on improved YOLOv10[J]. Alexandria engineering journal, 2025, 119: 379-390.

[26]
LI H L, LI J, WEI H B, et al. Slim-neck by GSConv: A lightweight-design for real-time detector architectures[J]. Journal of real-time image processing, 2024, 21(3): ID 62.

[27]
HU S, GAO F, ZHOU X W, et al. Hybrid convolutional and attention network for hyperspectral image denoising[J]. IEEE geoscience and remote sensing letters, 2024, 21: 1-5.

[28]
NGUGI H N, EZUGWU A E, AKINYELU A A, et al. Revolutionizing crop disease detection with computational deep learning: A comprehensive review[J]. Environmental monitoring and assessment, 2024, 196(3): ID 302.

[29]
ZHAO Y A, LV W Y, XU S L, et al. DETRs beat YOLOs on real-time object detection[C]// 2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2024: 16965-16974.

[30]
SELVARAJU R R, COGSWELL M, DAS A, et al. Grad-CAM: Visual explanations from deep networks via gradient-based localization[J]. International journal of computer vision, 2020, 128(2): 336-359.

[31]
FAN Q, HUANG H, GUAN J, et al. Rethinking local perception in lightweight vision transformer[EB/OL]. arXiv:2303.17803, 2023.

[32]
DAI Z, LIU H, LE Q V, et al. Coatnet: Marrying convolution and attention for all data sizes[J]. Advances in neural information processing systems, 2021, 34: 3965-3977.

[33]
PAN X R, GE C J, LU R, et al. On the integration of self-attention and convolution[C]// 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2022: 805-815.

文章导航

/