近年来,随着计算机视觉检测与深度学习技术的进步和训练与部署视觉模型成本的降低,使用视觉检测模型在病害检测领域逐渐崭露头角。不仅可降低漏检率与误判率、提升产品全链条质量管控水平,更是响应制造业智能化转型、践行高质量发展战略的必然技术路径。在已有研究中,学者从多个方向对病害检测模型进行了改进:一部分工作聚焦于复杂背景下的特征增强与多尺度融合。例如,楚家等
[7]提出一种融合了可变形卷积的神经网络,引入可变形卷积与卷积注意力机制模块(Convolutional Block Attention Module, CBAM),结合加权交并比(Weighted Intersection over Union, W-IOU)损失函数增强了对野外害虫的鲁棒检测。白凯等
[8]设计了多尺度特征融合网络(Multi-scale features inception Neck, MFI Neck),融入可变形注意力跨阶段部分特征融合(Cross-Stage Partial with 2 convolutions Feature fusion - Deformable attention, C2f-DA)结构与降采样(Adaptive Downsampling, ADown)模块,有效识别复杂环境下花生的相似病害。侯文慧等
[9]采用超分辨率生成对抗网络(Super-Resolution Generative Adversarial Network, SRGAN)进行图像增强,并引入小目标检测层与三重注意力机制,强化了对番茄病害小目标的检测性能。魏明飞等
[10]则提出多尺度注意力自适应空间融合的渐近特征金字塔网络(Efficient Multi-scale Attention-Asymptotic Feature Pyramid Network, EMA-AFPN)与双分支注意力机制,提升了遮挡情况下黄瓜病害的识别能力。前述方法在野外环境多尺度识别方面有一定进展,但算力要求使得边缘计算设备实时部署变得困难,同时对常见的茶园多种类多尺度识别上仍然不够理想仍然存在错检漏检。而在轻量化与结构优化方面,刘博等
[11]设计了一种基于图结构的番茄病害识别框架(Tomato leaf Disease Recognition Enhanced via Graph Structures, TDR-EGS),在不增加模型推理阶段复杂度的前提下有效地提升了分类性能。夏顺兴等
[12]使用动态卷积、混合标准卷积与深度可分离卷积(Grouped Shuffle Convolution, GSConv)与Slim-neck结构实现轻量化草莓病害检测。高山
[13]添加基于视觉注意力模块(Coordinate and Spatial Attention, CSA),在不损失检测性能的情况下降低了计算的开销。胡艳茹和刘德全
[14]基于YOLOv8n(You Only Look Once Version 8n)架构,结合高效多尺度注意力模块(Efficient Multi-scale Attention, EMA)与双向特征金字塔网络(Bidirectional Feature Pyramid Network, BiFPN)实现高效多尺度特征融合。这几种轻量化病害检测方法可满足边缘检测设备的部署,但在多尺度目标识别尤其是复杂背景的情况下准确率不尽如人意。上述方法与模型识别在复杂背景下识别多类别病斑时往往只能识别病斑占图片面积10%~30%的较窄范围的尺度,很难胜任茶田巡检时所面临的复杂野外环境下边缘计算设备部署时多尺度、多类别的茶叶病害检测。