传统图像检测技术的不足在于难以处理复杂场景、计算复杂度高、需要手动选择参数、无法适应动态场景等。这些问题导致传统技术在图像检测精度、实时性和适应性等方面存在局限性。相比之下,基于计算机视觉的图像处理方法,尤其是在目标分类和检测技术上的应用,通过从图像中提取特征实现定位与计数,显示出巨大潜力。近年来,基于卷积神经网络(Convolutional Neural Network, CNN)的葡萄产量估计方法为农业生产提供了新的技术手段,主要是利用深度学习技术通过卷积操作和池化操作从图像中提取特征,通过训练模型来实现检测和产量的精确估计。Silver和Monga
[7]通过图像处理和CNN的结合提出的模型,能够从智能手机拍摄的图像中估计葡萄藤上葡萄的重量。Buayai等
[8]提出了一种基于深度神经网络的新型端到端浆果技术方法,用于在现场拍摄的葡萄图像上检测葡萄串和葡萄颗粒,该技术能够为真实的葡萄园环境提供实际的应用,但会因为拍摄角度不同而影响对同一束葡萄串的浆果数量预测,影响葡萄产量估计的准确性。Aquino等
[9]提出了一种基于图像分析的解决方案,使用基于数学形态和像素分类的新图像分析算法对葡萄浆果图像进行分析,开发了一个监督分类器,用于检测葡萄浆果,这种方法仅方便于葡萄生长早期产量预测和评估。Shen等
[10]提出了一种基于YOLOv5s深度学习算法的葡萄串实时检测方法,最终实现了对葡萄串的快速、准确检测,但由于该网络仅仅是基于红葡萄品种训练的,因此难以准确识别绿葡萄。张传栋等
[11]提出了一种轻量级融合随机注意力机制(Shuffle attention, SA)的改进YOLOv8n模型(SAW-YOLOv8n)的实时检测方法,能够对葡萄簇的幼果识别实现高精度和轻量化的要求,并适应不同遮挡。Coviello等
[12]介绍了葡萄浆果计数网络架构(Grape Berries Counting Net, GBCNet),能够通过智能手机摄像头准确估计葡萄产量,使用空洞卷积神经网络(Dilated Convolutional Neural Network, Dilated CNN)生成葡萄浆果的密度图,利用葡萄数据取得了良好的表现。Zabawa等
[13]使用全卷积神经网络,通过语义分割方法对图像中的浆果进行检测和计数,能够正确检测到94%的浆果。Wang等
[14]提出了谷物作物头数计数统一模型(Counting Heads of Cereal Crops Net, CHCNet),可以通过小样本学习对多个谷物作物头进行计数,其中跨作物泛化能力方面表现得很好。刘畅等
[15]提出了3C-YOLOv8n目标检测模型,能够有效地对葡萄进行识别和定位。Yu等
[16]提出了一种基于MobileVit-Large选择性内核的GSConv-YOLO(MobileVit-Large Selective Kernel-GSConv-YOLO, MLG-YOLO)模型,能够有效地对冬枣进行检测和定位,基于YOLOv8n并引入轻量级卷积技术提高了检测冬枣的准确性。