YOLO系列模型在水果缺陷检测的研究进展及发展趋势

修贤超; 费士祺; 张伟; 黄文倩; 苗中华

doi:10.12133/j.smartag.SA202603017

智慧农业 >

2026 1 - 15

DOI: https://doi.org/10.12133/j.smartag.SA202603017

YOLO系列模型在水果缺陷检测的研究进展及发展趋势

修贤超 ¹ ,
费士祺 ¹^,²^,³ ,
张伟 ^,¹ ,
黄文倩 ²^,³ ,
苗中华 ¹

展开

^1. 上海大学机电工程与自动化学院，上海 200444，中国
^2. 北京农林科学院，北京 100097，中国
^3. 北京市农林科学院信息技术研究中心，北京 100097，中国

张伟，博士，助理研究员，研究方向为农业机器人具身智能。E-mail：wzhang23@shu.edu.cn

修贤超，副教授，硕士生导师，研究方向为大模型与具身智能。E-mail：xcxiu@shu.edu.cn

收稿日期: 2026-03-13

网络出版日期: 2026-05-22

基金资助

国家自然科学基金(32401712)

上海市自然科学基金(24ZR1424800)

博士后科学基金(2024M751937)

收起

Research Progress and Development Trends of YOLO Family of Algorithms in Fruit Defect Detection

XIU Xianchao ¹ ,
FEI Shiqi ¹^,²^,³ ,
ZHANG Wei ^,¹ ,
HUANG Wenqian ²^,³ ,
MIAO Zhonghua ¹

Expand

^1. School of Mechatronic Engineering and Automation, Shanghai University, Shanghai 200444, China
^2. Intelligent Equipment Research Center, Beijing Academy of Agriculture and Forestry Sciences, Beijing 100097, China
^3. Information Technology Research Center, Beijing Academy of Agriculture and Forestry Sciences, Beijing 100097, China

ZHANG Wei, E-mail: wzhang23@shu.edu.cn

XIU Xianchao, E-mail: xcxiu@shu.edu.cn

Received date: 2026-03-13

Online published: 2026-05-22

Supported by

National Natural Science Foundation of China(32401712)

Natural Science Foundation of Shanghai(24ZR1424800)

China Postdoctoral Science Foundation(2024M751937)

Copyright

Fold

摘要

【目的/意义】 作为水果产后的关键环节，高效精准的质量检测对保障食品安全与提升产业效率至关重要。本文综述了YOLO模型在水果缺陷检测领域的研究进展，旨在为农业水果缺陷检测技术的进一步发展提供理论支撑与技术参考。［进展］近年来，基于深度学习的目标检测算法，特别是YOLO（You Only Look Once）系列模型在实时性、高精度和低计算量的优势，在水果缺陷检测研究获得了出色的效果。本文聚焦水果缺陷检测，首先回顾了YOLOv1至YOLO26的发展历程，并分析每代YOLO的创新改进。在此基础上，综述了YOLO系列模型在多种水果缺陷检测任务中的应用现状，列举了这些算法在应对水果缺陷检测挑战方面的贡献，具体包括内部与隐性缺陷的识别、复杂表面形态下的缺陷检测，以及模型的轻量化与边缘部署。同时，本文也探讨了这些技术如何满足高速生产线的实时处理，以及在资源受限的硬件设备上实现高效部署的工业需求。 【结论/展望】 最后，总结了算法局限性，数据集特异性，硬件部署约束和复杂检测环境影响四方面的挑战，并从公共数据集的构建，模型可解释性，人机协作策略机制和大模型与YOLO的结合的四个方面展望了未来研究方向。

关键词： 深度学习; 目标检测; YOLO; 自动化; 水果缺陷检测

本文引用格式

修贤超 , 费士祺 , 张伟 , 黄文倩 , 苗中华 . YOLO系列模型在水果缺陷检测的研究进展及发展趋势[J]. 智慧农业, 2026 : 1 -15 . DOI: 10.12133/j.smartag.SA202603017

Abstract

[Significance] Efficient and accurate quality detection is a key link in the post-harvest fruit industry. It is critical for ensuring food safety and improving industrial efficiency. With the growth of global population and the increasing demand for food safety, traditional manual inspection has become incompetent. Manual inspection relies heavily on the experience of operators. It is time-consuming, labor-intensive and subjective. The results are often unstable and inaccurate. It also may cause secondary damage to fruits. In addition, the rising cost of human resources makes the transformation of the fruit industry towards automation and intelligence an inevitable trend. Computer vision and machine learning technologies provide a solution. They can improve detection accuracy and efficiency, while reducing labor costs. Among various object detection algorithms, the YOLO (You Only Look Once) series stands out for its balance of real-time performance, high accuracy and low computational cost. It has achieved excellent results in fruit defect detection. However, there is still a lack of comprehensive reviews on the application of YOLO series algorithms in this field. The purpose of this paper is to fill the blank of YOLO series algorithms in the field of fruit defect detection and provide strong support for the further development of agricultural fruit defect detection technology. [Progress] Focusing on fruit defect detection, this paper reviews the development history of YOLO models from YOLOv1 to YOLO26. It also analyzes the innovative improvements of each generation. The development of YOLO models can be divided into three stages. The first stage (YOLOv1-YOLOv3) established the single-stage detection framework. YOLOv1 proposed the idea of single-shot detection, laying a preliminary foundation for real-time fruit defect detection. YOLOv2 introduced the anchor box mechanism and a more efficient backbone network, improving the positioning robustness for fruits and their defects of different sizes and shapes. YOLOv3 proposed a multi-scale feature pyramid, enhancing the detection ability for small defects such as early lesions and minor bruises. The second stage (YOLOv4-YOLOv8) focused on modular design, engineering construction and efficiency optimization. YOLOv4 clarified the modular design of backbone, neck and head, providing a clear framework for algorithm improvement. YOLOv5, YOLOv6 and YOLOv8 made continuous breakthroughs in lightweight design, anchor-free detection and decoupled head structure. YOLOv7 introduced the E-ELAN (Extended Efficient Layer Aggregation Network) architecture and auxiliary head, balancing detection accuracy and speed. The third stage (YOLOv9-YOLO26) focused on information extraction and transmission, post-processing simplification and high-level semantic modeling. YOLOv9 alleviated information attenuation in deep networks. YOLOv10 simplified post-processing to meet the high throughput needs of online sorting systems. YOLOv13 and YOLO26 further improved the model's performance in complex scenarios. This review also summarizes the application of YOLO series models in various fruit defect detection tasks, including apples, citrus, tomatoes and pears. It focuses on three key challenges: detection of internal and latent defects, defect detection under complex surface morphologies, and model lightweighting and edge deployment. For internal and latent defects, researchers combine YOLO models with multi-modal imaging technologies such as near-infrared and hyperspectral imaging. For complex surface morphologies, they improve the model's feature extraction ability by introducing attention mechanisms and multi-scale feature fusion. For lightweight and edge deployment, they adopt strategies such as lightweight architecture design, model compression and training optimization. [Conclusions and Prospects] The YOLO series models have become one of the most widely used technical frameworks in fruit defect detection. They have achieved remarkable phased results. However, they still face several challenges. These include algorithm limitations, such as the coupling optimization conflict between positioning and classification, and the limitation of local feature extraction. Dataset specificity leads to poor model generalization. Hardware constraints restrict the deployment of models on edge devices. Complex detection environments reduce the model's robustness. Future research directions include four aspects. First, build standardized and large-scale public fruit defect datasets, covering different fruit varieties and defect types. Second, improve the interpretability of YOLO models, building intuitive explanation interfaces for non-professional users. Third, develop human-machine collaboration strategies, combining the advantages of deep learning models and farmers' practical experience. Fourth, integrate YOLO with large models, optimizing data generation strategies and model lightweighting to achieve efficient deployment. This review aims to provide theoretical support and technical reference for the further development of agricultural fruit defect detection technology.

Key words： deep learning; object detection; YOLO; automation; fruit defect detection

0 引言

随着全球人口增长及消费者对食品安全要求的日益提升，传统依赖人工的检测模式已难以满足高速生产线对效率和精度的严苛工业需求^{［1, 2］}。同时，随着人力资源日益稀缺与成本不断上涨，推动水果产业向全自动化、智能化方向转型升级已成为必然趋势^［3］。然而，水果在生长发育、采收及贮运全链条中，易受病害侵染、虫害侵袭及机械损伤，进而导致品质劣变、商品价值降低。因此，构建高效、精准的水果缺陷检测技术体系，对于保障采后水果品质、提升产业市场竞争力，已成为现代水果产业高质量发展面临的核心议题之一。

传统水果分级检测依赖人工分拣方式实现品质区分，但由于水果缺陷形态具有多样性、复杂性特征，且存在易被忽略的微小目标缺陷，人工分拣过程高度依赖操作人员的实践经验，不仅耗时费力，还易受主观判断因素干扰，导致检测结果稳定性与准确性不足；同时，分拣人员的不规范操作还可能对水果造成二次损伤。此外，人工分拣若想适配高速运行的输送线作业场景，需要极高的人工成本。综上，开发全自动、高效化、高可靠性的水果缺陷检测技术，已成为满足产业发展需求和破解行业痛点的迫切诉求。

计算机视觉和机器学习技术的引入，不仅能够提供更准确和客观的检测结果，还能够提高效率并降低人工成本^［4］。近年来，目标检测广泛应用于各个行业^［5］。其中，YOLO（You Only Look Once）因其兼顾检测精度和速度，在水果缺陷检测中有着良好的表现，但目前尚缺乏基于YOLO系列算法在该领域应用的综述文献。宋怀波等^［6］按照深度学习算法的发展历程，归纳了基于深度学习的果实目标检测和分割技术的常用方法，轻量化模型的研究进展和应用情况，并总结了基于深度学习的果实目标识别技术面临的挑战。WANG等^［7］探讨了大型厚皮水果的采后处理问题，并总结了目前在无损检测方面的最新研究成果。SOLTANI FIROUZ M等^［8］综述了机器视觉和图像处理技术在水果缺陷检测中的研究进展。ASHVINI GAIKWAD等^［9］综述了图像处理技术在水果缺陷检测领域的应用，结合研究成果，比较了数字成像技术和热成像技术在水果缺陷检测中的效果。张子申等^［10］对2025年之前的高光谱成像技术在水果品质检测中的应用进行了综述，内容涵盖了外观品质、内在品质、成熟度、病害和品种等多个检测项目。徐文清等^［11］基于数字图像处理的核心步骤，综述了基于数字图像处理技术的水果分级检测研究现状，指出目前存在的挑战并展望未来发展趋势。JOSHUA JOHN等^［12］基于卷积神经网络的最新水果品质评估进展，包括成熟度检测、病害分类以及苹果、橙子、番石榴和番茄等其他水果的分级评估。

与上述研究不同，本文从YOLO系列算法的角度出发，回顾了目前发布的YOLO系列算法的技术发展历程，介绍了各版本的技术创新及相关变体在水果缺陷检测中的应用成果，旨在帮助研究人员更好地了解YOLO在水果缺陷检测方面的相关研究进展。

1 目标检测

卷积神经网络（Convolutional Neural Network, CNN）推动了目标检测从传统机器学习方法向深度学习方法的转变。与传统机器学习方法严重依赖手工特征工程不同，深度学习通过神经网络自动从数据中学习特征，避免了复杂的人工特征设计^［13］。这种基于数据集的自动化特征学习机制，提升了模型对水果缺陷的检测性能。基于深度学习的水果缺陷检测过程主要分为数据准备、模型设计、模型训练、模型评估和缺陷检测五个阶段，如表1所示^{［14, 15］}。

表1 基于深度学习的水果缺陷检测主要步骤

Table 1 Main steps of fruit defect detection based on deep learning

主要步骤	详细操作
数据集准备	构建水果缺陷数据集，数据清洗，数据标注，数据集划分
模型设计	设计合适的深度学习模型，以适应水果缺陷检测任务的要求
模型训练	利用整理后的水果缺陷数据集训练模型，同时调整网络的训练参数
模型评估	选用合适的评估指标验证模型性能，如准确率、精确率、召回率、F ₁值、平均精度均值等
缺陷检测	将新的缺陷水果图像输入到训练好的模型中进行检测，并输出缺陷检测结果

CNN是一类用于图像网格数据的前馈神经网络（Feedforward Neural Networks, FNN）^［16］，通过卷积操作能够自动从原始图像中提取特征，这也是CNN在图像识别和目标检测等计算机视觉任务中得到广泛应用的原因。近年来，出现了许多CNN特征提取架构。AlexNet^［17］主要应用于图像分类任务，由五个卷积层、三个池化层和三个全连接层构成。视觉几何组网络（Visual Geometry Group Networks, VGGNet）^［18］通过增加网络的深度来减小参数量，用多层小卷积核替代单层大卷积核。GoogleNet^［19］通过级联多个Inception模块实现了多尺度特征融合，让不同感受野的特征进行提取和融合。残差网络（Residual Network, ResNet）^［20］通过跨层跳跃连接引入了残差学习的概念，缓解了梯度消失问题。EfficientNet^［21］通过复合缩放原则，实现网络深度、宽度和输入分辨率同步按比例缩放，兼顾精度和效率。MobileNetV3^［22］为轻量化模型，结合神经架构搜索和挤压-激活（Squeeze-and-Excitation, SE）注意力机制，降低参数量、提升推理速度，适用于资源受限场景。ConvNeXt^［23］将Transformer设计反向迁移至CNN，无需复杂注意力机制，即可实现高性能效果，适用于密集检测任务。RepLKNet（Re-parameterized Large Kernel Network）^［24］，引入大核卷积和结构重参数化技术，平衡精度和推理速度，适用于大尺寸图像检测。ConvFormer^［25］融合CNN局部特征提取和Transformer全局依赖建模，兼顾精度和效率，是混合架构典型代表。EfficientNetV2^［26］优化网络结构和缩放策略，提升训练和推理速度，适用于快速部署。HorNet^［27］以大核卷积为主要卷积层，设计多尺度交互模块，优化特征提取效率，实现CNN架构性能提升。

目标检测的任务是判断图像或视频帧中是否存在特定目标，若存在则识别其类别并使用边界框定位其空间位置。根据算法原理的差异，主流目标检测器可分为如图1所示的双阶段和单阶段两大类。双阶段方法首先通过区域提议网络（Region Proposal Network, RPN）或选择性搜索等机制进行生成大量潜在的目标候选框（Region Proposals），随后在第二阶段对每个候选区域进行精确的类别分类与边界框回归。目前双阶段检测器代表性的工作如区域卷积神经网络（Region-based Convolutional Neural Networks, R-CNN）系列（Fast R-CNN^［28］和Faster R-CNN^［29］），以及特征金字塔网络（Feature Pyramid Network, FPN）^［30］。这类方法虽然检测精度较高，但其复杂的流程导致计算开销大、推理速度慢，限制了在实时场景下的部署应用。

显示原图|下载原图ZIP|生成PPT

图1 基于深度学习的目标检测方法（2014-2026）

注：SPP-Net的全称是Spatial Pyramid Pooling Network；M2Det 的全称是Multi-Level Feature Pyramid Network based Single-Shot Object Detector

Fig.1 Deep learning-based object detection methods（2014-2016）

单阶段检测器将目标检测任务统一为一个端到端的回归问题，舍弃了候选区域生成的步骤，直接在设定的锚点或特征图网格上进行目标的类别预测和位置回归。这一特性使其具备极高的推理效率，恰好契合了水果自动化分选线对实时性的严格要求，以及嵌入式边缘设备对低延迟、低功耗部署的特定需求，因而成为水果缺陷检测场景下的主流技术路线。具有代表性的单阶段检测器包括SSD（Single Shot Multibox Detector）^［31］、YOLO（You Only Look Once）、RefineDet++^［32］、DSSD（Deconvolution Single Shot Detector）^［33］、RetinaNet^［34］。

相较于双阶段检测器，单阶段检测器在推理速度与模型轻量化方面具有显著优势，更适用于对实时性要求严格且计算资源受限的场景。在众多单阶段检测器中，YOLO系列算法因其在速度与精度间取得良好的平衡，以及其清晰简洁的架构设计，已成为该领域最具影响力的算法之一^［35］。作为一种典型的单阶段目标检测器，YOLO可直接对输入图像进行端到端推理，同步预测目标边界框坐标与对应类别概率，无须经过多阶段候选区域生成与筛选过程。这与 R-CNN ^［36］等需先生成候选区域再分类的双阶段检测器形成鲜明对比。如图2所示，YOLO可在卷积神经网络的一次前向传播中完成所有目标的检测，从而实现了极高的处理效率，即使在资源有限的图形处理器（Graphics Processing Unit, GPU）上也能满足实时处理的要求，能够以较低的代价实现高精度的实时目标检测。

显示原图|下载原图ZIP|生成PPT

图2 基于YOLO的目标检测技术原理图

Fig. 2 Schematic diagram of YOLO-based object detection technology

2 YOLO系列模型的发展历程

2015年，JOSEPH REDMON等提出了YOLO模型，是目标检测领域的一项重大突破。此后，YOLO系列模型通过引入更强大的特征提取模块、多尺度特征融合网络和高效的训练技巧，在保持实时性的同时，检测精度也得到了逐步提升。如今，YOLO系列凭借其在速度和精度之间的良好平衡，已被广泛应用于医疗影像分析^［37］、智慧农业^［38］及工业制造^［39］等诸多领域。

本节梳理了从YOLOv1到YOLO26的技术发展历程，如表2所示。根据YOLO的发展特点，将其划分为三个发展阶段，分别从提出时间、创新点、网络的关键改进和在水果缺陷检测中的优势等方面，对YOLO系列模型展开分析。

表2 YOLO各版本贡献

Table 2 Contributions of YOLO versions

	版本	贡献	框架
第一阶段	YOLOv1	单阶段检测器	Darknet
	YOLOv2	多尺度训练，维度聚类	Darknet
	YOLOv3	Darknet-53网络	Darknet
第二阶段	YOLOv4	空间金字塔池化模块，基于Mish的激活函数，CSPDarknet-53网络	Darknet
	YOLOv5	基于SWISH的激活函数，路径聚合网络	Pytorch
	YOLOv6	SimOTA标签分配策略，无锚框检测头	Pytorch
	YOLOv7	E-ELAN网络，Transformers预测头，扩展高效层聚合网络重参数化	Pytorch
	YOLOv8	分布焦点损失函数，空间金字塔快速池化层，任务对齐分配策略	Pytorch
第三阶段	YOLOv9	可编程梯度信息，广义高效层聚合网络	Pytorch
	YOLOv10	无非极大值抑制训练方法，双重标签分配，面向提升精度与效率的整体模型设计	Pytorch
	YOLOv11	带空间注意力的跨阶段局部网络，C3k2（Cross-Stage Partial Kernel-2）模块	Pytorch
	YOLOv12	残差高效层聚合网络，区域注意力机制	Pytorch
	YOLOv13	基于超图的自适应相关性增强，全流程聚合与分布	Pytorch
	YOLO26	MuSGD优化器，语义分割损失模块，多尺度原型模块	Pytorch

2.1　第一阶段YOLOv1-YOLOv3

本阶段标志着单阶段检测框架的创立与基础检测能力的形成，为自动化水果缺陷检测奠定了技术可行性的基础。YOLOv1提出的单次检测思想，为水果缺陷检测所需的实时处理能力提供了初步解决方案。YOLOv2^［40］引入的锚框机制和更高效的骨干网络^［41］，提升了对不同尺寸、形态的水果及其缺陷的定位鲁棒性与适应性。而YOLOv3^［42］提出的多尺度特征金字塔和更深的骨干网络，使其能够从不同感受野捕捉特征，从而增强了对早期病斑、微小瘀伤等小尺寸缺陷的检测能力，缓解了水果表面小目标缺陷漏检率高的难题，初步展现了YOLO系列在复杂农业视觉任务中的巨大应用潜力。

2.2　第二阶段YOLOv4-YOLOv8

此阶段研究重点在于模型架构的模块化、工程化构建和效率优化，推动水果缺陷检测技术向实用化、精准化方向发展。其中，YOLOv4^［43］首次明确了骨干网络（Backbone）、颈部网络（Neck）、检测头（Head）的模块化设计，为改进算法适配特定水果缺陷检测的需求提供了清晰的技术框架。该模型引入的CSP（Cross Stage Partial Network）^［44］、PANet（Path Aggregation Network）^［45］等模块，有效增强了对水果复杂纹理特征的提取融合能力。随后的YOLOv5具有工程友好性和多规模版本的设计特点，便利了研究者依据不同的计算资源和水果品类进行模型选型。YOLOv6^［46］和YOLOv8在轻量化设计、无锚框检测机制和解耦头结构等技术方向持续突破创新。YOLOv7^［47］设计了扩展高效层聚合网络（Extended Efficient Layer Aggregation Network, E-ELAN）架构提升特征学习能力，引入辅助头协同训练在不增加推理负担下提升精度，并通过广义的重参数化技术平衡训练和推理的效率，匹配了水果缺陷检测对低延迟、高精度的双重需求，为解决果实密集排布、部分遮挡等实际复杂检测难题提供了可靠技术方案。其相关改进策略已被广泛应用于苹果、柑橘、番茄等多种水果的缺陷检测模型中。

2.3　第三阶段YOLOv9-YOLO26

最新的YOLO系列主要研究信息的提取和传输、后处理流程的简化，以及高阶语义关系的建模，适合解决水果检测中的复杂场景问题，为水果缺陷检测带来了新的突破方向。YOLOv9^［48］的可编程梯度信息机制旨在缓解深层网络中的信息衰减，有助于提升对果皮轻微和模糊缺陷的特征保持能力。YOLOv10^［49］的无非极大值抑制设计减少了后处理流程带来的延迟，匹配在线分拣系统的高吞吐量需求。YOLOv11和YOLOv12^［50］在注意力机制和结构上的研究，强化了模型对缺陷相似区域的区分能力。YOLOv13^［51］引入的超图建模等高级语义理解技术，提升模型在复杂场景下的目标检测能力，为解决复杂背景干扰下的缺陷检测问题，提供了技术路径。YOLO26保留了非极大值抑制的设计，并引入了MuSGD优化器提升了训练稳定性和收敛速度，语义分割损失和多尺度原型模块提升模型对局部轻微缺陷的分割精度，为YOLO从实验室向工业化落地提供了技术支持。

3 YOLO模型在水果缺陷检测中的应用

本节系统梳理了YOLO系列模型在水果缺陷检测中的前沿应用研究。内容聚焦于苹果、柑橘、番茄和梨等典型水果，图3展示了这些水果的常见表面缺陷。研究主要围绕内部与隐性缺陷的检测、复杂表面形态下的缺陷识别以及面向实际部署的模型轻量化与加速三个检测难点展开。

显示原图|下载原图ZIP|生成PPT

图3 部分水果常见表面缺陷图

a. 苹果 b. 梨 c. 番茄 d. 草莓 e. 冬枣 f. 柑橘 g. 柠檬

Fig.3 Figures of common surface defects of some fruits

3.1　内部与隐性缺陷的检测

表3列出了2022—2026年以来基于YOLO系列模型的水果内部和隐性缺陷的检测研究成果。基于可见光的检测方法难以有效识别水果的内部生理病害，以及复杂环境干扰下导致正常果皮特征相似的隐性表面缺陷，这成为实现高精度分级的瓶颈。为应对这一挑战，研究趋势正向多模态信息融合方向演进，通过结合近红外、高光谱等成像技术以提供更丰富的缺陷信息。

表3 基于YOLO系列模型的水果内部与隐性缺陷检测相关研究成果

Table3 A review of research advances in internal and latent defect detection in fruits using YOLO series models

年份	模型	水果	改进方法	研究难点	mAP_0.5/%
2024	YOLOv7^［52］	柑橘	1）SIRI技术 2）坐标注意力机制 3）Mish激活函数 4）引入SPPFS（Spatial Pyramid Pooling - Fast， SPP Fand feature selection）模块	RGB图像无法检测内部缺陷	95.9
2022	YOLOv4^［53］	苹果	1）近红外相机图像采集系统 2）模型的通道剪枝与层剪枝	RGB图像无法检测内部缺陷	92.42
2023	YOLOv3^［54］	草莓	1）近红外相机图像采集系统 2）近红外与RGB图像像素融合	RGB图像无法检测内部缺陷	87.18
2023	YOLOv5^［55］	柑橘	1）双光源采集系统 2）广义交并比（Generalized Intersection over Union，GIoU）损失函数 3）卷积块注意力模块（Convolutional Block Attention Module，CBAM）	自然光下缺陷不易检测	98.7
2026	YOLOv11^［56］	柑橘	1）紫外荧光成像	自然光下缺陷不易检测	96.9
2025	YOLOv12^［57］	苹果	1）滤波成像与色彩空间重建结合	自然光下缺陷不易检测	98.9
2023	YOLOv5^［58］	草莓	1）引入分类模型 2）优化损失函数	复杂环境缺陷不易检测	85.4
2023	YOLOv5^［59］	草莓	1）引入Deeplabv3语义分割网络 2）添加分支结构 3）引入可变形卷积	复杂环境缺陷不易检测	62.8

注：平均精度均值（Mean Average Precision，mAP）

3.1.1　内部缺陷的跨模态感知

针对单一RGB（Red-Green-Blue）图像难以探测内部缺陷的问题，研究者们引入了新型成像技术与改进的YOLO模型相结合的策略。CAI等^［52］将空间分辨成像（Structured-Illumination Reflectance Imaging, SIRI）技术与改进的YOLOv7模型相结合用于柑橘检测，利用SIRI技术生成同时包含表面与皮下信息的交流分量（Alternating Component, AC）图像，实现了对柑橘内部与外部缺陷的同步、无损检测，为水果内部品质评估提供了新方法。FAN等^［53］则采用近红外相机采集苹果图像，并配合经过通道与层剪枝的轻量化YOLOv4模型，有效检测出苹果的内部缺陷。LU等^［54］提出了一种基于像素融合的方法，将RGB（Red-Green-Blue）图像和近红外图像的信息进行提取并处理，再利用YOLOv3-tiny模型实现草莓内部缺陷的精准无损检测。

3.1.2　隐形缺陷与复杂背景下的检测

对于自然光下难以察觉的隐性表面缺陷，主动光学成像技术提供了一种有效的增强手段。HU等^［55］针对柑橘隐性缺陷，设计了一套双光源图像采集系统，利用特定波段光照激发柑橘的生物荧光特性，从而凸显缺陷。在算法层面，通过改进的YOLOv5模型，有效增强了对小缺陷特征的捕捉能力。WANG等^［56］提出了一种缺陷无损检测系统，结合紫外荧光成像和YOLO11模型相结合，用于检测早期或不显眼的缺陷，包括真菌感染和机械损伤。WANG等^［57］将滤波成像和色彩空间重建结合，采用YOLOv12作为检测模型，提高苹果缺陷检测在复杂光照条件下的精准度，展现了主动光学与深度学习结合的潜力。

在复杂自然环境下，背景干扰是影响检测精度的主要因素之一。对此，一种策略是采用两阶段处理流程。YUAN等^［58］为草莓分级设计了融合模型，第一阶段使用改进的YOLOv5进行果实前景分割以消除背景干扰，第二阶段采用Stacking集成学习方法融合多种分类器，实现草莓缺陷的无损检测。朱文铭^［59］设计了YOLOv5-mask草莓缺陷检测模型，通过在YOLOv5的网络基础上增加分支结构，用于分割前景和背景，再引入可变形卷积增强模型对多变缺陷的检测能力。

综上，内部与隐性缺陷检测作为水果高精度分级的核心瓶颈，其技术突破依赖于成像技术创新和改进YOLO模型技术的融合。针对YOLO无法通过单一RGB图像进行内部缺陷检测的难题，跨模态感知成为主流解决方案，通过整合空间分辨成像、近红外和可见/近红外光谱等非可见光成像技术，结合改进YOLO模型，实现水果内外部缺陷的同步无损检测，为水果内部缺陷检测提供了技术方案。对于YOLO在可见光下难以检测隐性表面缺陷及复杂背景干扰问题，主动光学成像技术可有效增强缺陷特征辨识度，搭配引入注意力机制等优化方案的YOLO模型，或与其他分类模型组合为两阶段流程的检测模型，显著提升了复杂背景下表面缺陷捕捉能力。进一步适配了自然环境及实际生产场景需求，推动了水果缺陷检测技术的工程化落地。

3.2　复杂表面形态下的缺陷检测

表4列出了2022—2026年来基于YOLO系列模型的水果复杂表面形态下的缺陷检测研究成果。水果表面的复杂形态，如与缺陷相似的健康区域常导致误检和漏检，对水果表面缺陷的精准检测构成了挑战。因此，研究工作主要从提升相似特征辨别能力、增强微小与复杂缺陷特征捕捉能力，以及模型轻量化与边缘部署三个方向展开。

表4 基于YOLO系列模型的复杂表面环境下水果缺陷检测相关研究成果

Table 4 A review of research advances in fruit defect detection under complex surface conditions using YOLO series models

年份	模型	水果	改进方法	研究难点	mAP_0.5/%
2022	YOLOv8^［60］	苹果	1）引入空间深度卷积（Space-to-Depth Convolution， SPD-Conv） 2）引入多尺度空洞注意力机制（Multi-scale Empty Attention， MSDA） 3）引入上下文引导特征金字塔网络（Context Guided Feature Pyramid Network， CGFPN）	表面坑凹区域与缺陷相似易误检	91.4
2025	YOLOv8^［61］	苹果	1）引入部分卷积（Partial Convolution，PConv）模块 2）高效多尺度注意力（Efficient Multi-scale Attention，EMA）机制 3）最小点距离交并比（Minimum Point Distance Intersection over Union） 4）引入Slim-neck架构	表面坑凹区域与缺陷相似易误检	90.1
2023	YOLOv5^［62］	苹果	1）引入TRANS（Transformer）模块 2）引入BiFPN 3）基于归一化的注意力模块（Normalization-based Attention Module，NAM）	表面坑凹区域与缺陷相似易误检	98.9
2024	YOLOv5^［63］	梨	1）BAM（Bottleneck Attention Module）注意力机制 2）设计C3-GDC（C3-GhostDynamicConv）卷积模块 3）明智交并比（Wise Intersection over Union，WIoU）损失函数	花萼/果梗与缺陷相似易误检	93.9
2025	YOLOv5^［64］	梨	1）基于双层路由注意力机制的视觉 Transformer（Bi-Level Routing Vision Transformer，Bi Former） 2）引入双向特征金字塔网络（Bidirectional Feature Pyramid Network，BiFPN）	花萼/果梗与缺陷相似易误检	68.2
2023	YOLOv10^［65］	柑橘	1）引入线性可变形卷积（Linear Deformable Convolution，LDConv） 2）引入广义特征金字塔网络（Generalized Feature Pyramid Network，GFPN）	缺陷微小且复杂多变易漏检	98.7
2024	YOLOv5^［66］	柑橘	1）三维坐标注意力（Three-dimensional Coordinate Attention，TDCA）机制 2）引入CT（Contextual Transformer）模块 3）引入BiFPN	缺陷微小且复杂多变易漏检	98.7
2024	YOLOv8^［67］	柠檬	1）CBAM注意力机制 2）设计C2f-SAS（Switchable Atrous Convolution）模块	缺陷形态复杂多变易漏检	90.62
2024	YOLOv5^［68］	苹果	1）设计DSCS卷积模块 2）指数线性单元（Exponential Linear Unit，ELU）激活函数 3）WIoU损失函数	缺陷微小且复杂多变易漏检	90.9
2024	YOLOv7^［69］	苹果	1）CBAM和ECA注意力机制 2）引入深度可分离卷积策略 3）参数化修正线性单元（Parametric Rectified Linear Unit，PReLU）损失函数	缺陷微小且复杂多变易漏检	90.7
2026	YOLOv11^［70］	苹果	1）设计三视角成像系统 2）引入非局部自注意力残差多层感知机模块（Non-Local Attention Residual Multi-layer perceptron，NARM）	缺陷微小且复杂多变易漏检	89.8
2024	YOLOv8^［71］	李子	1）引入SPD-Conv模块 2）引入扩张式残差分割网络（Dilation-wise Residual Segmentation，DWRSeg）模块 3）高效交并比（Efficient Intersection over Union，EIoU）损失函数	缺陷微小且复杂多变易漏检	87.8
2025	YOLOv11^［72］	番茄	1）引入小波深度可分离卷积（ Wavelet Depth Separable Convolution，WDWConv） 2）设计WC3k2模块	不规则缺陷易漏检	88
2024	YOLOv7^［73］	猕猴桃	1）CBAM注意力机制 2）设计C3-Ghost模块 3）优化损失函数	不规则缺陷易漏检	93
2024	YOLOv7^［74］	红枣	1）简单注意力机制（Simple Attention Module，SimAM） 2）引入深度可分离卷积（Depthwise Separable Convolution，DSConv） 3）引入ByteTrack跟踪算法	密集排列遮挡且不规则缺陷易漏检	85.3
2025	YOLOv5^［75］	红枣	1）坐标注意力（Coordinate Attention，CA）机制 2）增加小目标检测头	密集排列遮挡且不规则缺陷易漏检	91.6
2025	YOLOv7^［76］	葡萄	1）WIoU损失函数 2）Bi-Former注意力机制	果实小且密集排列遮挡易漏检	80.1
2023	YOLOX^［77］	樱桃	1）CBAM注意力机制 2）改进损失函数	果实小且密集排列遮挡易漏检	91.84
2025	YOLOv8^［78］	樱桃	1）引入DySlimNeck动态颈部层 2）引入Detect-FRM（Detect-Fourier Representation Module）检测头 3）引入FasterNet-RepMixer网络	果实小且密集排列遮挡易漏检	91.5

3.2.1　相似特征的精准辨别

有些水果表面特征与缺陷相似，是导致误检的主要因素。为此，研究侧重于引入注意力机制以提升模型对关键特征的提取能力。

针对苹果表面常存在与病斑相似的天然凹坑，易导致误检的问题。SHAN等^［60］提出了SMC（Space-to-Depth Convolution-Multi-Scale Empty Attention-Context）-YOLOv8n苹果表面缺陷检测模型，通过改进注意力机制与FPN层提高模型检测精度，有效提升了对缺陷区域的识别精度。王会征等^［61］基于YOLOv8模型，设计了新的卷积模块并替换原网络中的，提高了对表面缺陷的识别能力。张嘉琪等^［62］利用设计的NAM（Normalization-based Attention Module）-YOLO网络提升了苹果缺陷的检测能力，有效缓解了误检与漏检问题，可较好地满足苹果分拣的实际需要。

针对果梗与花萼缺陷相似的问题，WANG等^［63］在YOLOv5中引入注意力机制与高效的卷积模块以提升特征提取能力，实现对秋月梨的高效缺陷检测。陈峻生^［64］基于YOLOv5模型，通过引入注意力机制与改进PANet层，有效降低了对缺陷相似区域的误检率。

3.2.2　微小缺陷与复杂缺陷形态的捕捉

面对水果表面广泛存在的微小点状缺陷和形态不规则且多变的复杂缺陷，研究策略的核心在于提升深度学习模型的表征能力。通过引入更高效的多尺度特征融合架构与扩大模型的有效感受野，能够显著增强模型对微小缺陷特征的敏感度，以及对复杂多变缺陷形态的适应性与判别力，从而为各类水果的精准缺陷检测提供技术解决思路。

柑橘类水果的缺陷检测需应对黑斑病等微小点状缺陷及干疤等不规则疤痕。WANG等^［65］提出一种改进的基于YOLOv10的表面缺陷检测方法，有效提升柑橘不同尺度缺陷特征的捕捉能力，为柑橘表面缺陷在线检测提供了一种精准的实时检测方法。LU等^［66］以YOLOv5为基准模型，通过融合三维空间信息优化多尺度特征流，有效提升了对柑橘微小缺陷的检测能力。WANG等^［67］在YOLOv8中设计了更高效的卷积模块以动态适应不同缺陷形态，并嵌入注意力机制强化缺陷定位，实现智能化柠檬缺陷的检测。

针对类似问题，朱琦^［68］等提出DSCS（Deep and Shallow Feature Selection Module）-YOLO苹果缺陷检测模型，作者基于YOLOv5模型，设计轻量化的卷积模块，在保证检测速度的同时提升了精度，满足实际应用需求。徐江鹏^［69］基于YOLOv7-模型进行改进，为增强对目标轮廓和空间位置的特征感知能力，引入两种注意力机制，实现了对缺陷果实的高效检测和分类。孙国祥等^［70］设计了一套三视角成像的苹果表面缺陷检测系统，通过三视角点云配准重建苹果模型，再利用改进后的YOLOv11模型进行缺陷检测，实现模型检测精度和小尺度缺陷识别能力的提升。霍新梅^［71］基于复杂的自然环境，构建了一个包含成熟、半成熟、未成熟和缺陷四类标签的数据集。并利用改进的YOLOv8开发了李子检测系统和果园管理系统，对未采摘的李子进行表面缺陷检测，为果园管理提供新的参考。

3.2.3　不规则缺陷与密集排列

面对水果不规则缺陷（如图3中番茄开裂、樱桃花皮等），以及在分选线上密集排列所带来的检测挑战，要求模型具备更强的鲁棒性。近年来，研究者基于YOLO系列提出了多种改进方法，有效提升了在上述复杂场景下的检测性能。

朱婷婷等^［72］以YOLOv11为基准模型，对Head层进行改进，以扩大感受野进而更好地捕捉不规则缺陷的纹理细节，实现对番茄五种表面缺陷的同步感知。许川^［73］建立了相关猕猴桃缺陷数据集，并设计GC-YOLOv7-tiny模型，实现了猕猴桃大小与表面缺陷的同步检测。

针对红枣，刘鑫等^［74］利用设计的YOLOv7-ByteTrack模型，有效解决了干制哈密大枣因外观相似、排布密集导致的缺陷难以检测难题。史鹏涛等^［75］通过优化YOLOv5的锚框尺寸、增加检测头，并引入注意力机制和学习率自适应等综合策略，提升了红枣缺陷的识别与分拣效果。LI等^［76］针对葡萄之间的遮挡现象情况下进行缺陷检测的问题，通过优化YOLOv7的损失函数和注意力机制，有效缓解了葡萄重叠果实导致的缺陷检测识别精度低。刘敬宇等^［77］采集了传送带上的樱桃缺陷图像，并基于YOLOX模型设计了樱桃缺陷检测模型，实现了工业化条件下樱桃缺陷的快速检测。LUAN等^［78］针对密集分布和细微特征等问题创建了一个高质量樱桃数据集，再通过对YOLOv8的网络结构、损失函数和检测头进行改进，实现了对樱桃缺陷的精准检测。

水果复杂表面形态和密集场景下导致误检、漏检的检测难题，需提升模型对特征的提取和融合能力。针对相似特征干扰问题，通过在YOLO模型中引入注意力机制、改进卷积层和特征融合层，有效提升了模型对缺陷和天然表面特征的辨别能力，显著降低误检率。对于微小、不规则缺陷，引入多尺度特征融合和扩大感受野的同时轻量化部分模块，兼顾了检测精度与速度，适配实际产线的检测需求。面对果实不规则缺陷与密集排列的挑战，通过提升模型的鲁棒性，满足了番茄、红枣、樱桃等水果在工业化分选与果园智能化管理中的应用需求。综上所述，提升模型特征提取能力和鲁棒性，是解决复杂表面形态下水果缺陷检测难题的方向之一，为后续相关研究提供了思路。

3.3　模型轻量化与边缘部署

表5列出了2022—2025年以来基于YOLO系列模型的轻量化与边缘部署的水果缺陷检测研究成果。为实现水果缺陷检测模型在计算资源受限的边缘设备上的高效部署，已有研究主要沿轻量化架构设计、模型压缩以及训练过程优化三大技术路径展开，以平衡模型精度、速度与资源消耗。

表5 基于YOLO系列算法的水果缺陷检测模型轻量化相关研究成果

Table5 A review of research advances in lightweight model design for fruit defect detection using YOLO series algorithms

年份	模型	水果	改进方法	研究难点	mAP_0.5/%
2025	YOLOv11^［79］	梨	1）引入BiFPN 2）CBAM注意力机制 3）引入TR2（Two Transformer）模块 4）双层迁移学习	实际场景计算资源受限模型难以部署	92.7
2023	YOLOv4^［80］	梨	1）PConv模块 2）EMA机制 3）MPDIoU损失函数 4）引入Slim-neck架构轻量化颈部网络	实际场景计算资源受限模型难以部署	85.52
2025	YOLOv5^［81］	苹果	1）多尺度检测头简化为双尺度或单尺度 2）移除冗余卷积层	实际场景计算资源受限模型难以部署	99.8
2024	YOLOv5^［82］	苹果	1）引入LightweightC3模块作为骨干网络的基本构建模块 2）设计EnhancedC3模块替代模型特征融合部分的C3模块 3）引入GSConv模块	实际场景计算资源受限模型难以部署	96.12
2022	YOLOv5^［83］	芒果	1）引入PPLCNet网络 2）引入GhostNet网络	实际场景计算资源受限模型难以部署	94.3
2025	YOLOv5^［84］	百香果	1）设计了StarC3SE模块替代C3模块 2）CBAM注意力机制 3）距离交并比（Distance Intersection over Union， DIoU）损失函数	实际场景计算资源受限模型难以部署	88.4
2024	YOLOv5^［85］	苹果	1）引入EfficientNetV模块 2）EMA机制	实际场景计算资源受限模型难以部署	93.6
2023	YOLOv4^［86］	柑橘	1）对网络进行剪枝优化移除冗余通道 2）去除冗余预测框	实际场景计算资源受限模型难以部署	94.56
2022	YOLOv4^［87］	苹果	1）与BiSeNet V2语义网络结合构成了双模型级联检测框架 2）对网络进行剪枝优化移除冗余通道	实际场景计算资源受限模型难以部署	92.42
2025	YOLOv12^［88］	番茄	1）引入RFEM模块 2）设计Dysample-Slim-Neck机制 3）引入动态卷积替代检测头中的传统卷积结构	实际场景计算资源受限模型难以部署	88.5
2024	YOLOv8^［89］	苹果	知识蒸馏	实际场景计算资源受限模型难以部署	97.8
2025	YOLOv8^［90］	百香果	1）设计MFSO（More Focus on Small Objects）网络结构 2）动态重参数化（Dynamic Reparameterization， DyRep） 3）NWD（Normalized Wasserstein Distance）损失函数 4）模型剪枝	实际场景计算资源受限模型难以部署	94.6
2024	YOLOv3^［91］	莲蓬	1）先验锚框尺度调整 2）引入金字塔池化层（Spatial Pyramid Pooling， SPP） 3）使用遗传算法改进网络超参数	实际场景计算资源受限模型难以部署	96.8

3.3.1　轻量化架构设计

通过构建高效网络降低复杂度和参数量。李成轩等^［79］基于YOLOv11提出了梨表面缺陷检测模型，引入Adown（Adaptive Downsampling）下采样模块和改进的C2PSA模块^［92］，将模型参数量和体积分别压缩至1.46 M和3.11 MB，减少了计算资源占用，适合实际部署。XIE等^［80］为梨缺陷检测模型设计了分层交互式收缩网络（Hierarchical Interactive Shrinking Network, HISNet）和块状征金字塔（Bulk Feature Pyramid, BFP）模块，将参数量压缩至基准模型的1.5%。JUAN CARLOS OLGUÍN-ROJAS等^［81］从检测头维度进行精简，通过将YOLOv5的多尺度检测头简化为双尺度或单尺度，并移除冗余卷积层，成功将参数量减少82.96%。鄢紫等^［82］以YOLOv5为基础，引入LightweightC3、EnhancedC3和GSConv（Ghost Shuffle Convolution）^［93］等多个轻量化模块，实验结果证明mAP_0.5相较基准模型提高了2.21个百分点，浮点数计算量减少了26%，满足识别水果品种和新鲜度的需求。聂衍文等^［83］构建了芒果的缺陷数据集，使用PPLCNet（PaddlePaddle Lightweight Convolutional Network）和GhostNet构建骨干特征提取网络和加强特征提取网络，并将改进模型部署在移动终端进行测试，测试证明模型大小减小了约70.80%，推理速度减少约52.7%。ZHOU等^［84］设计了一种轻量化SCD（StarC3SE-CBAM-DIoU）-YOLOv5s网络模型，以YOLOv5为基础，设计了StarC3SE模块取代了原有模型中的C3模块，并引入CBAM注意力机制，用于实时检测百香果表面的微小缺陷。LV等^［85］将轻量级的EfficientNetV2模块集成到YOLOv5架构中，此外通过在模型中加入EMA机制，提升了模型提取关键特征的能力，用于检测苹果表面的缺陷。这样一来，模型的大小减少了20%，同时仍能保持出色的检测效果。

3.3.2　模型压缩与加速

剪枝与量化是模型部署前的关键压缩步骤。梁晓婷等^{［86, 87］}在苹果和番茄检测中，对YOLOv4模型采用结构化与非结构化剪枝相结合的策略，在降低计算复杂度的同时通过微调保持精度。LIANG等^［88］在基于YOLOv12的番茄检测模型中首先引入感受野增强模块（Receptive Field Enhancement Module, RFEM）^［94］，在不提升计算量的同时提升检测精度，其次设计颈部网络Dysample-Slim-Neck以降低计算复杂度并提升细微缺陷检测效果。最后，采用动态卷积替代检测头中的传统卷积结构以减少模型参数量，在提升精度的同时降低了24.8%的计算量。方晨羽^［89］提出了YOLOv8distill苹果检测模型，通过知识蒸馏技术，将原模型计算量压缩至5%，推理速度提升十倍，在推理效率上取得了显著的提升。CHEN等^［90］以YOLOv8为基础模型，设计了YOLOv8-MDN-Tiny模型，通过剪枝和压缩技术来优化模型结构，大幅降低模型参数量，实现了对百香果缺陷的实时检测。

3.3.3　训练过程优化

轻量化不仅依赖架构设计，也涵盖训练过程的优化。张雷等^［91］在莲蓬分级模型中引入遗传算法进行超参数自动寻优，提升了模型性能与训练效率。相较于受控的产线环境，田间自然环境下的实时监测对模型的轻量化、鲁棒性和能效提出了更大的挑战，也指明了该领域技术需向更复杂应用场景迈进的方向。

4 当前的主要挑战

尽管YOLO系列模型通过持续迭代实现了检测精度与实时性的动态平衡，在水果缺陷检测领域展现出良好的潜力，为智能农业检测技术的发展奠定了重要基础，但面对农业场景的复杂性、多样性和实际部署需求等问题，该技术仍面临多方面需要突破的挑战，主要集中在算法设计、数据集、硬件约束和实际复杂环境适应性四个方面。

（1）算法局限性。尽管YOLO系列通过持续迭代在速度与精度上取得了卓越平衡，但针对水果缺陷检测的特有场景需求，仍暴露出两点固有局限性^［95］：其一，单阶段检测器固有的定位-分类耦合优化矛盾尚未完全解决。水果缺陷多呈现不规则形态（如梨的表皮擦伤、苹果的不规则病斑、柑橘的裂口），且部分缺陷和果实正常组织边界模糊，YOLO模型将边界框回归和类别分类任务集成于同一卷积层的设计，易引发任务间的优化冲突，导致缺陷边界定位偏差、类别误判，尤其对微小缺陷的定位精度不足。其二，局部特征提取的局限性。现有YOLO架构以卷积操作为核心，侧重局部特征捕捉，缺乏对水果全局上下文信息的有效建模，难以应对典型水果中正常组织和缺陷形态相似的场景，如梨的花萼、苹果的果梗和对应果实的腐烂斑、擦伤在局部形态、颜色特征上高度相似，仅依靠局部特征难以实现精准区分，易产生误检。

（2）数据集特异性。YOLO的水果缺陷检测研究高度依赖训练数据集的质量，但当前多数研究采用的数据集存在显著的特异性。现有研究使用的数据集多针对单一水果品种、特定产区或少数缺陷类型进行采集与标注^{［96， 97］}。此类数据构建策略虽能使模型在特定水果、缺陷的检测任务中达到较优性能，但当面对不同品种水果、同一水果不同生长阶段的缺陷，或未见过的缺陷形态时，模型泛化能力会显著退化。尤为关键的是，水果缺陷标注存在微小缺陷、隐性缺陷的标注难度大，高质量标注需结合多方面知识，标注成本极高，导致跨品种、多缺陷类型的通用数据集稀缺，这成为YOLO模型在水果缺陷检测中规模化应用的一大挑战。

（3）硬件部署约束。水果缺陷检测的实际部署环境（水果分选线、田间采摘现场、小型果蔬种植园），对硬件资源提出了严苛要求，主要面临两重挑战：其一，水果分选线的高速检测需求和嵌入式设备性能的矛盾。水果分选过程中，需实现每秒数颗甚至数十颗水果的实时检测，要求YOLO模型在分选线普遍应用的低成本嵌入式设备上实现高效推理，但现有高性能YOLO模型参数量较大，在这类设备上难以满足高速且精准检测需求，实时性不足会直接影响分选效率。其二，水果种植多以中小规模农户为主，这类用户对检测设备的成本敏感度极高，而能支撑高性能YOLO模型流畅运行的硬件设备价格偏高，会显著抬高技术落地门槛，降低用户的技术采纳意愿。

（4）复杂检测环境影响。水果缺陷检测的实际场景具有高度动态性和不可控性，检测环境的干扰的针对性强，导致YOLO模型的鲁棒性不足，成为制约其实用化的关键因素。一方面，光照波动对水果缺陷检测的影响更为突出，田间自然光照的强光、阴影，分选车间人工光源的明暗变化，会导致水果表面缺陷的颜色、纹理特征发生失真，尽管YOLO模型具备一定的特征学习能力，但仍易出现检测精度下降、漏检等问题。另一方面，水果缺陷检测场景存在遮挡等干扰因素，如田间检测时叶片、枝丫对果实的部分遮挡，以及分选线中水果的堆叠遮挡，会导致YOLO模型难以有效提取缺陷特征，影响缺陷检测精度。

YOLO模型在水果缺陷检测领域从实验室研究走向规模化实际应用仍有较长路程，未来研究需针对性地攻克这些技术瓶颈，进一步拓展模型在不同作物类型、生长阶段和复杂环境下的检测能力，推动技术从实验室走向规模化农业应用。

5 总结与展望

5.1　研究总结

本文综述了YOLO系列模型在水果缺陷检测领域的研究进展与应用现状。YOLO模型依托单阶段检测架构的独特优势，实现了检测精度与实时性的高效平衡，已成为该领域应用广泛的技术框架之一，为智能农业检测研究领域提供了重要技术支撑。尽管当前研究已取得阶段性显著成果，但仍存在一些亟待解决的问题。算法层面存在固有局限性，数据层面受限于小规模，导致模型泛化能力不足，硬件层面面临边缘设备部署的资源约束难题，环境层面则受困于复杂农业场景下的检测鲁棒性欠缺。对于上述问题需通过跨学科融合创新提出解决方案，开发能够自适应动态农业环境的高效智能检测模型，推动技术从实验室走向实际应用。

5.2　未来展望

5.2.1　公共数据集的构建

模型训练效果与数据集质量密切相关，数据集的样本数量和图像质量是评价一个数据集是否优秀的关键因素。随着高质量图像样本数量的增加，训练后的模型检测效果也会更加优秀。一般来说，理想的数据集能够具备大规模和多样化的特性。同时，训练集图像不仅需要较高的清晰度，而且还要求标注检测目标的准确性，这对模型训练出优秀的效果同样关键。

但是，当前水果缺陷检测研究中数据集多为自建数据集，研究对象多为特定某一产区和品种水果的多类型缺陷。未来研究需要在数据集构建方面，突破单一产区、单一品种的局限，构建标准化、规模化的水果缺陷公共数据集。数据集需涵盖不同水果品种、不同成熟度、不同生长环境下的各类缺陷样本，既包括常见的机械损伤、病虫害、腐烂等显性缺陷，也需纳入轻微损伤、内部病变等隐性缺陷，统一缺陷标注精度和类别划分，解决现有自建数据集通用性不足的问题。

5.2.2　模型可解释性

随着YOLO模型在智慧农业应用中的作用日益凸显，提升可解释性已成为技术落地的需求。农户和相关从业者需了解模型运行的内在逻辑，才能建立对技术的信任并采用相关技术。未来研究将进行YOLO模型的可解释性方法开发，通过可视化分析等技术，展示模型推理的原理，尤其是在复杂农业环境下，需构建面向非专业用户的直观解释界面，降低技术使用门槛。

5.2.3　人机协作策略机制

根据农户的实践经验和专业知识，构建人机协同决策模式是解决实际农业环境中复杂性的方案。深度学习模型擅长高效处理海量数据，同时农户具备对特例个体的分析能力，二者的结合可实现检测效率和精度的双重保障。未来研究需探索人机协同的具体实现方法，通过交互式界面让农户参与缺陷标注修正、模型预测结果验证，或采用模型初步检测，并让农户二次确认的分级决策模式，使基于YOLO的缺陷检测技术融入农业生产环境，提升技术的实用性与接受度。

5.2.4　大模型与YOLO的结合

大模型与YOLO网络的融合是近年来水果缺陷检测领域的研究热点，也是推动该领域发展的重要方向，要结合当前研究现状、现存挑战和实际应用需求，逐步实现从技术可行向产业实用发展。农业场景数据获取困难，且高质量标注成本极高。虽然生成式大模型可以合成数据，但生成数据的真实性、多样性和域适应性难以保证，可能引入偏差，影响模型在真实复杂农田环境中的泛化性能。针对这一问题，可优化大模型的生成策略，结合水果缺陷的形态特征、生长规律等信息，提升生成的数据集的有效性，减少数据偏差对模型泛化性能的影响。针对大模型虽然性能强，但计算开销大，难以部署于资源受限场景的问题，可借鉴轻量化大模型的优化经验，通过动态稀疏机制、模型压缩技术等手段，构建轻量级融合模型，实现模型在无人机、巡检机器人等资源受限设备上的高效部署，平衡检测精度和推理速度。此外，针对动态检测场景，可结合大模型的实时语义处理能力，实现缺陷检测和分拣决策的联动，提升检测系统的工程实用性^［98］。

基于YOLO模型的水果缺陷检测技术是人工智能与智慧农业深度融合的重要载体，其研究和应用具有显著的理论价值与实践意义。理论层面，可为计算机视觉技术在复杂农业场景中的应用提供方案参考，推动目标检测、模型优化和数据融合等技术的跨领域创新。实践层面，可实现水果缺陷检测的自动化、高效精准化检测，降低人工成本，提升分选效率与产品品质，为智慧农业的发展提供核心技术支撑，最终助力农业生产的可持续高效发展。突破当前技术挑战、把握未来发展方向，需要科研界、产业界与农户的通力合作，推动YOLO模型在水果缺陷检测领域的规模化应用与深度创新，从而达到促进中国农业智能化和自动化的目的。

本研究不存在研究者以及与公开研究成果有关的利益冲突。

参考文献

原文顺序 | 文献年度倒序 | 文中引用次数倒序

[1]	PANDISELVAM R, SUBHASHINI S, BANUU PRIYA E P, et al. Ozone based food preservation: a promising green technology for enhanced food safety[J]. Ozone: Science & Engineering, 2019, 41(1): 17-34.

[2]	PANDISELVAM R, SUNOJ S, MANIKANTAN M R, et al. Application and kinetics of ozone in food preservation[J]. Ozone: Science & Engineering, 2017, 39(2): 115-126.

[3]	RAWAT W, WANG Z H. Deep convolutional neural networks for image classification: A comprehensive review[J]. Neural Computation, 2017, 29(9): 2352-2449.

[4]	田有文, 吴伟, 卢时铅, 等. 深度学习在水果品质检测与分级分类中的应用[J]. 食品科学, 2021, 42(19): 260-270. TIAN Y W, WU W, LU S Q, et al. Application of deep learning in fruit quality detection and grading[J]. Food Science, 2021, 42(19): 260-270.

[5]	REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: unified, real-time object detection[C]// 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2016: 779-788.

[6]	宋怀波, 尚钰莹, 何东健. 果实目标深度学习识别技术研究进展[J]. 农业机械学报, 2023, 54(1): 1-19. SONG H B, SHANG Y Y, HE D J. Review on deep learning technology for fruit target recognition[J]. Transactions of the Chinese Society for Agricultural Machinery, 2023, 54(1): 1-19.

[7]	WANG H G, MEI M W, LI J B. Research progress on non-destructive detection of internal quality of fruits with large size and thick peel: A review[J]. Agriculture, 2023, 13(9): 1838.

[8]	SOLTANI FIROUZ M, SARDARI H. Defect detection in fruit and vegetables by using machine vision systems and image processing[J]. Food Engineering Reviews, 2022, 14(3): 353-379.

[9]	GAIKWAD A, DESHPANDE M, BHOLE V. Fruits defect detection: a review with image processing techniques[M]// Responsible Production and Consumption. LondonCRC Press 2024: 221-228.

[10]	张子申, 程红, 耿文娟, 等. 高光谱成像技术在水果品质检测中的应用研究进展[J]. 智慧农业(中英文), 2025, 7(5): 52-66. ZHANG Z S, CHENG H, GENG W J, et al. Research advances in hyperspectral imaging technology for fruit quality assessment[J]. Smart Agriculture, 2025, 7(5): 52-66.

[11]	徐文青, 丁爱霞, 朱文卿. 基于数字图像处理技术的水果分级检测研究进展[J]. 食品安全导刊, 2025(4): 183-189. XU W Q, DING A X, ZHU W Q. Research progress of fruit grading detection based on digital image processing technology[J]. China Food Safety Magazine, 2025(4): 183-189.

[12]	JOHN J, ANSARI R, DAFEDAR S, et al. Recent developments in fruit quality detection using deep learning: A review[C]// Proceedings of International Conference on Information Technology and Artificial Intelligence. Cham, Germany: Springer, 2026: 285-299.

[13]	麻剑钧, 刘晓慈, 金龙新, 等. 基于机器视觉的农作物病害识别研究进展[J]. 湖南农业科学, 2023(9): 97-100. MA J J, LIU X C, JIN L X, et al. Research progress of crop disease recognition based on machine vision[J]. Hunan Agricultural Sciences, 2023(9): 97-100.

[14]	周长建, 宋佳, 向文胜. 基于人工智能的作物病害识别研究进展[J]. 植物保护学报, 2022, 49(1): 316-324. ZHOU C J, SONG J, XIANG W S. Research progresses in artificial intelligence-based crop disease identification[J]. Journal of Plant Protection, 2022, 49(1): 316-324.

[15]	郭文娟, 冯全, 李相周. 基于农作物病害检测与识别的卷积神经网络模型研究进展[J]. 中国农机化学报, 2022, 43(10): 157-166. GUO W J, FENG Q, LI X Z. Research progress of convolutional neural network model based on crop disease detection and recognition[J]. Journal of Chinese Agricultural Mechanization, 2022, 43(10): 157-166.

[16]

IYYER

, MANJUNATHA

, BOYD-GRABER

, et al. Deep unordered composition rivals syntactic methods for text classification[C]// Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (volume 1: Long Papers). Beijing, China: Association for Computational Linguistics, 2015: 1681-1691.

[17]	KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks[C]// Communications of the ACM. ACM, 2017: 84-90.

[18]	SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition[C]// Proceedings of the International Conference on Learning Representations. San Diego, USA: ICLR, 2015.

[19]	SZEGEDY C, LIU W, JIA Y Q, et al. Going deeper with convolutions[C]// 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2015: 1-9.

[20]	HE K M, ZHANG X Y, REN S Q, et al. Deep residual learning for image recognition[C]// 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2016: 770-778.

[21]	TAN M, LE Q V. EfficientNet: Rethinking model scaling for convolutional neural networks[C]// International Conference on Machine Learning. New York, USA: PMLR, 2019: 6105-6114.

[22]	HOWARD A, SANDLER M, CHEN B, et al. Searching for MobileNetV3[C]// 2019 IEEE/CVF International Conference on Computer Vision (ICCV). Piscataway, New Jersey, USA: IEEE, 2019: 1314-1324.

[23]	LIU Z, MAO H Z, WU C Y, et al. A ConvNet for the 2020s[C]// 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2022: 11966-11976.

[24]	DING X, ZHANG X, MA N, et al. Scaling up your kernels to 31×31: Revisiting large kernel design in CNNs[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Piscataway, New Jersey, USA: IEEE, 2022: 11021-11030.

[25]	LIN X, YAN Z Q, DENG X B, et al. ConvFormer: plug-and-play CNN-style transformers forImproving medical image segmentation[C]// Medical Image Computing and Computer Assisted Intervention. Cham, Germany: Springer, 2023: 642-651.

[26]	TAN M, LE Q V. EfficientNetV2: Smaller models and faster training[C]// International Conference on Machine Learning. New York, USA: PMLR, 2021: 10096-10106.

[27]	LIM S N, LU J W, RAO Y M, et al. HorNet: efficient high-order spatial interactions with recursive gated convolutions[C]// Advances in Neural Information Processing Systems 35. New Orleans, Louisiana, USA. Neural Information Processing Systems Foundation, Inc. (NeurIPS), 2022: 10353-10366.

[28]	GIRSHICK R. Fast R-CNN[C]// 2015 IEEE International Conference on Computer Vision (ICCV). Piscataway, New Jersey, USA: IEEE, 2015: 1440-1448.

[29]	REN S Q, HE K M, GIRSHICK R, et al. Faster R-CNN: towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1137-1149.

[30]	LIN T Y, DOLLÁR P, GIRSHICK R, et al. Feature pyramid networks for object detection[C]// 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2017: 936-944.

[31]	LIU W, ANGUELOV D, ERHAN D, et al. SSD: single shot MultiBox detector[C]// Computer Vision – ECCV 2016. Cham, Germany: Springer, 2016: 21-37.

[32]	SUN C, AI Y B, WANG S, et al. Dense-RefineDet for traffic sign detection and classification[J]. Sensors, 2020, 20(22): 6570.

[33]	FU C Y, LIU W, RANGA A, et al. DSSD: deconvolutional single shot detector[EB/OL]. arXiv: 1701.06659, 2017.

[34]	LIN T Y, GOYAL P, GIRSHICK R, et al. Focal loss for dense object detection[C]// 2017 IEEE International Conference on Computer Vision (ICCV). Piscataway, New Jersey, USA: IEEE, 2017: 2999-3007.

[35]	GIRSHICK R, DONAHUE J, DARRELL T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]// 2014 IEEE Conference on Computer Vision and Pattern Recognition. Piscataway, New Jersey, USA: IEEE, 2014: 580-587.

[36]	LIAO S Y, WANG J B, YU R Y, et al. CNN for situations understanding based on sentiment analysis of twitter data[J]. Procedia Computer Science, 2017, 111: 376-381.

[37]	YEERJIANG A, WANG Z, HUANG X, et al. YOLOv1 to YOLOv10: A comprehensive review of YOLO variants and their application in medical image detection[J]. Journal of Artificial Intelligence Practice, 2024, 7(3): 112–122.

[38]	RABBANI ALIF MAL, HUSSAIN M. YOLOv1 to YOLOv10: a comprehensive review of YOLO variants and their application in the agricultural domain[EB/OL]. arXiv: 2406.10139, 2024.

[39]	HUSSAIN M. YOLO-v1 to YOLO-v8, the rise of YOLO and its complementary nature toward digital manufacturing and industrial defect detection[J]. Machines, 2023, 11(7): 677.

[40]	REDMON J, FARHADI A. YOLO9000: better, faster, stronger[C]// 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2017: 6517-6525.

[41]	FACHKHA C, DEBBABI M. Darknet as a source of cyber intelligence: survey, taxonomy, and characterization[J]. IEEE Communications Surveys & Tutorials, 2016, 18(2): 1197-1227.

[42]	REDMON J, FARHADI A, et al. YOLOv3: An incremental improvement[EB/OL]// arXiv:1804.02767v1, 2018.

[43]	BOCHKOVSKIY A, WANG C Y, LIAO H M. YOLOv4: Optimal speed and accuracy of object detection[EB/OL]. arXiv: 2004.10934, 2020.

[44]	WANG C Y, MARK LIAO H Y, WU Y H, et al. CSPNet: a new backbone that can enhance learning capability of CNN[C]// 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW). Piscataway, New Jersey, USA: IEEE, 2020: 1571-1580.

[45]	MA Z, LI M, WANG Y G. PAN: path integral based convolution for deep graph neural networks[EB/OL]. arXiv: 1904.10996, 2019.

[46]	DING X H, ZHANG X Y, MA N N, et al. RepVGG: Making VGG-style ConvNets great again[C]// 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2021: 13728-13737.

[47]	WANG C Y, BOCHKOVSKIY A, LIAO H M. YOLOv7: trainable bag-of-freebies sets new state-of-the-art for real-time object detectors[C]// 2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway, New Jersey, USA: IEEE, 2023: 7464-7475.

[48]	WANG C Y, YEH I H, LIAO H M. YOLOv9: Learning what you want to learn using programmable gradient information[EB/OL]. arXiv: 2402.13616, 2024.

[49]	CHEN H, CHEN K, DING G G, et al. YOLOv10: Real-time end-to-end object detection[C]// Advances in Neural Information Processing Systems 37. Vancouver, BC, Canada. Neural Information Processing Systems Foundation, Inc. (NeurIPS), 2024: 107984-108011.

[50]	TIAN Y J, YE Q X, DOERMANN D. YOLOv12: attention-centric real-time object detectors[EB/OL]. arXiv: 2502.12524, 2025.

[51]	LEI M Q, LI S Q, WU Y H, et al. YOLOv13: Real-time object detection with hypergraph-enhanced adaptive visual perception[EB/OL].: arXiv: 2506.17733, 2025.

[52]	CAI Z L, SUN C J, ZHANG H L, et al. Developing universal classification models for the detection of early decayed Citrus by structured-illumination reflectance imaging coupling with deep learning methods[J]. Postharvest Biology and Technology, 2024, 210: 112788.

[53]	FAN S X, LIANG X T, HUANG W Q, et al. Real-time defects detection for apple sorting using NIR cameras with pruning-based YOLOV4 network[J]. Computers and Electronics in Agriculture, 2022, 193: 106715.

[54]	LU Y Z, GONG M L, LI J, et al. Strawberry defect identification using deep learning infrared–visible image fusion[J]. Agronomy, 2023, 13(9): 2217.

[55]	HU W X, XIONG J T, LIANG J H, et al. A method of Citrus epidermis defects detection based on an improved YOLOv5[J]. Biosystems Engineering, 2023, 227: 19-35.

[56]	WANG D Y, ZHANG M, ZHU Q B, et al. Beyond human vision: highlighting and detecting inconspicuous defects in Citrus fruits using UV-fluorescence imaging and YOLO11[J]. Postharvest Biology and Technology, 2026, 235: 114190.

[57]	WANG L X, WANG Z S, ZHAO X Y, et al. Enhanced research on YOLOv12 detection of apple defects by integrating filter imaging and color space reconstruction[J]. Electronics, 2025, 14(21): 4259.

[58]	YUAN S Q, CAO Y, CHENG X. Research on strawberry quality grading based on object detection and stacking fusion model[J]. IEEE Access, 2023, 11: 137475-137484.

[59]	朱文铭. 基于深度学习的草莓缺陷检测算法研究[D]. 湛江: 广东海洋大学, 2023. ZHU W M. Research ON STRAWBERRY DEFECT DETECTION ALGORITHM BASED ON DEEP LEarning [D]. Zhanjiang: Guangdong Ocean University, 2023.

[60]	SHAN W, YUE Y R. Apple defect detection in complex environments[J]. Electronics, 2024, 13(23): 4844.

[61]	王会征, 李新龙, 薄萍, 等. 基于改进YOLOv8n的自然场景下苹果外观品质检测方法[J]. 农业工程学报, 2025, 41(11): 173-182. WANG H Z, LI X L, BO P, et al. Detecting apple appearance quality under natural scenes using improved YOLOv8n[J]. Transactions of the Chinese Society of Agricultural Engineering, 2025, 41(11): 173-182.

[62]	张嘉琪, 徐啟蕾. 基于NAM-YOLO网络的苹果缺陷检测算法[J]. 计算机与现代化, 2023(10): 53-58, 64. ZHANG J Q, XU Q L. Apple defect detection algorithm based on NAM-YOLO network[J]. Computer and Modernization, 2023(10): 53-58, 64.

[63]	WANG B Y, HUA J, XIA L M, et al. A defect detection method for Akidzuki pears based on computer vision and deep learning[J]. Postharvest Biology and Technology, 2024, 218: 113157.

[64]	陈峻生. 基于深度学习的梨缺陷检测与分级[D]. 福州: 福建农林大学, 2025. CHEN J S. Research on defect detection and grading of pears based on deep learning [D]. Fuzhou: Fujian Agriculture and Forestry University, 2025.

[65]	WANG L, YE R, CHEN Y Q, et al. YOLOv10-LGDA: An improved algorithm for defect detection in Citrus Fruits across diverse backgrounds[J]. Plants, 2025, 14(13): 1990.

[66]	LU J Q, CHEN W D, LAN Y B, et al. Design of Citrus peel defect and fruit morphology detection method based on machine vision[J]. Computers and Electronics in Agriculture, 2024, 219: 108721.

[67]	WANG S Y, LI Q J, YANG T, et al. LSD-YOLO: enhanced YOLOv8n algorithm for efficient detection of lemon surface diseases[J]. Plants, 2024, 13(15): 2069.

[68]	朱琦, 周德强, 盛卫锋, 等. 基于DSCS-YOLO的苹果表面缺陷检测方法[J]. 南京农业大学学报, 2024, 47(3): 592-601. ZHU Q, ZHOU D Q, SHENG W F, et al. Apple surface defect detection method based on DSCS-YOLO[J]. Journal of Nanjing Agricultural University, 2024, 47(3): 592-601.

[69]	徐江鹏, 王传安. 基于轻量化改进YOLO v7-Tiny算法的苹果检测与分类[J]. 江苏农业科学, 2024, 52(23): 221-229. XU J P, WANG C A. Detection and classification of apple based on lightweight improved YOLO v7-Tiny algorithm[J]. Jiangsu Agricultural Sciences, 2024, 52(23): 221-229.

[70]	孙国祥, 陈光宇, 汪小旵, 等. 基于三视角成像的苹果表面缺陷检测方法[J]. 农业工程学报, 2026, 42(3): 348-358. SUN G X, CHEN G Y, WANG X C, et al. Three-view imaging-based method for defect detection on apple surfaces[J]. Transactions of the Chinese Society of Agricultural Engineering, 2026, 42(3): 348-358.

[71]	霍新梅. 自然环境中李子果实成熟度与表面缺陷检测方法研究[D]. 合肥: 安徽农业大学, 2024. HUO X M. Research on maturity and surface defect detection method of plum fruit in natural environment [D]. Hefei: Anhui Agricultural University, 2024.

[72]	朱婷婷, 滕广, 张亚军, 等. 基于改进YOLOv11的番茄表面缺陷检测方法[J]. 农业机械学报, 2025, 56(6): 546-553. ZHU T T, TENG G, ZHANG Y J, et al. Improved YOLOv11 method for surface defect detection of tomato[J]. Transactions of the Chinese Society for Agricultural Machinery, 2025, 56(6): 546-553.

[73]	许川. 猕猴桃表面缺陷智能检测与分级方法研究[D]. 柳州: 广西科技大学, 2024. XU C. Research on intelligent detection and grading method for surface defects of kiwifruit [D]. Liuzhou: Guangxi University of Science and Technology, 2024.

[74]	刘鑫, 马本学, 李玉洁, 等. 基于改进YOLOv7-ByteTrack的干制哈密大枣缺陷检测与计数系统[J]. 农业工程学报, 2024, 40(3): 303-312. LIU X, MA B X, LI Y J, et al. Detecting and counting defects in dried Hami jujube using improved YOLOv7-ByteTrack[J]. Transactions of the Chinese Society of Agricultural Engineering, 2024, 40(3): 303-312.

[75]	史鹏涛, 田政伟, 李晓泽, 等. 基于改进YOLO v5s算法的红枣缺陷检测与分拣方法[J]. 江苏农业科学, 2025, 53(5): 83-88. SHI P T, TIAN Z W, LI X Z, et al. Defect detection and sorting method of jujube based on improved YOLO v5s algorithm[J]. Jiangsu Agricultural Sciences, 2025, 53(5): 83-88.

[76]	LI C Y, ZHANG S C, MA Z J. RF-YOLOv7: A model for the detection of poor-quality grapes in natural environments[J]. Agriculture, 2025, 15(4): 387.

[77]	刘敬宇, 裴悦琨, 常志远, 等. 基于改进YOLOX模型的樱桃缺陷及分级检测[J]. 食品与机械, 2023, 39(1): 139-145. LIU J Y, PEI Y K, CHANG Z Y, et al. Cherry defect and classification detection based on improved YOLOX model[J]. Food & Machinery, 2023, 39(1): 139-145.

[78]	LUAN F, FAN K L, XU X H, et al. Cherry-YOLO: enhanced real-time detection of Cherry ripeness and defects with optimised YOLOv8[J]. Computing, 2025, 107(10): 198.

[79]	李成轩, 赵春江, 张驰, 等. 基于AIC-YOLOv11n模型的砀山梨多表面缺陷检测方法[J]. 农业工程学报, 2025, 41(14): 320-328. LI C X, ZHAO C J, ZHANG C, et al. Multi-surface defect detection method for Dangshan pears based on AIC-YOLOv11n model[J]. Transactions of the Chinese Society of Agricultural Engineering, 2025, 41(14): 320-328.

[80]	XIE Y H, ZHONG X Y, ZHAN J L, et al. ECLPOD: An extremely compressed lightweight model for pear object detection in smart agriculture[J]. Agronomy, 2023, 13(7): 1891.

[81]	OLGUÍN-ROJAS J C, VASQUEZ J I, DE JESÚS LÓPEZ-CANTEÑS G, et al. A lightweight YOLO-based architecture for apple detection on embedded systems[J]. Agriculture, 2025, 15(8): 838.

[82]	鄢紫, 陈良艳, 刘卫华, 等. 基于YOLO-FFD的水果品种和新鲜度识别方法[J]. 食品与机械, 2024, 40(1): 115-121. YAN Z, CHEN L Y, LIU W H, et al. Fruit variety and freshness recognition method based on YOLO-FFD[J]. Food & Machinery, 2024, 40(1): 115-121.

[83]	聂衍文, 徐建. 基于YOLOv5s的移动端轻量化芒果果面缺陷检测应用设计[J]. 武汉轻工大学学报, 2022, 41(5): 89-95, 103. NIE Y W, XU J. Mobile terminal mango defect detection application design based on lightweight YOLOv5s[J]. Journal of Wuhan Polytechnic University, 2022, 41(5): 89-95, 103.

[84]	ZHOU Y, LI Z Y, XUE S, et al. Lightweight SCD-YOLOv5s: The detection of small defects on passion fruit with improved YOLOv5s[J]. Agriculture, 2025, 15(10): 1111.

[85]	LV L J, YILIHAMU Y, YE Y L. Apple surface defect detection based on lightweight improved YOLOv5s[C]// International Journal of Information and Communication Technology. New York, USA: ACM, 2024: 113-128.

[86]	LIANG X T, JIA X Y, HUANG W Q, et al. Real-time grading of defect apples using semantic segmentation combination with a pruned YOLO V4 network[J]. Foods, 2022, 11(19): 3150.

[87]	梁晓婷, 庞琦, 杨一, 等. 基于YOLOv4模型剪枝的番茄缺陷在线检测[J]. 农业工程学报, 2022, 38(6): 283-292. LIANG X T, PANG Q, YANG Y, et al. Online detection of tomato defects based on YOLOv4 model pruning[J]. Transactions of the Chinese Society of Agricultural Engineering, 2022, 38(6): 283-292.

[88]	LIANG Z H, ZHU T T, TENG G, et al. YOLO-RGDD: A novel method for the online detection of tomato surface defects[J]. Foods, 2025, 14(14): 2513.

[89]	方晨羽. 基于深度学习的果实采前识别与采后品质检测研究[D]. 杭州: 浙江科技大学, 2024. FANG C Y. Research on pre-harvest recognition and post-harvest quality detection of fruits based on deep learning [D]. Hangzhou: Zhejiang University of Science and Technology, 2024.

[90]	CHEN D J, LIN F, LU C H, et al. YOLOv8-MDN-Tiny: A lightweight model for multi-scale disease detection of postharvest golden passion fruit[J]. Postharvest Biology and Technology, 2025, 219: 113281.

[91]	张雷, 严昊, 贾永镒, 等. 采用改进YOLOv3-Tiny模型的轻量化莲蓬质量分级算法[J]. 农业工程学报, 2024, 40(23): 248-257. ZHANG L, YAN H, JIA Y Y, et al. Lightweight classification of Lotus seedpod quality using improved YOLOv3-Tiny model[J]. Transactions of the Chinese Society of Agricultural Engineering, 2024, 40(23): 248-257.

[92]	ZHANG J N, LI X T, LI J, et al. Rethinking mobile block for efficient attention-based models[C]// 2023 IEEE/CVF International Conference on Computer Vision (ICCV). Piscataway, New Jersey, USA: IEEE, 2023: 1389-1400.

[93]	梁秀满, 肖寒. 基于SDD-YOLO的轻量级带钢缺陷实时检测算法[J]. 中国测试, 2025, 51(3): 154-161. LIANG X M, XIAO H. Lightweight strip defect real-time detection algorithm based on SDD-YOLO[J]. China Measurement & Test, 2025, 51(3): 154-161.

[94]	YU Z P, HUANG H B, CHEN W J, et al. YOLO-FaceV2: : A scale and occlusion aware face detector[J]. Pattern Recognition, 2024, 155: 110714.

[95]	徐彦威, 李军, 董元方, 等. YOLO系列目标检测算法综述[J]. 计算机科学与探索, 2024, 18(9): 2221-2238. XU Y W, LI J, DONG Y F, et al. Survey of development of YOLO object detection algorithms[J]. Journal of Frontiers of Computer Science & Technology, 2024, 18(9): 2221-2238.

[96]	KIALA Z, ODINDI J, MUTANGA O. Determining the capability of the tree-based pipeline optimization tool (TPOT) in mapping Parthenium weed using multi-date Sentinel-2 image data[J]. Remote Sensing, 2022, 14(7): 1687.

[97]	SU W H. Advanced machine learning in point spectroscopy, RGB- and hyperspectral-imaging for automatic discriminations of crops and weeds: A review[J]. Smart Cities, 2020, 3(3): 767-792.

[98]	HUANG G, XU Z B, LIU L, et al. Evaluating and deploying Large Vision-Language Models for fruit quality assessment in smart agriculture systems[J]. Computers and Electronics in Agriculture, 2025, 238: 110806.

Options

文章导航

模态框（Modal）标题

摘要

本文引用格式

Abstract

0 引 言

1 目标检测

表1 基于深度学习的水果缺陷检测主要步骤

图1 基于深度学习的目标检测方法（2014-2026）

图2 基于YOLO的目标检测技术原理图

2 YOLO系列模型的发展历程

表2 YOLO各版本贡献

2.1 第一阶段YOLOv1-YOLOv3

2.2 第二阶段YOLOv4-YOLOv8

2.3 第三阶段YOLOv9-YOLO26

3 YOLO模型在水果缺陷检测中的应用

图3 部分水果常见表面缺陷图

3.1 内部与隐性缺陷的检测

表3 基于YOLO系列模型的水果内部与隐性缺陷检测相关研究成果

3.1.1 内部缺陷的跨模态感知

3.1.2 隐形缺陷与复杂背景下的检测

3.2 复杂表面形态下的缺陷检测

表4 基于YOLO系列模型的复杂表面环境下水果缺陷检测相关研究成果

3.2.1 相似特征的精准辨别

3.2.2 微小缺陷与复杂缺陷形态的捕捉

3.2.3 不规则缺陷与密集排列

3.3 模型轻量化与边缘部署

表5 基于YOLO系列算法的水果缺陷检测模型轻量化相关研究成果

3.3.1 轻量化架构设计

3.3.2 模型压缩与加速

3.3.3 训练过程优化

4 当前的主要挑战

5 总结与展望

5.1 研究总结

5.2 未来展望

5.2.1 公共数据集的构建

5.2.2 模型可解释性

5.2.3 人机协作策略机制

5.2.4 大模型与YOLO的结合

参考文献

0 引言

2.1　第一阶段YOLOv1-YOLOv3

2.2　第二阶段YOLOv4-YOLOv8

2.3　第三阶段YOLOv9-YOLO26

3.1　内部与隐性缺陷的检测

3.1.1　内部缺陷的跨模态感知

3.1.2　隐形缺陷与复杂背景下的检测

3.2　复杂表面形态下的缺陷检测

3.2.1　相似特征的精准辨别

3.2.2　微小缺陷与复杂缺陷形态的捕捉

3.2.3　不规则缺陷与密集排列

3.3　模型轻量化与边缘部署

3.3.1　轻量化架构设计

3.3.2　模型压缩与加速

3.3.3　训练过程优化

5.1　研究总结

5.2　未来展望

5.2.1　公共数据集的构建

5.2.2　模型可解释性

5.2.3　人机协作策略机制

5.2.4　大模型与YOLO的结合