[目的/意义] 为了提高葡萄采摘效率、做到葡萄采摘自动化,提出了3C-YOLOv8n目标检测模型,与RealSense D415深度相机结合,对葡萄进行识别和定位。 [方法] 首先对YOLOv8n主干网络进行改进,将卷积块注意力模块(Convolutional Block Attention Module, CBAM)与原本的网络结构融合,使模块全面捕获特征中的关键信息。再嵌入坐标注意力(Coordinate Attention, CA),既可以对一个通道的特征进行全面捕获,又可以对不同方向的特征进行敏锐感知。然后,在YOLOv8n颈部将最近邻插值上采样算法替换为内容感知特征重组算法(Content-aware ReAssembly of Features, CARAFE),弥补YOLOv8n的原始上采样模块没有利用特征图语义信息的缺点,增大了感受野。最后转换相机坐标系,将目标葡萄的二维平面坐标和距离深度相机的垂直距离结合,得到目标葡萄的世界坐标,实现葡萄的识别和定位。 [结果和讨论] 经过对比试验和消融试验,3C-YOLOv8n模型在并交比为0.5(IOU=0.5)的平均精度均值(Mean Average Precision, mAP)达到94.3%,高于YOLOv8n模型1%,准确率(Precision, P)和召回率(Recall, R)分别为91.6%和86.4%,3种改进策略的结合使损失初始值降低,曲线收敛更快。与其他主流YOLO系列算法对比,3C-YOLOv8n各个评价指标都有所提升,且漏检率、错检率为所有算法中最低,在实际检测中具有很大的优势。 [结论] 基于3C-YOLOv8n网络模型和RealSense D415深度相机,对葡萄进行精准识别和定位,为采摘自动化提供了技术手段。