Smart Agriculture ›› 2025, Vol. 7 ›› Issue (4): 174-186.doi: 10.12133/j.smartag.SA202504005
• 信息处理与决策 • 上一篇
徐雯雯1,2, 余克健3, 戴泽旭1,2, 吴云志1,2(
)
收稿日期:2025-04-06
出版日期:2025-07-30
基金项目:作者简介:徐雯雯,硕士研究生,研究方向为计算机视觉。E-mail:wenwenxu@stu.ahau.edu.cn
通信作者:
XU Wenwen1,2, YU Kejian3, DAI Zexu1,2, WU Yunzhi1,2(
)
Received:2025-04-06
Online:2025-07-30
Foundation items:2024 Anhui Provincial Science and Technology Innovation Plan Project(202423k09020031); Special Fund for Anhui Characteristic Agriculture Industry Technology System(ahtsnycytx-12)
About author:XU Wenwen, E-mail: wenwenxu@stu.ahau.edu.cn
Corresponding author:摘要:
【目的/意义】 葡萄作为全球综合产值最大的经济作物之一,其产量估计在农业经济发展中具有重要的意义。然而,目前葡萄产量预测困难且成本高。为解决上述问题,本研究提出了一种基于迁移学习的多模态检测框架,旨在实现不同品种葡萄的检测和计数,从而为葡萄产量预测及果园智能化管理提供有效支持。 【方法】 该框架利用公开数据集的预训练模型进行特征提取,并通过特征增强模块提高葡萄图像和文本之间的跨模态融合效果。在跨模态查询选择阶段,该框架通过语言引导的查询选择策略,从葡萄图像中筛选查询,进而采用跨模态解码器输出相应的预测结果。 【结果和讨论】 与9个基线模型相比,该方法在检测和计数方面均展现出最优效果。具体而言,在交并比(Intersection Over Union, IoU)阈值为0.5的条件下,该模型在检测任务上达到了80.3%的平均精度均值(Mean Average Precision, mAP);在计数任务上实现了1.65的平均绝对误差(Mean Absolute Error, MAE),2.48的均方根误差(Root Mean Square Error, RMSE)。值得关注的是,该方法在识别不同目标大小的效果均表现较好,并且在不同环境条件下表现出良好的泛化能力和更快的收敛速度。 【结论】 本研究提出的葡萄检测与计数方法能够为精准农业提供强有力的技术支持。
中图分类号:
徐雯雯, 余克健, 戴泽旭, 吴云志. 基于迁移学习的多模态葡萄检测与计数方法[J]. 智慧农业(中英文), 2025, 7(4): 174-186.
XU Wenwen, YU Kejian, DAI Zexu, WU Yunzhi. A Transfer Learning-Based Multimodal Model for Grape Detection and Counting[J]. Smart Agriculture, 2025, 7(4): 174-186.
表3
葡萄检测研究不同模型目标检测实验的结果
| 模型 | mAP/% | mAP50/% | mAP75/% | mAR/% | epochs |
|---|---|---|---|---|---|
| YOLOv3 | 22.0 | 57.0 | 11.3 | 37.3 | 200 |
| DDQ | 27.7 | 45.5 | 28.6 | 66.7 | 70 |
| Grid R-CNN | 32.0 | 63.3 | 28.6 | 48.5 | 70 |
| AutoAssign | 6.50 | 21.2 | 1.50 | 26.2 | 170 |
| PISA | 29.7 | 60.0 | 25.6 | 44.2 | 100 |
| NAS-FPN | 39.8 | 77.6 | 36.2 | 52.8 | 80 |
| Faster R-CNN | 28.0 | 53.4 | 26.4 | 48.4 | 100 |
| Dynamic R-CNN | 23.0 | 48.9 | 19.7 | 40.3 | 80 |
| ATSS | 9.60 | 28.6 | 3.20 | 32.6 | 170 |
| Grounding DINO | 1.50 | 2.90 | 1.60 | 33.1 | — |
| GDCNet | 53.2 | 80.3 | 58.2 | 76.5 | 30 |
表4
葡萄检测研究中不同规模目标检测的结果 (%)
| 模型 | mAP_s | mAP_m | mAP_l | mAR_s | mAR_m | mAR_l |
|---|---|---|---|---|---|---|
| YOLOv3 | 35.7 | 15.6 | 18.3 | 35.6 | 27.0 | 41.8 |
| DDQ | 64.7 | 15.9 | 24.9 | 64.9 | 57.7 | 71.7 |
| Grid R-CNN | 47.0 | 26.6 | 28.8 | 46.9 | 36.2 | 54.6 |
| AutoAssign | 28.4 | 2.4 | 4.4 | 28.3 | 8.0 | 29.0 |
| PISA | 44.3 | 16.8 | 27.1 | 44.3 | 26.8 | 48.7 |
| NAS-FPN | 51.7 | 31.2 | 36.7 | 51.8 | 43.7 | 57.3 |
| Faster R-CNN | 47.0 | 21.7 | 24.6 | 46.9 | 36.5 | 54.7 |
| Dynamic R-CNN | 39.2 | 14.8 | 19.6 | 39.2 | 23.9 | 45.5 |
| ATSS | 34.2 | 7.4 | 6.2 | 34.0 | 16.6 | 35.1 |
| Grounding DINO | 36.2 | 5.60 | 0.90 | 36.0 | 12.9 | 34.6 |
| GDCNet | 74.2 | 45.9 | 43.8 | 74.7 | 75.4 | 83.5 |
| [1] |
|
| [2] |
|
| [3] |
|
| [4] |
|
| [5] |
|
| [6] |
|
| [7] |
|
| [8] |
|
| [9] |
|
| [10] |
|
| [11] |
张传栋, 高鹏, 亓璐, 等. 基于SAW-YOLO v8n的葡萄幼果轻量化检测方法[J]. 农业机械学报, 2024, 55(10): 286-294.
|
|
|
|
| [12] |
|
| [13] |
|
| [14] |
|
| [15] |
刘畅, 孙雨, 杨晶, 等. 基于3C-YOLOv8n和深度相机的葡萄识别与定位方法[J]. 智慧农业(中英文), 2024, 6(6): 121-131.
|
|
|
|
| [16] |
|
| [17] |
|
| [18] |
|
| [19] |
|
| [20] |
|
| [21] |
|
| [22] |
|
| [23] |
|
| [24] |
|
| [25] |
|
| [26] |
|
| [27] |
|
| [28] |
|
| [29] |
|
| [30] |
|
| [31] |
|
| [32] |
|
| [33] |
|
| [34] |
|
| [35] |
|
| [36] |
|
| [37] |
|
| [38] |
|
| [39] |
|
| [40] |
|
| [41] |
|
| [42] |
|
| [43] |
|
| [44] |
|
| [45] |
|
| [46] |
|
| [1] | 白珏坤, 陈怀勐, 董大明, 刘亚超, 岳晓龙, 杜秀可. 光谱技术在蔬菜生产检测中的研究进展、挑战与建议[J]. 智慧农业(中英文), 2025, 7(4): 1-17. |
| [2] | 刘洁, 赵康, 赵钦君, 宋烨. 基于D-S证据理论的苹果霉心病声振检测方法[J]. 智慧农业(中英文), 2025, 7(4): 119-131. |
| [3] | 常戬, 王冰冰, 尹龙, 李燕青, 李兆歆, 李壮. 基于YOLOv10n-CHL的蜜蜂授粉轻量化识别模型[J]. 智慧农业(中英文), 2025, 7(3): 185-198. |
| [4] | 胡玲艳, 郭睿雅, 郭占俊, 徐国辉, 盖荣丽, 汪祖民, 张宇萌, 鞠博文, 聂晓宇. 融合PDE植物时序图像对比学习方法与GCN跳跃连接的U-Net温室甜樱桃图像分割方法[J]. 智慧农业(中英文), 2025, 7(3): 131-142. |
| [5] | 张乐, 李爱学, 陈立平. 电化学传感器应用于植物活性小分子检测综述[J]. 智慧农业(中英文), 2025, 7(3): 69-88. |
| [6] | 谢纪元, 张东彦, 牛圳, 程涛, 苑峰, 刘亚玲. 基于YOLOv10-MHSA的“三北”工程内蒙古地区植树位点精准检测研究[J]. 智慧农业(中英文), 2025, 7(3): 108-119. |
| [7] | 黎祖胜, 唐吉深, 匡迎春. 基于改进YOLOv10n的轻量化荔枝虫害小目标检测模型[J]. 智慧农业(中英文), 2025, 7(2): 146-159. |
| [8] | 牛子昂, 裘正军. 基于改进YOLOv11-Pose的玉米植株骨架及表型参数提取方法[J]. 智慧农业(中英文), 2025, 7(2): 95-105. |
| [9] | 杨晨雪, 李娴, 周清波. 知识图谱驱动下粮食生产大数据应用现状与展望[J]. 智慧农业(中英文), 2025, 7(2): 26-40. |
| [10] | 吴六爱, 许雪珂. 基于改进YOLOv10n的轻量化番茄叶片病虫害检测方法[J]. 智慧农业(中英文), 2025, 7(1): 146-155. |
| [11] | 杨信廷, 胡焕, 陈晓, 李汶政, 周子洁, 李文勇. 多源场景下粘虫板小目标害虫轻量化检测识别模型[J]. 智慧农业(中英文), 2025, 7(1): 111-123. |
| [12] | 金宁, 郭宇峰, 韩晓东, 缪祎晟, 吴华瑞. 基于迁移学习的农业短文本语义相似度计算方法[J]. 智慧农业(中英文), 2025, 7(1): 33-43. |
| [13] | 宫宇, 王玲, 赵荣强, 尤海波, 周沫, 刘劼. 基于多模态数据表型特征提取的番茄生长高度预测方法[J]. 智慧农业(中英文), 2025, 7(1): 97-110. |
| [14] | 吴华瑞, 赵春江, 李静晨. 基于多模态融合大模型架构Agri-QA Net的作物知识问答系统[J]. 智慧农业(中英文), 2025, 7(1): 1-10. |
| [15] | 李洪波, 田鑫, 阮志文, 刘少文, 任玮琪, 苏中滨, 高睿, 孔庆明. 基于改进YOLOv8的苗期玉米行检测方法[J]. 智慧农业(中英文), 2024, 6(6): 72-84. |
| 阅读次数 | ||||||
|
全文 |
|
|||||
|
摘要 |
|
|||||