Smart Agriculture ›› 2025, Vol. 7 ›› Issue (4): 174-186.doi: 10.12133/j.smartag.SA202504005
徐雯雯1,2, 余克健3, 戴泽旭1,2, 吴云志1,2(
)
收稿日期:2025-04-06
出版日期:2025-07-30
基金项目:作者简介:徐雯雯,硕士研究生,研究方向为计算机视觉。E-mail:wenwenxu@stu.ahau.edu.cn
通信作者:
XU Wenwen1,2, YU Kejian3, DAI Zexu1,2, WU Yunzhi1,2(
)
Received:2025-04-06
Online:2025-07-30
Foundation items:2024 Anhui Provincial Science and Technology Innovation Plan Project(202423k09020031); Special Fund for Anhui Characteristic Agriculture Industry Technology System(ahtsnycytx-12)
About author:XU Wenwen, E-mail: wenwenxu@stu.ahau.edu.cn
Corresponding author:摘要:
【目的/意义】 葡萄作为全球综合产值最大的经济作物之一,其产量估计在农业经济发展中具有重要的意义。然而,目前葡萄产量预测困难且成本高。为解决上述问题,本研究提出了一种基于迁移学习的多模态检测框架,旨在实现不同品种葡萄的检测和计数,从而为葡萄产量预测及果园智能化管理提供有效支持。 【方法】 该框架利用公开数据集的预训练模型进行特征提取,并通过特征增强模块提高葡萄图像和文本之间的跨模态融合效果。在跨模态查询选择阶段,该框架通过语言引导的查询选择策略,从葡萄图像中筛选查询,进而采用跨模态解码器输出相应的预测结果。 【结果和讨论】 与9个基线模型相比,该方法在检测和计数方面均展现出最优效果。具体而言,在交并比(Intersection Over Union, IoU)阈值为0.5的条件下,该模型在检测任务上达到了80.3%的平均精度均值(Mean Average Precision, mAP);在计数任务上实现了1.65的平均绝对误差(Mean Absolute Error, MAE),2.48的均方根误差(Root Mean Square Error, RMSE)。值得关注的是,该方法在识别不同目标大小的效果均表现较好,并且在不同环境条件下表现出良好的泛化能力和更快的收敛速度。 【结论】 本研究提出的葡萄检测与计数方法能够为精准农业提供强有力的技术支持。
中图分类号:
徐雯雯, 余克健, 戴泽旭, 吴云志. 基于迁移学习的多模态葡萄检测与计数方法[J]. 智慧农业(中英文), 2025, 7(4): 174-186.
XU Wenwen, YU Kejian, DAI Zexu, WU Yunzhi. A Transfer Learning-Based Multimodal Model for Grape Detection and Counting[J]. Smart Agriculture, 2025, 7(4): 174-186.
表3
葡萄检测研究不同模型目标检测实验的结果
| 模型 | mAP/% | mAP50/% | mAP75/% | mAR/% | epochs |
|---|---|---|---|---|---|
| YOLOv3 | 22.0 | 57.0 | 11.3 | 37.3 | 200 |
| DDQ | 27.7 | 45.5 | 28.6 | 66.7 | 70 |
| Grid R-CNN | 32.0 | 63.3 | 28.6 | 48.5 | 70 |
| AutoAssign | 6.50 | 21.2 | 1.50 | 26.2 | 170 |
| PISA | 29.7 | 60.0 | 25.6 | 44.2 | 100 |
| NAS-FPN | 39.8 | 77.6 | 36.2 | 52.8 | 80 |
| Faster R-CNN | 28.0 | 53.4 | 26.4 | 48.4 | 100 |
| Dynamic R-CNN | 23.0 | 48.9 | 19.7 | 40.3 | 80 |
| ATSS | 9.60 | 28.6 | 3.20 | 32.6 | 170 |
| Grounding DINO | 1.50 | 2.90 | 1.60 | 33.1 | — |
| GDCNet | 53.2 | 80.3 | 58.2 | 76.5 | 30 |
表4
葡萄检测研究中不同规模目标检测的结果 (%)
| 模型 | mAP_s | mAP_m | mAP_l | mAR_s | mAR_m | mAR_l |
|---|---|---|---|---|---|---|
| YOLOv3 | 35.7 | 15.6 | 18.3 | 35.6 | 27.0 | 41.8 |
| DDQ | 64.7 | 15.9 | 24.9 | 64.9 | 57.7 | 71.7 |
| Grid R-CNN | 47.0 | 26.6 | 28.8 | 46.9 | 36.2 | 54.6 |
| AutoAssign | 28.4 | 2.4 | 4.4 | 28.3 | 8.0 | 29.0 |
| PISA | 44.3 | 16.8 | 27.1 | 44.3 | 26.8 | 48.7 |
| NAS-FPN | 51.7 | 31.2 | 36.7 | 51.8 | 43.7 | 57.3 |
| Faster R-CNN | 47.0 | 21.7 | 24.6 | 46.9 | 36.5 | 54.7 |
| Dynamic R-CNN | 39.2 | 14.8 | 19.6 | 39.2 | 23.9 | 45.5 |
| ATSS | 34.2 | 7.4 | 6.2 | 34.0 | 16.6 | 35.1 |
| Grounding DINO | 36.2 | 5.60 | 0.90 | 36.0 | 12.9 | 34.6 |
| GDCNet | 74.2 | 45.9 | 43.8 | 74.7 | 75.4 | 83.5 |
| [1] |
|
| [2] |
|
| [3] |
|
| [4] |
|
| [5] |
|
| [6] |
|
| [7] |
|
| [8] |
|
| [9] |
|
| [10] |
|
| [11] |
张传栋, 高鹏, 亓璐, 等. 基于SAW-YOLO v8n的葡萄幼果轻量化检测方法[J]. 农业机械学报, 2024, 55(10): 286-294.
|
|
|
|
| [12] |
|
| [13] |
|
| [14] |
|
| [15] |
刘畅, 孙雨, 杨晶, 等. 基于3C-YOLOv8n和深度相机的葡萄识别与定位方法[J]. 智慧农业(中英文), 2024, 6(6): 121-131.
|
|
|
|
| [16] |
|
| [17] |
|
| [18] |
|
| [19] |
|
| [20] |
|
| [21] |
|
| [22] |
|
| [23] |
|
| [24] |
|
| [25] |
|
| [26] |
|
| [27] |
|
| [28] |
|
| [29] |
|
| [30] |
|
| [31] |
|
| [32] |
|
| [33] |
|
| [34] |
|
| [35] |
|
| [36] |
|
| [37] |
|
| [38] |
|
| [39] |
|
| [40] |
|
| [41] |
|
| [42] |
|
| [43] |
|
| [44] |
|
| [45] |
|
| [46] |
|
| [1] | 李澳强, 戴航宇, 郭亚. 基于双目视觉和改进YOLOv11-pose的河蟹水下原位质量估测方法[J]. 智慧农业(中英文), 2026, 8(1): 192-202. |
| [2] | 黄先果, 朱启兵, 黄敏. 基于时序多源信息融合的果蔬新鲜度在线检测系统[J]. 智慧农业(中英文), 2026, 8(1): 203-212. |
| [3] | 肖瑞宏, 谭立新, 王日凤, 宋敏, 胡程喜. 基于改进YOLOv11n的多尺度茶叶病害检测方法[J]. 智慧农业(中英文), 2026, 8(1): 62-71. |
| [4] | 高光甫, 王启磊, 宋丽雯, 冯海宽, 时雷, 杨浩, 刘杨, 岳继博. 基于CornYOLO的冠层内玉米果穗目标检测方法[J]. 智慧农业(中英文), 2026, 8(1): 167-177. |
| [5] | 叶鹏林, 闵超, 苟良杰, 王鹏程, 黄小鹏, 李鑫, 蒙玉平. 农作物病虫害自监督适应性多模态特征融合识别方法[J]. 智慧农业(中英文), 2026, 8(1): 72-84. |
| [6] | 姚晓通, 曲绍业. 基于改进YOLOv12s的辣椒叶片病虫害轻量化检测方法[J]. 智慧农业(中英文), 2026, 8(1): 1-14. |
| [7] | 肖德琴, 吕玉定, 黄一桂, 爨凯旋. 生猪智能检测技术研究进展与未来展望[J]. 智慧农业(中英文), 2026, 8(1): 86-103. |
| [8] | 赵峻, 聂志刚, 李广, 刘佳宇. 基于无人机低空近景图像的玉米螟虫害检测方法[J]. 智慧农业(中英文), 2025, 7(6): 111-123. |
| [9] | 曹玉莹, 刘银川, 高新悦, 贾银江, 董守田. LightTassel-YOLO:一种基于无人机遥感的玉米雄穗实时检测方法[J]. 智慧农业(中英文), 2025, 7(6): 96-110. |
| [10] | 李汶政, 杨信廷, 孙传恒, 崔腾鹏, 王慧, 李珊珊, 李文勇. 联合空间深度转换卷积与多尺度注意力机制的灯诱稻飞虱害虫检测方法[J]. 智慧农业(中英文), 2025, 7(5): 169-181. |
| [11] | 王风云, 王轩宇, 安磊, 封文杰. 基于改进RT-DETR的菌棒栽培香菇检测方法[J]. 智慧农业(中英文), 2025, 7(5): 67-77. |
| [12] | 党珊珊, 乔世成, 白明宇, 张明月, 赵晨雨, 潘春宇, 王国忱. 基于DCC-YOLOv10n的玉米叶片病害小目标检测方法[J]. 智慧农业(中英文), 2025, 7(5): 124-135. |
| [13] | 李飞, 王自强, 武晶, 辛霞, 李春梅, 徐虎博. 基于半监督深度卷积生成对抗网络的不平衡自然老化大豆种质活力高光谱检测[J]. 智慧农业(中英文), 2025, 7(5): 101-113. |
| [14] | 罗学论, GOUDA Mostafa, 宋馨蓓, 胡妍, 张文凯, 何勇, 张瑾, 李晓丽. 基于YOLO与扩散模型的冠层环境灰茶尺蠖幼虫检测方法[J]. 智慧农业(中英文), 2025, 7(5): 156-168. |
| [15] | 刘祎恒, 刘立波. 基于改进YOLOv12的遮挡环境下肉牛目标检测方法[J]. 智慧农业(中英文), 2025, 7(5): 182-192. |
| 阅读次数 | ||||||
|
全文 |
|
|||||
|
摘要 |
|
|||||