• •
收稿日期:2025-10-11
出版日期:2026-01-23
基金项目:作者简介:巫晨旭,硕士研究生,研究方向为时空大数据。E-mail:15589720597@163.com
通信作者:
WU Chenxu, ZUO Haolong, LI Gang(
)
Received:2025-10-11
Online:2026-01-23
Foundation items:Heilongjiang Province Double First-Class Discipline Coordinated Innovation Achievement Project(LJGXCG2025-P18)
About author:WU Chenxu, E-mail: 15589720597@163.com
Corresponding author:摘要:
【目的/意义】 本研究旨在突破传统光学遥感在云遮天气与耕地破碎地形下的局限性,通过构建一种具备优秀跨模态融合能力与泛化性能的深度网络模型来提升农业遥感分类精度。 【方法】 本研究提出一种基于注意力机制的3D卷积神经网络(3D Convolutional Neural Network Based on Attention Mechanism, Attention-3DCNN)模型:其通过3D卷积+2D卷积结构处理时序Sentinel-2多光谱影像,在空间与时间维度上提取丰富特征;同时以深度可分离卷积形式处理 来自于哨兵一号(Sentinel-1)的合成孔径雷达(Synthetic Aperture Radar, SAR)数据,实现对全天候可获取信息的高效抽取;进一步,模型引入“通道-时间-空间”三重注意力机制与残差连接策略,对两个模态的特征进行动态加权与深度融合,使得在光学数据缺失或遮挡严重的情形下,SAR数据能够有效补偿并维持分类性能。 【结果和讨论】 为全面评价模型性能,选取法国全景农业卫星时序数据集,以及山东沂水县实测数据集进行对比实验:在法国数据上模型达成97.5%的整体准确率,在沂水县数据上获得93%的准确率,均显著优于对照基线模型;同时,通过对注意力分布的可视化分析可见,模型聚焦的关键物候期与当地农业实地记录高度一致,其高权重光谱波段亦符合农学机理,这体现出模型在判别机制层面的可解释性。 【结论】 综上,Attention-3DCNN模型 在耕地破碎、云遮影响严重的山区条件下显著提升了作物分类精度,具有良好的推广前景与应用价值。
中图分类号:
巫晨旭, 左浩龙, 李刚. 基于跨模态注意力机制的多源遥感农作物分类研究[J]. 智慧农业(中英文), doi: 10.12133/j.smartag.SA202510010.
WU Chenxu, ZUO Haolong, LI Gang. Multi-Source Remote Sensing Crop Classification Via Cross-Modal Attention[J]. Smart Agriculture, doi: 10.12133/j.smartag.SA202510010.
表3
Attention-3DCNN模型与其他模型在不同数据集上的表现
| 模型名称 | OA(PASTIS)/% | 宏平均F 1分数(PASTIS) | Kappa(PASTIS) | OA(沂水县)/% | 宏平均F 1分数(沂水县) | Kappa(沂水县) |
|---|---|---|---|---|---|---|
| 标准3D-CNN | 94.2 | 0.932 | 0.915 | 87.2 | 0.845 | 0.822 |
| 光学-SAR简单融合模型 | 95.3 | 0.945 | 0.928 | 89.5 | 0.876 | 0.858 |
| 仅SAR 3D-CNN模型 | 91.6 | 0.902 | 0.889 | 88.3 | 0.861 | 0.842 |
| 注意力双分支融合模型 | 95.1 | 0.938 | 0.935 | 89.9 | 0.882 | 0.870 |
| 通道注意力双分支融合模型 | 96.5 | 0.953 | 0.942 | 90.0 | 0.898 | 0.890 |
| 时间注意力双分支融合模型 | 95.8 | 0.945 | 0.942 | 89.5 | 0.894 | 0.887 |
| 空间注意力双分支融合模型 | 96.9 | 0.959 | 0.956 | 91.0 | 0.906 | 0.900 |
| Attention-3DCNN | 97.5 | 0.970 | 0.965 | 93.0 | 0.920 | 0.910 |
表4
Attention-3DCNN模型与其他模型的对比
| 模型名称 | 核心方法简述 | OA(沂水县)/% | Kappa(沂水县) | 参数量/M | GFLOPs | 推理时间/(ms/景) |
|---|---|---|---|---|---|---|
| 3D-ConvSTAR | 3DCNN多源融合(固定权重) | 89.5 | 0.858 | 45.2 | 128.3 | 156 |
| Self-Attention 3D | 自注意力机制+3DCNN | 90.5 | 0.872 | 52.7 | 145.6 | 183 |
| UNet++ | 编码器-解码器结构,多尺度特征融合 | 88.0 | 0.835 | 68.9 | 212.4 | 245 |
| CNN-LSTM-DS | 光学影像时序+纹理特征融合 | 86.5 | 0.815 | 43.0 | 98.7 | 132 |
| TGF-Net | 基于Transformer与卷积(CNN)架构 | 90.5 | 0.900 | 105.3 | 285.1 | 312 |
| Attention-3DCNN | 跨模态三重注意力(通道-时间-空间) | 93.5 | 0.910 | 41.3 | 97.2 | 133 |
表5
在高云量的条件下Attention-3DCNN模型与其他模型在沂水县数据集的对比
| 模型名称 | 主要依赖信息 | OA/% | 宏平均F 1 | Kappa |
|---|---|---|---|---|
| 3D-ConvSTAR | 光学时序为主 | 83.6 | 0.802 | 0.775 |
| Self-Attention 3D | 光学 + 时序注意力 | 85.1 | 0.821 | 0.796 |
| UNet++ | 光学空间特征 | 82.4 | 0.789 | 0.761 |
| CNN-LSTM-DS | 光学时序 + 手工特征 | 81.9 | 0.781 | 0.754 |
| TGF-Net | Transformer + CNN融合 | 86.3 | 0.836 | 0.812 |
| Attention-3DCNN | 跨模态三重注意力(S2+S1) | 89.4 | 0.872 | 0.846 |
表7
地块破碎程度较高条件下Attention-3DCNN与其他模型在沂水县数据集的对比
| 模型名称 | 主要结构特点 | OA/% | 宏平均F 1 | Kappa |
|---|---|---|---|---|
| 3D-ConvSTAR | 3D 卷积,局部时空建模 | 84.9 | 0.816 | 0.792 |
| Self-Attention 3D | 3DCNN + 自注意力 | 86.2 | 0.829 | 0.806 |
| UNet++ | 编码器–解码器,多尺度跳连 | 83.5 | 0.801 | 0.776 |
| CNN-LSTM-DS | 空间 CNN+时序LSTM | 82.7 | 0.793 | 0.768 |
| TGF-Net | Transformer + CNN 融合 | 87.1 | 0.842 | 0.818 |
| Attention-3DCNN | 跨模态三重注意力 (含空间注意力) | 90.2 | 0.881 | 0.856 |
| [1] |
翟雪东, 韩文霆, 马伟童, 等. 基于改进AdvSemiSeg的半监督遥感影像作物制图方法[J]. 农业机械学报, 2024, 55(8): 196-204.
|
|
|
|
| [2] |
|
| [3] |
|
| [4] |
|
| [5] |
|
| [6] |
|
| [7] |
|
| [8] |
郭交, 王鹤颖, 项诗雨, 等. 基于多特征优化的PolSAR数据农作物精细分类方法[J]. 农业机械学报, 2024, 55(9): 275-285.
|
|
|
|
| [9] |
王佳玥, 蔡志文, 王文静, 等. 协同多源国产高分影像和面向对象方法的南方农作物遥感识别[J]. 中国农业科学, 2023, 56(13): 2474-2490.
|
|
|
|
| [10] |
林云浩, 王艳军, 李少春, 等. 一种耦合DeepLab与Transformer的农作物种植类型遥感精细分类方法[J]. 测绘学报, 2024, 53(2): 353-366.
|
|
|
|
| [11] |
张伟雄, 唐娉, 孟瑜, 等. 基于多尺度时空全局注意力的遥感影像时间序列农作物分类[J]. 遥感学报, 2024, 28(11): 2865-2877.
|
|
|
|
| [12] |
|
| [13] |
|
| [14] |
|
| [15] |
|
| [16] |
|
| [17] |
|
| [18] |
|
| [19] |
|
| [20] |
蔡玉林, 王兴路, 高洪振, 等. 融合3DCNN和Vision Transformer的多模态遥感数据树种分类方法[J]. 激光与光电子学进展, 2025, 62(20): 2028001.
|
|
|
|
| [21] |
李泽慧, 张琳, 山显英. 三维卷积神经网络方法改进及其应用综述[J]. 计算机工程与应用, 2025, 61(3): 48-61.
|
|
|
|
| [22] |
杨朋辉, 杨长青, 刘静, 等. 基于2D-3D卷积神经网络的情绪识别模型[J]. 燕山大学学报, 2025, 49(1): 66-73.
|
|
|
|
| [23] |
|
| [24] |
|
| [25] |
|
| [26] |
|
| [27] |
|
| [28] |
|
| [29] |
|
| [30] |
|
| [31] |
|
| [32] |
史洁宁, 吴田军, 黄启厅, 等. 耦合NDVI与纹理时序特征的地块作物遥感分类[J]. 南方农业学报, 2025, 56(1): 29-40.
|
|
|
|
| [33] |
|
| [34] |
|
| [1] | 蔡玉琴, 刘大铭, 徐琴, 李波洋, 刘博杰. 基于自适应Kalman滤波与GWO-LSTM-Attention的温室温湿度预测方法[J]. 智慧农业(中英文), 2026, 8(1): 148-155. |
| [2] | 胡雨萌, 关非凡, 谢东辰, 马萍, 余有本, 周杰, 聂炎明, 黄铝文. 基于增强型轻量U-Net3+的茶叶病害诊断方法[J]. 智慧农业(中英文), 2026, 8(1): 15-27. |
| [3] | 黄先果, 朱启兵, 黄敏. 基于时序多源信息融合的果蔬新鲜度在线检测系统[J]. 智慧农业(中英文), 2026, 8(1): 203-212. |
| [4] | 武张斌, 何宁, 吴延东, 郭新宇, 温维亮. 点云数据驱动的玉米叶片生物量估算方法[J]. 智慧农业(中英文), 2026, 8(1): 156-166. |
| [5] | 姚晓通, 曲绍业. 基于改进YOLOv12s的辣椒叶片病虫害轻量化检测方法[J]. 智慧农业(中英文), 2026, 8(1): 1-14. |
| [6] | 谢文豪, 张新, 董文, 郑逸榛, 程博, 涂文丽, 孙凤青. 基于Stacking集成学习的地块尺度农作物分布制图[J]. 智慧农业(中英文), 2025, 7(6): 196-209. |
| [7] | 卢怡行, 董文, 张新, 闫若一, 张玉加, 唐涛. 基于物理约束PROSAIL-cGAN的冬小麦LAI光谱样本增强与反演方法[J]. 智慧农业(中英文), 2025, 7(6): 149-160. |
| [8] | 王银辉, 赵安周, 李丹, 朱秀芳, 赵军, 王紫晴. 轻量可解释的大豆遥感识别模型构建与评估[J]. 智慧农业(中英文), 2025, 7(6): 136-148. |
| [9] | 龙禹桥, 孙晶, 温艳茹, 汪楚涯, 董秀春, 黄平, 吴文斌, 陈晋, 丁明忠. 南方丘陵山区耕地撂荒遥感监测综述[J]. 智慧农业(中英文), 2025, 7(6): 58-74. |
| [10] | 赵峻, 聂志刚, 李广, 刘佳宇. 基于无人机低空近景图像的玉米螟虫害检测方法[J]. 智慧农业(中英文), 2025, 7(6): 111-123. |
| [11] | 张运, 张露敏, 许广涛, 郝佳慧. 基于双分支与多尺度注意力机制的稻虾田遥感提取方法[J]. 智慧农业(中英文), 2025, 7(6): 185-195. |
| [12] | 孙荣, 高晗, 姜钰杰, 李翘楚, 吴昊宇, 吴尚蓉, 玉山, 许磊, 于亮亮, 张杰, 包玉海. 多极化合成孔径雷达作物覆盖下土壤湿度反演研究进展[J]. 智慧农业(中英文), 2025, 7(6): 75-95. |
| [13] | 宋明轩, 白波, 杨俊涛, 张宇涛, 李飒, 李振海, 万书波, 李国卫. 裸地不变量约束的花生株高无人机稳健估算方法[J]. 智慧农业(中英文), 2025, 7(6): 124-135. |
| [14] | 李汶政, 杨信廷, 孙传恒, 崔腾鹏, 王慧, 李珊珊, 李文勇. 联合空间深度转换卷积与多尺度注意力机制的灯诱稻飞虱害虫检测方法[J]. 智慧农业(中英文), 2025, 7(5): 169-181. |
| [15] | 韩文凯, 李涛, 冯青春, 陈立平. 面向复杂果园环境的改进YOLOv11n苹果轻量化实例分割算法[J]. 智慧农业(中英文), 2025, 7(5): 114-123. |
| 阅读次数 | ||||||
|
全文 |
|
|||||
|
摘要 |
|
|||||