欢迎您访问《智慧农业(中英文)》官方网站! English

基于CNN-LSTM-SA的玉米地上生物量估算

  • 王毅 1 ,
  • 薛蓉 1 ,
  • 韩文霆 , 2 ,
  • 邵国敏 3 ,
  • 侯艳巧 1 ,
  • 崔茜彤 1
展开
  • 1. 西安财经大学信息学院,陕西 西安 710100,中国
  • 2. 西北农林科技大学机械与电子工程学院,陕西杨凌 712100,中国
  • 3. 西安理工大学西北旱区生态水利国家重点实验室,陕西 西安 710048,中国
韩文霆,博士,研究员,农业水信息天空地一体化智能感知与精准灌溉技术及装备。E-mail:

王 毅,博士,讲师,研究方向为农情信息空天地一体化智能感知与精准作业技术。E-mail:

收稿日期: 2024-12-01

  网络出版日期: 2025-06-27

基金资助

陕西省自然科学基础研究计划项目(2022JQ-363)

陕西省社会科学基金项目(2021R022)

陕西省重点研发计划项目(S2024-YF-ZDCXL-ZDLNY-0158)

Estimation of Corn Aboveground Biomass Based on CNN-LSTM-SA

  • WANG Yi 1 ,
  • XUE Rong 1 ,
  • HAN Wenting , 2 ,
  • SHAO Guomin 3 ,
  • HOU Yanqiao 1 ,
  • CUI Xitong 1
Expand
  • 1. College of Information, Xi'an University of Finance and Economics, Xi'an 710100, China
  • 2. College of Mechanical and Electronic Engineering, Northwest A&F University, Yangling 712100, China
  • 3. State Key Laboratory of Eco-hydraulics in Northwest Arid Region of China, Xi'an University of Technology, Xi'an 710048, China
HAN Wenting, E-mail:

WANG Yi, E-mail:

Received date: 2024-12-01

  Online published: 2025-06-27

Supported by

Shaanxi Province Natural Science Basic Research Program(2022JQ-363)

Shaanxi Provincial Social Science Foundation Program(2021R022)

Shaanxi Provincial Key Research and Development Program(S2024-YF-ZDCXL-ZDLNY-0158)

Copyright

copyright©2025 by the authors

摘要

[目的/意义] 玉米地上生物量(Above Ground Biomass, AGB)反映了玉米的生长状况,但其形成受多种动态因素的影响,导致AGB在空间和时间上的变化较为复杂。因此,本研究引入卷积神经网络(Convolutional Neural Network, CNN)、长短期记忆网络(Long Short-Term Memory, LSTM)和自注意力机制(Self-Attention, SA)结合的模型架构,用于估算田间尺度的玉米AGB。 [方法] 首先,利用该架构构建CNN-LSTM-SA优化模型。分析影响因子与玉米AGB之间的皮尔逊相关系数,并通过递归特征消除法确定模型的最佳输入特征。其次,使用局部可解释模型无关解释方法对单个样本进行解释。最后,通过消融实验,探讨引入CNN和SA对CNN-LSTM-SA模型的影响,并与随机森林(Random Forest, RF)和支持向量机(Support Vector Machine, SVM)模型进行对比。 [结果和讨论] CNN-LSTM-SA模型的决定系数(R2)为0.92,均方根误差(Root Mean Square Error, RMSE)和平均绝对误差(Mean Absolute Error, MAE)为107.53 g/m2和55.19 g/m2,优于单一类型的LSTM模型、CNN-LSTM模型和LSTM-SA模型。同时,在各项指标上比RF模型和SVM模型效果更好。 [结论] 该模型从时空角度出发,提升了玉米AGB估算的准确性,具有可解释性。该研究为作物AGB的动态建模提供了思路与方法,具有一定参考价值。

本文引用格式

王毅 , 薛蓉 , 韩文霆 , 邵国敏 , 侯艳巧 , 崔茜彤 . 基于CNN-LSTM-SA的玉米地上生物量估算[J]. 智慧农业, 2025 : 1 -15 . DOI: 10.12133/j.smartag.SA202412004

Abstract

[Objective] Maize is one of the most widely cultivated staple crops worldwide, and its aboveground biomass (AGB) serves as a crucial indicator for evaluating crop growth status. Accurate estimation of maize AGB is vital for ensuring food security and enhancing agricultural productivity. However, maize AGB is influenced by a multitude of dynamic factors, exhibiting complex spatial and temporal variations that pose significant challenges to precise estimation. Although deep learning techniques have demonstrated strong capabilities in feature extraction and spatiotemporal modeling, their application in agricultural remote sensing still has significant potential for development and exploration. At present, most studies on maize AGB estimation rely primarily on single-source remote sensing data and conventional machine learning algorithms, which limits the accuracy and generalizability of the models. To overcome these limitations, this study develops a model architecture that integrates convolutional neural networks (CNN), Long short-term memory networks (LSTM), and a self-attention (SA) mechanism to estimate maize AGB at the field scale. [Methods] The experimental site was located in Zhaojun Town, Dalad Banner, Ordos City, Inner Mongolia Autonomous Region. The study utilized vegetation indices, crop parameters, and meteorological data that were collected under varying gradient water treatments in the experimental area. First, an optimized CNN-LSTM-SA model was constructed. The model employed two-dimensional convolutional layers to extract both spatial and temporal features, while utilizing max-pooling and dropout techniques to mitigate overfitting. The LSTM module was used to capture temporal dependencies in the data. Subsequently, the SA mechanism was introduced to compute global attention weights, enhancing the representation of critical time steps. Additionally, nonlinear activation functions were applied to mitigate multicollinearity among features. A fully connected layer was used to output the estimated AGB values. Second, the Pearson correlation coefficients between influencing factors and maize AGB were analyzed, and the importance of multi-source data was validated. recursive feature elimination (RFE) was used to select the optimal input features. The local interpretable model-agnostic explanations (LIME) method was employed to interpret individual samples. Finally, ablation experiments were conducted to assess the effects of incorporating CNN and SA into the model, with performance comparisons made against random forest (RF) and Support Vector Machine (SVM) models. [Results and Discussions] The correlation analysis revealed that crop parameters exhibited strong correlations with AGB (-0.66 ≤ r ≤ 0.79). Among the vegetation indices, the normalized difference red edge index (NDREI) demonstrated the highest correlation (r = 0.63). To address multicollinearity issues, the visible atmospherically resistant index (VARI), Soil Adjusted vegetation index (SAVI), and normalized difference red edge index (NDRE) were excluded from the analysis. The CNN-LSTM-SA model integrated crop parameters, vegetation indices, and meteorological data and initially achieved a coefficient of determination (R2) of 0.89, a root mean square error (RMSE) of 129.38 g/m2, and a mean absolute error (MAE) of 65.99 g/m2. When only vegetation indices and meteorological data were included, the model's performance declined, yielding an R2 of 0.83, an RMSE of 161.36 g/m2, and an MAE of 89.37 g/m2. Using a single vegetation index further reduced model accuracy. Based on multi-source data integration, RFE removed redundant features. After excluding the 2-meter average wind speed, the model reached its best performance with R2 of 0.92, RMSE of 107.53 g/m2, and MAE of 55.19 g/m2. Using the LIME method to interpret feature contributions for individual maize samples, the analysis revealed that during the rapid growth stage, the model was primarily influenced by the current growth status and vegetation indices. For samples in the mid-growth stage, multi-day crop physiological characteristics had a substantial impact on model predictions. In the late growth stage, higher vegetation index values showed a clear suppressive effect on the model outputs. During the mid-growth stage of maize under varying moisture conditions, the model consistently demonstrated heightened sensitivity to low temperatures, moderate humidity levels, and optimal vegetation indices. The CNN-LSTM-SA model demonstrated more consistent fitting performance across different growth stages and water conditions compared to the LSTM, LSTM-SA, and CNN-LSTM models. Its accuracy surpassed the standalone LSTM model, the CNN-LSTM model, and the LSTM-SA model. Additionally, it also exceeded the performance of the RF model and the SVM model in all evaluation metrics. [Conclusions] This study leveraged the feature extraction capabilities of CNN, the temporal modeling strength of LSTM, and the dynamic attention mechanism of the SA to enhance the accuracy of maize AGB estimation from a spatiotemporal perspective. The approach not only reduced estimation errors but also improved model interpretability. This research provided valuable insights and references for the dynamic modeling of crop AGB.

0 引 言

玉米作为一种广泛种植的全球重要粮食作物,其生长状况直接影响粮食安全和农业经济效益。同时,玉米植株的可利用率超过85%,整株都可作为饲料1。准确、高效估算区域作物地上生物量(Above Ground Biomass, AGB)对于农田管理和决策具有重要意义,如在有效施肥2, 3、水灌溉4, 5、病虫害防治6, 7等方面。作物AGB的形成受到其自身形态生理特征与气象环境等因素在整个生育期内的动态变化影响,进而导致AGB在时间和空间上呈现出高度复杂的变化特征。
时空数据具有时序性和空间相关性,传统的时间序列模型8和空间分析方法9,往往难以同时捕捉两者的复杂关系。近年来,卷积神经网络(Convolutional Neural Network, CNN)、递归神经网络(Recurrent Neural Network, RNN),长短期记忆网络(Long Short-Term Memory, LSTM)、门控循环单元等,逐渐被应用到时空估算模型中。Shi等10首次提出了一种结合CNN和LSTM的模型架构,通过结合CNN提取的空间特征与LSTM捕捉的时间依赖关系,有效构建了短时降水预测模型,该研究为后续基于深度学习的时空数据分析和估算提供了理论支持。研究者们进一步结合多尺度建模11、自适应学习机制12和注意力机制13等方法,提升了时空估算模型的精度与泛化能力。CNN与LSTM的结合及其优化模型在交通运输14、气候科学15和农业产量预测16等领域得到了广泛应用。Wang等17构建了一种嵌入CNN与LSTM 组合模型,能够捕捉不同干旱条件下植物的生长状态。
遥感技术是一种独特且实用的作物AGB监测方法,能够有效弥补传统AGB估算方法在耗时耗力和空间覆盖有限方面的不足,还能高效获取植被指数18。基于光学遥感数据的作物AGB估算方法有统计方法、过程模型法、机器学习方法等。与传统经验统计模型相比,机器学习模型可以简单、充分地考虑到AGB的外部影响因素,实现更高精度的反演。尤其是以深度学习为代表的人工智能数据挖掘技术,能够在多种生态要素之间建立起深层神经网络式的映射关系。许多先前的研究采用了回归树、随机森林(Random Forest, RF)、支持向量机(Support Vector Machine, SVM)、多元回归和关联规则挖掘等机器学习方法估算作物AGB。Sarker等19指出,基于复杂的数据技术和高性能计算,深度学习能够广泛应用于农业领域,为深度学习技术在农业数据处理中的应用提供了重要的理论基础。深度学习在作物AGB估算方面的应用展现出了巨大潜力。肖武等20通过结合22种不同的植被指数,运用反向传播神经网络(Backpropagation Neural Network, BP),对采煤沉陷区上方的玉米AGB进行了估算,结果表明,该模型的决定系数(R 2)和均方根误差(Root Mean Square Error, RMSE)分别为0.78和177.23 g/m²,证明了BP神经网络在估算AGB方面的有效性。Raya-Sereno等21研究发现高光谱数据结合人工神经网络能很大幅度地提升作物AGB的估算精度。Wang等22提出一种基于LSTM的RNN模型进行作物AGB估算,所提模型能够实现较高的AGB估算精度。Wei等23提出了一种新的深度神经网络CNN-LSTM,结果表明该模型在作物AGB上获得了最高的精度,比CNN和LSTM效果更好。目前对于作物AGB的研究大多使用单一类型的遥感数据,以及传统估算模型通常未能考虑天数及关键时间点对玉米AGB的影响。
本研究针对玉米AGB受时间与空间复杂生态因子共同影响而导致估算困难的问题,引入结合CNN、LSTM和自注意力机制(Self-Attention, SA)的模型架构。通过该架构构建CNN-LSTM-SA优化模型。分析影响因子与玉米AGB之间的皮尔逊相关系数(Pearson Correlation Coefficient, r),验证多源数据在玉米AGB估算中的重要性,并确定模型的最优输入组合。采用局部可解释模型无关解释方法(Local Interpretable Model-agnostic Explanations, LIME)分析单个样本的输入特征对玉米AGB估算的贡献。设计消融实验探讨CNN和SA模块对CNN-LSTM-SA模型的影响,并将该模型与RF和SVM进行比较,评估所建模型的有效性。

1 材料与方法

1.1 研究区域概况

实验区域位于内蒙古自治区鄂尔多斯市达拉特旗昭君镇(40°26'0.29″N,109°36'25.99″E)。该区域干旱少雨,冬寒夏热,昼夜温差大,年均日照时数约3 000 h,年均气温6.1~7.1 °C,无霜期135~150 d。该区域年均降水量240~360 mm,主要集中在7—9月份,属于典型温带大陆性半干旱季风气候。
夏玉米的种植时间为2019年5月10日,收获时间为2019年9月12日(青贮)。玉米的生育期(Day After Planting, DAP)为125 d,分为快速生长期、生长中期和成熟期。实验区是一个半径为60 m的圆形区域,划分为5个扇形区域(分别标记为T1、T2、T3、T4、T5),每个扇形区域设定6 m×6 m的3个地面数据采样区,每个采样区选取3个采样点(如图1所示)。
图1 2019年内蒙古自治区鄂尔多斯市达拉特旗昭君镇实验区域采样点

注:T1、T2、T3、T4和T5为实验地5个扇形区域标记。

Fig.1 Sampling sites in the experimental area of Zhaojun town, Dalad banner, Ordos city, Inner Mongolia Autonomous Region (2019)

该区域的土壤为砂壤土,耕层土壤有机质质量分数为47.15 g/kg,田间持水率为29%,土壤容重为1.56 g/cm3。玉米行距58 cm,株距25 cm,种植面积1.13 hm2。玉米生育期内自然降雨难以满足作物需水要求,主要的水分供给方式为喷灌,对实验地进行不同梯度水分处理。玉米不同生长阶段5个扇形区域的灌溉量与降雨量如表1所示。
表1 2019年实验区实际灌溉量与降雨量

Table 1 Actual irrigation and rainfall in the experimental area in 2019

水分处理区域 快速生长期(DAP: 30—73d) 生长中期(DAP: 74—104d) 生长后期(DAP: 105—125d)
灌溉量/mm 降雨量/mm 总量/mm 灌溉量/mm 降雨量/mm 总量/mm 灌溉量/mm 降雨量/mm 总量/mm
T1 56.0 19.6 75.6 68.3 94.2 162.5 12.0 0 12.0
T2 36.4 19.6 56.0 56.3 94.2 150.5 7.8 0 7.8
T3 22.4 19.6 42.0 64.6 94.2 158.8 9.6 0 9.6
T4 36.4 19.6 56.0 46.8 94.2 141.0 7.8 0 7.8
T5 22.4 19.6 42.0 51.3 94.2 145.5 4.8 0 4.8

1.2 数据获取

1.2.1 遥感数据获取

利用大疆精灵4 Pro无人机和自主研发的无人机多光谱图像采集系统,分别获取RGB图像和多光谱图像。两种无人机图像采集系统主要参数如表2所示。在晴朗无云的天气条件下,于11∶00—13∶00拍摄玉米冠层多光谱影像。由于无人机受到续航时间和复杂环境的限制,其飞行高度一般选取为100 m以下,且在周围基础设施高度之上,地面分辨率为5 cm,航向和旁向重叠度均为80%,每次航拍采用固定航线。相机捕获五个波段,蓝色、绿色、红色、近红外(Near-Infrared, NIR)和红边,其波段的中心波长分别为475、560、668、840和717 nm。
表2 无人机图像采集系统主要参数表

Table 2 Main parameters of UAV image acquisition system

无人机系统 主要参数 参数值
无人机可见光图像采集系统 重量/g 1388
飞行时间/min 30
通行半径/km 5
飞行速度/km/s <72
像素 5 472×3 648
焦距/mm 8.8/24
视场角/(°) 84
传感器 1英寸CMOS
RGB颜色空间 sRGB
ISO范围 100~12 800
快门速度/s 8~1/8 000
图像格式 JPEG、DNG
无人机多光谱图像采集系统 轴距/mm 900
起飞重量/kg 6
载重/kg 2
飞行时间/min 18
通信半径/km 3
飞行速度/(m/s) 5
搭载相机 MicaSense RedEdge-M
像素 1 280×960
数据格式 12位Raw
光谱波段 蓝、绿、红、近红外、红边
焦距/mm 9.6
视场角/(°) 47.2
实验对无人机图像进行几何校正、提高图像拼接精度及进行重采样。为了保持无人机多传感器图像的地理配准一致性,在无人机图像采集时,设置地面控制点(Ground Control Point, GCP)。地面布置采用已观测坐标(精度为1 cm)的几何控制板(长×宽:80 cm×80 cm)。地面控制点由黑白相间的木板组成。为防止自然因素(刮风等天气)造成位置发生变化,使用地钉将其固定。采用科力达公司生产的K5plus型高精度实时动态(Real-Time Kinematic, RTK)载波相位差分技术获取地面控制点坐标。RTK的通信选择外置悬挂电台收发模式,坐标系统为2000国家大地坐标系,投影模式为高斯投影,具体测量每个控制点中心的东坐标、北坐标及高程。

1.2.2 作物数据与气象数据获取

玉米的作物数据在无人机采集期间同时进行,具体采集时间如表3所示。包括叶面积指数(Leaf area Index, LAI)、株高(Height, H)、AGB、冠层温度(Canopy Temperature, Tc)。使用LAI-2200C(LI-COR, USA)冠层分析仪在各地面数据采样点处进行LAI测量,取不同采样区内测得LAI的平均值作为该区域的LAI。在采样区内各采样点处选取5棵玉米,每个采样区共选取15棵玉米,测量每株玉米高度,取不同采样区内测得H的平均值作为该区域的H。将所有植物样品加热至105 °C,保持30 min,然后在80 °C下烘烤至恒重,获得玉米AGB(g/m2)。利用雷泰(Raytek)ST60+手持红外测温仪进行冠层温度数据采集,采样区内各采样点重复3次测量,取不同采样区内测得Tc的平均值作为该区域的Tc。
表3 2019年玉米作物生长期数据采集日期

Table 3 Data collection date of the growth period of corn crops in 2019

日期(月/日) 7/1 7/11 7/12 7/20 7/26 7/31 8/7 8/12 8/14 8/21 8/25 8/27 8/31 9/4
DAP/d 52 62 63 71 77 82 89 94 96 103 107 109 113 117
气象数据从位于实验区旁的农业标准气象站获取(40°25'55.53"N,109°36'22.69"E)。农业标准气象站监测的气象数据包括空气湿度(Relative Humidity, RH)、太阳净辐射(Net Solar Radiation, Rn)和2 m处的风速(Wind Speed at 2 Meters, U2)。以上数据每30 min进行一次数据采集。一天内测量的所有值的平均值记作实验区的RH、Rn和U2。

1.3 玉米植被指数提取方法

植被指数具有广泛的空间覆盖、较长的时间序列以及数据一致性高的特点,因此在一定条件下,其能用来定量说明植被的生长状况24-26。依据先前的研究,本研究选取10种植被指数(见表4)。采用Pix4DMapper软件平台对RedEdge相机拍摄的多光谱影像进行几何校正、高斯均值滤波和拼接处理,生成正射影像图,并利用灰板和光照传感器对光谱影像进行反射率校正,生成反射率影像。采用 ENVI软件平台裁剪不同区域的反射率影像,并提取所选10种植被指数。计算时,灰板对多光谱相机各波段中心波长的平均反射率分别为蓝、绿、红、近红外波段的反射率。
表4 玉米AGB估算中使用的主要植被指数及其计算公式

Table 4 Formulas of major vegetation indices applied in maize AGB estimation

植被指数 公式
归一化差值植被指数(Normalized Difference Vegetation Index, NDVI )27 N D V I = ( R N I R - R R ) / ( R N I R + R R ) (1)
土壤调整植被指数(Soil Adjusted Vegetation Index, SAVI)28 S A V I = ( 1 + L ) × ( R N I R - R R ) / ( R N I R + R R + L ) (2)
增强型植被指数(Enhanced Vegetation Index, EVI)29 E V I = 2.5 × ( R N I R - R R ) / ( R N I R + 6 × R R - 7.5 × R B + 1 ) (3)
改进型叶绿素吸收植被指数(Transformed Chlorophyll Absorption In Reflectance Index,TCARI)30 T C A R I = 3 × ( R R E - R R ) - 0.2 × ( R R E - R G ) × ( R R E / R R ) (4)
绿度归一化植被指数(Green Normalized Difference Vegetation Index, GNDVI)31 G N D V I = ( R G - R R ) / ( R G + R R ) (5)
抗大气指数(Visualized Atmospheric Resistance Index, VARI)32 V A R I = ( R G - R R ) / ( R G + R R - R B ) (6)
比值植被指数(Simple Ratio, SR)33 S R = R N I R / R R (7)
归一化差异红边指数(Normalized Difference Red Edge Index, NDRE)34 N D R E = ( R N I R - R R E ) / ( R N I R + R R E ) (8)
标准化差值红边指数(Improved Normalized Difference Red Edge Index, NDERI)35 N D R E I = ( R R E - R G ) / ( R R E + R G ) (9)
改进的叶绿素吸收反射指数(Modified Chlorophyll Absorption in Reflectance Index, MCARI)36 M C A R I = ( R R E - R R ) - 0.2 × ( R R E - R G ) × ( R R E / R R ) (10)

注:RB、RG、RR、RNIR和RRE分别表示蓝色、绿色、红色、近红外和红边波段的反射率;L是本研究中等于0.5的土壤校准因子。

1.4 数据预处理与多区域影响因子时空差异分析

数据集包括作物数据、植被指数和气象数据,具体内容见表5。原始数据集共采集150个样本。在数据预处理阶段,原始数据通过去除噪声和缺失值,插值处理,确保数据的完整性和一致性。在数据融合过程中,植被指数、作物数据和气象数据按照时间和空间维度进行对齐,通过三次样条插值法37对数据进行扩充,确保数据的高质量和一致性。经过处理后,每个区域的时间序列样本数为67个。将不同区域数据进行编码处理,并在输入特征中加入区域编码。所有区域数据合并训练,并采用5折时间序列交叉验证方法8划分训练集和测试集(见表6)。
表5 玉米AGB估算中使用的多源数据特征参数

Table 5 Feature parameters of multi-source data used in maize AGB estimation

数据类型 特征参数
作物数据 H、LAI、Tc
植被指数 NDVI、SAVI、EVI、TCARI、GNDVI、VARI、SR、NDRE、NDREI、MCARI
气象数据 RH、Rn、U2
表6 玉米AGB估算研究中5折时间序列交叉验证在不同折数下的训练集与测试集划分

Table 6 Training-test set partitioning for 5-fold time-series cross-validation at different folds for maize AGB estimation study

折数 训练集样本范围 测试集样本范围
第一折 第1到第67个样本 第68到第100个样本
第二折 第1到第100个样本 第101到第134个样本
第三折 第1到第134个样本 第135到第167个样本
第四折 第1到第167个样本 第168到第200个样本
第五折 第1到第268个样本 第269到第335个样本
图2通过对多区域影响因子时间序列趋势的对比,以揭示影响因子在不同区域的时空差异。图中气象因子在整个时间序列中波动较大。此外,T1区域的 H、GNDVI、VARI、SR 和 MCARI 影响因子波动幅度明显高于其他区域。
图2 不同区域的玉米AGB影响因子的时间序列变化

Fig. 2 Time series variation of maize agb influence factors across different experimental plots

1.5 研究方法

1.5.1 CNN-LSTM-SA模型结构

注意力机制从本质上讲和人类的选择性注意力机制类似,核心目标是从众多信息中选出对当前任务目标更加关键的信息38。以往研究表明SA能够捕捉长期依赖关系,可以通过计算全局注意力权重强化关键时序特征的表达,能够适用于玉米AGB估算中的多时序信息建模。基于此,构建CNN-LSTM-SA优化模型,具体结构如图3所示。
图3 CNN-LSTM-SA模型结构

注:其中One-Hot是独热编码,Min-max scalar是归一化,Conv是卷积层,Max-pooling是最大池化层,Dropout是丢弃层,Full connect是全连接层,Estimates是输出层。

Fig.3 Structural Diagram of the CNN-LSTM-SA Model

该模型结构共有五个模块,分别为输入模块、特征提取模块、LSTM模块、注意力机制模块和输出模块。将不同区域的作物参数、植被指数、气象参数输入到该模型的输入模块中。考虑到不同区域人为干预的不同对不同区域进行编码(One-Hot)。然后将数据整合、归一化(Min-Max Scalar)后作为模型的输入模块。将输入模块预处理后的数据输入到特征提取模块,通过卷积层(Conv)提取相关的特征,通过卷积核加权局部序列生成特征矩阵。卷积层链接到一个最大池化层(Max-Pooling),降低提取特征的维度。利用二维CNN,在时空维度上提取和学习参数的空间和时间特征,特征提取过程如图4所示。
图4 特征提取模块的卷积与池化过程

注:F代表特征数,T代表时间步长。

Fig. 4 Convolution and Pooling process within the feature extraction module

考虑到小样本数据易引发过拟合的特点,通过在池化层后链接Dropout层,随机丢弃部分神经元,并借助多次迭代生成新的特征图并保持原始的时间序列顺序。
在LSTM模块中,输入门(如公式(11))决定新生成的特征图中哪些被添加到细胞状态中,遗忘门(如公式(12))决定保留或者遗忘哪些信息,输出门(如公式(13))根据当前的细胞状态形成新的特征向量。
i t = σ ( W i × [ h t - 1 , x t ] + b i )
f t = σ ( W f × [ h t - 1 , x t ] + b f )
o t = σ ( W o × [ h t - 1 , x t ] + b o )
式中: W为权重矩阵; b为偏置量; σ为激活函数; i t为输入门; f t为遗忘门; o t为输出门; h t - 1为前一时刻的隐藏状态; x t为当前时刻输入。
在注意力机制模块,将LSTM模块输出的 d维特征向量 X = x 1 , x 2 , . . . . . . , x n通过三组矩阵权重 W Q W K W V(如公式(14))变换为查询向量(Query,Q)、键向量(Key,K)和值向量(Value,V)。通过对 Q K V 进行线性变换和点积计算(如公式(15))获得注意力得分。
Q = X W Q K = X W K V = X W V
S c o r e s = Q K T
为了防止注意力得分过大,梯度变得过小,造成训练收敛缓慢。需要将注意力得分除以缩放因子 d k ,再通过 S o f t m a x层转换为向量权重(如公式(16))。使用向量权重对 V 进行加权求和,得到包含输入序列中最重要信息的上下文向量(如公式(17))。
A t t e n t i o n W e i g h t = S o f t m a x Q K T d k
Z = A t t e n t i o n W e i g h t × V
通过SA,在全局范围内动态分配不同输入元素的权重。鉴于SA本质上是一个线性操作,通过在自注意力机制之后添加隐藏层,引入非线性激活函数,以减少特征多重共线性的影响,增强模型的非线性表达能力,并对上下文向量进行进一步的特征提取和转换。
输出模块负责将处理后的特征向量转换为最终的估算结果。先通过Dropout层随机丢弃部分神经元,再连接全连接层(Full connect),使用修正线性单元(Rectified Linear Unit, ReLU)激活函数,将上下文向量转换为估算特征。最终,输出层生成目标变量的估算值。

1.5.2 模型参数设置

模型使用随机搜索算法39对超参数进行优化。模型参数如表7所示,损失函数采用均方误差(Mean Squared Error, MSE)和Adam优化器。
表7 CNN-LSTM-SA模型参数表

Table 7 Parameter configuration of the CNN-LSTM-SA model

CNN-LSTM-SA模型参数 参数值
LSTM单元数 16
Dense单元数 32
训练轮数 100
批次大小 32
激活函数 ReLU
Dropout率 0.2
损失函数 均方误差函数
优化器 Adam
为减小模型复杂度,设置LSTM单元数为16,Dense单元数为32,训练轮数为100,批次大小为32。为了防止LSTM网络的过拟合问题,模型引入了Dropout正则化技术40,设置Dropout率为0.2。Dropout通过随机“丢弃”神经元的部分输出(如公式(18)),使得它们在每一次前向传播和反向传播中不参与计算,从而迫使模型在训练过程中不会过度依赖某些特定神经元,以增强模型对特征的泛化能力和鲁棒性40
s ^ i = s i p     以概 p 保留 0      以概 1 - p 丢弃
式中: s ^ i是经过Dropout后的神经元输出; s i是原始神经元的输出; p是保留神经元的概率。

1.6 评价指标选取

本研究采用R 2、RMSE和平均绝对误差(Mean Absolute Error, MAE)作为模型评价指标。R²衡量的是模型估算值与实际值之间的拟合程度,能够反映模型的解释能力和准确性41。RMSE计算的是估算值与实际值之间差异的平方根,能有效反映模型误差的平均水平42。MAE则衡量的是估算值与实际值之间的平均绝对差异,进而能避免单个异常值对模型评估结果的过度影响43,如公式(19)~公式(21)所示。
R 2 = 1 - i = 1 n y i - y ^ i 2 i = 1 n y i - y ¯ i 2
R M S E = 1 n i = 1 n y i - y ^ i 2
M A E = 1 n i = 1 n y i - y ^ i
式中: y i是实际值; y ^ i是估算值; y ¯ i是实际值的均值; n是样本个数。

2 结果与分析

2.1 玉米AGB影响因子相关性分析与特征选择

玉米AGB影响因子的相关性分析结果如图5所示。其中r取值范围为(-1,1)。r接近1表示正相关,接近-1表示负相关,接近0表示无线性相关。结果表明,作物因子与玉米AGB相关性较高,其中Tc与玉米AGB呈负相关(r = -0.66)。在气象因子中,Rn与玉米AGB相关性最高(r = -0.62),U2与玉米AGB相关性最低(r =-0.01)。在植被指数中,NDREI和玉米AGB之间的线性相关性最高(r = 0.63),TCARI和玉米AGB之间的线性相关性最低(r = 0.28)。同时,TCARI 与其他植被指数的线性相关性相对较低,r范围为0.19(GNDVI)至0.53(SAVI)。一些植被指数之间的多重共线性较高(r > 0.90),如SAVI和NDVI(r = 0.94)、EVI(r = 0.92)、NDER(r = 0.92),VARI和GNDVI(r= 0.98),NDVI和NDER(r = 0.96)。为减少模型中的冗余信息并提升其稳定性,剔除部分冗余特征。NDVI广泛应用于植被监测中,能够有效反映植被状况,与玉米AGB 相关性较强(r = 0.60)。因此保留NDVI,剔除与其高度相关的SAVI和NDRE。GNDVI用于反映植物叶绿素含量及光合作用效率,而VARI主要用于减少土壤背景的影响,与AGB关系更为间接。GNDVI与玉米AGB相关性(r = 0.58)高于VARI(r = 0.54)。因此,保留 GNDVI,剔除VARI。
图5 玉米AGB估算中影响因子相关性分析

Fig. 5 Correlation analysis of factors influencing maize AGB estimation

为验证多源数据在CNN-LSTM-SA 模型用于玉米 AGB 估算中的重要性,在不同数据类型的组合下构建评估模型,模型的拟合效果如图6所示。结果表明,当输入数据源减少时,模型性能也相应降低,R 2分别为0.89、0.83和0.77,RMSE分别为129.38、161.36和188.95 g/m2,MAE分别为65.99、89.37和118.79 g/m2
图6 不同数据源组合下CNN-LSTM-SA模型估算玉米AGB的结果

Fig. 6 Estimation of maize AGB by CNN-LSTM-SA model with different data source combination

为确定模型的最终输入特征,采用递归特征消除法,逐步剔除与输出变量相关性较低的因子,直到剩余因子对模型性能的提升不再显著。结果如表8所示,在去除U2后,模型的R 2提升至0.92,RMSE和MAE分别减小到107.53和55.19 g/m2。继续依次去除RH、TCARI和EVI后,模型精度不断呈现下降趋势。最终确定模型的最佳输入参数为H、LAI、Tc、RH、Rn、EVI、GNDVI、NDVI、TCARI、SR、NDREI和MCARI。
表8 不同特征参数组合下CNN-LSTM-SA模型性能的评价指标对比

Table 8 Comparison of performance evaluation metrics of the CNN-LSTM-SA model with different feature parameter combinations

特征参数 R 2 RMSE/( g/m2 MAE/( g/m2
H,LAI,Tc,RH,Rn,U2,EVI,GNDVI,NDVI,TCARI,SR,NDREI,MCARI 0.89 129.38 65.99
H,LAI,Tc,RH,Rn,EVI,GNDVI,NDVI,TCARI,SR,NDREI,MCARI 0.92 107.53 55.19
H,LAI,Tc,Rn,EVI,GNDVI,NDVI,TCARI,SR,NDREI,MCARI 0.88 134.06 76.01
H,LAI,Tc,Rn,EVI,GNDVI,NDVI,SR,NDREI,MCARI 0.83 161.46 89.76
H,LAI,Tc,Rn,GNDVI,NDVI,SR,NDREI,MCARI 0.81 170.03 92.41

2.2 基于LIME的CNN-LSTM-SA模型特征贡献可解释性分析

在深度学习模型中,模型的“黑箱”特性使得结果难以解释,这会影响模型的可信度和可用性44。为提高模型解释性,本研究选取了7个样本,分别对应不同生长阶段和不同研究区域,包括T1区域第62d、82d和107d,以及T2、T3、T4、T5第82d的玉米样本,并使用LIME对单个样本进行分析,识别输入特征在估算过程中的贡献。
LIME通过在原始样本局部邻域内生成扰动样本,拟合线性模型,从而量化各输入特征对模型输出的局部贡献。其具体过程如下。
设原始时间序列特征为 x,则输入特征可以表示为公式(22)
x = { x t - 4 , x t - 3 , x t - 2 , x t - 1 , x t } R 5 × m
式中: x t - i表示估算点前第 i天的多源特征; m为单天特征数量。
记CNN-LSTM-SA模型的函数表示为公式(23)
L = f ( x ) , x R d
式中: d = 5 × m为整合后总特征维度; L表示对输入特征 x的估算输出值。
LIME方法通过在输入样本附近生成一系列扰动样本,并计算这些扰动样本在原模型中的估算输出,进一步拟合一个局部线性可解释模型,具体形式如公式(24)所示。
g ( x ' ) = w 0 + j = 1 d w j x j '
式中: x '表示扰动样本; w 0为偏置项; w j表示第 j个输入特征在该扰动样本上的局部权重,反映该特征对模型估算结果的正负贡献及贡献大小。
局部线性模型采用加权最小二乘法,对原模型在局部邻域内的估算输出进行拟合。通过最小化加权损失函数,求解最优的局部解释模型,目标函数如公式(25)所示。
a r g m i n g G i = 1 n π x ( x i ' ) ( f ( x i ' ) - g ( x i ' ) ) 2
式中: f ( x i ' )表示原模型在扰动样本 x i '上的估算输出; g ( x i ' )表示局部线性模型在扰动样本 x i '上的估算输出; π x ( x i ' )表示扰动样本 x i '相对于原始输入样本 x的局部权重; G是所有可能的线性模型的集合。
LIME对单个玉米样本特征贡献可解释分析结果如图7所示,每幅图展示了对CNN-LSTM-SA模型贡献最大的前15个特征。X轴代表特征对估算目标的贡献值,Y轴是各个特征和对应的阈值。绿色条代表该特征对估算结果的正向贡献,红色条则表示负向贡献。时间步(t0、t1、t2、t3、t4)分别对应估算点及其前4天的特征,其中t4为当天,t0至t3分别为前4至前1天。
图7 不同阶段不同区域玉米单样本特征贡献的可解释性分析

Fig.7 Interpretability analysis of single sample feature contributions of maize from different growth stages and experimental plots

结果显示,在T1第62天样本中(图7a),t0较高RH(RH > 0.73),以及较低EVI对估算值有正向促进作用,而t1和t2较高的Rn(Rn > 0.64)和较低的LAI(t1_LAI ≤ 0.30)则明显抑制了估算值的提高。在T1第82天样本中(图7b),连续多天较低的Tc(t0、t1和t2的Tc ≤ 0.25)与较高的H(t1、t2和t3的H > 0.73)显著提高了估算值,而当天较低RH(t0_RH ≤ 0.22)是主要的负向因素。在T1第107天样本中(图7c),连续多天较低的Tc(t0、t1、t2的Tc ≤ 0.2)和较高的H(t1、t2和t3的H > 0.73)显著提高了估算值,而多天较高的SR(t0、t1、t2的SR > 0.5)和高NDVI(t0_NDVI > 0.83)则对估算产生了明显负面作用。
T2第82d的样本中(图7d),较低的Tc(t2_Tc ≤ 0.25)和较高的NDVI(t1、t2的NDVI > 0.83)是主要的正向因素,过高的SR(t2_SR > 0.5)和MCARI(t2_MCARI > 0.59)则对估算值有抑制作用。T3第82d样本中(图7e),连续多天较低的Tc(t0、t1、t2的Tc ≤ 0.25)和较高的NDREI(t2_NDREI > 0.56)对估算值有显著的正面作用,而连续多天较高的H(t0、t1、t2、t3的0.28 < H ≤ 0.64)和当天较高的RH(t4_RH > 0.73)则产生了负面作用。T4第82d样本中(图7f),适中的Tc(0.25 < t2_Tc ≤ 0.43、0.25 < t3_Tc ≤ 0.43)与SR(0.11 < t2_SR ≤ 0.31、0.11 < t1_SR ≤ 0.31)促进了估算值的提升,而过高的Tc(0.43 < t1_Tc ≤ 0.71)与RH(t4_RH > 0.73)对模型估算产生负面影响。T5第82d样本中(图7g),适中的Tc(0.25 < Tc≤ 0.43)、偏高的RH(0.58 < t0_RH ≤ 0.73)和合理范围内的MCARI(0.12 < t0_RH ≤ 0.34)对估算值有正向作用,而连续多天偏低的H(t0、t1、t2的0.28 < H ≤ 0.64)和RH(0.22 < t0_RH ≤ 0.58)产生了抑制作用。

2.3 消融对比实验

为了评估CNN模块和SA模块在CNN-LSTM-SA模型中的性能贡献,本研究在相同特征和超参数设置下,设计了不同模块组合的消融实验。具体包括:仅采用LSTM模块的单一模型、在LSTM前引入CNN以提取局部特征的CNN-LSTM模型、在LSTM后引入SA以增强时序特征权重建模的LSTM-SA模型,以及同时结合CNN、LSTM与SA模块的完整CNN-LSTM-SA模型。
消融对比实验结果如表9所示,单一LSTM模型的R 2为0.79,RMSE和MAE分别为180.11和125.50 g/m2。相比之下,引入CNN模块后,CNN-LSTM模型的R²提升至0.87,RMSE降低至141.45 g/m2,MAE减少至82.25 g/m2。引入SA模块的LSTM-SA模型R²为0.82,RMSE最低,为102.68 g/m2,但MAE最大,为163.96 g/m2,虽然整体误差较小,但在部分样本上存在较大偏差。CNN、LSTM和SA组合后的CNN-LSTM-SA模型整体表现更均衡,R²达到0.92,RMSE和MAE分别为107.53和55.19 g/m2。结果表明,CNN与SA模块的引入有效提升了模型的拟合能力,并在一定程度上降低了估算误差。
表9 CNN-LSTM-SA模型的消融对比实验结果

Table 9 Ablation comparative results of the CNN-LSTM-SA model

模型 R 2 RMSE/(g/m2 MAE/(g/m2
LSTM 0.79 180.11 125.50
CNN-LSTM 0.87 141.45 82.25
LSTM-SA 0.82 105.68 163.96
CNN-LSTM-SA 0.92 107.53 55.19
在T1、T2、T3、T4和T5区域上,LSTM、CNN-LSTM、LSTM-SA和CNN-LSTM-SA模型对玉米AGB的估算值与实际值拟合情况,如图8所示。其中,LSTM模型的估算点分布较为分散,反映其估算精度较低。LSTM-SA模型降低了不同区域拟合偏差,提高了模型的稳定性。
图8 不同模块组合下模型估算玉米AGB结果

Fig.8 Estimation of maize AGB by models with multiple model combination

CNN-LSTM和CNN-LSTM-SA模型在0 < AGB< 600 g/m2的范围内,不同区域估算的点分布均较为集中,表明两者在较低玉米AGB条件下的估算精度较高。在600 < AGB < 1 000 g/m2范围内,不同区域间的拟合效果差异开始增大。CNN-LSTM模型在T5区域的估算点逐渐偏离理想线,与实际的玉米AGB产生较大偏差。而CNN-LSTM-SA模型更有效地捕捉了影响因子与玉米AGB之间的关系,从而显著降低了T5区域的拟合偏差。在1 000 g/m2<AGB范围内,CNN-LSTM模型未能捕捉到关键点信息,导致拟合偏差逐渐增大。CNN-LSTM-SA模型在各区域的估算效果得到改善。结果表明,结合了CNN和SA的CNN-LSTM-SA模型在不同区域和生长条件下具有更好的适应性,增强了模型的稳定性,提高了模型的估算精度。

2.4 CNN-LSTM-SA模型与传统机器学习模型的对比分析

通过对比CNN-LSTM-SA模型与RF和SVM模型在玉米AGB估算中的效果,评估所提模型的有效性。RF和SVM使用相同的数据集进行建模,均采用5折交叉验证和随机搜索算法。实验结果如图9所示。
图9 RF与SVM模型估算玉米AGB结果

Fig. 9 Estimation of maize AGB by RF and SVM models

结果表明,在玉米生长后期,RF和SVM对玉米AGB的拟合效果较差。CNN-LSTM-SA模型在R 2、RMSE和MAE方面均优于RF和SVM。SVM性能不如CNN-LSTM-SA和RF模型,其R 2为0.75,RMSE为187.78 g/m2,MAE为130.82 g/m2。尽管RF模型在处理高维和非线性特征参数时表现出良好的适应性(R 2=0.83),但其估算精度明显不及CNN-LSTM-SA模型。

3 讨论与结论

3.1 讨论

作物因子与AGB相关性较高,因为其直接反映了玉米生长的生物学特征,与光合作用和干物质积累密切相关45, 46。植被指数存在多重共线性,但在大范围实时监测中具有一定优势18。进一步分析发现,去除U2因子后,模型精度有所提升,表明U2的波动对作物AGB积累影响较小。
基于LIME方法对单个玉米样本进行解释分析发现,在T1区域快速生长期样本,主要受当前玉米生长状况、环境因素和植被指数多方面的影响。正向贡献主要来自RH和EVI;负向贡献则主要由高温、低湿度等不利因素引起,反映了不良环境条件对玉米初期生长的抑制效应47。生长中期和生长后期的样本表现出明显的滞后效应,前1至3天的气象数据及作物生理特征对当天的估算结果产生重要影响。这表明,随着玉米生长周期的推进,环境变化对玉米状态的即时调控作用逐渐增强48。在第107天样本中,高植被指数(如SR > 0.5、NDVI > 0.83)对AGB估算结果产生一定抑制作用,主要与玉米生长后期植被指数饱和现象有关。处于玉米生长中期T2、T3和T5区域的样本普遍表现出低温、适中湿度及合理植被指数水平对玉米AGB估算的正向促进作用;而T4区域样本对高温高湿的负向影响更为敏感。这反映出玉米在不同生育阶段对环境因子的响应机制存在差异,T4区域样本在后期阶段更容易受到不良环境叠加影响,体现了玉米生长过程与环境因子之间复杂且具有阶段性演变的交互作用机制。
结合CNN的空间特征提取能力与LSTM的时序建模能力,CNN-LSTM模型可捕捉玉米生长的复杂时空关系,提升AGB估算精度。此外,传统LSTM无法聚焦关键时间点,而SA机制通过动态分配注意力权重,增强了模型对关键时间点和特征的理解能力13。CNN-LSTM-SA模型有效组合了不同的模块,相比Wang等22提出的基于LSTM的RNN模型和Wei等23提出的CNN-LSTM模型,在作物AGB估算中展现出更高的精度。研究发现,在低AGB范围内,玉米处于生长初期或中期,主要受气象因素和生长参数的影响。玉米AGB变化幅度较小且非线性关系较弱,模型易于学习规律。在中后期,玉米进入快速生长期,受复杂非线性(如光合效率、养分吸收、土壤水分)因素影响,生长规律逐渐复杂。CNN-LSTM-SA模型通过挖掘区域特定模式,降低了估算误差。在高AGB阶段,玉米趋于成熟或接近生长极限,光合作用和养分利用饱和,AGB积累减缓,受到其他限制因素(如养分供给、环境胁迫等)的影响49。CNN-LSTM-SA模型能够聚焦于关键的时间点和影响因素,提高了玉米AGB估算的准确性。尽管CNN-LSTM-SA模型在实验中表现出较强的估算能力,但在超参数优化、模型可解释性等方面仍有改进的空间。未来可以尝试引入Shapley值50等解释性方法,探索Transformer和GRU等神经网络结构51, 52,进一步优化模型性能。

3.2 结论

本研究针对玉米AGB估算过程中,动态变化的影响因子和复杂的生态机制导致估算准确性较低的问题,使用了结合CNN、LSTM和SA的CNN-LSTM-SA模型。实验结果显示,CNN-LSTM-SA模型在处理玉米AGB的复杂时间序列和多维输入特征时,提升了模型的准确性,展现出优于单一LSTM模型、LSTM-SA模型及CNN-LSTM模型的适用性与拟合效果。与传统机器学习模型(RF、SVM)相比,CNN-LSTM-SA模型在处理非线性且动态变化的数据时,有效降低了玉米AGB估算的误差。此外,研究结果进一步表明了,多源数据与时空特征在玉米AGB估算中的重要性。总体而言,本研究为玉米AGB估算提供了一种能够有效处理时空特征的方法。

利益冲突声明

本研究不存在研究者以及与公开研究成果有关的利益冲突。

1
李娜. 玉米秸秆青贮饲料关键技术分析[J]. 农业科技与发展, 2022, 1(3): 137-139.

LI N. Key technologies for silage feed production from maize straw[J]. Agricultural Science and Technology and Development, 2022, 1(3): 137-139.

2
FARIAS G D, BREMM C, BREDEMEIER C, et al. Normalized Difference Vegetation Index (NDVI) for soybean biomass and nutrient uptake estimation in response to production systems and fertilization strategies[J]. Frontiers in sustainable food systems, 2023, 6: ID 959681.

3
MALTESE N E, MADDONNI G A, MELCHIORI R J M, et al. The allometric relationships between biomass and nitrogen of vegetative organs affect crop N status in maize at silking stage[J]. Field crops research, 2023, 294: ID 108861.

4
LI Z P, WAN S M, CHEN G D, et al. Effects of irrigation regime on soil hydrothermal microenvironment, cotton biomass, and yield under non-film drip irrigation system in cotton fields in southern Xinjiang, China[J]. Industrial crops and products, 2023, 198: ID 116738.

5
LI H T, SHAO L W, LIU X W, et al. What matters more, biomass accumulation or allocation, in yield and water productivity improvement for winter wheat during the past two decades [J]. European journal of agronomy, 2023, 149: ID 126910.

6
ABRAHA T, BASIR FAL, OBSU L L, et al. Pest control using farming awareness: Impact of time delays and optimal use of biopesticides[J]. Chaos, solitons & fractals, 2021, 146: ID 110869.

7
HAN P, LAVOIR A V, RODRIGUEZ-SAONA C, et al. Bottom-up forces in agroecosystems and their potential impact on arthropod pest management[J]. Annual review of entomology, 2022, 67: 239-259.

8
HYNDMAN R J. Forecasting: principles and practice[M]. Melbourne: OTexts, 2018.

9
OSHAN T M. The spatial structure debate in spatial interaction modeling: 50 years on[J]. Progress in human geography, 2021, 45(5): 925-950.

10
SHI X J, CHEN Z R, WANG H, et al. Convolutional LSTM network: A machine learning approach for precipitation nowcasting[J]. Advances in neural information processing systems, 2015, 802-810.

11
ZHOU H Y, ZHANG S H, PENG J Q, et al. Informer: Beyond efficient transformer for long sequence time-series forecasting[EB/OL]. arXiv: 2012.07436, 2020.

12
ANDRYCHOWICZ M, DENIL M, COLMENAREJO S G, et al. Learning to learn by gradient descent by gradient descent[J]. Advances in neural information processing systems, 2016: 3988-3996.

13
VASWANI A. Attention is all you need[C]// 31st Conference on Neural Information Processing Systems (NIPS 2017). Red Hook, NY, USA: Curran Associates Inc, 2017.

14
TA X X, LIU Z H, HU X, et al. Adaptive spatio-temporal graph neural network for traffic forecasting[J]. Knowledge-based systems, 2022, 242: ID 108199.

15
CHEN G, CHEN S, LI D, et al. A hybrid deep learning air pollution prediction approach based on neighborhood selection and spatio-temporal attention[J]. Scientific reports, 2025, 15(1): ID 3685.

16
PADMAVATHI B, BHAGYALAKSHMI A, VISHNUPRIYA G, et al. IoT-based prediction and classification framework for smart farming using adaptive multi-scale deep networks[J]. Expert systems with applications, 2024, 254: ID 124318.

17
WANG L, ZHANG H C, BIAN L M, et al. Poplar seedling varieties and drought stress classification based on multi-source, time-series data and deep learning[J]. Industrial crops and products, 2024, 218: ID 118905.

18
WU B F, ZHANG M, ZENG H W, et al. Challenges and opportunities in remote sensing-based crop monitoring: A reviewOpen Access[J]. National science review, 2023, 10(4): ID nwac290.

19
SARKER I H. Deep learning: A comprehensive overview on techniques, taxonomy, applications and research directions[J]. SN computer science, 2021, 2(6): ID 420.

20
肖武, 陈佳乐, 笪宏志, 等. 基于无人机影像的采煤沉陷区玉米生物量反演与分析[J]. 农业机械学报, 2018, 49(8): 169-180.

XIAO W, CHEN J L, DA H Z, et al. Inversion and analysis of maize biomass in coal mining subsidence area based on UAV images[J]. Transactions of the Chinese society for agricultural machinery, 2018, 49(8): 169-180.

21
RAYA-SERENO M D, ORTIZ-MONASTERIO J I, ALONSO-AYUSO M, et al. High-resolution airborne hyperspectral imagery for assessing yield, biomass, grain N concentration, and N output in spring wheat[J]. Remote sensing, 2021, 13(7): ID 1373.

22
WANG T J, CRAWFORD M M, TUINSTRA M R. A novel transfer learning framework for sorghum biomass prediction using UAV-based remote sensing data and genetic markers[J]. Frontiers in plant science, 2023, 14: ID 1138479.

23
WEI L L, YANG H S, NIU Y X, et al. Wheat biomass, yield, and straw-grain ratio estimation from multi-temporal UAV-based RGB and multispectral images[J]. Biosystems engineering, 2023, 234: 187-205.

24
ZHANG L Y, HAN W T, NIU Y X, et al. Evaluating the sensitivity of water stressed maize chlorophyll and structure based on UAV derived vegetation indices[J]. Computers and electronics in agriculture, 2021, 185: ID 106174.

25
SHAO G M, HAN W T, ZHANG H H, et al. Mapping maize crop coefficient Kc using random forest algorithm based on leaf area index and UAV-based multispectral vegetation indices[J]. Agricultural water management, 2021, 252: ID 106906.

26
PÔÇAS I, CALERA A, CAMPOS I, et al. Remote sensing for estimating and mapping single and basal crop coefficientes: A review on spectral vegetation indices approaches[J]. Agricultural water management, 2020, 233: ID 106081.

27
陈雨烨, 王培娟, 张源达, 等. 基于3种遥感指数的东北春玉米干旱识别对比[J]. 应用气象学报, 2022, 33(4): 466-476.

CHEN Y Y, WANG P J, ZHANG Y D, et al. Comparison of drought recognition of spring maize in Northeast China based on 3 remote sensing indices[J]. Journal of applied meteorological science, 2022, 33(4): 466-476.

28
MSADEK J, TLILI A, CHOUIKHI F, et al. Assessing the impacts of climate change scenarios on soil-adjusted vegetation index in north African arid montane rangeland: Case of toujane region[J]. Climate, 2025, 13(3): 59.

29
SUN X B, ZHANG P L, WANG Z H, et al. Potential of multi-seasonal vegetation indices to predict rice yield from UAV multispectral observations[J]. Precision agriculture, 2024, 25(3): 1235-1261.

30
GAO S, YAN K, LIU J X, et al. Assessment of remote-sensed vegetation indices for estimating forest chlorophyll concentration[J]. Ecological indicators, 2024, 162: ID 112001.

31
KUMAR M, BHATTACHARYA B K, PANDYA M R, et al. Machine learning based plot level rice lodging assessment using multi-spectral UAV remote sensing[J]. Computers and electronics in agriculture, 2024, 219: ID 108754.

32
COSWOSK G G, GONÇALVES V M L, DE LIMA V J, et al. Utilizing visible band vegetation indices from unmanned aerial vehicle images for maize phenotyping[J]. Remote sensing, 2024, 16(16): ID 3015.

33
张慧, 李平衡, 周国模, 等. 植被指数的地形效应研究进展[J]. 应用生态学报, 2018, 29(2): 669-677.

ZHANG H, LI P H, ZHOU G M, et al. Advances in the studies on topographic effects of vegetation indices[J]. Chinese journal of applied ecology, 2018, 29(2): 669-677.

34
束美艳, 顾晓鹤, 孙林, 等. 基于新型植被指数的冬小麦LAI高光谱反演[J]. 中国农业科学, 2018, 51(18): 3486-3496.

SHU M Y, GU X H, SUN L, et al. High spectral inversion of winter wheat LAI based on new vegetation index[J]. Scientia agricultura sinica, 2018, 51(18): 3486-3496.

35
邵亚杰, 李珂, 丁文浩, 等. 基于无人机多光谱影像特征估算棉花生物量[J]. 新疆农业科学, 2024, 61(6): 1328-1335.

SHAO Y J, LI K, DING W H, et al. Study on cotton biomass estimation based on multi-spectral imaging features of unmanned aerial vehicle[J]. Xinjiang agricultural sciences, 2024, 61(6): 1328-1335.

36
QIAO L, TANG W J, GAO D H, et al. UAV-based chlorophyll content estimation by evaluating vegetation index responses under different crop coverages[J]. Computers and electronics in agriculture, 2022, 196: ID 106775.

37
VIRTANEN P, GOMMERS R, OLIPHANT T E, et al. SciPy 1.0: Fundamental algorithms for scientific computing in Python[J]. Nature methods, 2020, 17(3): 261-272.

38
NIU Z Y, ZHONG G Q, YU H. A review on the attention mechanism of deep learning[J]. Neurocomputing, 2021, 452: 48-62.

39
GOODFELLOW I, BENGIO Y, COURVILLE A. Deep learning: Hyperparameter optimization [M]. Cambridge: MIT Press, 2016.

40
LIU Z, XU Z, JIN J, et al. Dropout reduces underfitting[C]// Proceedings of the 40th International Conference on Machine Learning. New York, NY, USA: Proceedings of Machine Learning Research, 2023, 202: 22233–22248.

41
XIAO F, SHI B Y, GAO J, et al. Enhanced probabilistic prediction of pavement deterioration using Bayesian neural networks and cuckoo search optimization[J]. Scientific reports, 2025, 15(1): ID 8665.

42
HODSON T O. Root-mean-square error (RMSE) or mean absolute error (MAE): When to use them or not[J]. Geoscientific model development, 2022, 15(14): 5481-5487.

43
LI Z Z, BI S D, HAO S, et al. Aboveground biomass estimation in forests with random forest and Monte Carlo-based uncertainty analysis[J]. Ecological indicators, 2022, 142: ID 109246.

44
GUIDOTTI R, MONREALE A, RUGGIERI S, et al. A survey of methods for explaining black box models[J]. ACM computing surveys, 2019, 51(5): 1-42.

45
FANG H L, BARET F, PLUMMER S, et al. An overview of global leaf area index (LAI): Methods, products, validation, and applications[J]. Reviews of geophysics, 2019, 57(3): 739-799.

46
YUAN L M, ZHOU T Y, LI K, et al. Moderate soil drying improves physiological performances and kernel yield of maize[J]. Food and energy security, 2023, 12(3): ID e444.

47
SHAO R X, YU K K, LI H W, et al. The effect of elevating temperature on the growth and development of reproductive organs and yield of summer maize[J]. Journal of integrative agriculture, 2021, 20(7): 1783-1795.

48
HOU P, LIU Y E, LIU W M, et al. Quantifying maize grain yield losses caused by climate change based on extensive field data across China[J]. Resources, conservation and recycling, 2021, 174: ID 105811.

49
YUAN A, KUMAR S D, WANG H T, et al. Dynamic interplay among soil nutrients, rhizosphere metabolites, and microbes shape drought and heat stress responses in summer maize[J]. Soil biology and biochemistry, 2024, 191: ID 109357.

50
MOLNAR C. Interpretable machine learning[M]. Saarbrücken: Lulu. com, 2020.

51
YANG Q, LIU L C, ZHOU J X, et al. A flexible and efficient knowledge-guided machine learning data assimilation (KGML-DA) framework for agroecosystem prediction in the US Midwest[J]. Remote sensing of environment, 2023, 299: ID 113880.

52
ZHANG Y F, WU R, DASCALU S M, et al. A novel extreme adaptive GRU for multivariate time series forecasting[J]. Scientific reports, 2024, 14(1): ID 2991.

文章导航

/