欢迎您访问《智慧农业(中英文)》官方网站! English

基于GCN-BiGRU-STMHSA的农业干旱预测研究

  • 权家璐 ,
  • 陈雯柏 ,
  • 王一群 ,
  • 程佳璟 ,
  • 刘亦隆
展开
  • 北京信息科技大学,北京 100192,中国
陈雯柏,博士,教授,研究方向为人工智能与智能检测。E-mail:

权家璐,研究方向为人工智能。E-mail:

收稿日期: 2024-10-21

  网络出版日期: 2025-01-24

基金资助

国家科技创新2030-“新一代人工智能”重大项目课题(2021ZD0113603)

版权

copyright©2025 by the authors (登录www.smartag.net.cn免费获取电子版全文)

Research on Agricultural Drought Prediction Based on GCN-BiGRU-STMHSA

  • QUAN Jialu ,
  • CHEN Wenbai ,
  • WANG Yiqun ,
  • CHENG Jiajing ,
  • LIU Yilong
Expand
  • School of Automation, Beijing Information Science & Technology University, Beijing 10019, China
CHEN Wenbai, E-mail:

QUAN Jialu, E-mail:

Received date: 2024-10-21

  Online published: 2025-01-24

Supported by

National Science and Technology Innovation 2030-"New Generation Artificial Intelligence" Major Project(2021ZD0113603)

摘要

【目的/意义】 农业干旱对中国农业生产发展具有消极影响,甚至威胁到粮食安全。为了降低灾害损失,保障中国的作物产量,根据标准化土壤湿度指数(Standardized Soil Moisture Index, SSMI)对农业干旱进行准确预测和等级分类具有重要意义。 【方法】 基于遥感数据,采用深度学习相关模型实现了农业干旱预测。首先,考虑了农业干旱的空间特点,提出了一种结合图神经网络、双向门控循环单元(Bi-Directional Gated Recurrent Unit, BiGRU)和多头自注意力机制的农业干旱预测模型GCN-BiGRU-STMHSA(Graph Convolutional Networks-Bidirectional Gated Recurrent Unit-Spatio-Temporal Multi-Head Self-Attention)。其次,使用日尺度的SSMI作为农业干旱指标。最后,根据搭建的GCN-BiGRU-STMHSA模型实现对SSMI的精准预测和分类。采用全球陆地数据同化系统2.1(Global Land Data Assimilation System-2.1, GLDAS-2.1)为数据集,在该数据集上训练GCN-BiGRU-STMHSA模型,以预测SSMI值并进行农业干旱等级分类。并与经典深度学习模型进行了比较。 【结果和讨论】 实验结果表明,GCN-BiGRU-STMHSA模型结果优于其他模型。在5个研究地点中,固始县数据集上误差最小,预测10天后的SSMI时,其平均绝对误差(Mean Absolute Error, MAE)为0.053、均方根误差(Root Mean Square Error, RMSE)为0.071、决定系数(Coefficient of Determination, R2)为0.880,准确率(Accuracy, ACC)为0.925,调和平均值( F1)为0.924。预测步长越短,预测的效果越好,当预测步长为28天时,模型预测干旱分类表现依然良好。 【结论】 该模型在农业干旱预测和分类任务中具有更高的精度和更好的泛化能力。

本文引用格式

权家璐 , 陈雯柏 , 王一群 , 程佳璟 , 刘亦隆 . 基于GCN-BiGRU-STMHSA的农业干旱预测研究[J]. 智慧农业, 2025 : 1 -9 . DOI: 10.12133/j.smartag.SA202410027

Abstract

[Objective] Agricultural drought has a negative impact on the development of agricultural production in China and even poses a threat to food security. To reduce disaster losses and ensure stable crop yields in China, accurately predicting and classifying agricultural drought severity based on the standardized soil moisture index (SSMI) is of significant importance. [Methods] An agricultural drought prediction model, GCN-BiGRU-STMHSA was proposed, which integrates a graph convolutional network (GCN), a bidirectional gated recurrent unit (BiGRU), and a multi-head self-attention (MHSA) mechanism, based on remote sensing data. In terms of model design, the proposed method first employs GCN to fully capture the spatial correlations among different meteorological stations. By utilizing GCN, a spatial graph structure based on meteorological stations was constructed, enabling the extraction and modeling of spatial dependencies between stations. Additionally, a spatial multi-head self-attention mechanism (S-MHSA) was introduced to further enhance the model's ability to capture spatial features. For temporal modeling, BiGRU was utilized as the time-series feature extraction module. BiGRU considers both forward and backward dependencies in time-series data, enabling a more comprehensive understanding of the temporal dynamics of agricultural drought. Meanwhile, a temporal multi-head self-attention mechanism (T-MHSA) was incorporated to enhance the model's capability to learn long-term temporal dependencies and improve prediction stability across different time scales. Finally, the model employed a fully connected layer to perform regression prediction of the SSMI. Based on the classification criteria for agricultural drought severity levels, the predicted SSMI values were mapped to the corresponding drought severity categories, achieving precise agricultural drought classification. To validate the effectiveness of the proposed model, the global land data assimilation system (GLDAS_2.1) dataset and conducted modeling and experiments was utilized on five representative meteorological stations in the North China Plain (Xinyang, Gushi, Fuyang, Huoqiu, and Dingyuan). Additionally, the proposed model was compared with multiple deep learning models, including GRU, LSTM, and Transformer, to comprehensively evaluate its performance in agricultural drought prediction tasks. The experimental design covered different forecasting horizons to analyze the model's generalization capability in both short-term and long-term predictions, thereby providing a more reliable early warning system for agricultural drought. [Results and Discussions] Experimental results demonstrated that the proposed GCN-BiGRU-STMHSA model outperforms baseline models in both SSMI prediction and agricultural drought classification tasks. Specifically, across the five study stations, the model achieved significantly lower mean absolute error (MAE) and root mean squared error (RMSE), while attaining higher coefficient of determination ( R²), classification accuracy (ACC), and F1-Score ( F1). Notably, at the Gushi station, the model exhibited the best performance in predicting SSMI 10 days ahead, achieving an MAE of 0.053, an RMSE of 0.071, an R² of 0.880, an ACC of 0.925, and an F1 of 0.924. Additionally, the model's generalization capability was investigated under different forecasting horizons (7, 14, 21, and 28 days). Results indicated that the model achieved the highest accuracy in short-term predictions (7 days). Although errors increase slightly as the prediction horizon extends, the model maintained high classification accuracy even for long-term predictions (up to 28 days). This highlighted the model's robustness and effectiveness in agricultural drought prediction over varying time scales. [Conclusions] The proposed model achieves superior accuracy and generalization capability in agricultural drought prediction and classification. By effectively integrating spatial graph modeling, temporal sequence feature extraction, and self-attention mechanisms, the model outperforms conventional deep learning approaches in both short-term and long-term forecasting tasks. Its strong performance provides accurate drought early warnings, assisting agricultural management authorities in formulating efficient water resource management strategies and optimizing irrigation plans. This contributes to safeguarding agricultural production and mitigating the potential adverse effects of agricultural drought.

0 引 言

干旱是一种缓慢发生的现象,是具有破坏性的自然灾害之一 1。干旱一般可分为气象干旱、农业干旱、水文干旱和社会经济干旱四大类 2- 4。其中农业干旱对作物生产的影响最为直接 5。在历史时期,严重的农业干旱事件已被证明对农业和社会经济造成巨大损害 6,对粮食安全和人类社会构成威胁 7。因此对农业干旱进行精准的预测对农业规划管理具有重要意义 8
农业干旱是指在作物生长期间,作物缺水影响作物生长发育的现象。农业干旱的发生受大气、作物、土壤等有关因素的影响 9,因此,农业干旱的监测预测评估指标大致可分为三类,即水分指标、温度指标和综合指标 10。其中,水分指标常用的有降水距平百分比、标准化降水指数、连续无雨天数等降水指标,土壤有效水分贮存量、综合旱涝指标等土壤水分指标,以及叶水势、气孔开度、光合作用等作物水分指标。温度指标常用的是植物冠层温度。综合指标常用的是植被指数、作物干旱指数和水分指数等。在农业干旱的监测预测评估指标中,标准化土壤湿度指数(Standardized Soil Moisture Index, SSMI)受地理、气候条件限制较小,常用于深度学习评估农业干旱 11
基于不同的农业干旱指标,人们开发了多种农业干旱预测模型,包括基于物理机制的模型和基于数据驱动的模型 12。基于物理机制的模型涉及对大气、水循环、土壤蒸发蒸腾等物理过程的深入研究,通常依赖复杂的数值模拟和物理模型。例如,Mo和Lyon 13利用北美多模式集合预测了不同时间尺度下的全球标准化降水指数(Standardized Precipitation Index, SPI),并且提出气候模式的改进可以提高干旱预测能力。然而构建模型的过程需要大量观测数据和高性能计算设备来运行,计算成本高、关键因素不确定,导致模型预测结果存在不确定性。
基于数据驱动的模型主要依赖于历史数据的分析,通过建立数学模型来预测和评估干旱。这类方法通常关注的是气象、土壤湿度、降水、蒸发蒸腾等环境因素,利用时间序列分析、回归分析、机器学习等技术,找出干旱发生的规律和趋势。常用的统计方法包括回归模型、人工智能模型、条件分布模型和马尔可夫链模型 14。随着机器学习和人工智能的迅速进展,研究人员开始收集和使用大规模的气象、水文、遥感和地球观测数据,以训练更复杂的数据驱动模型。例如,Tian等 15使用降水蒸散指数表示农业干旱程度,对湘江流域建立了结合气候数据的支持向量回归(Support Vector Regression, SVR)模型来预测农业干旱。Fung等 16使用标准化降水蒸散指数(Standardized Precipitation Evapotranspiration Index, SPEI)作为农业干旱指标,建立SVR模型预测SPEI。Kadam等 17利用长短期记忆网络(Long Short-Term Memory, LSTM)模型预测SPI-6,LSTM表现出最低的均方根误差(Root Mean Square Error, RMSE)(0.61)、平均绝对误差(Mean Absolute Error, MAE)(0.4)和最高的决定系数(Coefficient of Determination, R 2)(0.85)。
尽管上述基于数据驱动的模型在农业干旱预测中取得了一定的成果,但它们通常未能充分考虑影响农业干旱格局的区域空间结构,导致在捕捉干旱的复杂时空动态方面存在一定的局限性。图神经网络(Graph Neural Network, GNN) 18是一类可以利用区域内空间结构的模型,常见的GNN模型包括图卷积网络(Graph Convolutional Networks, GCN) 19、GraphSAGE 20等,在农业领域,GNN已被广泛应用于多个任务,如作物产量预测 21、土壤湿度估计、农业病虫害监测 22等。为了充分利用农业干旱数据中的空间和时间特征,近年来的研究尝试将GNN与循环神经网络(Recurrent Neural Network, RNN)结合起来,形成一种时空融合的模型架构。例如,Yu等 23基于GNN结合门控循环单元(Gate Recurrent Unit, GRU)提出了一种新的多元时空网络(Multivariate Spatio-Temporal Sensitive Network, MSTSN)用于干旱预测,通过将地理和时间知识融合在网络中,进一步增强了干旱预测的能力。与传统的单向GRU相比,双向门控循环单元(Bi-directional Gated Recurrent Unit, BiGRU) 24在处理具有双向依赖关系的时间序列数据时,能够提供更全面的特征表示。GCN与BiGRU相结合的模型在处理复杂的时空数据时,能够更好地平衡空间和时间特征的提取,提升整体预测性能。此外,本研究进一步引入了多头自注意力机制(Multi-Head Self-Attention, MHSA) 25,可以通过并行捕捉不同子空间的信息,增强模型对关键特征的关注能力。综上所述,本研究提出了一种结合GCN、BiGRU和时空多头自注意力机制(Spatio-Temporal Multi-Head Self-Attention, STMHSA)的农业干旱预测模型GCN-BiGRU-STMHSA,该模型通过有效整合空间和时间特征,并引入自注意力机制,显著提升农业干旱预测和分类的精度和泛化能力。

1 研究区域与数据集

1.1 研究区域

华北平原又称黄淮海平原,位于中国华北地区,介于黄河和淮河之间,是中国三大平原之一。农业是黄淮海平原的重要产业之一,该区域是中国主要的粮食生产基地之一。然而,黄淮海平原是一个干旱灾害频发的地区,农业干旱对当地的农业生产和居民生活造成了巨大的影响。因此,本研究对黄淮海平原的部分地区进行采样作为农业干旱预测研究的数据集。采样气象站点的基本情况如 表1所示。
表1 农业干旱预测研究采样气象站点基本信息

Table 1 Basic information of meteorological stations sampled for agricultural drought prediction research

地点 经度/(°) 纬度/(°) 海拔/m
信阳 114.03 32.08 115.4
固始 115.37 32.10 43.9
阜阳 115.44 32.52 33.9
霍邱 116.47 32.33 64.4
定远 117.40 32.32 70.6

1.2 数据集构建

本研究使用了美国国家航空航天局(National Aeronautics and Space Administration, NASA)的全球陆地数据同化系统2.1(Global Land Data Assimilation System-2.1, GLDAS-2.1),数据时间范围为2000年1月1日至2023年4月7日,空间分辨率为0.25°×0.25°,时间分辨率为3小时,并计算得到日尺度数据。通过Google Earth Engine(GEE)平台下载GLDAS-2.1数据,选取5个气象站点,包含10个特征变量,分别为根区土壤水分(RootMoist_inst)、降雨量(Rainf_tavg)、平均表面温度(AvgSurfT_inst)、40~100 cm土壤湿度(SoilMoi40~100 cm_inst)、雪深水当量(SWE_inst)、植物冠层表面水(CanopInt_inst)、裸露土壤的直接蒸发量(ESoil_tavg)、潜热净通量(Qle_tavg)、0~10 cm土壤温度(SoilTMP0~10 cm_inst)、10~40 cm土壤温度(SoilTMP10~40 cm_inst),对特征变量中的根区土壤湿度进行计算可以得到SSMI,即SSMI为目标变量。每个气象站点的数据集分为三个子集,即训练集、验证集和测试集,划分比例为7∶1∶2。具体划分情况如 表2所示,每个气象站点的数据集有8 500条,其中训练集包含5 950条,验证集包含850条,测试集包含1 700条。
表2 农业干旱预测研究数据集划分

Table 2 Dataset division for agricultural drought prediction research

数据集划分 起始时间 结束时间 总数/条
训练集 2000/1/1 2016/4/15 5 950
验证集 2016/4/16 2018/8/13 850
测试集 2018/8/14 2023/4/9 1 700

2 GCN-BiGRU-STMHSA模型

针对农业干旱预测问题,本研究提出了一个基于GCN-BiGRU-STMHSA模型的农业干旱预测框架,如 图1所示。其中输入层为5个采样点的11个特征变量数据。GCN-BiGRU-STMHSA模型主要分为两部分:空间特征提取模块和时间特征提取模块。空间特征提取模块由GCN和空间多头自注意力机制(S-MHSA)组成,以提取空间特征。时间特征提取模块由BiGRU和时间多头自注意力机制(T-MHSA)组成,以提取时间序列的特征。最后输出SSMI预测值。
图1 农业干旱预测模型总框架图

Fig. 1 Framework diagram of the agricultural drought prediction model

2.1 空间特征提取模块GCN-SMHSA

GCN架构由Kipf和Welling 26于2016年提出,其理念是创建一种适用于图的高效卷积神经网络(Convolutional Neural Networks, CNN)。构建图是图卷积中一个基本且关键的过程,它捕捉了不同位置之间的相互联系。通常,地理位置相近且气象变化相似的站点往往表现出相似的农业干旱状况。特别是,图中特定节点对之间的边权重可能相比其他边权重更高。因此,考虑到影响农业干旱的因素,空间图被表示为 G n = S , E n , A n。其中 S表示包括共 n个站点的站点集合。 E是图中的边集合。邻接矩阵 A 对应于图,反映了站点之间的地理空间关系。基于站点之间的欧几里得距离构建空间图,其中 a A,表示站点 s i s j之间的连通性。相邻关系如 公式(1)表示。
a i j = 1 , d i j d k - l g 0 , d i j > d k - l g
式中: d i j表示站点 s i与站点 s j之间的欧几里得距离; k为邻近站点数量,个; d k - l g为阈值距离,即站点 s i附近 k个站点中最远的距离,km。对于任何站点 s i,如果两个站点之间的距离 d i j小于或等于阈值距离 d k - l g,则 a i j=1,表示站点 s i与站点 s j相邻。否则 a i j=0。
为了捕捉由非欧几里得分布特征的站点之间的空间依赖性,使用GCN从相邻节点收集信息。GCN中每一层的传播规则描述如 公式(2)所示。
H ( l + 1 ) = σ D ˜ ( - 1 / 2 ) A ˜ D ˜ ( - 1 / 2 ) H ( l ) W ( l )
式中: H ( l )表示第 l层的节点特征矩阵, A ˜ = A + I表示图的加权邻接矩阵,包括自连接,其中 I代表单位矩阵。 D ˜表示 A ˜的度矩阵,即 D ˜ i i = j A ˜ i j,而 W l表示图卷积层中滤波参数的可训练权重矩阵。 σ x表示激活函数。
图卷积层用于最初编码站点数据的空间相关性,但显然,明确定义的空间依赖模式具有局限性,数据的潜在关系仍需要一个有效的模型结构进行进一步探索。本研究引入了空间多头自注意力S-MHSA,以使模型能够学习数据的隐含内在相关性,如 公式(3)所示。
P h = S o f t m a x α Q h K h T + B h V h
式中: P h R C / N h × N × T为第 h个注意力头的输出, Softmax为激活函数。 B h R ( N × M )是第 h个注意力头的偏置向量。 Q h = B W q K h = H W k V h = H W v分别代表查询、键和值, W q W k W v R C × C / N h是线性投影的可学习参数, h是头的数量, α是一个缩放因子。
图2展示了S-MHSA的结构,S-MHSA层首先取图卷积层的输出作为输入,先对特征进行归一化,然后使用线性层生成查询向量。对于每个查询站点,取 M个邻近站点的特征作为键向量和值向量。然后应用S-MHSA层来捕捉查询站点与其对应区域之间的空间关系,并输出 P h
图2 空间多头自注意力机制结构图

Fig. 2 Spatial Multi-Head Self-Attention mechanism structure diagram

2.2 时间特征提取模块BiGRU-TMHSA

农业干旱预测仍然是一个时间序列预测问题。GRU(Gated Recurrent Unit) 27模型通过引入门控机制来解决梯度消失问题,提高了模型的性能,并且相比于LSTM提供了更快的训练。在标准的GRU单元中,重置门 r t和更新门 z t的存在使得单元能够利用最近和先前的输入来预测输出。具体如公式(4)~ 公式(8)所示,其中 X t '表示输入数据, h t - 1表示前一时刻的隐藏状态, W是权重矩阵, σ表示激活函数。 h ˜ t为隐藏状态, h t - 1为前一时刻隐藏状态, tanh为激活函数。 y t为输出。
z t = σ W z [ h t - 1 , X t ' ]
r t = σ W r [ h t - 1 , X t ' ]
h ˜ t = t a n h W h [ r t × h t - 1 , X t ' ]
h t = 1 - z t × h ˜ t + z t × h t - 1
y t = σ W o h t
而BiGRU神经网络时序预测算法是一种基于BiGRU的多变量时间序列预测方法。该方法结合了双向模型和门控机制,可以有效地捕捉时间序列数据中的时序关系和多变量之间的相互影响。具体来说,BiGRU模型由两个方向的GRU网络组成,一个网络从前向后处理时间序列数据,另一个网络从后向前处理时间序列数据。这种双向结构可以同时捕捉到过去和未来的信息,从而更全面地建模时间序列数据中的时序关系。
图3所示,在使用BiGRU从历史 T小时窗口提取时间特征后,本研究引入了一个T-MHSA,以进一步增强模型的预测能力并更准确地捕捉时间序列中的关键信息。T-MHSA允许模型在不同时间点上变化地聚焦,显著提高了其捕捉SSMI变化趋势的能力。在经过相对位置编码后, R = R t - T + 1 , . . . , R t , R R U × N × T序列特征输入时间注意层,其中 U表示BiGRU最后一层的单元数。然后将整合的特征输入到由全连接层组成的输出层,该层输出10天后的SSMI值。
图3 时间特征提取模块BiGRU-TMHSA构建结构图

Fig. 3 Architecture diagram of the BiGRU-TMHSA time feature extraction module

3 评价指标

3.1 农业干旱指标

SSMI作为评价农业干旱的指标,对根区土壤湿度进行标准化。计算方法如 公式(9)所示。
S S M I = S M - S M ¯ σ
式中: SM为某一时间尺度的土壤湿度值,kg/m 2 S M ¯为土壤湿度序列均值,kg/m 2 σ为土壤湿度序列标准差。农业干旱预测研究的SSMI指标分级如 表3所示。
表3 农业干旱预测研究SSMI指标分级表

Table 3 SSMI index classification table for agricultural drought prediction research

指标范围 分类 等级
0<SSMI 正常 1
-1<SSMI≤0 轻度干旱 2
-1.5<SSMI≤-1 中度干旱 3
-2.0<SSMI≤-1.5 重度干旱 4
SSMI≤-2.0 特旱 5

3.2 模型评价指标

为了评估模型性能,选用平均绝对误差(MAE)、均方误差(MSE)、均方根误差(RMSE)、决定系数( R 2)、准确率(Accuracy,ACC)、精确率(Precision)、召回率(Recall)和 F 1-Score( F 1)为评价指标。MAE是真实值与预测值的绝对值的平均值,它可以衡量预测值与实际值之间的平均差距,反映预测值误差的实际情况,值越小越好;MSE是真实值和预测值之间误差平方的均值,RMSE是MSE的平方根,反映预测的准确性,值越小越好; R 2能反映模型拟合优度,值越大预测值与实际值越接近。ACC和 F 1为农业干旱分类指标,值越大越好。其中 F 1为精确率和召回率的调和平均数,兼顾了精确率和召回率两个评价指标。具体计算如公式(10)~ 公式(17)所示,其中, n为预测数量, y ^ i为预测值, y i为真实数值, y ¯为平均值。TP(True Positive)表示预测值、真实值均为正样本的数量;FP(False Positive)表示预测值为正样本,真实值为负样本的数量;TN(True Negative)表示预测值、真实值均为负样本的数量;FN(False Negative)表示预测值为负样本,真实值为正样本的数量。
M A E = 1 n i = 1 n y ^ i - y i
M S E = 1 n i = 1 n y ^ i - y i 2
R M S E = 1 n i = 1 n y ^ i - y i 2
R 2 = 1 - 1 n i = 1 n y i - y ^ i 2 1 n i = 1 n y i - y ¯ 2      = 1 - M S E 1 n i = 1 n y i - y ¯ 2
A C C = T P + T N T P + T N + F P + F N
R e c a l l = T P T P + F N
P r e c i s i o n = T P T P + F P
F 1 = 2 P r e c i s i o n × R e c a l l P r e c i s i o n + R e c a l l               = 2 T P 2 T P + F P + F N

4 结果与分析

4.1 实验结果分析

本研究选取了GRU、BiGRU、LSTM 28、Transformer 29、GCN-BiGRU 27共5种深度学习模型与本研究提出的GCN-BiGRU-STMHSA改进模型进行对比实验。该模型架构较为复杂,对计算资源要求较高,本研究硬件资源配备了AMD R7 7745HX CPU,NVIDIA RTX 4060 GPU和32 GB内存以及1 TB 固态硬件。同时,本研究通过在验证集上进行多次实验,综合考虑后选择学习率为le-4,批尺寸设置为256,优化器选择Adam,输入步长为30天,预测步长为10天。具体实验结果如 表4所示,可知,本研究提出的GCN-BiGRU-STMHSA模型在五个样本地点表现均优于其他五个模型,误差最小的是固始采样点,其MAE为0.053、RMSE为0.071、 R 2为0.880,ACC为0.925, F 1为0.924。模型在硬件环境下表现优异并能较快完成训练,但在资源有限的应用场景中,可通过减小模型规模、采用模型剪枝或迁移部分计算至云端的方法,平衡预测精度与计算成本,为农业干旱预测提供更灵活的解决方案。
表4 在不同地区的SSMI预测与分类对比试验结果

Table 4 Comparative trials of SSMI prediction and classification results in different regions

模型 GRU LSTM BiGRU Transformer GCN-BiGRU GCN-BiGRU-STMHSA
信阳 MAE 0.116 0.124 0.097 0.084 0.078 0.066
RMSE 0.152 0.163 0.128 0.118 0.119 0.087
R 2 0.724 0.683 0.804 0.834 0.737 0.857
ACC 0.874 0.863 0.894 0.918 0.861 0.925
F 1 0.874 0.863 0.894 0.918 0.860 0.924
阜阳 MAE 0.080 0.092 0.061 0.050 0.047 0.044
RMSE 0.102 0.117 0.081 0.071 0.667 0.061
R 2 0.778 0.711 0.859 0.893 0.877 0.882
ACC 0.886 0.871 0.912 0.925 0.924 0.900
F 1 0.886 0.871 0.912 0.925 0.924 0.898
霍邱 MAE 0.106 0.112 0.089 0.081 0.061 0.057
RMSE 0.130 0.143 0.122 0.116 0.092 0.079
R 2 0.730 0.714 0.792 0.813 0.839 0.860
ACC 0.845 0.833 0.884 0.887 0.924 0.888
F 1 0.845 0.833 0.884 0.887 0.924 0.887
固始 MAE 0.141 0.148 0.130 0.155 0.067 0.053
RMSE 0.183 0.191 0.172 0.201 0.096 0.071
R 2 0.592 0.555 0.641 0.506 0.827 0.880
ACC 0.793 0.776 0.809 0.770 0.911 0.925
F 1 0.791 0.772 0.808 0.768 0.911 0.924
定远 MAE 0.108 0.128 0.091 0.083 0.074 0.059
RMSE 0.139 0.164 0.122 0.116 0.108 0.079
R 2 0.756 0.661 0.813 0.831 0.802 0.884
ACC 0.834 0.794 0.861 0.877 0.899 0.913
F 1 0.834 0.794 0.861 0.877 0.898 0.910
在相同数据集与评价指标下,由 表4对比结果可知,仅使用RNN类模型(如LSTM、GRU、BiGRU)时,由于忽视了站点之间的地理空间关系,预测误差显著高于引入GCN的模型。GCN-BiGRU模型在捕捉空间依赖后,预测效果有所提升,但在干旱等级分类和长期预测上仍存在一定不足。本研究提出的GCN-BiGRU-STMHSA模型在5个采样区域的指标(MAE、RMSE、 R 2、ACC、 F 1)上均取得良好结果,说明其充分结合了GCN所提供的空间信息,以及BiGRU在时间序列建模上的优势。此外,MHSA可在局部与全局尺度灵活关注不同站点与不同时刻的关键特征,进一步降低预测误差、提升分类准确率。

4.2 不同时间尺度实验结果分析

根据 表4可以看出,GCN-BiGRU-STMHSA模型在多个采样地点上表现出色。为探讨不同时间尺度下的预测效果,进行了步长为7天、14天、21天、28天的实验,具体结果见 表5,展示了GCN-BiGRU-STMHSA模型在4种不同预测步长下,在信阳、阜阳、霍邱、固始、定远共5个站点的性能指标(MAE、RMSE、 R 2、ACC、 F 1)。从整体来看,随着预测步长的增加(从7天到28天),模型误差呈上升趋势,而 R 2、ACC、 F 1等指标则呈下降趋势。这说明当预测范围更长时,模型在准确度与稳定性方面面临更大挑战。
表5 GCN-BiGRU-STMHSA模型在不同时间尺度的SSMI预测及分类结果

Table 5 Prediction and classification results of SSMI at different time scales using the GCN-BiGRU-STMHSA model

预测步长/天 7 14 21 28
信阳 MAE 0.058 0.087 0.099 0.101
RMSE 0.082 0.112 0.131 0.138
R 2 0.881 0.787 0.704 0.664
ACC 0.962 0.886 0.835 0.844
F 1 0.962 0.886 0.835 0.844
阜阳 MAE 0.039 0.052 0.061 0.064
RMSE 0.051 0.070 0.082 0.090
R 2 0.924 0.853 0.806 0.755
ACC 0.911 0.911 0.899 0.857
F 1 0.910 0.911 0.899 0.856
霍邱 MAE 0.043 0.066 0.081 0.085
RMSE 0.058 0.093 0.115 0.129
R 2 0.941 0.839 0.752 0.615
ACC 0.937 0.924 0.899 0.883
F 1 0.934 0.924 0.899 0.882
固始 MAE 0.041 0.063 0.078 0.079
RMSE 0.059 0.084 0.109 0.113
R 2 0.930 0.853 0.779 0.730
ACC 0.924 0.873 0.835 0.870
F 1 0.922 0.873 0.834 0.870
定远 MAE 0.043 0.061 0.084 0.087
RMSE 0.061 0.088 0.120 0.127
R 2 0.933 0.851 0.776 0.671
ACC 0.950 0.924 0.873 0.883
F 1 0.950 0.923 0.873 0.883
具体而言,模型短期预测(7天)表现最佳,其MAE和RMSE最低:如在阜阳站点,MAE仅为0.039,RMSE仅为0.051,这说明模型在一周的预测周期内能够更精准地捕捉土壤湿度和干旱动态。 R 2、ACC及 F 1较高:信阳与霍邱等地区短期内的 R 2均达到0.88以上,ACC和 F 1也显著高于其他预测步长,表明模型能较好区分不同干旱等级并保持较高的一致性。中期预测(14天、21天)准确度略有下降,误差随时间略微增大,分类指标(ACC、 F 1)较短期预测有所波动。长期预测(28天)误差明显增大, R 2、ACC显著下降,在28天步长下,信阳与霍邱等地的 R 2分别降至约0.664和0.615,ACC也下滑到0.844和0.883左右。干旱分类能力受限, F 1同样降低,这表明当预测范围扩展到4周后,干旱过程的随机性、区域差异性会明显削弱模型的精度与分类性能。
总体而言,当预测步长为28天时,农业干旱分类ACC最低为0.844,分类效果较为良好,能够较为准确地预测农业干旱情况。阜阳市在预测步长为7天时的预测效果最佳,其具体预测值与真实值对比如 图4所示,可以看出,GCN-BiGRU-STMHSA模型在捕捉SSMI值变化方面拟合效果良好,能有效预测干旱趋势。
图4 在阜阳市预测步长为7天的SSMI预测值与真实值对比图

Fig. 4 Comparison of predicted and true SSMI values in Fuyang city for prediction steps of 7 days

综上所述,基于GCN-BiGRU-STMHSA模型的农业干旱预测具有广泛的应用前景。在农业生产中,提前预测SSMI值并对农业干旱进行准确分类,有助于政府和农民采取及时的预防措施,例如调整灌溉方案、优化水资源分配和选择耐旱作物等。同时,不同时间尺度下的干旱预测结果有助于制定更灵活的农业管理计划,降低干旱对农业产量的影响。此外,尽管在长时间预测(如28天)下准确性有所下降,但依然为季节性规划提供了重要的趋势参考。

5 结 论

本研究针对农业干旱预测问题,提出了一种结合GNN、BiGRU和MHSA的深度学习模型GCN-BiGRU-STMHSA,并以SSMI作为农业干旱的预测指标。实验结果表明,该模型在农业干旱等级分类和预测SSMI值的任务中表现优异,与经典的GRU、LSTM、Transformer等模型相比,GCN-BiGRU-STMHSA模型在不同研究地点和时间尺度上均表现出更高的预测精度和稳定性。此外,本研究通过在不同时间尺度(7天、14天、21天和28天)的实验中进一步验证了模型的泛化能力。结果显示,随着时间尺度的延长,模型的误差有所增加,但整体预测表现仍然保持在较高水平。总的来说,GCN-BiGRU-STMHSA模型在农业干旱预测任务中不仅具有更高的精度,还展现了良好的泛化能力。其优越的性能将为农业干旱灾害的防治和决策提供有力支持,有助于减少灾害损失,保障粮食生产安全。

利益冲突声明

本研究不存在研究者以及与公开研究成果有关的利益冲突。

1
陈颖, 吴焕萍, 谢能付, 等. 基于深度学习的干旱预测方法研究进展[J/OL]. 中国农业资源与区划. ( 2024-03-26) [ 2024-10-18].

CHEN Y, WU H P, XIE N F, et al. REsearch progress on drought prediction methods based on deep learning[J/OL]. China Agricultural Resources and Regional Planning. ( 2024-03-26) [ 2024-10-18].

2
LIU C H. Drought level prediction with deep learning[M]// Communications in computer and information science. Singapore: Springer Nature Singapore, 2021: 53- 65.

3
PARK E, JO H W, LEE W K, et al. Development of earth observational diagnostic drought prediction model for regional error calibration: A case study on agricultural drought in Kyrgyzstan[J]. GIScience & remote sensing, 2022, 59( 1): 36- 53.

4
SARDAR V S, M Y K, CHAUDHARI S S, et al. Convolution neural network-based agriculture drought prediction using satellite images[C]// 2021 IEEE Mysore Sub Section International Conference (MysuruCon). Piscataway, New Jersey, USA: IEEE, 2021: 601- 607.

5
KAFY AAL, BAKSHI A, SAHA M, et al. Assessment and prediction of index based agricultural drought vulnerability using machine learning algorithms[J]. Science of the total environment, 2023, 867: ID 161394.

6
AGHELPOUR P, MOHAMMADI B, MEHDIZADEH S, et al. A novel hybrid dragonfly optimization algorithm for agricultural drought prediction[J]. Stochastic environmental research and risk assessment, 2021, 35( 12): 2459- 2477.

7
XU Y, ZHANG X, HAO Z C, et al. Characterization of agricultural drought propagation over China based on bivariate probabilistic quantification[J]. Journal of hydrology, 2021, 598: ID 126194.

8
HUANG S Z, WANG L, WANG H, et al. Spatio-temporal characteristics of drought structure across China using an integrated drought index[J]. Agricultural water management, 2019, 218: 182- 192.

9
YANG M X, MOU Y L, MENG Y R, et al. Modeling the effects of precipitation and temperature patterns on agricultural drought in China from 1949 to 2015[J]. Science of the total environment, 2020, 711: ID 135139.

10
韩东, 王鹏新, 张悦, 等. 农业干旱卫星遥感监测与预测研究进展[J]. 智慧农业(中英文), 2021, 3( 2): 1- 14.

HAN D, WANG P X, ZHANG Y, et al. Progress of agricultural drought monitoring and forecasting using satellite remote sensing[J]. Smart agriculture, 2021, 3( 2): 1- 14.

11
周洪奎, 武建军, 李小涵, 等. 基于同化数据的标准化土壤湿度指数监测农业干旱的适宜性研究[J]. 生态学报, 2019, 39( 6): 2191- 2202.

ZHOU H K, WU J J, LI X H, et al. Suitability of assimilated data-based standardized soil moisture index for agricultural drought monitoring[J]. Acta ecologica sinica, 2019, 39( 6): 2191- 2202.

12
ZHANG Y, HAO Z C, FENG S F, et al. Agricultural drought prediction in China based on drought propagation and large-scale drivers[J]. Agricultural water management, 2021, 255: ID 107028.

13
MO K C, LYON B. Global meteorological drought prediction using the North American multi-model ensemble[J]. Journal of hydrometeorology, 2015, 16( 3): 1409- 1424.

14
黄睿茜, 赵俊芳, 霍治国, 等. 深度学习技术在农业干旱监测预测及风险评估中的应用[J]. 中国农业气象, 2023, 44( 10): 943- 952.

HUANG R X, ZHAO J F, HUO Z G, et al. Application of deep learning technology in monitoring, forecasting and risk assessment of agricultural drought[J]. Chinese journal of agrometeorology, 2023, 44( 10): 943- 952.

15
TIAN Y, XU Y P, WANG G Q. Agricultural drought prediction using climate indices based on support vector regression in Xiangjiang River basin[J]. Science of the total environment, 2018, 622: 710- 720.

16
FUNG K F, HUANG Y F, KOO C H, et al. Improved SVR machine learning models for agricultural drought prediction at downstream of Langat River Basin, Malaysia[J]. Journal of water and climate change, 2020, 11( 4): 1383- 1398.

17
KADAM C M, BHOSLE U V, HOLAMBE R S. Deep learning-driven regional drought assessment: An optimized perspective[J]. Earth science informatics, 2024, 17( 2): 1523- 1537.

18
SCARSELLI F, GORI M, TSOI A C, et al. The graph neural network model[J]. IEEE transactions on neural networks, 2009, 20( 1): 61- 80.

19
BHATTI U A, TANG H, WU G L, et al. Deep learning with graph convolutional networks: An overview and latest applications in computational intelligence[J]. International journal of intelligent systems, 2023, 2023( 1): ID 8342104.

20
LIU J P, LEI X J, ZHANG Y C, et al. The prediction of molecular toxicity based on BiGRU and GraphSAGE[J]. Computers in biology and medicine, 2023, 153: ID 106524.

21
FAN J, BAI J W, LI Z Y, et al. A GNN-RNN approach for harnessing geospatial and temporal information: Application to crop yield prediction[J]. Proceedings of the AAAI conference on artificial intelligence, 2022, 36( 11): 11873- 11881.

22
YANG J, SUN J, REN Y, et al. GACP: Graph neural networks with ARMA filters and a parallel CNN for hyperspectral image classification[J]. International journal of digital earth, 2023, 16( 1): 1770- 1800.

23
YU J X, MA T H, JIA L, et al. Multivariate spatio-temporal modeling of drought prediction using graph neural network[J]. Journal of hydroinformatics, 2024, 26( 1): 107- 124.

24
BALTI H, ABBES ABEN, FARAH I R. A Bi-GRU-based encoder-decoder framework for multivariate time series forecasting[J]. Soft computing, 2024, 28( 9): 6775- 6786.

25
VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need[EB/OL]. arXiv: 1706. 03762v 7, 2023.

26
KIPF T N, WELLING M. Semi-supervised classification with graph convolutional networks[EB/OL]. arXiv: 1609. 02907v 4, 2016.

27
SANKALP S, RAO U M, PATRA K C, et al. Modeling gated recurrent unit (GRU) neural network in forecasting surface soil wetness for drought districts of Odisha[J]. Developments in environmental science, 2023, 14: 217- 229.

28
SALAS-MARTÍNEZ F, MÁRQUEZ-GRAJALES A, VALDÉS-RODRÍGUEZ O A, et al. Prediction of agricultural drought behavior using the long short-term memory network (LSTM) in the central area of the Gulf of Mexico[J]. Theoretical and applied climatology, 2024, 155( 8): 7887- 7907.

29
AMANAMBU A C, MOSSA J, CHEN Y H. Hydrological drought forecasting using a deep transformer model[J]. Water, 2022, 14( 22): ID 3611.

文章导航

/