粮食生产对国民经济至关重要,玉米作为中国主要粮食作物之一,对农业和经济发展具有显著影响。尽管中国玉米产量在过去10年间增长了8.58%,但仍存在较大的供需缺口。在此背景下,探究玉米产量的变动规律及其影响因素,在优化农业政策、提升产量、保障国家粮食安全方面具有关键意义。然而,作物产量的形成并非一蹴而就,而是一个多步骤、多因素交织的复杂过程。它涉及植物的多个生理和生化反应,受到诸如气候、土壤质量、田间管理等多种因素的影响
[1]。要了解产量的形成,就需要明确作物生长各阶段的特性、这些阶段与产量之间的联系,以及作物生长和产量对环境因素的响应。近年来,机器学习进入快速发展时期,与传统的方法相比,其在样本上的拟合稳定性也更为优越。其中,长短期记忆网络(Long Short-Term Memory, LSTM)
[2]因具有较好地保存记忆时间序列数据的能力而被广泛应用于各行业的时序预测。王旭等
[3]通过门控机制提取了冬小麦生长过程中的时间序列特征,建立了基于LSTM的冬小麦估产模型。SHI等
[4]将LSTM与工业应用相结合,通过多传感器数据融合实现了高精度的振动预测。董莉霞等
[5]利用霍德里克-普雷斯科特滤波(Hodrick-Prescott, HP)算法通过对气象驱动产量与长期变化产量进行区分处理,并通过5种机器学习算法对气象产量进行预测,同时构建差分自回归移动平均模型(Autoregressive Integrated Moving Average Model, ARIMA)时间序列模型对趋势产量进行预测,最终通过LSTM和ARIMA模型的组合,实现了对旱地春小麦产量的高精度预测。YU等
[6]将卷积神经网络(Convolutional Neural Network, CNN)和LSTM网络融合,使系统能够在旋转过程中跟踪有缺陷的机器人并识别其真实类型,并预测其未来路径。王得道等
[7]通过构建一种融合CNN与LSTM的预测模型,其中CNN用于提取气象条件对当前时刻板温的影响特征,LSTM用于预测,有效预测了中国铁路轨道系统(China Railway Track System, CRTS)Ⅱ型轨道板温度。WANG等
[8]提出了一种基于麻雀搜索算法(Sparrow Search Algorithm, SSA)优化的CNN-LSTM的混合模型,该模型通过引入CNN的空间表征提取优势,并融合LSTM在时间动态建模方面的能力,通过SSA进行全局优化,提高了多特征时间序列的预测精度。尽管上述模型在多特征时间序列建模中展现出较高的预测能力,但多数仅从历史数据中学习变量间的统计相关性,忽略了潜在的滞后因果关系,在农业遥感建模实践中,这一问题亦未得到有效解决。JOSHI等
[9]指出,传统统计模型虽然易于实现,但难以捕捉变量间复杂的非线性交互作用,依赖人工特征构建,且无法揭示驱动作物产量变化的因果机制。正如VAN CLEEMPUT等
[10]所强调,仅依赖遥感数据的传统方法难以揭示因果关系,且易受混杂变量与测量误差影响而产生偏差。这些研究表明,利用相关性建模方法虽取得一定进展,但仍难以揭示变量间的深层驱动机制。RUNGE等
[11]指出,在高维、多变量、非线性时间序列中,传统方法易产生“伪相关”,误将非因果关联纳入建模依据,从而影响模型稳定性与可解释性。在该领域中,RUNGE等
[12]提出的基于条件独立性的瞬时因果推断算法(Peter-Clark and Momentary Conditional Independence, PCMCI),通过结合条件选择(Partial Correlation, PC)与瞬时条件独立性检验(Momentary Conditional Independence, MCI),系统性应对了自相关、非线性和高维等挑战,实现了大规模时间序列因果网络的高效重构。