欢迎您访问《智慧农业(中英文)》官方网站! English

面向干旱条件下的冬小麦估产HLM模型改进研究

  • 赵培钦 , 1, 2 ,
  • 刘长斌 , 2 ,
  • 郑婕 1, 2 ,
  • 孟炀 2 ,
  • 梅新 1 ,
  • 陶婷 1, 2 ,
  • 赵倩 1, 2 ,
  • 梅广源 1, 2 ,
  • 杨小冬 , 2
展开
  • 1. 湖北大学 资源环境学院,湖北 武汉 430062,中国
  • 2. 农业农村部农业遥感机理与定量遥感重点实验室,北京市农林科学院信息技术研究中心,北京 100097,中国
刘长斌,工程师,研究方向为农业信息化技术研究。E-mail:
杨小冬,博士,研究员,研究方向为农业遥感、农业空间信息服务系统研发。E-mail:

赵培钦,研究方向为农业遥感。E-mail:

ZHAO Peiqin, E-mail:

收稿日期: 2024-08-14

  网络出版日期: 2025-01-24

基金资助

国家重点研发计划(2023YFD2000105)

版权

copyright©2025 by the authors (登录www.smartag.net.cn免费获取电子版全文)

Improvement of HLM modeling for Winter Wheat Yield Estimation Under Drought Conditions

  • ZHAO Peiqin , 1, 2 ,
  • LIU Changbin , 2 ,
  • ZHENG Jie 1, 2 ,
  • MENG Yang 2 ,
  • MEI Xin 1 ,
  • TAO Ting 1, 2 ,
  • ZHAO Qian 1, 2 ,
  • MEI Guangyuan 1, 2 ,
  • YANG Xiaodong , 2
Expand
  • 1. School of Resources and Environment, Hubei University, Wuhan 430062, China
  • 2. Key Laboratory of Agricultural Remote Sensing and Quantitative Remote Sensing Mechanism, Ministry of Agriculture and Rural Affairs, Information Technology Research Center, Beijing Academy of Agriculture and Forestry Sciences. Beijing 100097, China
LIU Changbin, E-mail: ;
YANG Xiaodong, E-mail:

Received date: 2024-08-14

  Online published: 2025-01-24

Supported by

National Key Research and Development Program of China(2023YFD2000105)

摘要

【目的】 现有的作物估产模型通常在灾害气候条件下的估产精度不高,本研究提出一种基于干旱天气指数减产率模型的改进分层线性模型(Improved Hierarchical Linear Model, IHLM),旨在提高在干旱条件下作物产量估算的精度。 【方法】 采用最大值的增强植被指数-2(Maximum Enhanced Vegetation Index 2, EVI2max)和每年3月~5月降水量,辐射量和气温等气象数据和2018—2021年山东省160个农情调查基点的冬小麦实测产量数据构建冬小麦产量预测基础分层线性模型(Hierarchical Linear Model, HLM)。考虑到气象因素的变异程度是影响作物生长的关键障碍因子,首先将气象因子相对性计算进行模型改进,并对改进的HLM模型与随机森林(Random Forest, RF)模型、支持向量回归(Support Vector Regression, SVR)模型和极端梯度提升(Extreme Gradient Boosting, XGBOOST)模型进行精度对比。然后引入农业保险行业的干旱天气指数减产率模型,对改进的HLM模型进一步优化,从而更加适应干旱条件下的作物估产。为了验证IHLM模型的迁移性,本研究将其应用于河南省对比分析,以评估该模型在不同地理和气候条件下的表现。 【结果和讨论】 基于相对气象因子(Relative Meteorological Factors, rMF)改进的HLM模型精度相比于RF、SVR和XGBOOST更高,验证精度皮尔逊相关系数(Pearson Correlation Coefficien, r)为0.76,均方根误差(Root Mean Square Error, RMSE)为0.60 t/hm2,归一化均方根误差(Normalized Root Mean Square Error, nRMSE)为11.21%。在干旱条件数据集中,利用冬小麦干旱天气指数和冬小麦减产率的关系对模型进行了改进,改进之后RMSE减少了0.48 t/hm2, nRMSE减少了28.64个百分点,提高了IHLM模型在干旱条件下的精度。 【结论】 该研究对冬小麦产量HLM模型进行改进,提高了模型精度,在干旱情况下模型精度和稳定性有一定提升,相比于RF、SVR、XGBOOST模型,IHLM模型更适合对冬小麦产量预测。

本文引用格式

赵培钦 , 刘长斌 , 郑婕 , 孟炀 , 梅新 , 陶婷 , 赵倩 , 梅广源 , 杨小冬 . 面向干旱条件下的冬小麦估产HLM模型改进研究[J]. 智慧农业, 2025 : 1 -11 . DOI: 10.12133/j.smartag.SA202408009

Abstract

[Objective] Winter wheat yield is crucial for national food security and the standard of living of the population. Existing crop yield prediction models often show low accuracy under disaster-prone climatic conditions. This study proposed an improved hierarchical linear model (IHLM) based on a drought weather index reduction rate, aiming to enhance the accuracy of crop yield estimation under drought conditions. [Methods] The study constructed a winter wheat yield prediction hierarchical linear model (HLM) using the maximum Enhanced Vegetation Index-2 (EVI2max), meteorological data (precipitation, radiation, and temperature from March to May), and observed winter wheat yield data from 160 agricultural survey stations in Shandong province (2018–2021). To validate the model's accuracy, 70% of the data from Shandong province was randomly selected for model construction, and the remaining data was used to validate the accuracy of the yield model. Based on the basic HLM model, the study proposed a method to build an improved hierarchical linear model (IHLM). It considered the variation in meteorological factors as a key obstacle affecting crop growth and improved the model by calculating the relative meteorological factors. The calculation of relative meteorological factors helped reduce the impact of inter-annual differences in meteorological data. The accuracy of the improved HLM model was compared with that of the Random Forest (RF), Support Vector Regression (SVR), and Extreme Gradient Boosting (XGBoost) models. The HLM model provided more intuitive interpretation, especially suitable for processing hierarchical data, which helped capture the variability of winter wheat yield data under drought conditions. Therefore, a drought weather index reduction rate model from the agricultural insurance industry was introduced to further optimize the HLM model, resulting in the construction of the IHLM model. The IHLM model was designed to improve crop yield prediction accuracy under drought conditions. Since the precipitation differences between Henan and Shandong Provinces were small, to test the transferability of the IHLM model, Henan province sample data was processed in the same way as in Shandong, and the IHLM model was applied to Henan province to evaluate its performance under different geographical conditions. [Results and Discussions] The accuracy of the HLM model, improved based on relative meteorological factors (rMF), was higher than that of RF, SVR, and XGBoost. The validation accuracy showed a Pearson correlation coefficient (r) of 0.76, a Root Mean Squared Error (RMSE) of 0.60 t/hm², and a Normalized RMSE (nRMSE) of 11.21%. In the drought conditions dataset, the model was further improved by incorporating the relationship between the winter wheat drought weather index and the reduction rate of winter wheat yield. After the improvement, the RMSE decreased by 0.48 t/hm², and the nRMSE decreased by 28.64 percentage points, significantly enhancing the accuracy of the IHLM model under drought conditions. The IHLM model also demonstrated good applicability when transferred to Henan Province. This study used meteorological data from March to May and remote sensing data from EVI2max, which are easy to obtain, highly transferable, and offer good accuracy and resolution. Additionally, this research provided an approach to improve model stability under extreme weather conditions, showing a significant improvement in the model's performance. [Conclusions] The IHLM model developed in this study improved the accuracy and stability of crop yield predictions, especially under drought conditions. Compared to RF, SVR, and XGBoost models, the IHLM model was more suitable for predicting winter wheat yield. This research can be widely applied in the agricultural insurance field, playing a significant role in the design of agricultural insurance products, rate setting, and risk management. It enables more accurate predictions of winter wheat yield under drought conditions, with results that are closer to actual outcomes.

0 引 言

小麦是中国主要粮食作物之一。冬小麦的产量关乎国家粮食安全和人民的生活水平1-3,准确预测冬小麦产量对确保粮食安全、规划生产、储存、运输和其他相互关联的活动十分重要4。全球气候变化会影响冬小麦产量5-9,容易引发旱灾导致冬小麦减产10, 11。旱灾是农业保险灾害风险评估的重点12, 13,在干旱情况下对冬小麦产量准确预测具有重要意义。
利用遥感数据预测季内小麦产量已具备可行性14,以其无损、及时和经济的优势,成为收获后实验室测定产量的一种替代方式。农业估产模型更多基于单个试验区域的关键生育期建立,在确保估产精度的前提下,难以在年际和区域尺度上进行扩展15,机理性较差。为了克服这一问题,需要引入更多的数据和技术手段。目前,冬小麦产量预测模型可以分为统计模型、经验模型、机理模型和半机理模型4大类。统计模型依赖对历史遥感数据的分析16。在统计模型中研究者认为产量主要受光照和降水等环境因素影响17,以数据量和数据类型为切入点,一方面可以通过增加试验地点和生育期扩大数据集,从而提高模型的适应性和泛化能力,或者基于历史数据中的各种影响因素(如降水量、温度、辐射等)与冬小麦产量之间的线性关系进行建模18,或者利用基于作物长势参数的间接参数法19。利用经验模型对农作物产量预测,研究者使用基于非参数的机器学习模型20,例如使用随机森林(Random Forest, RF)、支持向量机(Support Vector Machine, SVM),已经通过集成学习融合多种预测器来提高产量预测精度21, 22,该类方法需要大量数据输入,计算复杂且消耗算力。基于生理生态机理的作物模型可以用于模拟和预测作物生长和发育,结合高效大量获取的遥感数据,实现产量预测。基于遥感获取更多作物生长信息,如植株高度、气象数据23、土地利用数据24等,对作物光谱信息进行补充,以提高模型的预测精度和可靠性。基于作物模型和遥感数据同化25,如Huang等使用集合卡尔曼滤波的方法,将叶面积指数(Leaf Area Index, LAI)同化进世界粮食研究模型(World Food Studies, WOFOST)作物模型26-28,Xu等29采用粒子群优化算法基于光学和雷达数据同化进联合国粮食及农业组织作物模型(The FAO Crop Model to Simulate Yield Response to Water, AquaCrop),在冬小麦产量预测上均取得了很好的改进效果。在基于半机理模型进行产量预测的研究中,Johnson等使用中分辨率成像光谱仪(Moderate-resolution Imaging Spectroradiometer, MODIS)获取的归一化植被指数(Normalized Difference Vegetation Index, NDVI)和增强型植被指数(Enhanced Vegetation Index, EVI)可以实现大麦、油麦、春小麦的产量预测30,这些参数易获取,有一定机理性,但易受到植被指数饱和的影响,适用性较差。Yu等31提出了一种基于高分辨率总初级生产力(Gross Primary Productivity, GPP)和时空动态收获指数(Harvest Index, HI)的高精度作物产量估测方法,在考虑光合作用、干物质积累和分配生理机制的基础上,通过收获指数将地上生物量转化为籽粒产量。这些研究表明,半机理模型在作物产量预估方面具有很大潜力。
干旱是一种非生物胁迫,严重影响农业产出。它不仅影响作物生长,还可能加剧其他胁迫如盐分、病原体攻击和热胁迫,从而对植物造成损害32。在干旱胁迫条件下,作物形态特征、生理生化特性,以及根系对水分的吸收能力都会有所变化,导致作物产量的变异性增大,作物估产的难度也会增大。国内外对冬小麦产量预测的研究很多,但多数集中于正常气候条件,在干旱条件下准确预测产量仍是一个挑战。现有的产量预估模型在极端天气情况下的适用性和精度都不高。但随着全球气候异常变化,极端天气出现频繁,必须开展在极端气象条件下产量预估研究,提高模型在极端气候条件下的稳定性,才能提高农作物估产精度。
本研究旨在开发一种针对干旱条件的冬小麦产量预估模型,提高干旱条件下冬小麦产量预测的准确性,增强模型在干旱条件下的适应性。因此,研究结合卫星观测(Sentinel-2)和区域气象信息(Fifth Generation ECMWF Atmospheric Reanalysis of the Global Climate, ERA5),利用山东省和河南省小麦历史产量数据,以及农业保险领域的气象指数损失模型,使用改进分层线性模型(Improved Hierarchical Linear Modeling, IHLM)建立了综合考虑小麦生长状况和气候因素的产量预测模型,提升估产模型在干旱条件下的稳定性和精度。

1 材料和方法

1.1 研究区概况

研究区域为山东省,干旱改进对比区域为河南省。山东省位于中国东部沿海(34°22.9′~38°24.01′N,114°47.5′~122°42.3′E),是中国主要的冬小麦种植区。境内以平原和山地丘陵为主,地形变化差异较大。山东省是典型的温带季风气候,春季和夏季的平均气温分别为14 ℃和25 ℃,年太阳辐射量为4 625 MJ/m2。年平均降水量为550~950 mm,自东南向西北递减。全年降水集中在夏季,容易发生洪涝,春季容易发生干旱。该地区每年轮作冬小麦和玉米,冬小麦通常在10月初播种,6月中旬收割,农业生产受气候灾害的影响较大。
河南省位于中国中部(110°21′~116°39′E,31°23′~36°22′N)。该省气候类型多样,总体上属于暖温带至亚热带的过渡性气候,具有明显的季风气候特征。河南省的气候和地形条件为农业生产提供了多样化的生态环境,适宜多种作物的种植,是重要的农业大省。
在2018—2021年间,两省的月平均降水量对比如图1,数据来源为欧洲中期天气预报中心,可以看出,山东省和河南省的降水差异不大。
图1 山东省和河南省2018—2021年月平均降水量对比

Fig. 1 Comparison of average monthly precipitation in Shandong Province and Henan Province, 2018—2021

1.2 数据获取与处理

1.2.1 产量数据采集

本研究产量数据来源为人工采集,在2018年—2021年,对山东省和河南省内多个种植冬小麦的地块进行了产量调查。在冬小麦收获期采用五点取样法,选择5个均匀生长的小麦样本点(1 m2/点)进行实收测产。采样点距离田块外围边界10 m以上,以减少边缘效应造成的影响。将采集的麦穗脱粒去壳,风干,测定水分含量和重量,最终按14%的标准含水量折算产量。每个地块最终得到一个产量值,单位为t/hm2。在2018—2021年期间,共随机采集了山东省160个样本数据,其中2018年28个样本,2019年37个样本,2020年37个样本,2021年58个样本,整体来说采样点在山东省西部相对较多。共采集了河南省148个河南冬小麦样本点,采集标准和山东省数据一样,其中2018年样本点42个,2019年样本点40个,2020年样本点29个,2021年样本点37个,山东省和河南省采样点总体的分布如下图2所示。
图 2 2018—2021年山东省和河南省采样点分布情况

注:该图基于自然资源部标准地图服务网站下载的审图号为GS(2019)1822号的标准地图制作,底图无修改。

Fig. 2 Distribution of sampling points in Shandong and Henan provinces from 2018 to 2021

1.2.2 遥感影像数据

研究使用的卫星影像数据是2018—2021年的Sentinel-2数据集。根据山东省冬小麦的年际生长期特点,每年3月~5月是冬小麦生长的关键时期。增强植被指数-2(Enhanced Vegetation Index 2, EVI2)指数构建的线性模型在生育后期可以较为准确地预测小麦的产量18,与标准的增强植被指数(EVI)相比,本研究使用的EVI2省略了蓝色波段(Blue)的反射率项,这一改变旨在提高对高生物量植被的敏感度,同时减少土壤背景和大气条件的干扰,在不包含蓝色波段项的情况下,EVI2能够更有效地反映本研究区域的植被状况。因此本研究在Google Earth Engine(GEE)平台上,引用GEE的COPERNICUS/S2_SR数据集,对使用的数据集大气校正后去云,选取B4红边波段和B8近红外波段,计算样本地块的EVI2值,并得到最大EVI2(EVI2max)31。根据EVI2时间序列显示,最大值集中在4月下旬至5月上旬,此时小麦位于挑旗期至开花期,是产量形成的关键时期,EVI2max表示了冬小麦的最大生长情况。EVI2的计算方法如公式(1)所示。
E V I 2 = 2.5 × N I R - R e d N I R + 2.4 × R e d + 1
式中:NIR和Red分别代表近红外和红色波段的光谱反射率。在后续模型计算之中,通过获取地块2018—2021年间每年4月1日—5月20日的遥感影像数据并统计出EVI2max数据,将其加入模型。

1.2.3 气象数据

3月至5月是冬小麦最关键的生长阶段(即茎生长、孕穗、抽穗、灌浆和灌浆阶段)33,这时期的气象数据是产量预测的重要输入变量。气象数据来源于GEE平台的ECMWF/ERA5_LAND/MONTHLY数据集,包括三种气象类型:月平均降水量(Monthly Average Precipitation, Pre)、月平均太阳辐射量(Monthly Average Solar Radiation, Rad)和月平均气温(Monthly Average Temperature, Tem),分辨率为0.1°×0.1°,所有的气象数据都被重采样到10 m分辨率以保证数据的一致性。其中,Pre是指一个月每天平均的降水量,即每月的总降水量除当月天数,将降水量数据乘1×103转换单位为mm;Rad除1×106,单位为MJ/m2;Tem减去273.15转换单位为℃。在小麦生长发育和产量形成过程中,不同生育期均对其有着显著影响。降雨量、辐射量和气温已被证明在营养生长阶段会影响分蘖形成,在营养生长和生殖生长并进阶段通过影响光合作用影响作物发育,因此选取了3月~5月的气象数据作为气象层的预测因子。为进一步分析三类气象数据的组间差异和年际差异,分别计算了2012年—2021年共计10年的3月~5月Pre、Rad和Tem的逐月平均值、最大值和最小值。其中2018年—2021年试验期间的气候条件如下图3所示。
图3 2018—2021年试验期间气候条件(气温、辐射量和降雨量)

a.3月~5月平均Rad和Tem b.3月~5月平均Pre

Fig. 3 Climatic conditions (temperature, radiation and rainfall) during the test period 2018—2021

1.3 模型方法

1.3.1 基于分层线性模型的产量预测模型

分层线性模型是普通最小二乘回归的复杂形式,其考虑了数据之间的嵌套结构关系18,该模型已经被广泛应用在冬小麦产量预估上15。分层回归是一种用于具有嵌套结构的多层数据的线性统计方法。遥感植被指数和作物产量之间的关系在不同地区和不同年份并不一致,因为气象条件影响冬小麦的生长和产量形成。目前,HLM已经被证明在预测作物农艺性状、产量和谷物蛋白方面具有可靠性,适用于跨年际和跨区域间的分析。鉴于此,研究将遥感数据EVI2与气象数据相结合,根据气象环境调整EVI2与产量之间的关系。引入HLM来分析两层预测变量对预测值的影响。产量预测模型的第一层(Level-1)类似于普通最小二乘法的回归,由EVI2max组成,如公式(2)所示。
L e v e l - 1 :   Y i e l d   = β 0 j + β 1 j × E V I 2 m a x   + r i j
式中: β 0 j β 1 j分别表示截距和线性回归系数; r i j表示Level-1层的随机误差。
在模型第二层(Level-2),Level-1中的 β 0 j β 1 j参数作为因变量存在,以气象因子(Meteorological Factors, MF)为因变量进行调整,如公式(3)所示。
L e v e l - 2 :   β m j   = γ m 0 +   i = 1 n γ m i * M F i + μ m j
式中: β m j分别表示Level-1中的 β 0 j β 1 j γ m 0 μ m j分别表示截距和随机误差; γ m i表示每一个MF的斜率;n表示MF的个数。
模型算法基于Python3.80实现,使用gdal库处理栅格数据,结合numpy库和pandas库对数据处理。在模型中基于Sentinel-2数据计算得到EVI2max数据,结合3、4、5月的Pre、Rad、Tem数据带入产量预测模型,得到预测结果并与实际产量数据进行比较和精度评估。其预估产量的模型结构如下图4所示。
图4 HLM产量预估模型结构图

Fig. 4 Structure of the HLM yield estimation model

1.3.2 IHLM模型构建方法

利用HLM模型对冬小麦产量预估已经有了很多研究,但是通常在干旱气候条件下的估产精度不高,本研究针对干旱情况进行了气象因子改进和干旱改进,构建了IHLM冬小麦估产模型。
1)模型气象因子改进。适当的降雨量、太阳辐射量和气温是小麦产量形成的重要气象保障。在产量预测模型中,参与建模的气象指标包括3月~5月每月的Pre、Rad和Tem。这三类数据的计量单位不同,反映的数值差异偏大,不具备可比性。研究采取相对气象平均值计算来反应不同气象数据的相对差异。
对于相对气象因子,与气象平均值的比较反映了气象数据偏离正常值的程度,数值越接近1,气象越正常稳定,反之气象差异越大,其技术见公式(4)
x ' = x i x ¯
式中: x '为各点位相对气象数据值; x i为各点位气象数据值; x ¯为10年内各月气象数据的平均值。
因此,本研究基于两种气象因子,分别与产量模型相结合,对不同方式组合的结果进行对比分析。
2)模型干旱改进。降水对冬小麦生长发育和产量的形成十分重要,遇到干旱天气,会导致冬小麦损失产量。参照天气指数选取原则,选择山东省冬小麦拔节—抽穗期(4月)的降水负距平百分率来代表冬小麦的干旱情况,具体计算如公式(5)所示。
H = - P i - P ¯ P ¯ × 100 %
式中: H为冬小麦干旱指数,%; P i为冬小麦开花期的降水量,mm; P ¯为2012—2021年冬小麦拔节—抽穗期的平均降水量,mm。
利用产量预估模型估产结果,结合实际产量计算冬小麦的减产率,具体计算如公式(6)所示。
y r = - y i - y i ' y i ' × 100 %
式中: y r为冬小麦减产比率,%; y i y i '分别为样本 i的实测值和预测值,t/hm2。本研究未使用该公式计算减产率,而是通过引用保险指数中冬小麦干旱天气指数与减产率的关系模型直接计算减产率。
对干旱情况下的HLM模型的估产结果改进,具体为公式(7)
y c = y i ' × ( 1 - y r )
式中: y c为干旱情况下矫正的冬小麦估测产量; y i ' y r分别为样本i的预测值和减产率。
3)IHLM模型搭建。基于原始HLM模型,结合rMF改进、冬小麦干旱天气指数与减产率的关系模型和对估产结果改进,得到IHLM模型。相对于原始HLM模型,IHLM模型利用相对气象因子减小各气象数据年际带来的差异,然后引入农业保险行业的干旱天气指数减产率模型,对干旱条件针对性改进,考虑了干旱对冬小麦产量带来的影响。IHLM模型能够更准确地反映农业实际生产条件,提高产量预估的精度。IHLM模型结构如下图5所示。
图5 IHLM产量预估模型结构图

Fig. 5 Structure of the IHLM yield estimation model

1.4 模型精度评价

从2018—2021年4年山东省收集的田间数据(n=160)中,按年份随机抽取70%的数据(n=112,建模集)用于构建模型,其他数据(n=48,验证集)用于验证产量模型的准确性。
采用皮尔逊相关系数(r)、均方根误差(Root Mean Square Error, RMSE)和标准化均方根误差(Normalized Root Mean Square Error, nRMSE)作为评价模型精度的指标,计算如公式(8)~公式(10)所示。
r = C o v y , y ' V a r y   V a r y '
R M S E = i = 1 n ( y i - y i ' ) 2 n
n R M S E = R M S E R a n g e ( y )
式中: y i y i '分别为样本 i的实测值和预测值; C o v ( y , y ' )是实测值和预测值的协方差, V a r y V a r y '分别为实测值和预测值的方差;n代表样本个数; R a n g e ( y )表示实测值的范围大小。其中r的值越大,越说明模型因子和结果相关性高,RMSE和nRMSE的值越小,说明模型精度越高。

2 结果与分析

2.1 不同生长季小麦产量和气象变化统计

表1总结了2018—2021年4年间山东省小麦实测产量的汇总统计数据,这些田块种植条件均不相同,包括不同的小麦品种、施肥水平、播种收获时间等。整个数据集的小麦产量范围在4.27~10.07 t/hm2之间,平均值为8.00 t/hm2。统计数据显示,在不同年份下小麦产量差异明显。研究选取的建模集和验证集产量范围较为一致(建模集:4.70~10.07 t/hm2,验证集:4.27~9.39 t/hm2),标准差分别为0.93和0.96,变异系数均为0.12,二者具有相似的统计特征。
表1 2018—2021年山东省冬小麦实测产量统计分析

Table 1 Statistical analysis of measured production of winter wheat in Shandong province from 2018 to 2021

数据集 样本数量/个 产量/(t/hm2
最小值 最大值 均值 标准差 变异系数
2018 28 5.63 9.50 7.68 1.12 0.15
2019 37 6.41 9.57 8.18 0.78 0.10
2020 37 4.27 9.32 8.00 0.87 0.11
2021 58 4.70 10.07 8.04 0.95 0.12
建模集 112 4.70 10.07 8.04 0.93 0.12
验证集 48 4.27 9.39 7.90 0.96 0.12
总计 160 4.27 10.07 8.00 0.94 0.12
总结2018—2021年试验期间的气候条件(表2),整体上看,3月至5月的Rad和Tem均呈现增长状态。不同年份间,每月的Tem均较为稳定,Rad存在一定差异。降雨量在不同年份间存在明显变化,是对小麦产量影响最为常见的气象因素。
表2 2018—2021年山东省月均气象数据统计

Table 2 Monthly average weather statistics for Shandong province from 2018—2021

数据集 3月 4月 5月
Pre/mm Rad/(MJ/ m2 Tem/℃ Pre/mm Rad/(MJ/ m2) Tem/℃ Pre/mm Rad/(MJ/ m2 Tem/℃
2018 0.92 13.97 10.28 1.76 16.0 16.41 2.53 16.56 21.25
2019 0.32 15.47 10.52 1.55 15.21 14.99 0.27 19.26 22.16
2020 0.31 14.53 10.60 1.08 17.82 14.56 1.72 18.34 21.82
2021 0.68 13.15 9.72 1.16 14.58 14.21 1.44 18.30 20.65

2.2 不同气象改进模型性能比较

分别使用MF、rMF两种气象因子构建了基于HLM的两种冬小麦产量预测模型,得到不同气象因子下的产量预测精度如图6。其中,使用原始气象数据MF构建的模型,在建模集和验证集中r分别为0.70和0.72,RMSE分别为0.75和0.74 t/hm2,nRMSE分别为13.87%和14.41%。对气象数据采用相对性计算后参与建模,显著提高了产量预测精度,使得在建模集和验证集中r分别为0.76和0.75,RMSE分别为0.60和0.65 t/hm2,nRMSE分别为11.21%和12.80%。基于rMF变量的产量模型,相比较原始基于MF变量的产量模型,在建模集和验证集中RMSE分别降低了0.15和0.09 t/hm2,nRMSE分别降低了2.66个百分点和1.61个百分点,说明使用rMF变量参与建模表现出更优的预测精度,效果比MF好。对气象数据相对化计算,将每个气象因子除以该气象因子10年内平均值,这样将不同单位的气象数据转换为相对数值,有助于避免不同量级特征对结果的影响,相对化后的数据被调整到同一尺度,可以跨区域跨时间段比较,提高模型的准确性。
图6 基于不同气象因子的产量模型精度比较

a.MF气象因子 b.rMF气象因子

Fig. 6 Comparison of yield model accuracy based on different meteorological factors

2.3 不同产量预测模型性能比较

机器学习方法在农业产量预测领域中被广泛应用,其中随机森林算法(Random Forest, RF)、XGBOOST(Extreme Gradient Boosting)和支持向量回归(Support Vector Regression, SVR)是近年来常用的模型,这几种模型各自具有优势,通过与这三种模型的对比可以更全面地评估HLM模型产量预估的准确性。RF是一种机器学习方法,常用于分类和回归任务,它结合了决策树的优点,并通过随机选择样本和特征来减少过拟合,提高模型的泛化能力。预测冬小麦产量可以看作是一个回归问题,输入气象数据及EVI2max数据回归得到最后的产量预测结果。SVR也是一种机器学习算法,用于解决回归问题。与传统的回归方法相比,SVR能够处理非线性关系,并在面对高维数据时表现出色。XGBOOST是一种梯度提升算法,用于解决分类和回归问题。它是一种基于决策树的集成学习算法,通过迭代训练决策树模型并组合多个弱分类器来提升模型性能。
将原始HLM模型及基于rMF改进后的HLM模型,与RF模型、SVR模型和XGBOOST模型进行对比分析,全面评估不同模型在冬小麦产量预测任务中的性能和特点。为了提升模型性能并且防止过拟合,需要找到模型的最优参数,经试验,确定对比模型最优超参数的设置如表3所示。不同模型的精度如表4所示,在验证集中改进后的HLM模型相对于RF,SVR和XGBOOST,r分别提高了0.04,0.01和0.03,RMSE分别减少了0.04,0.06和0.02 t/hm2,nRMSE分别减少了0.7个百分点,1.10个百分点和0.24个百分点。原始HLM模型在验证集中效果并没有明显优于RF,SVR和XGBOOST模型,模型精度并不足够,但是基于rMF气象改进之后,模型精度有了略微提升,改进之后的HLM模型相比其他三个模型稍有优势。
表3 冬小麦产量预估研究对比模型超参数设置

Table 3 Hyperparameterization of comparison models for winter wheat yield estimation studies

模型类别 超参数 超参数范围 最优超参数
RF 子树的数量 100,200,500,1 000,2 000,4 000 2000
最大生长深度 1,3,5,10,20 3
SVR 惩罚系数 100,500,1 000,2 000,4 000 1000
核函数类型 linear,rbf,poly linear
XGBOOST 子树的数量 50,60,70,80 70
最大深度 11,13,15,17,19,21 15
学习率 0.01,0.1,0.2 0.1
表4 冬小麦产量预估研究不同模型精度比较

Table 4 Comparison of the accuracy of different models for winter wheat yield estimation studies

模型类别 r RMSE/(t/hm2) nRMSE/%
RF 0.71 0.69 13.50
SVR 0.74 0.71 13.90
XGBOOST 0.72 0.67 13.04
HLM 0.72 0.74 14.41
HLM基于rMF改进后 0.75 0.65 12.80
HLM模型作为线性模型提供了更直观的解释,特别适合处理具有层次结构的数据,这有利于捕捉干旱情况下冬小麦产量数据的变异性,可以直观看到干旱对产量带来的影响。而RF、SVR、XGBOOST模型通常被认为是黑盒模型,RF构建多个决策树并将它们的预测结果结合起来,XGBOOST通过添加树使得可微分的损失函数最小化,在处理大规模数据时非常高效,SVR通过在高维空间中寻找最优超平面来预测连续的数值变量,通常适用于非线性结构的小规模样本数据,这三个模型内部关系复杂,在面对极端情况或异常值时,它们对这类值过于敏感而不稳定,因此HLM模型在干旱条件下表现更优。

2.4 干旱条件下HLM模型改进

在基于rMF气象因子的HLM模型中,根据冬小麦干旱天气指标和减产指标,选取山东省同时满足减产率5%以上和四月份干旱指数在20%以上的冬小麦数据共17个样本作为验证集。
引用冬小麦拔节—抽穗期干旱天气指数保险研究12中冬小麦干旱天气指数与减产率的关系模型,如公式(11)所示。
y r = 0.3204 H - 0.0264
式中: H为冬小麦的干旱天气指数,%; y r为冬小麦的减产率,%。干旱天气指数越大,即干旱程度越重,减产率越高,该公式计算出的干旱天气指数与减产率之间的关系等级与刘荣花研究划分的干旱灾害指标等级基本一致12,说明建立的干旱天气指数与冬小麦减产率关系模型合理可行。
利用IHLM模型对干旱改进前预测产量与干旱改进后预测产量对比分析精度,得到对比结果,如图7所示,干旱改进前后,验证集模型的r都为0.83,RMSE分别为0.78和0.30 t/hm2,nRMSE分别为46.19%和17.55%;在模型干旱改进后,RMSE减少了0.48 t/hm2,nRMSE减少了28.64个百分点。利用干旱减产条件产量数据集得到干旱改进前后山东省旱灾条件下冬小麦预测产量对比,如图8所示,改进之前存在一些精度在90%以下的点位,平均精度为89.66%,但是改进之后预测精度都在90%以上,平均精度为96.59%,干旱情况下冬小麦平均估产精度提高了6.93个百分点,明显提高了在干旱情况下估产模型的精度和稳定性。
图7 干旱改进前后山东省冬小麦正常气象和旱灾条件预测产量对比图

a.干旱改进前 b.干旱改进后

Fig.7 Comparison of predicted yields of winter wheat under normal meteorological and drought conditions in Shandong province before and after drought improvement

图8 干旱改进前后山东省旱灾条件下冬小麦预测产量对比图

Fig. 8 Comparison of projected winter wheat yields under drought conditions in Shandong Province before and after drought improvement

为了研究模型适用性,河南省样本点数据经过和山东省相同的处理流程,在基于rMF气象因子的HLM模型中,根据冬小麦干旱天气指标和减产指标,选取同时满足减产率5%以上和四月份干旱指数在20%以上的冬小麦数据共15个样本作为验证集,得到rMF干旱改进前后河南省冬小麦预测产量对比,如图9所示。模型改进后平均精度为93.83%,模型相对于改进前平均精度提高了5.10个百分点,平均提高精度相比山东省低了1.83个百分点,表明改进之后的模型在河南省地区适用性也良好,提高了在干旱条件下冬小麦估测精度。
图9 干旱改进前后河南省旱灾条件下冬小麦预测产量对比图

Fig.9 Comparison of projected winter wheat yields under drought conditions in Henan province before and after drought improvement

3 结论和讨论

3.1 讨论

现有作物生长模型依赖每日气象数据和长时间范围的遥感数据,数据量限制了它扩展和应用,本研究使用气象数据为3~5月气象数据,使用遥感数据为最大EVI2max数据,数据获取难度低,有良好的可迁移性,并且精度和分辨率较高。现有农作物估产研究多数集中于正常气候条件,本研究基于农业保险行业的气象损失模型计算减产率从而改进在干旱条件下估产精度,提供了一种在极端气象条件提高模型稳定性的思路,从结果来看,模型有很大改善。
植被指数与产量关系之间以及气象数据与产量关系间存在嵌套问题,而HLM在解决嵌套数据问题方面提供了潜在的优势34,它在跨地区和年际的情况下有很高的估产精度。随着全球气候变暖,干旱情况出现频繁,在干旱条件下估算冬小麦产量会引入很大的不确定性,本研究进一步完善了冬小麦遥感估计模型的框架,模型改进考虑了气象年际变化和干旱对产量带来的影响,局限性在于没有考虑土壤因素,以及冬小麦病虫害导致减产带来的影响。因此,未来需要将这些因素一起加入到模型的改进之中。值得注意的是,本研究收集了山东省和河南省冬小麦的历史产量数据,样本点的数量和质量会对模型效果产生较大影响,而且利用遥感数据和气象数据及历史产量数据对冬小麦产量预估只能获得当下的长势信息,后续产量变化可能受到其他因素的影响。
本研究构建IHLM模型提高了冬小麦估产模型在干条件下的精度,其可以被应用在多方面,如政府部门可以根据干旱情况下冬小麦产量预测结果,制定相应的农业支持政策,调整种植策略,面对干旱情况时,精准农业系统可以根据预测结果合理优化灌溉计划,合理分配水资源,提高作物的抗旱能力,及时采取措施减轻干旱对冬小麦带来的影响,保险行业也可以根据干旱情况下减产结果确定合理的理赔方案。

3.2 结论

本研究基于改进分层线性模型IHLM对冬小麦的产量预估,将EVI2max数据和3月—5月的月平均降水量、月平均太阳辐射量和月平均气温一起加入到估产模型中,使用收集的2018年—2021年山东省和河南省冬小麦历史产量数据对模型精度进行评估。本研究基于原始气象因子MF改进为相对气象因子rMF,然后引入农业保险领域的气象指数损失模型构建IHLM模型,提升估产模型在干旱条件下的稳定性和精度。通过实验研究,得出以下结论。
1)基于rMF构建的产量预估模型相对于原始气象模型,精度有了一定的提升,rMF变量模型验证集的r相比MF提高了0.03,RMSE减少了0.09 t/hm2,nRMSE减少了1.61个百分点,rMF变量参与的估产模型表现更加优秀,估产的准确性有了较大提高。
2) 将原始HLM模型与基于rMF气象因子改进之后模型RF、SVR和XGBOOST模型进行了对比,改进之后的HLM模型表现更加优秀,相对于RF、SVR和XGBOOST,r提高了0.04,0.01和0.03,RMSE分别减少了0.04,0.06和0.02t/hm2,nRMSE分别减少了0.70,1.10和0.24个百分点,基于rMF气象因子改进之后的分层线性估产模型相对于其他模型而言更具有优势。
3) 在干旱情况下对于模型进行改进,引用冬小麦减产率和拔节—抽穗期降水量之间的线性关系并将减产率因子加入到模型之中,改进之后,模型RMSE减少了0.48 t/hm2,nRMSE减少了28.64个百分点,提高了冬小麦估产模型在干旱情况下的精度。改进之后模型使用在山东省的产量预测中,干旱情况下冬小麦估产精度提高了6.93个百分点,而在河南省的产量预测中,在干旱情况下平均精度提高了5.10个百分点。结果表明对模型的改进提高了模型在干旱条件下的稳定性和精度,并且在其他区域有良好的适用性。
本研究的干旱天气指数与减产率的关系模型可以在农业保险领域广泛使用。在干旱频发的情况下,准确的减产结果对于农业保险产品设计、费率制定和风险管理具有重要意义,农业保险公司可以根据预测结果,设计符合实际情况的保险产品,确定合理的保费,为农民提供风险保障。而将该模型运用到冬小麦产量预测计算中,通过分析不同干旱程度的减产比率,可以更准确地预测在干旱条件下的冬小麦产量,使得预测结果更加贴近实际,提高冬小麦在干旱情况下的预测精度。

利益冲突声明

本研究不存在研究者以及与公开研究成果有关的利益冲突。

1
WANG L G, TIAN Y C, YAO X, et al. Predicting grain yield and protein content in wheat by fusing multi-sensor and multi-temporal remote-sensing images[J]. Field crops research, 2014, 164: 178-188.

2
陶惠林, 徐良骥, 冯海宽, 等. 基于无人机高光谱遥感数据的冬小麦产量估算[J]. 农业机械学报, 2020, 51(7): 146-155.

TAO H L, XU L J, FENG H K, et al. Winter wheat yield estimation based on UAV hyperspectral remote sensing data[J]. Transactions of the Chinese society for agricultural machinery, 2020, 51(7): 146-155.

3
CUI K, SHOEMAKER S P. A look at food security in China[J]. NPJ science of food, 2018, 2: 4.

4
BENAMI E, JIN Z N, CARTER M R, et al. Uniting remote sensing, crop modelling and economics for agricultural risk management[J]. Nature reviews earth & environment, 2021, 2: 140-159.

5
王妍, 张晓龙, 石嘉丽, 等. 中国冬小麦主产区气候变化及其对小麦产量影响研究[J]. 中国生态农业学报(中英文), 2022, 30(5): 723-734.

WANG Y, ZHANG X L, SHI J L, et al. Climate change and its effect on winter wheat yield in the main winter wheat production areas of China[J]. Chinese journal of eco-agriculture, 2022, 30(5): 723-734.

6
AJILOGBA C F, WALKER S. Modeling climate change impact on dryland wheat production for increased crop yield in the Free State, South Africa, using GCM projections and the DSSAT model[J]. Frontiers in environmental science, 2023, 11: ID 1067008.

7
MIRGOL B, NAZARI M, ETEGHADIPOUR M. Modelling climate change impact on irrigation water requirement and yield of winter wheat (triticum aestivum L.), barley (hordeum vulgare L.), and fodder maize (zea mays L.) in the Semi-arid qazvin plateau, Iran[J]. Agriculture, 2020, 10(3): ID 60.

8
BRACHO-MUJICA G, RÖTTER R P, HAAKANA M, et al. Effects of changes in climatic means, variability, and agro-technologies on future wheat and maize yields at 10 sites across the globe[J]. Agricultural and forest meteorology, 2024, 346: ID 109887.

9
杨艳颖, 毛克彪, 韩秀珍, 等. 1949—2016年中国旱灾规律及其对粮食产量的影响[J]. 中国农业信息, 2018, 30(5): 76-90.

YANG Y Y, MAO K B, HAN X Z, et al. Characteristics of drought disaster and its impact on grain production in China from 1949 to 2016[J]. China agricultural informatics, 2018, 30(5): 76-90.

10
NXUMALO G, BASHIR B, ALSAFADI K, et al. Meteorological drought variability and its impact on wheat yields across South Africa[J]. International journal of environmental research and public health, 2022, 19(24): ID 16469.

11
GUAN X K, SONG L, WANG T C, et al. Effect of drought on the gas exchange, chlorophyll fluorescence and yield of six different-era spring wheat cultivars[J]. Journal of agronomy and crop science, 2015, 201(4): 253-266.

12
曹雯, 成林, 杨太明, 等. 河南省冬小麦拔节-抽穗期干旱天气指数保险研究[J]. 气象, 2019, 45(2): 274-281.

CAO W, CHENG L, YANG T M, et al. Study on weather index insurance of drought damage at jointing-heading stage of winter wheat in Henan Province[J]. Meteorological monthly, 2019, 45(2): 274-281.

13
杨太明, 许莹, 孙喜波, 等. 安徽省夏玉米干旱天气指数保险产品设计及应用[J]. 气象, 2016, 42(4): 450-455.

YANG T M, XU Y, SUN X B, et al. Design and application of the drought weather index insurance of summer corn in Anhui Province[J]. Meteorological monthly, 2016, 42(4): 450-455.

14
王靖雯. 基于遥感模型的作物产量差估算体系研究[D]. 北京: 中国科学院大学(中国科学院空天信息创新研究院), 2022.

WANG J W. A methodological study on estimating crop yield gap based on remote sensing models[D]. Beijing: University of Chinese Academy of Sciences (Aerospace Information Research Institute, Chinese Academy of Sciences), 2022.

15
LI Z H, TAYLOR J, YANG H, et al. A hierarchical interannual wheat yield and grain protein prediction model using spectral vegetative indices and meteorological data[J]. Field crops research, 2020, 248: ID 107711.

16
DEBAEKE P, ATTIA F, CHAMPOLIVIER L, et al. Forecasting sunflower grain yield using remote sensing data and statistical models[J]. European journal of agronomy, 2023, 142: ID 126677.

17
ZHUANG J Y, XU S W, LI G Q, et al. The influence of meteorological factors on wheat and rice yields in China[J]. Crop science, 2018, 58(3): 1440-1445.

18
韩少宇. 基于多平台遥感数据的冬小麦长势监测和产量预测[D]. 郑州: 河南农业大学, 2023.

HAN S Y. Growth monitoring and yield prediction of winter wheat based on multi-platform remote sensing data[D]. Zhengzhou: Henan Agricultural University, 2023.

19
KAYAD A, RODRIGUES F A, NARANJO S, et al. Radiative transfer model inversion using high-resolution hyperspectral airborne imagery-Retrieving maize LAI to access biomass and grain yield[J]. Field crops research, 2022, 282: ID 108449.

20
BELGIU M, DRĂGUŢ L. Random forest in remote sensing: A review of applications and future directions[J]. ISPRS journal of photogrammetry and remote sensing, 2016, 114: 24-31.

21
CHEN R Q, ZHANG C J, XU B, et al. Predicting individual apple tree yield using UAV multi-source remote sensing data and ensemble learning[J]. Computers and electronics in agriculture, 2022, 201: ID 107275.

22
FEI S P, HASSAN M A, XIAO Y G, et al. UAV-based multi-sensor data fusion and machine learning algorithm for yield prediction in wheat[J]. Precision agriculture, 2023, 24(1): 187-212.

23
李红艳, 徐建强, 许甫金, 等. 气象因素对水稻产量的影响及预测模型的建立[J]. 浙江农业科学, 2018, 59(7): 1104-1107, 1110.

LI H Y, XU J Q, XU F J, et al. Influences and prediction model of rice yield based on meteorological[J]. Journal of Zhejiang agricultural sciences, 2018, 59(7): 1104-1107, 1110.

24
CARNEIRO F M, DE BRITO FILHO A L, FERREIRA F M, et al. Soil and satellite remote sensing variables importance using machine learning to predict cotton yield[J]. Smart agricultural technology, 2023, 5: ID 100292.

25
王永强. 基于作物模型与遥感数据同化的区域尺度夏玉米生长模拟与灌溉施肥制度优化[D]. 杨凌: 西北农林科技大学, 2023.

WANG Y Q. Simulation of summer maize growth and optimization of irrigation and fertilization system on regional scale based on crop model and assimilation of remote sensing data[D]. Yangling: Northwest A & F University, 2023.

26
HUANG J X, SEDANO F, HUANG Y B, et al. Assimilating a synthetic Kalman filter leaf area index series into the WOFOST model to improve regional winter wheat yield estimation[J]. Agricultural and forest meteorology, 2016, 216: 188-202.

27
KANG Y H, ÖZDOĞAN M. Field-level crop yield mapping with Landsat using a hierarchical data assimilation approach[J]. Remote sensing of environment, 2019, 228: 144-163.

28
ZHUO W, FANG S B, GAO X R, et al. Crop yield prediction using MODIS LAI, TIGGE weather forecasts and WOFOST model: A case study for winter wheat in Hebei, China during 2009–2013[J]. International journal of applied earth observation and geoinformation, 2022, 106: ID 102668.

29
XU X B, NIE C W, JIN X L, et al. A comprehensive yield evaluation indicator based on an improved fuzzy comprehensive evaluation method and hyperspectral data[J]. Field crops research, 2021, 270: ID 108204.

30
JOHNSON M D, HSIEH W W, CANNON A J, et al. Crop yield forecasting on the Canadian Prairies by remotely sensed vegetation indices and machine learning methods[J]. Agricultural and forest meteorology, 2016, 218: 74-84.

31
YU W G, LI D, ZHENG H B, et al. HIDYM: A high-resolution gross primary productivity and dynamic harvest index based crop yield mapper[J]. Remote sensing of environment, 2024, 311: ID 114301.

32
AHLUWALIA O, SINGH P C, BHATIA R. A review on drought stress in plants: Implications, mitigation and the role of plant growth promoting rhizobacteria[J]. Resources, environment and sustainability, 2021, 5: ID 100032.

33
ZHAO Y, HAN S Y, ZHENG J, et al. ChinaWheatYield30m: A 30 m annual winter wheat yield dataset from 2016 to 2021 in China[J]. Earth system science data, 2023, 15(9): 4047-4063.

34
ZHAO Y, MENG Y, HAN S Y, et al. Should phenological information be applied to predict agronomic traits across growth stages of winter wheat?[J]. The crop journal, 2022, 10(5): 1346-1352.

文章导航

/