Welcome to Smart Agriculture 中文

Reconstruction of U.S. Regional-Scale Soybean SIF Based on MODIS Data and BP Neural Network

  • YAO Jianen ,
  • LIU Haiqiu ,
  • YANG Man ,
  • FENG Jinying ,
  • CHEN Xiu ,
  • ZHANG Peipei
Expand
  • Anhui Agricultural University Imformation and Artificial Intelligence College, Hefei 230000, China
LIU Haiqiu, E-mail:

Received date: 2023-09-05

  Online published: 2024-02-05

Supported by

Anhui Province Key Research and Development Plan(2022l07020017)

National Natural Science Foundation project(61805001)

Anhui Provincial Natural Science Foundation Project(1808085QF218)

Anhui Agricultural University Graduate Innovation Fund Project(2021yjs-51)

Copyright

copyright©2024 by the authors

Abstract

Objective SIF (Solar Induced Fluorescence) data obtained from satellites suffer from issues such as low spatial and temporal resolution, and discrete footprint because of the limitations imposed by satellite orbits. To address these problems, obtaining higher resolution SIF data, most studies are based on low-resolution satellite SIF for reconstruction. Moreover, the spatial resolution of most SIF reconstruction products is still not enough to be directly used for the study of crop photosynthetic rate at the regional scale. Although some SIF products boast elevated resolutions, it is crucial to underscore that these derive not from the original satellite SIF data reconstruct but instead evolve from secondary reconstructions based on preexisting SIF reconstruction products. A satellite named OCO-2 (The Orbiting Carbon Obsevatory-2) equipped with a high-resolution spectrometer, OCO-2 SIF has higher spatial resolution (1.29×2.25 km) compared to other original SIF products. It holds profound significance in advancing the realm of high-resolution SIF data reconstruction, particularly within the context of regional-scale crop studies. Methods This research primarily exploration SIF reconstruct at the regional scale, mainly focused on the partial soybean planting regions nestled within the United States. The selection of MODIS raw data hinged on a meticulous consideration of environmental conditions, the distinctive physiological attributes of soybeans, and an exhaustive evaluation of factors intricately linked to OCO-2 SIF within these soybean planting regions. This foundational research laid the groundwork for this subsequent investigation into reconstructing SIF using the original OCO-2 SIF data and MODIS products. The primary tasks encompassed reconstructing high resolution soybean SIF while concurrently executing a rigorous assessment of the reconstructed SIF's quality. During the dataset construction process, amalgamated SIF data from multiple soybean planting regions traversed by the OCO-2 satellite's footprint, the purpose was to retain as many of the available original SIF samples as possible. This approach has provided the subsequent SIF reconstruction model with a rich source of SIF data. SIF data obtained beneath the satellite's trajectory were matched with various MODIS datasets, including Enhanced Vegetation Index (EVI), Fraction of Photosynthetically Active Radiation (FPAR), and Land Surface Temperature (LST), resulting in the creation of a multisource remote sensing dataset ultimately used for model training. Because of the multisource remote sensing dataset encompassed the most relevant explanatory variables within each SIF footprint coverage area concerning soybean physiological structure and environmental conditions. Through the activation functions in the BP neural network, it enhanced the understanding of the complex nonlinear relationships between the original SIF data and these MODIS products. Leveraging these inherent nonlinear relationships, compared and analyzed the effects of different combinations of explanatory variables on SIF reconstruction, mainly analyzing the three indicators of goodness of fit R2, root mean square error RMSE, and mean absolute error MAE, and then selecting the best SIF reconstruction model, generate a regional scale, spatially continuous, and high temporal resolution (500 m, 8 d) soybean SIF reconstruction dataset (BPSIF). Results and Discussions The research findings confirmed the strong performance of the SIF reconstruction model in predicting soybean SIF. After simultaneously incorporating Enhanced Vegetation Index (EVI), Fraction of Photosynthetically Active Radiation (FPAR), and Land Surface Temperature (LST) as explanatory variables to model, achieved a goodness of fit with an R2 value of 0.84, this statistical metric validated the model's capability in predicting SIF data, it also reflected that the reconstructed 8 d time resolution of SIF data's reliability of applying to small-scale agricultural crop photosynthesis research with 500 m×500 m spatial scale. Based on this optimal model, generated the reconstructed SIF product (BPSIF). The Pearson correlation coefficient between the original OCO-2 SIF data and MODIS GPP stood were at a modest 0.53. In stark contrast, the correlation coefficient between BPSIF and MODIS Gross Primary Productivity (GPP) rosed significantly to 0.80. The increased correlation suggests that BPSIF could more accurately reflect the dynamic changes in GPP during the soybean growing season, making it more reliable compared to the original SIF data. This research selected soybean planting areas in the United States with relatively single crop cultivation as the research area, based on high spatial resolution (1.29 km×2.25 km) OCO-2 SIF data, greatly reduces vegetation heterogeneity under a single SIF footprint. Conclusions The resolution of most SIF reconstruction data is not yet sufficient for application in the agricultural field. Although some SIF reconstruction data have higher resolution, these data are not reconstructed from the original satellite SIF data, but evolved from the secondary reconstruction of pre-existing SIF reconstruction data, and the errors introduced cannot be ignored. BPSIF has significantly enhancing the regional and temporal continuity of OCO-2 SIF while preserving the time and spatial attributes contained in the original SIF dataset. Within the study area, BPSIF exhibits a significantly improved correlation with MODIS GPP compared to the original OCO-2 SIF. The proposed OCO-2 SIF data reconstruction method in this study holds the potential to provide a more reliable SIF dataset. This dataset has the potential to drive further understanding of soybean SIF at finer spatial and temporal scales, as well as find its relationship with soybean GPP.

Cite this article

YAO Jianen , LIU Haiqiu , YANG Man , FENG Jinying , CHEN Xiu , ZHANG Peipei . Reconstruction of U.S. Regional-Scale Soybean SIF Based on MODIS Data and BP Neural Network[J]. Smart Agriculture, 2024 : 1 -12 . DOI: 10.12133/j.smartag.SA202309006

0 引 言

美国种植区的大豆碳循环是全球大豆碳循环的重要组成部分。总初级生产力(Gross Primary Productivity,GPP)是叶片光合作用固碳量的总和,与植物碳循环过程密切相关1。部分研究使用基于可见光和近红外波段测量的植被指数(Vegetation Index,VI)作为GPP的代理,但传统植被指数并不能准确、直接地反映植物实际光合动态。日光诱导叶绿素荧光(Sunlight-induced Chlorophyll Fluorescence,SIF)是植物光合作用中心的副产物,是叶绿素分子在650~800 nm波段吸收的光合活性辐射(Photosynthetically Active Radiation,PAR)的部分再发射光2。相较传统植被指数,SIF对植被生长更敏感,可直接作为光合作用的探针3。已经有研究证实SIF与GPP之间存在显著相关性,表明SIF在估算GPP方面有重要价值4
已有的星载SIF数据,空间分辨率较低的有SCIMACHY SIF5(30 km×40 km),GOME-2 SIF6(40 km×80 km)和GOSAT SIF7(10.5 km×10.5 km);空间分辨率较高的有TanSat SIF8(1 km×2 km),OCO-2 SIF9(1.29 km×2.25 km)和FLEX SIF(300 m×300 m)。其中TanSat卫星重访周期16 d,轨道幅宽20 km,光谱范围758~778 nm,SIF像元足迹离散;OCO-2卫星重访周期16 d,轨道幅宽10 km,光谱范围757~775 nm,SIF像元足迹离散;FLEX卫星预计2025年发射,重访周期27 d,光谱范围670~780 nm,SIF像元足迹连续但轨道幅宽高达150 km10,对可获取SIF像元数量影响较大。Zhang等11基于热力学、光学、SIF和环境变量,使用多种机器学习方法估计了2001—2015年中国县级玉米产量,发现玉米的空间特征无法被低分辨率SIF数据采集。Cao等12使用0.05° SIF数据集预测县级水稻产量效果也不理想。目前对具有更高时空分辨率SIF数据的需求愈发强烈。
针对上述问题,许多研究重构生成了不同高空间分辨率的SIF。SIF重构指的是基于辐射传输模型或机器学习模型,利用空间不连续的SIF数据集结合解释变量生成空间连续SIF数据集的方法。Guo等13利用增强植被指数(Enhanced Vegetation Index,EVI)、温度和OCO-2 SIF模拟大兴安岭落叶林和针叶林SIF,发现不同空间尺度和不同解释变量的模型效果不同。考虑到不同的解释变量为SIF提供的生理信息差异14,并且植被空间信息会伴随着空间分辨率的提高而更加丰富,其他一些研究的研究区域大小、植被类型和解释变量的选择也不尽相同15
目前SIF重构主要分为全球和区域尺度下的森林、草原及农作物的重构。全球尺度方面,Ma等16使用GOME-2 SIF生成了全球0.05°的DSIF数据。Li和Xiao17使用MODIS的光谱波段作为解释变量,结合OCO-2 SIF数据集构建神经网络,生成了0.05°分辨率的全球连续GOSIF数据。Yu等18使用机器学习方法生成了0.05°的SIF数据集SIFoco2_005。然而SIF对入射辐射的响应随区域和植物类型而变化,全球尺度模型重构的SIF数据并未针对农作物展开验证,并且0.5°和0.05°分辨率的SIF不足以在农业这种小规模领域应用。草原和森林方面,Duveiller和Cescatti19使用0.5° GOME-2 SIF数据集建立了不同气候带下5.5°×5.5°区域范围内不同植被类型(森林和草原)0.5°SIF数据集的预测模型。Wen等20基于0.5° GOME-2 SIF创建了亚高山针叶林5°×5°区域范围内0.05° SIF数据集的模型。但由于GOME-2 SIF分辨率较低,足迹内植被异质程度较高,二者研究生成的高分辨率SIF数据会遗失部分信息。作物方面,Liu等21基于TROPOMI SIF、MODIS反射率和ERA5再分析数据生成了北京市小汤山镇冬小麦8 d 0.05°的eSIF数据集,eSIF与该区域的GPP相关系数R2为0.72。Kang等21基于GOSIF数据,利用两步卷积神经网络重构生成了新疆棉花种植区0.005°和0.000 5°的新型SIF数据集。但二者使用的SIF数据集时间分辨率较高(1 d),因此对多天的原始数据集进行了取平均值操作,可能会引入误差。
综上所述,在SIF反演方面,由于卫星SIF原始数据存在时空分辨率低、空间不连续等问题,SIF的重构应运而生,但研究者们所采取的数据源存在差异,部分研究者以空间连续但分辨率较低的卫星原始SIF数据为信息源(例如30 km×40 km的SCIMACHY SIF,80 km×40 km的GOME-2 SIF,7 km×7 km的TROPOMI SIF等),重构生成新的SIF数据集,将空间分辨率提升到0.5°和0.05°,但对于农作物而言,该空间分辨率仍然较低,尚不足以直接用于日光诱导叶绿素荧光的研究;另一方面,由于低分辨率卫星数据单个足迹点覆盖范围大,足迹点内存在作物异质性问题,会影响SIF重构的可靠性;OCO-2 SIF卫星原始数据空间不连续,仅在卫星轨迹点处存在SIF反演结果,故较少被应用于SIF重构中,但其空间分辨率(1.29 km×2.25 km)很高且幅宽很小,对于区域尺度农作物SIF重构很有价值。大豆在美国种植范围较广,本研究选取美国区域尺度大豆作为研究对象,通过组合多个OCO-2 SIF足迹经过的美国大豆种植区提高样本总量,与MODIS产品匹配构建数据集,探究利用OCO-2 SIF原始卫星数据和MODIS产品进行高分辨率大豆SIF重构的可能性,并生成区域尺度内空间连续且具有较高时空分辨率(8 d、500 m)的大豆SIF重构数据,试图为区域尺度作物日光诱导叶绿素荧光研究提供数据支撑。

1 研究数据和方法

本研究技术路线如图1所示。首先处理增强植被指数(Enhanced Vegetation Index,EVI)、光合有效辐射分量(Fraction of Photosynthetically Active Radiation,FPAR)、土地表面温度(Land Surface Temperature,LST)和OCO-2 SIF等数据后构建大豆种植区多源遥感数据集;在剔除数据集中的异常值后加入BP神经网络进行模型训练,并根据R2等统计指标确定最佳模型;基于最佳模型,利用更高分辨率(500 m×500 m)的EVI、FPAR、LST数据生成新型SIF数据(BPSIF),最后处理并提取MODIS GPP和OCO-2 SIF数据对BPSIF进行质量评价。
图1 美国区域尺度大豆SIF重构技术路线图

Fig. 1 Regional-scale soybean SIF reconstruction technology roadmap of USA

1.1 研究区域

本研究选取6块美国大豆主要种植区作为研究区域,包括爱荷华州、明尼苏达州、伊利诺伊州、俄亥俄州和内布拉斯加州,覆盖温带草原气候带和温带落叶阔叶林气候带。研究区域选自2019年美国农业部官网(https://nassgeodata.gmu.edu/CropScape)农田数据图层,如图2所示。区域内大豆于4月下旬开始种植,生长周期在90~120 d,本研究选取2019年5月1日至10月7日(儒略日第121~280 d)作为大豆的生长季节。探讨利用MODIS和OCO-2 SIF重构美国区域尺度大豆SIF的可行性。
图2 6块研究区域分布

注: 红色部分是区域内OCO-2 SIF足迹分布情况。

Fig. 2 Distribution of the six study area

1.2 研究数据来源

1.2.1 确定解释变量和因变量

由于OCO-2 SIF数据分辨率高,相较于其他SIF数据足迹内植被异质程度更低,轨道间幅宽更小,本研究选用OCO-2 SIF数据作为因变量,并确定了可以用来重构OCO-2 SIF的解释变量。前人研究表明SIF可以表示为公式(1) 23
S I F   =   F P A R × P A R × S I F p h o t o n
式中:FPAR是植物冠层吸收的光合作用有效辐射比例,对SIF影响显著;SIF photon 是每个荧光分子吸收的SIF发射量。该公式由估算GPP的LUE模型衍生而来,因此与LUE相关的环境因子也可能影响SIF24。相关研究证明SIF与LST(土地表面温度)之间关系如公式(2) 16
S I F     B 0 × f ( N D V I ) × f ( L S T ) × f ( E T )  
式中:B 0为常数;NDVI为差异化植被指数; LST为土地表面温度。有研究证明EVI和环境因子与SIF相关25,且EVI改善了NDVI在植被茂密区域应用的缺陷,本研究最终选取EVI和FPAR两种植被指数;由于环境条件复杂多样,除选取LST外,还选取了与光合作用有关的CO2和H2O作为环境因子。但加入EVI、FPAR、LST三个变量的模型,再加入H2O和CO2后模型效果并未提升,综合考虑模型复杂度,最终本研究选取EVI、FPAR和LST作为解释变量用于重构SIF。

1.2.2 OCO-2 SIF数据

OCO-2卫星由美国国家航空航天局(National Aeronautics and Space Administration,NASA)于2014年发射,旨在监测大气中的CO2浓度。OCO-2卫星搭载的高分辨率光谱仪测量了0.76 μm O2 A-B波段的反射光,衍生出了OCO-2 SIF数据。研究证明SIF是反应植物光合作用的有效指标,高云等26已成功将OCO-2 SIF应用于估算美国县级的大豆和玉米产量,验证了数据的可用性。
OCO-2卫星有最低点(Nadir)、闪烁(Glint)和目标(Target)三种数据观测模式,OCO-2 SIF足迹大小为1.29 km×2.25 km(越轨×沿轨)。考虑到研究区域主体为陆地,并且对消除云污染的要求较高。本研究使用Nadir模式下,包含偏差校正的740 nm波段的SIF,在剔除小于0 w/(m2·µm·sr)的异常值后尽可能多地保留可用SIF数据。OCO-2 SIF数据下载自https://disc.gsfc.nasa.gov

1.2.3 MODIS数据

MODIS是上午穿越赤道(Terra)和下午穿越赤道(Aqua)卫星上的关键仪器。Terra和Aqua提供了接近全球范围内每日可见光、近红外、短波红外和热红外区域的电磁光谱覆盖26。本研究选取了能够详细反应地表植被特征的MOD09Q1G EVI;反应作物冠层吸收的光合有效波长中可用辐射比例的MYD15A2H FPAR;反应地表温度的MYD11A2 LST,LST包含白天和夜间土地表面温度波段,由于光合作用在白天活跃,本研究采用的是白天波段;反应单位时间内绿色植物光合作用固碳总量的MYD17A2H GPP。MODIS产品数据均下载自https://ladsweb.modaps.eosdis.nasa.gov,具体信息见表1。其中EVI、FPAR、LST用作解释变量研究与OCO-2 SIF之间的关系,GPP用于重构后SIF的质量评价。
表1 EVI、FPAR、LST、GPP相关信息

Table 1 EVI, FPAR, LST, and GPP related information

数据 时间分辨率/d 空间分辨率/m 波段
EVI 8 500 Gap-Filled and Timesat-Smoothed EVI
FPAR 8 500 Composed FPAR from MODIS and Converted FPAR
LST 8 1 000 8-day daytime 1 km grid LST
GPP 8 500 MODIS/Aqua GPP 8-Day L4 Global 500m SIN Grid

1.3 研究方法

1.3.1 数据处理

美国农作物图层数据分辨率为30 m×30 m,理论上单个OCO-2 SIF(2 250 m×1 290 m)足迹下包含接近3 225个农作物像元(但部分区域可能存在未种植作物等情况,实际上小于该数值)。研究根据OCO-2 SIF单个足迹和单个农作物像元的经纬度范围,统计每个OCO-2 SIF足迹下包含的农作物像元数量,保留大豆占比70%以上的OCO-2 SIF像元用于建模。
本研究需保证区域内MODIS产品和SIF时空尺度的一致性。考虑到OCO-2卫星重访周期为16 d,SIF足迹大小为2.25 km×1.29 km,本研究将6个研究区域的OCO-2 SIF数据从儒略日第121~280 d编制到16 d时间尺度。同时利用最大值组成技术(Maximal Composition Technology,MVC)将EVI、FPAR、LST数据也编制到16 d时间尺度,并利用重采样技术将空间分辨率降低到2.25 km×1.29 km。将每16 d的EVI、FPAR、LST数据分别与对应的SIF数据进行像元匹配(研究设定与SIF足迹点中心沿经度/纬度距离小于0.002 5°为阈值,阈值内的MODIS数据为有效像元),然后汇总为多源遥感数据集,用于训练SIF重构模型。本研究保留了500 m空间分辨率,8 d时间尺度的MODIS EVI、FPAR、LST原始数据集,应用于最佳重构模型以获取新型SIF数据(BPSIF);同时也保留原始500 m空间分辨率,8 d时间尺度的GPP数据用于验证BPSIF的效果。

1.3.2 模型构建方法及评价指标

采用近年来较流行的有监督(已知输入和对应输出)机器学习回归算法:决策树、支持向量机、随机森林算法;深度学习回归算法:卷积神经网络(Convolutional Neural Networks,NN)、BP神经网络算法,以EVI、FPAR和LST为输入特征,SIF为输出特征进行了模型训练,结果如表2所示。
表2 有监督机器学习和深度学习算法性能对比

Table 2 Comparison of the performance of supervised machine learning and deep learning algorithms

指标 机器学习算法 深度学习算法
决策树回归 随机森林回归 支持向量机回归归 CNN BP神经网络
R 2 0.64 0.68 0.70 0.742 0.841
RMSE 0.123 0.118 0.114 0.241 0.152
MAE 0.096 0.093 0.089 0.193 0.039
表2结果显示,机器学习算法五次交叉验证实验中,决策树回归平均R 2为0.64;随机森林回归平均R 2 为0.68;支持向量机回归平均R 2 为0.70,均低于BP神经网络。深度学习算法CNN R 2 为0.74,也低于BP神经网络,这是因为CNN在BP神经网络基础上增加的卷积层和池化层对数据集进行了降维处理,导致效果并没有单纯使用BP神经网络好;而其他较流行的深度学习算法,例如循环神经网络(Recurrent Neural Networks,RNN)是在BP神经网络基础上添加长期记忆链应用于文本生成;长短期记忆网络(Long Short-Term Memory Networks,LSTM)是对RNN模型添加门控机制后的改进。由于本研究针对整个生长季数据集进行训练,数据集之间没有语义关联,经比较,使用RNN和LSTM模型对性能并没有增益,最终本研究选取了基础的BP神经网络用于回归分析。
BP神经网络训练过程由信号的正向传播和误差的反向传播两个部分组成。正向传播过程中引进的激活函数能更好地表达原始EVI、FPAR、LST、SIF数据包含的复杂信息,学习解释变量与SIF之间复杂的非线性映射关系,然后通过反向传播过程计算输出与期望值之间的误差来优化网络参数,提高模型性能。模型包含输入/输出层、隐藏层,输入层神经元数量等于输入的解释变量个数,输出层神经元数量为1,隐藏层神经元数量通过经验公式(3)得出范围,并根据训练过程的调优确定。
N o d e   =   i n p u t   +   o u t p u t     +   A   
式中:input/output为输入/输出层节点数;A为范围1~10之间的调节因子。
本研究按7∶1.5∶1.5的比例将多源遥感数据集划分为训练集、验证集和测试集,训练集用于训练具有最佳参数(权重、阈值等)的BP神经网络,验证集用于调整模型超参数(学习率、激活函数等),测试集用于评估模型的性能。SIF重构模型的解释变量包括生长季内大豆EVI、FPAR、LST数据的不同组合,因变量为大豆SIF数据。训练前将数据归一化消除不同特征单位差异的影响。最后利用拟合优度R2,均方根误差RMSE,平均绝对误差MAE等指标验证模型性能,如公式(4)、(5)、(6)所示。
M S E   =   1 n i = 1 n ŷ i   -   y i   
R M S E   =   1 n i = 1 n ( ŷ i   -   y i ) 2
R 2   =    1   -   i = 1   n ( ŷ i   -   y i ) 2 / i = 1   n ( ŷ i   -   ȳ ) 2
式中:ŷi 为SIF预测值;yi 为SIF实际值;ȳ为原始SIF数据平均值;n为SIF样本数量。

1.3.3 解释变量重要性分析方法

本研究采用特征重要性分析(Feature Important,FI)确定EVI、FPAR、LST等解释变量在SIF重构中的重要性。在同时输入EVI、FPAR、LST构建的最佳模型基础上,依次随机替换部分5—9月EVI、FPAR、LST三个特征变量中的值,使部分EVI、FPAR、LST和SIF之间建立起的联系失效,这会导致模型性能降低(表现为R 2变小),通过计算R 2的减少程度来评估EVI、FPAR、LST相对SIF的重要性。本研究中将20次重复实验结果的平均值作为每个特征的FI值,计算方法如公式(7)所示。
F I   =   R O r i g i n a l 2   -   1 n i = 1 n R F I 2
式中:R 2 Original表示未替换特征前的R 2R 2 FI表示特征替换部分值后的R 2n表示重复次数。

2 研究结果与分析

2.1 研究区MODIS数据与SIF随时间变化情况

为了解研究区大豆SIF与MODIS数据之间的关系,本研究计算了大豆生长季内每16 d的EVI、FPAR、LST和SIF的平均值,并绘制了大豆SIF和MODIS产品随时间的变化情况,如下图3所示。研究区农作物SIF在儒略日第153日开始显著上升,于儒略日第201日达到峰值后逐渐下降;EVI在儒略日第217日达到峰值,且峰值相比于SIF滞后,于儒略日第217日后开始下降;由于植物光合作用伴随的蒸腾作用会带走热量,理论上在无胁迫条件下SIF和LST之间呈负相关关系。但由于地表温度受环境温度的季节性影响,这一关系在生长季有所波动。儒略日第121~153日由于植物光合作用较弱(SIF数值较低),且受到夏季到来影响,LST逐渐升高;儒略日第153~201日由于植物光合作用增强(SIF数值较高),LST呈现下降趋势;儒略日第201~280日虽然植物光合作用减弱(SIF数值下降),但受到秋季气温下降影响,LST也呈现降低趋势。
图3 2019年大豆生长季节EVI、FPAR、LST以及SIF随时间变化情况

Fig. 3 Changes of EVI, FPAR, LST, SIF over time during the 2019 soybean growing season

由于2019年5—9月解释变量数据并不符合正态分布,采取Spearman相关系数进行EVI、FPAR、LST与SIF的相关性分析。研究计算发现各月份解释变量与SIF的P值均小于0.05标准显著性水平,表明各月份解释变量与SIF的相关性具有统计学意义,利用EVI、FPAR、LST进行大豆SIF的预测是合理的,研究区5—9月份EVI、FPAR、LST与SIF之间的P值如下表3所示。
表3 2019年5-9月EVI、FPAR、LST与SIF在双尾双样本等方差检验下的P

Table 3 P-values of EVI, FPAR, LST, and SIF from 5—9 September under two tailed and two sample tests of equal variance

月份 EVI FPAR LST
5月 0.030 1 2.90E-96 2.96E-322
6月 0.013 3 1.44E-44 4.32E-164
7月 3.59E-37 3.66E-8 4.14E-8
8月 7.02E-14 0.000 2 4.94E-182
9月 6.38E-14 0.042 2 3.27E-12

2.2 MODIS数据对SIF的预测性能

本研究采用生长季6个区域的大豆SIF、EVI、FPAR和LST数据训练BP神经网络模型,并分析了解释变量对模型的影响,不同解释变量组合对SIF的预测效果如图4(上标G表示归一化后的数据)所示。其中图4(d)表示同时加入EVI、FPAR和LST三个变量的模型,该模型具有最高的R 2、最低的RMSE和MAE,可以解释研究区域大豆SIF 84%的变化,表明植被指数和环境因子对预测大豆SIF有很大作用。单一变量输入的模型中,解释变量对大豆SIF预测的R 2从高到低依次为EVI(0.64),FPAR(0.53),LST(0.45),表明EVI对大豆SIF空间变化的捕捉能力强于FPAR和LST。研究发现模型加入EVI和FPAR的模型(图4(e))相比于仅使用EVI(图4(a))的模型性能几乎没有提升(R2由0.64提升到0.66),而其余双变量模型相对于只有一个解释变量的模型R2都明显提高。其中加入EVI和LST的模型(图4(f))R 2为0.80,对比最优模型R 2为0.84,表明EVI和LST作为输入的模型已经能很好地预测大豆SIF。
研究针对加入EVI和FPAR的双变量模型(图4(e))相对于单独使用EVI作为输入的模型(图4(a))性能几乎没有提升这一现象做了更深入的研究,结果发现在作物的冠层尺度上,EVI和FPAR之间存在相关性28,这导致FPAR与EVI同时存在于一个模型中时无法提供更多有关大豆SIF的额外信息,可能是FPAR加入模型后R2提升不大的原因。考虑到EVI、FPAR和LST同时作为输入的模型特征复杂度不高且R 2最高,基于该模型生成了重构后的SIF数据BPSIF。
(a)EVI与SIF相关性 (b)FPAR与SIF相关性 (c)LST与SIF相关性 (d)“EVI+FAPR+LST”与SIF相关性
(e)“EVI+FPAR”与SIF相关性 (f)“EVI+LST”与SIF相关性 (g)“FPAR+LST”与SIF相关性
图4 预测研究区大豆SIF的BP神经网络拟合图

Fig. 4 BP neural network fitting plot for predicting soybean SIF in the study area

2.3 用MODIS GPP和原始OCO-2 SIF验证BPSIF

利用最佳BP神经网络模型重构后的BPSIF数据集空间连续且分辨率为500 m,这导致生长季内研究区大豆原始OCO-2 SIF和BPSIF数据量差异巨大,为避免BPSIF数据量的提升对实验结果的影响,研究从重构后的BPSIF数据集中选取与原始OCO-2 SIF数据量一致的BPSIF数据进行相关性分析实验,结果作为研究区域内BPSIF的质量评估指标。考虑到前人已经证明GPP与SIF之间显著的线性相关性,研究采用Pearson相关系数分析BPSIF与GPP之间的相关性,二者达到了0.05的显著性水平;从图5(a)图5(b)可以看出BPSIF相比于OCO-2 SIF与GPP的相关性从0.53提高到0.80,有望为监测植被GPP的空间变化提供更好的数据集。
图5 质量评价结果对比

Fig. 5 Comparison of quality evaluation results

2.4 特征重要性分析

本研究利用最佳模型(包含最全面生理信息)计算2019年5—9月份EVI、FPAR、LST的FI数值以检验对大豆SIF预测的重要性。FI数值的大小与解释变量预测大豆SIF的能力成正比,也代表在大豆SIF预测模型中对性能的贡献更大。如图6(a)所示,7、8、9月份的EVI和FPAR在最佳大豆SIF预测模型中贡献最大,对预测大豆SIF起到了重要作用,其中最关键变量是7月份的EVI。7月是美国中北部大豆生育期,光合活动旺盛,作物覆盖茂密,EVI准确反映了这一现象。8、9月份日照充足,这2个月FPAR是大豆SIF预测第二和第三重要的变量,是由于大豆生长速度减慢造成的。LST对大豆SIF预测的重要性低于EVI和FPAR,如图6(b)所示,5、6月份的LST与SIF相关性较低,是大豆SIF预测中贡献最低的两个变量。光合作用伴随的蒸腾作用会降低地表温度,理论上SIF和LST呈负相关,但受气温对LST的影响,这一关系并不稳定,是导致各月份LST对SIF预测贡献较低的可能原因。为验证FI对解释变量预测大豆SIF能力的准确性,研究对比了5—9月份EVI、FPAR、LST和SIF的相关性和对应的FI值,证明了FI准确反映不同变量对模型的实际作用。
图6 5—9月EVI、FPAR、LST的FI分数以及与大豆SIF的相关性

Fig. 6 EVI, FPAR, LST FI scores from May to September (Figure a) and their correlation with soybean SIF (Figure b)

3 讨 论

3.1 BPSIF的优势讨论

图7所示,星载OCO-2 SIF数据除重访周期长外,还存在不同区域足迹大小不一致(图7(a)图7(b)中SIF的足迹形状完全不同)以及足迹不连续的缺陷(图7(a)白色部分为足迹缺失的像元),本研究重构的BPSIF可以提高原始SIF时间和空间上的连续性。
图7 忽略土地覆盖的OCO-2 SIF足迹简化图像

Fig. 7 Simplified image of OCO-2 SIF footprint ignoring land cover

具体来说,第一,BPSIF可以填补由于带状间隙和云污染而导致的数据集空间不连续,丰富了空间细节。从研究结果中得出的最明显发现是,原始SIF数据在区域尺度下每16 d的足迹分布差异显著,BPSIF时间分辨率提高到8 d,并且足迹分布连续且均匀,有望提高SIF在更精细尺度上应用的能力。第二,许多研究利用多天SIF平均值研究SIF与GPP的关系或者进行GPP预估,但SIF的平均值不一定能反应真实的SIF。BPSIF由未经数值处理的原始OCO-2 SIF数据与MODIS数据进行像元匹配后代入BP神经网络训练得到。图5(a)显示了利用最大值重组技术编制到16 d的MODIS GPP与16 d的OCO-2 SIF数据之间的相关性,图5(b)原始8 d时间尺度的MODIS GPP与BPSIF数据之间的相关性。结果表明,OCO-2 SIF与16 d尺度GPP相关性较低(r = 0.53),对此一种可能的解释是16 d尺度下SIF的有效观测过少。而8 d尺度的BPSIF与8 d尺度GPP有较强的线性相关性(r = 0.80),BPSIF的这一优势是由于它增强了OCO-2 SIF的时间连续性,而不是从稀疏的日SIF观测中提取16 d的SIF值。
目前的结果至少在2个主要方面具有重要价值。首先,本研究的模型有望在扩大研究区域和作物范围的基础上重构其他区域作物的SIF;其次,BPSIF有望为理解更精细尺度上的SIF数据提供数据来源以及为其他除SIF数据之外的无缝数据的生产提供有价值的参考。

3.2 SIF和GPP相关性研究分析对比

有研究证明SIF对光合活动敏感并且和GPP都依赖于吸收辐射,二者在冠层尺度上显著相关29。Guo等13发现在16 d时间尺度和1 km空间分辨率下SIF与GPP几乎没有相关性。Frankenberg等30的研究显示在4°×4°空间分辨率条件下GOSAT SIF与MODIS GPP相关性显著(R 2 = 0.74)。Guanter等31发现在2°×2°空间分辨率条件下二者相关性升高(R 2 = 0.80)。Parazoo等32总结出在2.5°×2°分辨率下GOSAT SIF与不同GPP数据集相关系数R 2值在0.63~0.84之间。基于以上研究我们得出结论,SIF和GPP之间的相关性会受到地域环境、植被种类和数据集类型的影响。
上述研究基本上是在较低的足迹空间分辨率条件下进行的,存在植物异质程度较高和混合像元较多的问题,会丢失部分植被真实的SIF信息,这可能会影响SIF和GPP的相关性。相比于之前的研究,本研究在500 m空间分辨率下进行BPSIF和GPP的相关性分析,降低了作物的异质现象及混合像元对实验结果的影响,这也是BPSIF与GPP相关性为0.80,相较于Guo13、Frankenberg等30以及Guanter等31的实验结果有所提高的可能原因。但相对于Parazoo等32的部分条件下的研究结果,本研究的BPSIF和GPP的相关性偏低,这可能是由于选取的GPP数据集不同或者研究区域植被类型的差异等原因造成的。

3.3 SIF重构方法的可靠性与不确定性分析

本研究基于BP神经网络,利用MODIS的 EVI、FPAR和LST等连续高分辨率数据重构OCO-2 SIF。该方法在理论上是合理的,研究选取的解释变量反映了作物冠层结构、叶片光能利用率和环境条件等与SIF关系密切的信息。与之前类似的研究相比,例如基于数据驱动的GOME-2降尺度方法,无缝OCO-2/Tansat生成方法33-35;前者生成GOME-2 SIF模型的RMSE在0.06~0.07之间,后者生成OCO-2 SIF模型的RMSE在0.065~0.08之间,本研究的BP神经网络最优模型的测试性能相比于二者更高。
本研究基于6个研究区域开发了SIF重构的通用模型,目前只在采集到原始OCO-2 SIF足迹覆盖下的区域展开了训练,最终训练的模型应用到完全没有原始SIF足迹覆盖区域的能力尚不清楚。另外,重构SIF的过程中原始数据引入的误差会导致模型的不确定性。这些误差第一部分是来自于MODIS的FPAR、EVI和LST数据采集过程中的误差,包括大气校正误差和云雾污染等,但这部分相对于SIF噪声来说较小。另外,数据重采样过程也会引入一部分的误差。第二部分误差来自于OCO-2 SIF数据检索,在将云污染分数控制在0.3以下之后,最主要的误差产生于噪声滤波过程,可能是导致模型不确定性的因素之一。

4 结 论

卫星原始SIF数据存在足迹离散、时空分辨率低等缺陷,并且目前无法获得其他连续的更高时空分辨率的SIF数据。许多研究重构生成了不同的SIF数据,但大多数重构SIF数据基于分辨率较低的星载SIF数据重构而来,低分辨率SIF数据造成的严重的植被异质现象,使得SIF重构结果的不可靠性增加。另外,多数SIF重构数据的分辨率尚不足以应用于农业领域,尽管一些SIF重构数据具有更高的分辨率,但这些数据并非重建自原始卫星SIF数据,而是基于先前存在的SIF重建数据的二次重构演变而来,其中引入的误差不可忽视。本研究选取农作物种植较为单一的美国大豆种植区作为研究区域,基于具有较高空间分辨率(1.29 km×2.25 km)的原始OCO-2 SIF数据,大大降低了单一SIF足迹下的植被异质性。基于BP神经网络,利用MODIS EVI、FPAR、LST作为解释变量重构了原始空间分辨率相对更高的OCO-2 SIF,并应用不同解释变量的组合构建模型并对R2进行评估,最终选择精度最高的模型(R 2 = 0.84)生成了美国大豆种植区2019年5—9月局部8 d、500 m时空分辨率的无缝BPSIF数据。
基于BP神经网络的大豆SIF重构结果表明,BPSIF提高了OCO-2 SIF区域尺度上的连续性和时间上的连续性,可以很好地保留原始SIF数据的时间和空间特征。经过验证,BPSIF相对于原始OCO-2 SIF与研究区域内MODIS GPP呈现出更显著的相关性(Pearson 相关系数由0.53提升到0.80)。因此研究提供的OCO-2 SIF数据重构方案有望为在更精细的时空尺度上理解大豆SIF和GPP之间的关系提供更好的SIF数据集。

利益冲突声明

本研究不存在研究者以及与公开研究成果有关的利益冲突。

1
ZHANG Z Y, ZHANG Y G, ZHANG Y, et al. The potential of satellite FPAR product for GPP estimation: An indirect evaluation using solar-induced chlorophyll fluorescence[J]. Remote sensing of environment, 2020, 240: ID 111686.

2
BAKER N R. Chlorophyll fluorescence: A probe of photosynthesis in vivo [J]. Annual review of plant biology, 2008, 59: 89-113.

3
ZARCO-TEJADA P J, CATALINA A, GONZÁLEZ M R, et al. Relationships between net photosynthesis and steady-state chlorophyll fluorescence retrieved from airborne hyperspectral imagery[J]. Remote sensing of environment, 2013, 136: 247-258.

4
HAO P Y, DI L P, ZHANG C, et al. Transfer learning for crop classification with cropland data layer data (CDL) as training samples[J]. Science of the total environment, 2020, 733: ID 138869.

5
KÖHLER P, GUANTER L, JOINER J. A linear method for the retrieval of Sun-induced chlorophyll fluorescence from GOME-2 and SCIAMACHY data[J]. Atmospheric measurement techniques, 2015, 8(6): 2589-2608.

6
JOINER J, GUANTER L, LINDSTROT R, et al. Global monitoring of terrestrial chlorophyll fluorescence from moderate-spectral-resolution near-infrared satellite measurements: Methodology, simulations, and application to GOME-2[J]. Atmospheric measurement techniques, 2013, 6(10): 2803-2823.

7
JOINER J, YOSHIDA Y, VASILKOV A P, et al. First observations of global and seasonal terrestrial chlorophyll fluorescence from space[J]. Biogeosciences, 2011, 8(3): 637-651.

8
SUN Y, FRANKENBERG C, JUNG M, et al. Overview of Solar-Induced chlorophyll Fluorescence (SIF) from the Orbiting Carbon Observatory-2: Retrieval, cross-mission comparison, and global monitoring for GPP[J]. Remote sensing of environment, 2018, 209: 808-823.

9
FRANKENBERG C, O'DELL C, BERRY J, et al. Prospects for chlorophyll fluorescence remote sensing from the orbiting carbon observatory-2[J]. Remote sensing of environment, 2014, 147: 1-12.

10
章钊颖, 王松寒, 邱博, 等. 日光诱导叶绿素荧光遥感反演及碳循环应用进展[J]. 遥感学报, 2019, 23(1): 37-52.

ZHANG Z Y, WANG S H, QIU B, et al. Retrieval of Sun-induced chlorophyll fluorescence and advancements in carbon cycle application[J]. Journal of remote sensing, 2019, 23(1): 37-52.

11
ZHANG L L, ZHANG Z, LUO Y C, et al. Combining optical, fluorescence, thermal satellite, and environmental data to predict county-level maize yield in China using machine learning approaches[J]. Remote sensing, 2019, 12(1): ID 21.

12
CAO J, ZHANG Z, TAO F L, et al. Integrating multi-source data for rice yield prediction across China using machine learning and deep learning approaches[J]. Agricultural and forest meteorology, 2021,297: ID 108275.

13
GUO M, LI J, HUANG S B, et al. Feasibility of using MODIS products to simulate Sun-induced chlorophyll fluorescence (SIF) in boreal forests[J]. Remote sensing, 2020, 12(4): ID 680.

14
YANG P Q, VANDERTOL C, VERHOEF W,et al.Using reflectance to explain vegetation biochemical and structural effects on sun-induced chlorophyll fluorescence[J]. Remote sensing of environment, 2019, 231: ID 110996.

15
DUVEILLER G, FILIPPONI F, WALTHER S, et al. A spatially downscaled Sun-induced fluorescence global product for enhanced monitoring of vegetation productivity[J]. Earth system science data, 2020, 12(2): 1101-1116.

16
MA Y, LIU L Y, LIU X J, et al. An improved downscaled Sun-induced chlorophyll fluorescence (DSIF) product of GOME-2 dataset[J]. European journal of remote sensing, 2022, 55(1): 168-180.

17
LI X, XIAO J F. A global, 0.05-degree product of solar-induced chlorophyll fluorescence derived from OCO-2, MODIS, and reanalysis data[J]. Remote sensing, 2019, 11(5): ID 517.

18
YU L, WEN J, CHANG C Y, et al. High-resolution global contiguous SIF of OCO-2[J]. Geophysical research letters, 2019, 46(3): 1449-1458.

19
DUVEILLER G, CESCATTI A. Spatially downscaling Sun-induced chlorophyll fluorescence leads to an improved temporal correlation with gross primary productivity[J]. Remote sensing of environment, 2016, 182: 72-89.

20
WEN J, KÖHLER P, DUVEILLER G, et al. A framework for harmonizing multiple satellite instruments to generate a long-term global high spatial-resolution solar-induced chlorophyll fluorescence (SIF)[J]. Remote sensing of environment, 2020, 239: ID 111644.

21
LIU X J, LIU L Y, BACOUR C, et al. A simple approach to enhance the TROPOMI solar-induced chlorophyll fluorescence product by combining with canopy reflected radiation at near-infrared band[J]. Remote sensing of environment, 2023, 284: ID 113341.

22
KANG X Y, HUANG C P, ZHANG L F, et al. Downscaling solar-induced chlorophyll fluorescence for field-scale cotton yield estimation by a two-step convolutional neural network[J]. Computers and electronics in agriculture, 2022, 201: ID 107260.

23
YOSHIDA Y, JOINER J, TUCKER C, et al. The 2010 Russian drought impact on satellite measurements of solar-induced chlorophyll fluorescence: Insights from modeling and comparisons with parameters derived from satellite reflectances[J]. Remote sensing of environment, 2015, 166: 163-177.

24
YANG X, TANG J W, MUSTARD J F, et al. Solar-induced chlorophyll fluorescence that correlates with canopy photosynthesis on diurnal and seasonal scales in a temperate deciduous forest[J]. Geophysical research letters, 2015, 42(8): 2977-2987.

25
KIRA O, Y-Y CHANG C, GU L, et al. Partitioning net ecosystem exchange (NEE) of CO2 using solar-induced chlorophyll fluorescence (SIF)[J]. Geophysical research letters, 2021, 48(4): ID e2020GL091247.

26
GAO Y, WANG S H, GUAN K Y, et al. The ability of Sun-induced chlorophyll fluorescence from OCO-2 and MODIS-EVI to monitor spatial variations of soybean and maize yields in the Midwestern USA[J]. Remote sensing, 2020, 12(7): ID 1111.

27
MOHAMMED G H, COLOMBO R, MIDDLETON E M, et al. Remote sensing of solar-induced chlorophyll fluorescence (SIF) in vegetation: 50 years of progress[J]. Remote sensing of environment, 2019, 231: ID 111177.

28
梁守真, 马万栋, 王猛, 等. 冠层绿色FPAR与植被指数关系及其对气溶胶的敏感性分析[J]. 测绘与空间地理信息, 2018, 41(12): 11-14.

LIANG S Z, MA W D, WANG M, et al. Analysis on the relationship between green FPAR and vegetation indices and their sensitivity to aerosol optical depth[J]. Geomatics & spatial information technology, 2018, 41(12): 11-14.

29
KÖEHLER P, FRANKENBERG C, MAGNEY T S, et al. Global retrievals of solar induced chlorophyll fluorescence with TROPOMI: First results and inter-sensor comparison to OCO-2[J]. Geophysical research letters, 2018, 45(19): 10456-10463.

30
FRANKENBERG C, FISHER J B, WORDEN J, et al. New global observations of the terrestrial carbon cycle from GOSAT: Patterns of plant fluorescence with gross primary productivity[J]. Geophysical research letters, 2011, 38(17): 2011GL048738.

31
GUANTER L, FRANKENBERG C, DUDHIA A, et al. Retrieval and global assessment of terrestrial chlorophyll fluorescence from GOSAT space measurements[J]. Remote sensing of environment, 2012, 121: 236-251.

32
PARAZOO N C, BOWMAN K, FRANKENBERG C, et al. Interpreting seasonal changes in the carbon balance of southern Amazonia using measurements of XCO2 and chlorophyll fluorescence from GOSAT[J]. Geophysical research letters, 2013, 40(11): 2829-2833.

33
GENTINE P, ALEMOHAMMAD S H. Reconstructed solar-induced fluorescence: A machine learning vegetation product based on MODIS surface reflectance to reproduce GOME-2 solar-induced fluorescence[J]. Geophysical research letters, 2018, 45(7): 3136-3146.

34
LI X, XIAO J F, HE B B. Chlorophyll fluorescence observed by OCO-2 is strongly related to gross primary productivity estimated from flux towers in temperate forests[J]. Remote sensing of environment, 2018, 204: 659-671.

35
MA Y, LIU L Y, CHEN R N, et al. Generation of a global spatially continuous TanSat solar-induced chlorophyll fluorescence product by considering the impact of the solar radiation intensity[J]. Remote sensing, 2020, 12(13): ID 2167.

Outlines

/