  马宇靖
  吴尚蓉
  杨鹏
  曹红
  谭杰扬
  赵荣坤
  1. 中北大学 信息与通信工程学院,山西 太原 030051,中国
  2. 北方干旱半干旱耕地高效利用全国重点实验室(中国农业科学院农业资源与农业区划研究所),北京 100081,中国
  3. 湖南省农业科学院农业经济和农业区划研究所,湖南 长沙 410125,中国


收稿日期: 2023-03-03

  网络出版日期: 2023-11-10






Research Progress and Challenges of Oil Crop Yield Monitoring by Remote Sensing

  MA Yujing
  WU Shangrong
  YANG Peng
  CAO Hong
  TAN Jieyang
  ZHAO Rongkun
  1. School of Information and Communication Engineering, North University of China, Taiyuan 030051, China
  2. State Key Laboratory of Efficient Utilization of Arid and Semi-arid Arable Land in Northern China (the Institute of Agricultural Resources and Regional Planning, Chinese Academy of Agricultural Sciences, Beijing 100081, China )
  3. Institute of Agricultural Economy and Agricultural Regionalization, Hunan Academy of Agricultural Sciences, Changsha 410125, China

Received date: 2023-03-03

  Online published: 2023-11-10

Supported by

National Natural Science Foundation of Hunan Province(2021JJ40286)

National Natural Science Foundation of China(42271374)

The Fundamental Research Funds for Central Nonprofit Scientific Institutions(1610132021009)

The Youth innovation Program of Chinese Academy of Agricultural Sciences(Y2023QC18)


[目的/意义] 油料作物是粮食供应和非粮食供应的重要组成部分,也是食用植物油和植物蛋白的重要来源。实时、动态、大范围的油料作物生长监测对指导农业生产、维持粮油市场稳定、确保国民生命健康具有重大意义。遥感技术因其覆盖范围广、获取信息及时、快速等优势被广泛应用于区域作物产量监测研究和应用中。 [进展] 本文首先介绍了利用遥感技术对油料作物进行估产的相关背景;其次,从遥感参数反演、面积监测及估产研究三个方面综述了基于遥感技术的油料作物监测研究现状,指出数据同化技术在油料作物估产方面具有极大潜力,并从同化方法、网格选取两方面进行详细阐述。 [结论/展望] 指出了遥感技术在油料作物监测中的机遇,提出了基于遥感技术的油料作物估产在作物特征选取、空间尺度确定以及遥感数据选择等方面存在的一些问题和挑战,并对未来油料作物估产研究的发展趋势进行了展望。本文可为油料作物的区域估产及生长监测的深入研究提供借鉴和参考。


马宇靖 , 吴尚蓉 , 杨鹏 , 曹红 , 谭杰扬 , 赵荣坤 . 油料作物产量遥感监测研究进展与挑战[J]. 智慧农业, 2023 , 5(3) : 1 -16 . DOI: 10.12133/j.smartag.SA202303002


[Significance] Oil crops play a significant role in the food supply, as well as the important source of edible vegetable oils and plant proteins. Real-time, dynamic and large-scale monitoring of oil crop growth is essential in guiding agricultural production, stabilizing markets, and maintaining health. Previous studies have made a considerable progress in the yield simulation of staple crops in regional scale based on remote sensing methods, but the yield simulation of oil crops in regional scale is still poor as its complexity of the plant traits and structural characteristics. Therefore, it is urgently needed to study regional oil crop yield estimation based on remote sensing technology. [Progress] This paper summarized the content of remote sensing technology in oil crop monitoring from three aspects: backgrounds, progressions, opportunities and challenges. Firstly, significances and advantages of using remote sensing technology to estimate the of oil crops have been expounded. It is pointed out that both parameter inversion and crop area monitoring were the vital components of yield estimation. Secondly, the current situation of oil crop monitoring was summarized based on remote sensing technology from three aspects of remote sensing parameter inversion, crop area monitoring and yield estimation. For parameter inversion, it is specified that optical remote sensors were used more than other sensors in oil crops inversion in previous studies. Then, advantages and disadvantages of the empirical model and physical model inversion methods were analyzed. In addition, advantages and disadvantages of optical and microwave data were further illustrated from the aspect of oil crops structure and traits characteristics. At last, optimal choice on the data and methods were given in oil crop parameter inversion. For crop area monitoring, this paper mainly elaborated from two parts of optical and microwave remote sensing data. Combined with the structure of oil crops and the characteristics of planting areas, the researches on area monitoring of oil crops based on different types of remote sensing data sources were reviewed, including the advantages and limitations of different data sources in area monitoring. Then, two yield estimation methods were introduced: remote sensing yield estimation and data assimilation yield estimation. The phenological period of oil crop yield estimation, remote sensing data source and modeling method were summarized. Next, data assimilation technology was introduced, and it was proposed that data assimilation technology has great potential in oil crop yield estimation, and the assimilation research of oil crops was expounded from the aspects of assimilation method and grid selection. All of them indicate that data assimilation technology could improve the accuracy of regional yield estimation of oil crops. Thirdly, this paper pointed out the opportunities of remote sensing technology in oil crop monitoring, put forward some problems and challenges in crop feature selection, spatial scale determination and remote sensing data source selection of oil crop yield, and forecasted the development trend of oil crop yield estimation research in the future. [Conclusions and Prospects] The paper puts forward the following suggestions for the three aspects: (1) Regarding crop feature selection, when estimating yields for oil crops such as rapeseed and soybeans, which have active photosynthesis in siliques or pods, relying solely on canopy leaf area index (LAI) as the assimilation state variable for crop yield estimation may result in significant underestimation of yields, thereby impacting the accuracy of regional crop yield simulation. Therefore, it is necessary to consider the crop plant characteristics and the agronomic mechanism of yield formation through siliques or pods when estimating yields for oil crops. (2) In determining the spatial scale, some oil crops are distributed in hilly and mountainous areas with mixed land cover. Using regularized yield simulation grids may result in the confusion of numerous background objects, introducing additional errors and affecting the assimilation accuracy of yield estimation. This poses a challenge to yield estimation research. Thus, it is necessary to choose appropriate methods to divide irregular unit grids and determine the optimal scale for yield estimation, thereby improving the accuracy of yield estimation. (3) In terms of remote sensing data selection, the monitoring of oil crops can be influenced by crop structure and meteorological conditions. Depending solely on spectral data monitoring may have a certain impact on yield estimation results. It is important to incorporate radar off-nadir remote sensing measurement techniques to perceive the response relationship between crop leaves and siliques or pods and remote sensing data parameters. This can bridge the gap between crop characteristics and remote sensing information for crop yield simulation. This paper can serve as a valuable reference and stimulus for further research on regional yield estimation and growth monitoring of oil crops. It supplements existing knowledge and provides insightful considerations for enhancing the accuracy and efficiency of oil crop production monitoring and management.

1 引 言

油料作物主要包括大豆、油菜、向日葵、花生等1,是粮食供应的重要组成部分2,也是饲用蛋白和生物润滑油等非粮食供应的重要来源3, 4,2021年为中国居民提供了超过70%的油脂供应5。中国是油料作物种植大国,2022年油料作物种植面积达1314.1万公顷,仅次于水稻、小麦、玉米三大主粮作物(http://data.stats.gov.cn)。中国是世界上重要的油料生产和消费大国,也是最大的大豆进口国。近年来,中国持续鼓励扩大油料作物种植,中央一号文件也多次提出“稳定大豆生产,多措并举发展油菜、花生等油料作物”“大力实施大豆和油料产能提升工程”“加力扩种大豆油料”等措施(http://lswz.gov.cn),因此预计油料作物种植面积将持续扩大。实时、动态、大范围的油料作物生长监测对指导农业生产、维持粮油市场稳定、确保国民生命健康具有重大意义。

2 油料作物遥感监测研究现状


2.1 油料作物参数反演

在基于遥感的作物监测过程中,生物量、叶面积指数(Leaf Area Index,LAI)等作物参数可以较好地描述作物生长状况,是研究作物产量的关键指标。但是,直接测量这些生长参数具有一定破坏性且成本昂贵。因此,基于遥感技术对上述作物参数进行反演研究以获取油料作物的观测信息具有重要意义。

2.1.1 经验模型

线性、指数等统计回归方法具有操作简单、解释性强的优点,常被用于作物参数的估计中。已有研究表明作物的植被指数(Vegetation Index, VI)与作物参数之间具有良好的相关性。研究人员基于统计回归方法优势,研究VI与油料作物生长参数的相关性,并进行参数反演研究。Zhang等15、Sun等16利用归一化植被指数(Normalized Difference Vegetation Index,NDVI)与LAI间的统计关系建立了油菜的LAI反演模型,发现NDVI与LAI之间存在较好的相关性,可用于作物的LAI参数反演研究。Qiu等17基于指数函数,利用NDVI及其衍生参数与LAI之间的关系构建油菜LAI反演模型,证明植被指数中的NDVI系列对LAI具有良好的反演效果。Qi等18利用归一化差分植被指数(Normalized Difference Spectral Index,NDSI)、比率光谱指数(Ratio Spectral Index,RSI)等构建高光谱简单回归(Simple Regression,SR)模型反演花生的叶片叶绿素含量(Chlorophyll Content,CC),指出光谱指数可以有效的反演花生叶片叶绿素。同时,已有研究指出,合成孔径雷达数据(Synthetic Aperture Radar,SAR)极化信息同样可用于油料作物的参数反演。Zhang等19利用线性、对数、二次等统计回归方法探索油菜的生长参数反演,研究发现极化信息对油菜作物参数具有高度敏感性,适用于油菜的生长参数反演。上述研究证明基于统计回归方法,利用遥感数据与作物参数之间的相关性进行反演研究是可行的。但是,当数据存在复杂的非线性关系时,仅靠简单的光谱特征提取和回归模型可能无法准确地进行作物参数反演。在此情况下,需要使用机器学习或物理模型等分析方法提高参数反演的准确性。
经验模型除线性、指数、对数等回归方法外,机器学习也被用于构建反演模型,且在实际应用中更具优势。利用机器学习建立遥感数据和作物观测数据之间的复杂非线性关系,通过训练模型并利用大量的数据进行预测,能够较准确地估算油料作物的产量。Yuan等20分别利用随机森林(Random Forest,RF)、人工神经网络(Artificial Neural Network,ANN)、支持向量机(Support Vector Machine,SVM)及偏最小二乘回归(Partial Least Squares Regression,PLSR)等几种不同的方法构建模型研究大豆LAI反演,发现ANN模型更适用于单个生育期的大豆LAI估计,而RF模型更适用于整个生育期的大豆LAI估计。Qi等21基于高光谱数据计算的比值植被指数(Ratio Vegetation Index, RVI)、NDVI等12个与LAI相关的植被指数,利用SR方法和反向传播神经网络(Back Propagation Neural Network,BPNN)分别构建预测模型估算花生的LAI,发现BPNN模型预测精度更高。Wei等13分别基于线性拟合和RF方法来构建反演模型估算油菜LAI,得出机器学习的反演精度更高的结论。此外,还有研究利用机器学习方法探索SAR遥感数据与油料作物参数的复杂相关关系。Mercier等22利用高斯过程回归(Gaussian Process Regression,GPR)反演油菜生物量,发现VH、VV等极化指标与湿重和干重相关性较高,且基于不同波段的雷达数据对油菜作物参数反演研究具有一定潜力。Ghosh等23采用GPR方法,基于C波段SAR数据构建模型估算油菜、大豆的植物面积指数(Plant Area Index, PAI)、植被含水量(Water Content,WC)、湿重等植株参数,证明全极化和双极化均可用于上述作物植株参数的反演。

2.1.2 物理模型

物理模型方法基于光的传输和相互作用过程,通过建立遥感数据与物理模型之间的映射关系,推断作物的光学参数,并利用观测数据对模型进行参数估计和优化13, 25。油料作物冠层的几何形状和生化特性会随生长发生变化,冠层内的辐射传递也随之改变26。而物理模型可描述冠层反射率随冠层、叶片和土壤背景特征的光谱变化27,适用于油料作物参数反演。PROSAIL模型是光学遥感反演中的经典模型,已被应用于检索油料作物的生化和结构变量,耦合原理如图1所示。优化方法主要包括迭代优化、查找表(Lookup Table, LUT)和神经网络等。与经验模型相比,物理反演方法适用于各种条件,更适合区域规模的参数反演28
图1 PROSPECT+SAIL耦合模型反演参数示意图14

Fig. 1 The inversion processing of parameters of PROSPECT+SAIL coupling model


2.2 油料作物面积监测

目前,利用遥感技术进行油料作物面积提取的方法主要有RF、决策树(Decision Tree,DT)、SVM等分类方法。数据源包含光学遥感和微波遥感数据,各有优势。

2.2.1 光学遥感数据

光学数据已被证明在油料作物的面积监测方面具有巨大潜力。Song等37通过Landsat、MODIS数据中的NDVI对美国大豆进行面积估计,研究指出时间序列指标可较好的表征植被生物物理特性,可应用于油料作物的分类及面积监测中。Shangguan等38使用RF方法,基于Landsat数据提取阿根廷全国的大豆种植面积,结果发现由NDVI与近红外波段计算的特征在大豆与非大豆的分类中具有重要作用。Li等39利用RF方法,使用Landsat数据估计黑龙江省的大豆种植面积,总体精度达到了84%。由于作物种植类型复杂,仅靠光谱特征将油料作物与其他类型作物及干扰地物区分开来具有一定难度。Yang等40利用DT法获取来自MODIS的增强型植被指数(Enhanced Vegetation Index, EVI)提取油菜种植面积,研究表明250 m分辨率适用于大尺度平原的面积监测,还发现,在种植结构复杂,地块破碎的小面积区域应该考虑更高分辨率的遥感影像。Jiang等41基于Sentinel-2光学数据对中国东北、华北、长江中下游平原地区的大豆、油菜等作物进行面积监测,并取得了较高的监测精度,此外,研究指出,长江中下游地区油菜作物农田零散,云和山等因素会对作物面积监测产生干扰,使得面积监测精度相对较低,这表明光学数据在山区作物的监测方面具有一定难度。

2.2.2 微波遥感


2.3 油料作物遥感估产


2.3.1 估产物候期

表1 部分油料作物物候期选择

Table 1 Selection of phenological period of some oil crops

作物 估产物候期
大豆 种子初期、豆荚期、灌浆期4748
油菜 开花期、角果期4950
花生 种子初生期51
向日葵 开花期前的花序出现阶段52

2.3.2 遥感数据源

光学遥感数据可以提供丰富的光谱信息,以反映作物的生长状况。当前作物估产研究使用的遥感数据以MODIS6, 57、Landsat58, 59、Sentinel-260, 61、环境星7等光学遥感数据为主。但是,遥感传感器不能直接感知作物产量,需要利用遥感波段或通过波段计算的植被指数反演与作物产量密切相关的冠层或作物参数获取遥感特征与作物参数间的关系,进而进行作物产量的估算62, 63。NDVI、EVI等植被指数被广泛应用于区域玉米64、小麦59, 65等作物的产量估算研究中,并获得了较好的估产进展。除主粮作物外,有研究证明光学植被指数同样适用于油料作物的估产研究。Song等66在对大豆的遥感估产研究中指出,生长季高峰期的NDVI是大豆模拟过程中最重要的变量之一。Zamani-noor等67基于多光谱数据计算的NDVI监测油菜生长状况,发现NDVI值在油菜的全生育期遥感监测中更为可靠。

2.3.3 建模方法

统计回归模型法主要基于遥感波段或遥感植被指数建立与产量的经验回归关系,建立遥感数据和产量之间的数学模型,主要包括最小二乘(Least Squares,LS)法和线性回归(Linear Regression,LR)法等。统计回归模型具有简单直观、快速高效、适用性广泛等优点,可用于获取大范围的作物产量信息。Li等48基于PLSR方法建立产量预测模型估算了区域大豆产量,验证了LAI、生物量等参数与大豆产量的显著相关性。回归模型建模方法简单但仍有一定局限性,存在模型稳健性不强的问题64。此外,作物的产量形成具有非线性特点,对于复杂的非线性关系使用简单的回归模型可能会影响估产结果的精度和准确性77
机器学习方法则是一种基于数据的建模方法,通过对大量数据进行训练学习遥感数据与产量信息之间的复杂关系78,从而建立作物估产模型,主要包括支持向量机回归(Support Vactor Regression, SVR)、BPNN等。机器学习可以自动学习来自多个数据级别的特征,因其高精度、训练快速及可用小样本建模等优势被广泛应用。Mateo-sanchis等79利用机器学习方法组合光学EVI和微波植被光学深度(Vegetation Optical Depth,VOD)的完整时间序列,并构建估产模型预测大豆产量,最终获得了较高的估产精度,其决定系数R 2高达0.9。Krupavathi等10在研究中指出,利用ANN方法构建产量预测模型相对稳定,可较好地获取作物产量与遥感参数之间的复杂关系,在产量预测中具有优越性。因此,相较于统计回归模型方法,机器学习法在油料作物估产领域具有更大的应用潜力。
国内外一些学者基于遥感技术在不同油料作物的估产研究上进行了探索,证明了机器学习方法在油料作物估产上的优越性。Pejak等80利用多光谱植被指数,分别基于SVM、RF、极限梯度提升(Extrme Gradient Boosting,XGB)、随机梯度下降法(Stochastic Gradient Descent,SGD)等多种不同的机器学习算法构建模型预测大豆产量,并探索不同模型的估产性能,结果发现相较于其他算法,SGD模型表现最佳,平均绝对误差MAE为0.436 t/ha,相关系数为0.83%。Schwalbert等81基于光学遥感数据计算的EVI和NDVI,结合长短期记忆神经网络(Long Short-Term Memory, LSTM)构建区域大豆产量预测模型并估算了大豆产量,与基于RF方法构建的估产模型预测结果进行比较,发现LSTM模型的MAE、RMSE指标均低于RF,说明LSTM在大豆产量预测方面的性能优于传统的机器学习算法。Sun等74基于光学遥感反射率,利用卷积神经网络(Convolutional Neural Network, CNN)、LSTM算法提出了一种CNN-LSTM深度学习模型并模拟县级大豆产量,研究表明相较于单纯的CNN、LSTM,所提出的CNN-LSTM模型预测性能更佳,其决定系数R 2为0.78。Abbaszadeh等82通过集成3维卷积神经网络(Three-Dimensional Convolutional Neural Network, 3DCNN)和卷积长短期记忆(Convolutional Long Short-Term Memory,ConvLSTM )两个深度神经网络构建估产模型,利用MODIS数据研究美国多个县的大豆产量,表明所提方法的大豆估产性能优于单独的3DCNN和ConvLSTM,能够更准确、可靠地用于大豆估产。Zhou等83基于多光谱大豆数据和CNN模型,开发了一种混合CNN模型用于估算大豆产量,并获得了较高的估产精度,预测精度R 2为0.78,研究指出深度学习方法在大豆产量预测方面具有较大潜力。Teodoro等84基于多光谱数据,提出了一个深层的深度学习网络用于大豆产量预测,并将其与RF、SVM和LR浅层学习模型进行比较,发现基于深度学习网络构建的估产模型预测精度最高。Reisi-gahrouei等85基于机载SAR数据的L波段,利用多元线性回归(Multiple Linear Regression,MLR)和ANN构建模型估计油菜、大豆作物的生物量,结果表明基于ANN构建的模型生物量估计更为准确。Yu和Shang86通过HJ-1A/1B计算的NDVI值结合物候特征,利用RF方法构建估产模型估算区域向日葵产量,结果证明RF模型可用于准确预测区域向日葵产量,均方根误差RMSE为0.4 t/ha,相对误差为10.1%。Zeng等87利用PLSR和ANN建立向日葵产量预测模型,结果表明结合遥感数据和ANN模型在向日葵产量预测方面具有一定优势。Amankulova等88基于Sentinel-2多光谱数据计算的植被指数,分别采用MLR、RF、SVM三种方法构建模型预测向日葵产量,结果表明RF方法是预测田间规模作物产量的最佳机器学习方法。大量研究证实了机器学习方法在油料作物遥感估产领域的优势。

2.3.4 数据同化估产

自20世纪60年代起,作物模型的研究随着农业科学、计算机技术的发展以及人类对作物生长机理认识的不断加深得到了快速发展89, 90。作物模型可以较好地模拟单点尺度的作物生长发育过程,但Deligios等91在对油菜的产量预测研究中发现作物生长模型不适用于区域尺度的油菜产量模拟。当作物产量模拟从单点研究扩展到区域尺度时,空间尺度的增加会带来地表或近地表环境的非均匀性,使得作物模型中的参数获取以及区域化等问题的解决遇到困难92, 93。卫星遥感因其覆盖范围广和时空分辨率等独特优势被应用于地面作物的信息获取,但只能获得时间有限、离散的作物生长观测数据,不能有效支持作物生长发育和产量形成动态过程的研究。而油料作物生长结构特殊,生长过程中伴随着光合器官的演替,这导致了时间上的显著差异性;与传统的主粮作物相比,油料作物的种植方式也存在差异,通常表现为小块且零散的田块,因而在空间分布上呈现出多样性。这些特殊性可能会给基于遥感技术的油料作物监测带来挑战。因此,可将遥感信息引入作物模型进行数据同化,以提高作物生长模拟和产量估测能力,实现遥感反演与作物模型模拟的时空扩展。而同化算法和同化网格是数据同化估产的重要组成部分,结合油料作物特点,选取合适的算法和网格进行研究尤为重要。
(1)同化算法。同化算法是作物同化估产系统中最重要的组成部分。基于代价函数的参数优化算法和基于估计理论的集合滤波算法,是目前使用最广泛的两类同化算法。前者主要包括单纯形搜索算法、复合型混合演算法(Shuffled Complex Evolution, SCE-UA等);代价函数有均方根误差、四维变分等。而后者主要有集合卡尔曼滤波(Ensemble Kalman Filter,EnKF)及粒子滤波(Particle Filter,PF)等同化算法。
有研究人员基于数据同化技术对油料作物展开研究,证实了数据同化技术可作为油料作物估产的一种有效工具。Trépos等94利用EnKF方法将LAI同化到SUNFLO作物模型中预测向日葵的产量,并比较了直接模拟和不同同化LAI算法的预测结果,研究发现与单独模拟相比,将LAI同化到作物模型中进行产量预测的结果更好(RMSE从9.88到7.49 q/ha),且相较于最小二乘估计(the Least Square Estimator, LSE)方法,EnKF方法进一步提高了产量预测精度(RMSE从7.92到7.49 q/ha),明显改善了向日葵的产量预测结果。研究表明,数据同化技术可以弥补遥感数据和实地观测数据的互补性,从而提高油料作物的区域估产精度。

3 油料作物产量监测的挑战与展望


3.1 主要挑战


3.1.1 作物特征选取

在同化估产系统中,桥接作物模型与遥感观测的同化变量直接影响着同化效率和估产精度。LAI与作物产量密切相关101,是主粮作物估产中较为常用的同化变量102, 103。但研究表明,对于大豆、油菜等油料作物,仅用LAI进行产量预测会造成估产精度偏低。
从植物学和作物学等相关学科进行分析发现,造成区域油料作物产量模拟精度偏低的原因在于大豆、油菜等油料作物存在豆荚或角果等光合作用活跃的非叶光合器官104-106。以油菜为例,叶片是油菜苗期至开花期的主要冠层组分,承担着油菜苗期的大部光合作用;油菜开花后角果生长,角果表面积迅速增加,叶片和角果共同作为油菜冠层组分并共同进行植株光合作用;角果期后,角果生长发育至定型,叶片衰落,油菜主要依靠角果皮光合作用充实菜籽,油菜角果成为冠层主要组分107-109。油菜长角果、大豆短荚果均因参与作物光合作用对产量形成具有一定作用,其中,油菜籽粒产量的50%—70%来自角果皮,而豆荚对产量的贡献仅次于叶片110, 111。由此可知,角果、豆荚等器官是大豆、油菜等油料作物的特有结构,与产量密切相关,这些特殊的生长结构和生理指标对于油料作物的产量估算具有重要影响。因此,对于油菜、大豆等角果或豆荚光合作用活跃的作物进行估产时,仅使用冠层LAI作为同化状态变量进行作物产量估算可能出现产量的严重低估,影响区域作物产量模拟的准确性。

3.1.2 空间尺度确定


3.1.3 遥感数据选取


3.2 展望




