欢迎您访问《智慧农业(中英文)》官方网站! English
信息处理与决策

基于长短时记忆网络(LSTM)的蟹塘溶解氧估算优化方法

  • 朱南阳 1 ,
  • 吴昊 2 ,
  • 尹达恒 1 ,
  • 王志强 1 ,
  • 蒋永年 3 ,
  • 郭亚 , 1, *
展开
  • 1. “轻工过程先进控制”教育部重点实验室,江南大学物联网工程学院,江苏无锡 214122
  • 2. 江苏省互联网农业发展中心,江苏南京 210017
  • 3. 江苏中农物联网科技有限公司,江苏宜兴 214200
* 郭 亚(1977-),男,博士,教授,研究方向:传感器与仪器,系统建模与控制,农业物联网与大数据分析,电话:0510-85910652,Email:

朱南阳(1994-),男,硕士,研究方向:水产大数据分析,Email: zhunanyang08@163.com。

收稿日期: 2019-05-22

  要求修回日期: 2019-07-15

  网络出版日期: 2019-08-23

基金资助

国家自然科学基金面上项目(31771680)

版权

版权所有,未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。

An improved method for estimating dissolved oxygen in crab ponds based on Long Short-Term Memory

  • ZHU Nanyang 1 ,
  • WU Hao 2 ,
  • YIN Daheng 1 ,
  • WANG Zhiqiang 1 ,
  • JIANG Yongnian 3 ,
  • GUO Ya , 1, *
Expand
  • 1. Key Laboratory of Advanced Process Control for Light Industry (Ministry of Education), School of Internet of Things Engineering, Jiangnan University, Wuxi 214122, China
  • 2. Jiangsu Internet Agricultural Development Center, Nanjing 210017, China
  • 3. Jiangsu Zhongnong Internet of Things Technology Co., Ltd., Yixing 214200, China

Received date: 2019-05-22

  Request revised date: 2019-07-15

  Online published: 2019-08-23

Copyright

Copyright reserved © 2019

摘要

水中溶解氧含量低会影响螃蟹的成活率,保证低溶解氧时刻溶解氧的预测精度非常重要。目前,溶解氧传感器价格昂贵且易遭受腐蚀,因此通过相关变量来间接估计溶解氧浓度有重要的意义。本研究在长短时记忆网络(LSTM)模型的基础上,优化LSTM反向传播时的损失函数,提出了提高低溶解氧含量估算精度的溶解氧预测模型(LDO-LSTM)。LDO-LSTM的损失函数是在平均绝对百分比误差(MAPE)基础上,根据溶解氧值的变化趋势和溶解氧浓度大小,分别赋予不同权值的权重函数,并通过均方根误差(RMSE)和平均绝对百分比误差(MAPE)来评估LDO-LSTM和LSTM在不同范围的溶解氧估算能力。对模型的测试试验结果表明:在溶解氧高于6mg/L时,LDO-LSTM和LSTM的RMSE、MAPE差值稳定在0.1左右;在溶解氧低于6mg/L时,LDO-LSTM的RMSE值和MAPE值分别比LSTM低0.25和0.139,说明了LDO-LSTM网络不但可以保证整体溶氧预测精度,而且能够提高较低溶解氧值的估算精度。本研究对于降低水产养殖成本、提高溶解氧估算精度有着重要的作用。

本文引用格式

朱南阳 , 吴昊 , 尹达恒 , 王志强 , 蒋永年 , 郭亚 . 基于长短时记忆网络(LSTM)的蟹塘溶解氧估算优化方法[J]. 智慧农业, 2019 , 1(3) : 67 -76 . DOI: 10.12133/j.smartag.2019.1.3.201905-SA004

Abstract

Dissolved oxygen (DO) is vital to aquaculture industry and affects the yield of aquaculture. Low DO in water can lead to death of crabs, therefore, it is important to measure DO accurately. However, the DO sensors are usually expensive and often lost function due to corrosion in water environmental and adsorption of different materials on their surface, which result in the inaccuracy in measured DO values. It is thus important to develop effective methods to estimate DO concentrations by using other environmental variables, which may reduce farmers' cost because DO sensors are not used. In this research, the collected environmental data, including temperature, pH, ammonia nitrogen, turbidity, were used to estimate DO concentrations in crab ponds. The data were preprocessed to eliminate missing values and outlier. Correlation analysis was applied to determine the relationship between environmental variables (temperature, pH, ammonia nitrogen, turbidity) and DO to show the rationale of using these four variables to forecast DO concentration. Principal component analysis was used to reduce the dimension of environmental data to reduce computation cost. For DO concentration estimation, it is more important to make the estimation of DO concentration at low values more accurate because DO concentration at low values is dangerous to crabs. This implies that estimation of DO concentrations at low or high values should be treated differently and applied different rates. Based on the Long Short-Term Memory (LSTM), a low DO concentration estimation model of Low Dissolved Oxygen Long Short-Term Memory(LDO-LSTM), which can improve the estimation accuracy of low DO values was proposed by optimizing the loss function of LSTM back propagation. The loss function of LDO-LSTM was based on the Mean Absolute Percentage Error (MAPE). According to the trend of DO, the true DO and the estimated DO values were applied weight functions. The Root Mean Square Error (RMSE) and the MAPE were used to evaluate the performance of LDO-LSTM and LSTM in DO estimation. Experimental results show that the value of RMSE and MAPE were stable at about 0.1 for LSTM and LDO-LSTM in forecasting DO when dissolved oxygen was higher than 6mg/L and the value of RMSE and MAPE of LDO-LSTM were lower than LSTM by 0.25 and 0.139. The results prove that the proposed method can not only provide desirable estimation accuracy for DO concentrations at high values but also make the estimated DO concentrations at low values more accurate. This research is expected very useful in reducing aquaculture costs and improving accuracy in forecasting DO especially at low values.

1 引言

溶解氧是溶解于水中呈现分子状态的氧,水产养殖中的溶解氧主要来源是大气中向水体渗入的氧气和水中植物通过光合作用释放出的氧。溶解氧的含量能反映水产品的生长状况,是衡量水体质量的综合指标,因此对于水中溶解氧的监控具有重要意义。目前,溶解氧的监测主要依靠溶解氧传感器,但是溶解氧传感器价格昂贵并且易受水体环境的腐蚀,导致测量不精确。因此,研究在不使用溶解氧传感器的情况下,通过温度、pH、浊度和氨氮等环境变量构建溶解氧估算模型具有重要意义。
目前,溶解氧的监测预测模型已有大量的研究。余成洲等[1]将集合经验模态分解与支持向量机(Support Vector Machine,SVM)结合,提高了溶解氧浓度的预测精度;陈彦等[2]考虑了季节效应,提出了利用条件期望误差的差分形式实现溶解氧的预测;Chen和Liu[3]通过比较自适应神经的模糊推理系统(Adaptive Network-based Fuzzy Inference System,ANFIS)、反向传播神经网络(Back Propagation Neural Network,BPNN)和多元线性回归模型(Multivariable Linear Regression Model,MLR),在溶解氧预测上的性能得出ANFIS要更优越;Olyaie等[4]为了提高溶解氧预测模型的性能,将SVM模型、人工神经网络(Artificial Neural Network,ANN)和线性遗传规划(Linear Genetic Programming,LGP)进行比较,结果表明使用SVM可以得到更优的模型预测效果;袁洪春和潘金晶[5]改进递归最小二乘法优化的径向基函数,对水温、酸碱度、盐度氧化还原电位进行建模来预测溶解氧,预测的结果优于径向基函数;宦娟和刘星桥[6]将K-means聚类算法和极限学习机(Extreme Learning Machine,ELM)神经网络算法进行结合,以15分钟为间隔,通过pH、水温、溶解氧、浊度、叶绿素、天气类型、气温、气压、湿度等环境特征因素构建溶解氧预测模型,虽然该算法在常规天气和突变天气下都有利于提高水产水质,但是模型使用的环境变量较多。施珮等[7]将广义回归神经网络(General Regression Neural Network,GRNN)和Elman神经网络算法应用于水产养殖溶解氧的预测,平均相对误差绝对值分别为7.48%和11.03%;吴静等[8]划分溶解氧数据为线性和非线性序列,分别采用差分整合移动平均自回归(Auto Regressive Integrated Moving Average,ARIMA)模型和遗传算法优化小波神经网络(Genetic Algorithm Optimization Wavelet Neural Network,GAWNN)模型,在不使用环境数据的情况下,得出了将遗传算法用于优化小波神经网络的预测模型获得最小的平均绝对误差的结论;魏小敏等[9]采用互信息理论(Mutual Information,MI)降低环境变量盐度值、pH、硝酸盐的相关性,建立了粒子群算法(Particle Swarm Optimization,PSO)优化的径向基神经网络(Radial Basic Function Neural Network, RBFNN)预测模型。
目前溶解氧的估算模型都是基于统计学习,机器学习算法和深度学习算法,深度学习在处理时间序列上有优越性,在各个领域得到了大量的应用。深度学习在时间序列方面的预测主要依赖于循环神经网络,该算法能够将过去时刻的信息与当前时刻的信息融合,来预测或估算信息,但是该方法在处理长时间序列问题时,容易造成梯度消失和梯度爆炸[10]。循环神经网络的变种长短时记忆网络(Long Short-Term Memory,LSTM)能够解决长时间序列的问题。李志刚等[11]采用LSTM循环神经网络和ARIMA两种预测模型对高炉煤气产生量预测,验证了结合LSTM模型与ARIMA模型能够改善模型的弊端,提高了预测的精度;范竣翔等[12]采用循环神经网络用于空气污染时空序列的预测,并比较不同模型的预测精度,得出了LSTM预测模型要优于传统的全连接神经网络。Ma等[13]使用LSTM模型自动确定最佳滞后,建立了短期交通预测,表明了LSTM可以在准确性和稳定性方面实现最佳预测性能。杨祎玥等[14]采用小波变换将水文时间序列分解为多个低频和高频序列,然后针对各个序列建立LSTM预测模型,这种将小波变换和LSTM模型结合的模型在水文时间序列预测的应用上具有一定的帮助。Akita等[15]通过段落向量(Paragraph Vector)将报纸文章转换为分布式表示,模拟过去事件对LSTM模型的时间影响,建立金融时间序列预测模型并得到了很好的预测准确度。石磊[16]等结合了自注意力机制(Attention)和Tree-LSTM模型实现对社会热点事件的情感倾向。谢明磊[17]利用主成分分析(Principal Component Analysis,PCA)对气象数据的特征进行降维,然后对自适应矩估计(Adaptive Moment Estimation,ADAM)算法优化后的LSTM网络进行建模,实现住宅负荷的短期预测方法。Najah等[18]研究了多层感知器神经网络(Multi-Layer Perception-Artificial Neural Network,MLP-ANN),集合神经网络(Ensemble Neural Network, ENN)和SVM三个模型对溶解氧的预测。Wen等[19]通过对pH、电导率、氯、钙、总碱度、总硬度、硝态氮和氨氮等变量建立ANN模型,能够模拟水质的参数,实现溶解氧预测建模。Rankovic等[20]利用Levenberg-Marquardt算法用于训练前馈神经网络(Feedforward Neural Network,FNN),并通过灵敏度分析确定最有效的输入为pH和温度,进而实现有效的溶解氧预测。然而目前利用LSTM网络对溶解氧进行估算较少,陈英义等[21]将PCA和LSTM网络模型结合,通过对水温、土壤温度、土壤水分等数据建立溶解氧预测模型,提高了溶解氧的预测精度。但是,该模型并没有针对低溶解氧估算进行优化,而是进行全局优化,难以最大限度保证低溶解氧时的更高估算精度。
因此,本研究以LSTM为基础建立了尽量保证低溶解氧含量估算精度的预测模型(Low Dissolved Oxygen Long Short-Term Memory,LDO-LSTM),该模型在不使用溶解氧传感器的情况下,能够对低溶解氧进行实时估算,当溶解氧浓度含量低的时候就要及时用增氧机增氧。

2 长短时记忆网络(LSTM)

LSTM网络是一种特殊的RNN模型,是为了解决RNN在构建长依赖序列模型时会出现梯度弥散而提出的[22]。LSTM模型主要由输入门、遗忘门、输出门和细胞状态组成。输入门用来控制当前时刻输入的信息有多少可以加入到细胞状态中;遗忘门决定上一时刻细胞状态中有多少信息可以传递到当前时刻中;输出门是基于遗忘门和输入门更新的细胞状态,来输出结果;细胞状态用来记录当前输入、上一时刻隐藏层状态、上一时刻细胞状态以及门结构中的信息[10]。LSTM模型的算法公式如下:
f t = σ ( W f · h t - 1 + U f · x t + b f )
i t = σ W i · h t - 1 + U i · x t + b i
a t = σ W a · h t - 1 + U a · x t + b a
C t = C t - 1 · f t + i t · a t
$o^t=σ(W_o· h^{t-1}+U_O· x^t+b_o)$
h t = o t · tanh tanh C t
其中,f t是遗忘门,i t是输入门,a t是候选记忆,C t是记忆单元,ot是输出门,ht是最后的输出值,Wo ,Wf,Wi,Wf,Uf,Ui,Ua,Uo是各个门结构的权值,bf,bi,ba,bo是各个门结构的阈值,tanh 是激活函数。
在LSTM网络结构中,采用的损失函数为公式(7):
e t = 1 t · i = 1 t y i - y i ¯ y i
其中,e(t)是损失函数,yi是真实值, y i ̅ 是预测值。
在用上述损失函数反向传播时,虽然LSTM网络能够学习到溶解氧的总体特征,但是并不能精确学习到低溶解氧时刻的数据分布特征,在低溶解氧时刻的估算不能保证更高的精度。因此,本研究在LSTM网络模型的基础上,改进反向传播时的损失函数,使网络充分学习到低溶解氧时刻的特征。

3 LSTM模型算法改进

为了使得低溶解氧时刻给与更大的权重,本研究中选用sin函数,具体的t时刻输出层的损失函数为:
e t = 1 t · i = 1 t α · y i - sin sin π φ · y i ¯ + β · y i ¯ α · y i
其中,
$\alpha =\left\{ \begin{matrix} \sin (\tfrac{pi}{\phi }\cdots {{y}_{i}})+1\begin{array}{*{35}{l}} {} & {} & {} & {} & {} & 6.5<{{y}_{i}}<8.5 \\\end{array} \\ \sin (\tfrac{pi}{\phi }\cdots {{y}_{i}})+1.2\begin{array}{*{35}{l}} {} & {} & {} & {} & {} & 4.5<{{y}_{i}}\le 6.5 \\ \end{array} \\ \sin (\tfrac{pi}{\phi }\cdots {{y}_{i}})+1.5\begin{array}{*{35}{l}} {} & {} & {} & {} & {} & 0<{{y}_{i}}\le 4.5 \\ \end{array} \\ \end{matrix} \right.$
$\phi =\left\{ \begin{matrix} 1\begin{array}{*{35}{l}} {} & {} & {} & {} & {} & 6.5<{{y}_{i}}<8.5 \\ \end{array} \\ 3\begin{array}{*{35}{l}} {} & {} & {} & {} & {} & 4.5<{{y}_{i}}\le 6.5 \\ \end{array} \\ 0.5\begin{array}{*{35}{l}} {} & {} & {} & {} & {} & 0<{{y}_{i}}\le 4.5 \\ \end{array} \\ \end{matrix} \right.$
$\beta =\left\{ \begin{matrix} 0.7\begin{array}{*{35}{l}} {} & {} & {} & {} & {} & 6.5<{{y}_{i}}<8.5 \\ \end{array} \\ 0.6\begin{array}{*{35}{l}} {} & {} & {} & {} & {} & 4.5<{{y}_{i}}\le 6.5 \\ \end{array} \\ 0.5\begin{array}{*{35}{l}} {} & {} & {} & {} & {} & 0<{{y}_{i}}\le 4.5 \\ \end{array} \\ \end{matrix} \right.$
在反向传播时求梯度时,t时刻的损失函数不仅来自于当前输出层的损失函数e(t),而且来自于t时刻之后的损失函数。因此,t时刻,总的损失函数为:
E t = e t + E ( t + 1 )
对隐含层ht、Ct分别求导:
E t h t = e t + E t + 1 h t = e t h t + E t + 1 h t = ( e ( t ) ) ( h ( t ) ) + E ( t + 1 ) h t + 1 · h t + 1 h t
E t C t = e t C t + E t + 1 C t = e t h t · h t C t + E t + 1 C t + 1 · C t + 1 C t = e t h t · o t · 1 - tanh 2 C t + E t + 1 C t + 1 · f t + 1
其中,
a) ( e ( t ) ) ( h ( t ) ) = 1 t i=1 t 1 α · y i · π φ · V T · cos π φ · V T · cos [ π φ · σ V · h i + c + β ] · σ ' ( V · h i + c ) · σ ( V · h i + c ) + V T · sin sin π φ · σ V · h i + c + β · σ ' V · h i + c
b) h t + 1 h t = o t + 1 · tanh C t + 1 h t = o t + 1 h t · tanh C t + o t + 1 · tanh C t + 1 h t
c) o t + 1 h t = σ W o · h t + U o · x t + 1 + b o h t = W O T · o t + 1 · 1 - o t + 1
d) o t + 1 h t = σ W o · h t + U o · x t + 1 + b o h t = W O T · o t + 1 · 1 - o t + 1
e) C t + 1 h t = C t · f t + 1 + i t + 1 · a t + 1 h t = C t · f t + 1 h t + i t + 1 · a t + 1 h t
f) f t + 1 h t = W f T · f t + 1 · 1 - f t + 1
g) i t + 1 h t = W i T · i t + 1 · 1 - i t + 1
h) a t + 1 h t = W a T · a t + 1 · 1 - a t + 1
i) i t + 1 · a t + 1 h t = i t + 1 h t · a t + 1 + i t + 1 · a t + 1 h t = W i T · i t + 1 · 1 - i t + 1 · a t + 1 + W a T · a t + 1 · 1 - a t + 1 · i t + 1
当溶解氧高于6.5mg/L并且小于8.5mg/L时,真实溶解氧初始的权重值赋予 1 + sin π φ · y i ,预测溶解氧初始的权重值为 0.7 + sin sin π φ · y ¯ i ;当溶解氧高于4.5mg/L并且小于等于6.5mg/L时,真实溶解氧的初始值赋予 1.2 + sin π φ · y i ,预测溶解氧初始的权重值为 0.6 + sin sin π φ · y i ¯ ;当溶解氧小于等于4.5mg/L时,真实溶解氧的初始值赋予 1.5 + sin π φ · y i ,预测溶解氧的初始值赋予 0.5 + sin sin π φ · y i ¯ φ是初始值,随着LDO-LSTM网络逐渐训练更新。

4 试验方法与结果分析

为了更好保证溶解氧在低浓度时的预测精度,进行了改进LSTM模型的实验。通过相关性分析确定环境变量和溶解氧之间的关系,并通过PCA融合环境变量之间的信息,达到数据降维的目的。对降维后的数据分别建立LSTM和LDO-LSTM溶解氧预测模型,实现对低溶解氧的精确预测。

4.1 试验数据获取

试验样本数据来自江苏无锡宜兴河蟹养殖基地。该基地位于北纬31°,东经119°。基地的池塘面积大约202000m2,水深为1.2~1.5m。采集的数据主要是溶解氧、pH、温度、浊度和氨氮。采用荧光DO探针、差分pH电极、温度传感器、Chemins ZS-206在线浊度传感器和Chemins NHN-202在线氨氮传感器对池塘溶解氧的水质参数(pH、温度、浊度和氨氮)进行收集。荧光DO探针传感器的测量范围是0~20mg/L,测量精度是±0.1mg/L;差分pH电极传感器的原理是玻璃电极的恒定电位,它的测量范围是0~14pH,灵敏度是0.05;温度传感器的是电阻传感,它的测量范围是-20~80℃,测量精度是≦±0.5℃;Chemins ZS-206在线浊度传感器的原理是散光法,它的测量范围是0~1000NTU,测量分辨率是0.1NTU;Chemins NHN-202在线氨氮传感器的测量范围是0~100mg/L,测量精度为±2mg/L。这些测量传感器均安置在距离水底30cm左右。

4.2 试验数据分析

本试验数据的采集时间为2017年5月1日至2017年7月2日。共收集了6891个样本数据,其中10个样本是缺失值,20个样本数据异常值。在收集的数据中,需要对样本数据进行预处理,对于异常值直接删除,缺失值用该值邻近的5个值的平均值填充。剩余的有效数据总数为6871个。由于水体环境恶劣,水中的传感器容易腐蚀,测得的样本数据会存在噪声干扰,因此对样本数据进行滤波是非常重要的。在本研究中,采用中值滤波技术对采集的数据进行预处理,滤除噪声影响大的数据。
在对样本数据进行预处理后,通过主成分分析和相关性分析探索环境变量和溶解氧之间的关系,随后构建LDO-LSTM溶解氧预测模型。采用本研究提出的LDO-LSTM建立溶解氧的预测模型,并精准估算出低溶解氧的值。试验采用的程序设计语言是Python3.6,集成开发环境是PyCharm,使用的深度学习框架是TensorFlow和Keras。LDO-LSTM网络的参数选择为:(1)网络的迭代次数为300次;(2)输入层节点数为4;(3)输出层节点数为1;(4)隐含层节点数为20;(5)学习率为0.001;(6)时间步长为10。图1是建立LDO-LSTM溶解氧预测模型的流程图。
图1 LDO-LSTM溶解氧预测模型流程图

Fig. 1 Flow chart of predicting dissolved oxygen through LDO-LSTM

在对环境数据中的异常值和缺失值预处理后,需要对各个环境变量和溶解氧之间的相关性进行分析[23]。在本研究中,采用互相关函数确定各个环境变量和溶解氧之间的相关关系,如表1所示。
表1 温度、pH、浊度和氨氮同溶解氧的相关关系

Table 1 Correlation between dissolved oxygen and temperature, pH, turbidity and ammonia nitrogen

变量 温度(℃) pH 浊度(NTU) 氨氮(mg/L)
溶解氧 0.793 0.837 0.697 0.723
成分分析是设法将原来具有一定相关性的指标,重新组合成一组较少个数的互不相关的综合指标[24]。综合指标最大程度地反映了原变量代表的数据信息,同时保证新指标之间相互无关,是一种数据降维的方法。本研究通过对温度、pH、氨氮和浊度进行主成分分析,得到了4个成分,这些成分都涵盖了温度、pH、氨氮和浊度的信息,通过对这4个主成分的特征值及贡献率分析,筛选出影响溶解氧的关键成分。各个成分的特征值、特征值差值、贡献率以及累计贡献率如表2所示。根据各个成分的贡献率,前3个贡献率比较高,累计贡献率达到了93.351%,因此,选择了前3个主成分用于对深度网络训练。
表2 主成分分析的特征值、特征值差值、贡献率和累计贡献率

Table 2 Eigenvalue, eigenvalue difference, contribution rate, and cumulative contribution rate of principal component analysis

成分 特征值 特征值差值 贡献率(%) 累计贡献率(%)
1 79.232 6.439 38.601 38.601
2 72.793 9.278 33.127 71.728
3 63.515 5.218 21.623 93.351
4 58.297 —— 6.649 100
在前期工作中,将LSTM同多种传统方法对比,例如各种多项式拟合、BP神经网络等,发现LSTM比其他方法好,因此,本研究中主要将LDO-LSTM同LSTM模型进行比较。
损失函数能够反映模型预测值和真实值之间的差距,能够用来指挥网络如何更新参数。因此,损失函数的变化能够看出该模型对数据分布特征的学习情况。图2是LDO-LSTM和LSTM溶解氧预测模型的损失函数变化对比。
图2 LDO-LSTM和LSTM损失函数变化趋势

Fig. 2 Comparison of the loss function of LDO-LSTM and LSTM models

图2可以看出,随着迭代次数的增加,LDO-LSTM和LSTM损失函数的值逐渐变小。当迭代次数为0到60时,LDO-LSTM要比LSTM的收敛速度快;当迭代次数到达60次时,这两个损失函数的收敛速度都趋于平缓,LDO-LSTM的损失函数值要小于LSTM模型;当训练次数达到300次时,LDO-LSTM的损失函数稳定在0.1,而LSTM的损失函数的值要大于0.1。经试验验证,迭代次数达到300次时,LDO-LSTM网络模型要比LSTM更能够充分学习溶解氧的数据分布特征,对溶解氧的预测精度能够达到最优。图3图4分别是LSTM和LDO-LSTM溶解氧预测模型拟合图。
图3 LSTM模型的溶解氧预测拟合结果

Fig. 3 The fitting of DO through the LSTM model

图4 LDO-LSTM模型的溶解氧预测拟合结果

Fig. 4 The fitting of DO through the LDO-LSTM model

图3图4可以看出,LDO-LSTM和LSTM对于溶解氧的总体拟合趋势相差不大,但是对于低溶解氧值的预测来说,LSTM预测值产生很大的误差,但LDO-LSTM预测的值更逼近真实值。为了更加直观比较LDO-LSTM网络模型和LSTM网络模型对不同值大小的溶解氧的预测能力,以溶解氧为6mg/L为界,比较了平均相对误差(The Root Mean Square Error,RMSE)、平均绝对百分误差(The Mean Absolute Percentage Error,MAPE)两个模型评价指标[25]表3表4分别是LDO-LSTM和LSTM在溶解氧不同取值范围内的RMSE、MAPE值。在实际养殖过程中,对于某一时间段低溶解氧的预测不准确,容易造成螃蟹的死亡,而本研究的算法恰能克服这一缺点,在确保溶解氧的总体拟合趋势前提下,更关注低溶解氧的预测精度,以确保降低螃蟹的死亡率。
表3 LDO-LSTM模型的评价指标(溶解氧>6mg/L)

Table 3 Evaluation of DO prediction model (DO > 6mg/L)

DO模型 RMSE MAPE
LSTM 0.719 0.259
LDO-LSTM 0.709 0.250
表4 LDO-LSTM模型的评价指标(溶解氧<6mg/L)

Table 4 Evaluation of DO prediction mode l (DO < 6mg/L)

溶解氧模型 RMSE MAPE
LSTM 0.756 0.297
LDO-LSTM 0.506 0.158
表3表4分别为溶解氧在不同取值范围时,LDO-LSTM和LSTM网络模型的RMSE、MAPE值。在溶解氧低于6mg/L时,LDO-LSTM的RMSE值和MAPE值分别比LSTM低0.25和0.139,这表明了LDO-LSTM能够提高低溶解氧的预测精度;在溶解氧高于6mg/L时,LDO-LSTM和LSTM的RMSE、MAPE差值稳定在0.1左右,这表明了LDO-LSTM模型没有降低整体的预测精度。对于LDO-LSTM网络,将溶解氧小于6mg/L和溶解氧大于6mg/L对比发现,前者的RMSE、MAPE值要分别小于后者0.203和0.092,说明了LDO-LSTM在低溶解氧的预测能力要更优。

5 讨论与结论

LDO-LSTM溶解氧预测模型主要通过优化LSTM网络在反向传播过程中的损失函数,在平均绝对误差的基础上,根据溶解氧的变化趋势,赋予溶解氧在不同取值范围的权重函数。低溶解氧时刻,真实值赋予低的权重函数,高的溶解氧浓度赋予高的权重函数。在反向传播过程中,LDO-LSTM网络模型更容易学习到低溶解氧时刻的数据分布特征,提高低溶解氧的估算准确率。在评估模型的优劣时,考虑到模糊区间的具体设定要依赖于具体环境,而本文的数据只是某一个区域的数据,模型没有学习到同地域环境的依赖关系,在未来的研究中,可以收集覆盖面更为广泛的数据,同时让溶氧浓度临界值6是一个参数或是一个模糊的区间,以提高模型的预测性能。通过模型评价指标RMSE、MAPE来评价此LDO-LSTM和LSTM在临界区的预测能力,得出LDO-LSTM在低溶解氧时刻的预测准确率要更优。
本研究从实际需求出发,在LSTM网络模型的基础上,通过优化网络模型的损失函数,提高低溶解氧的预测精度。主要采用相关性分析和主成分分析探究溶解氧和各个环境变量之间的关系,融合数据特征之间的信息,降低数据的维度,确定LDO-LSTM网络模型的输入特征。
本研究建立的LDO-LSTM溶解氧预测模型能够在不使用溶解氧传感器的情况下更加准确估算溶解氧浓度低的时候变化,并且此模型不影响总体溶解氧的估算精度,在溶解氧的预测方面具有很好的指导意义。
[1]
余成洲, 李勇, 白云 . 基于集合经验模态分解和支持向量机的溶解氧预测[J]. 环境监测管理与技术, 2018,30(03):27-31.

Yu C, Li Y, Bai Y . DO prediction based on ensemble empirical mode decomposition and support vector machine[J]. The Administration and Technique of Environmental Monitoring, 2018,30(03):27-31.

[2]
陈彦, 殷建军, 项祖丰 , 等. 基于时间序列模型的海洋溶解氧分析与预测[J]. 轻工机械, 2012,30(03):83-87.

Chen Y, Yin J, Xiang Z , et al. Marine dissolved oxygen analysis and prediction based on the time series model[J]. Light Industry Machinery, 2012,30(03):83-87.

[3]
Chen W, Liu W . Artificial neural network modeling of dissolved oxygen in reservoir[J]. Environmental monitoring and assessment, 2014,186(2):1203-1217.

DOI

[4]
Olyaie E, Abyaneh H Z, Mehr A D . A comparative analysis among computational intelligence techniques for dissolved oxygen prediction in Delaware River[J]. Geoscience Frontiers, 2017,8(3):517-527.

DOI

[5]
袁红春, 潘金晶 . 改进递归最小二乘RBF神经网络溶解氧预测[J]. 传感器与微系统, 2016,35(10):20-23.

Yuan H, Pan J . Dissolved oxygen prediction based on improved recursive least square RBF neural network[J]. Transducer and Microsystem Technologies, 2016,35(10):20-23.

[6]
宦娟, 刘星桥 . 基于K-means聚类和ELM神经网络的养殖水质溶解氧预测[J]. 农业工程学报, 2016,32(17):174-181.

Huan J, Liu X . Dissolved oxygen prediction in water based on K-means clustering and ELM neural network for aquaculture[J]. Transactions of the CSAE, 2016,32(17):174-181.

[7]
施珮, 袁永明, 张红燕 , 等. GRNN和Elman神经网络在水体溶解氧预测中的应用[J]. 江苏农业科学, 2017,45(23):217-221.

[8]
吴静, 李振波, 朱玲 , 等. 融合ARIMA模型和GAWNN的溶解氧含量预测方法[J]. 农业机械学报, 2017,48(S1):205-210, 204.

Wu J, Li Z, Zhu L , et al. Hybrid model of ARIMA model and GAWNN for dissolved oxygen content prediction[J]. Transactions of the CSAM, 2017,48(S1):205-210, 204.

[9]
魏小敏, 张宝峰, 朱均超 , 等. 基于PSO优化RBF神经网络的溶解氧预测算法研究[J]. 自动化与仪表, 2018,33(05):57-60.

Wei X, Zhang B, Zhu J , et al. Remote monitoring system of fishery breeding based on Internet of Things[J]. Automation & Instrumentation, 2018,33(05):57-60.

[10]
Zhu N, Liu X, Liu Z , et al. Deep learning for smart agriculture: Concepts, tools, applications, and opportunities[J]. International Journal of Agricultural and Biological Engineering, 2018,11(4):32-44.

[11]
李志刚, 纪月, 任雄朝 . 基于LSTM与ARIMA组合模型的高炉煤气产生量预测[J]. 铸造技术, 2018,39(11):2456-2460.

Li Z, Ji Y, Ren X . Prediction of blast furnace gas output based on combined model of LSTM and ARIMA[J]. Foundry Technology, 2018,39(11):2456-2460.

[12]
范竣翔, 李琦, 朱亚杰 , 等. 基于RNN的空气污染时空预报模型研究[J]. 测绘科学, 2017,42(07):76-83, 120.

Fan J, Li Q, Zhu Y , et al. Aspatio-temporal prediction framework for air pollution based on deep RNN[J]. Science of Surveying and Mapping, 2017,42(07):76-83, 120.

[13]
Ma X, Tao Z, Wang Y , et al. Long short-term memory neural network for traffic speed prediction using remote microwave sensor data[J]. Transportation Research Part C: Emerging Technologies, 2015,54:187-197.

DOI

[14]
杨祎玥, 伏潜, 万定生 . 基于深度循环神经网络的时间序列预测模型[J]. 计算机技术与发展, 2017,27(03):35-38, 43.

Yan Y, Fu Q, Wan D . A Prediction model for time series based on deep recurrent neural network[J]. Computer Technology and Development, 2017,27(03):35-38, 43.

[15]
Akita R, Yoshihara A, Matsubara T, et al. Deep learning for stock prediction using numerical and textual information [C]. IEEE/ACIS International Conference on Computer & Information Science. IEEE, 2016.

[16]
石磊, 张鑫倩, 陶永才 , 等. 结合自注意力机制和Tree-LSTM的情感分析模型[J]. 小型微型计算机系统, 2019,40(07):1486-1490.

Shi L, Zhang X, Tao Y , et al. Sentiment analysis model with the combination of self-attention and Tree-LSTM[J]. Journal of Chinese Computer Systems, 2019,40(7):1486-1490.

[17]
谢明磊 . 基于LSTM网络的住宅负荷短期预测[J]. 广东电力, 2019,32(06):108-114.

[18]
Najah A, El-Shafie A, Karim O A , et al. An application of different artificial intelligences techniques for water quality prediction[J]. International Journal of Physical Sciences, 2011,6(22):5298-5308.

[19]
Wen X, Fang J, Diao M , et al. Artificial neural network modeling of dissolved oxygen in the Heihe River, Northwestern China[J]. Environmental Monitoring and Assessment, 2013,185(5):4361-4371.

DOI

[20]
Rankovic V, Radulovic J, Radojevic I , et al. Neural network modeling of dissolved oxygen in the Gruza reservoir[J]. Serbia. Ecological Modelling, 2010,221(8):1239-1244.

[21]
陈英义, 程倩倩, 方晓敏 , 等. 主成分分析和长短时记忆神经网络预测水产养殖水体溶解氧[J]. 农业工程学报, 2018,34(17):183-191.

Chen Y, Cheng Q, Fang X , et al. Principal component analysis and long short-term memory neural network for predicting dissolved oxygen in water for aquaculture[J]. Transactions of the CSAE, 2018,34(17):183-191.

[22]
Hochreiter S, Schmidhuber J . Long short-term memory[J]. Neural Computation, 1997,9(8):1735-1780.

DOI

[23]
Cohen P, West S G, Aiken L S. Applied multiple regression/correlation analysis for the behavioral sciences[M]. New York: Psychology Press, 2014.

[24]
Abdi H, Williams L J . Principal component analysis[J]. Wiley Interdisciplinary Reviews Computational Statistics, 2010,2(4):433-459.

DOI

[25]
Willmott C J, Matsuura K . Advantages of the mean absolute error (MAE) over the root mean square error (RMSE) in assessing average model performance[J]. Climate Research, 2005,30(1):79-82.

DOI

文章导航

/