  • 吴华瑞 1, 2
  • 1. 国家农业信息化工程技术研究中心,北京 100097
  • 2. 农业农村部农业信息技术重点实验室,北京 100097


收稿日期: 2019-08-14

  修回日期: 2019-11-07

  网络出版日期: 2019-12-24




Method of tomato leaf diseases recognition method based on deep residual network

  • Wu Huarui 1, 2
  • 1. National Engineering Research Center for Information Technology in Agriculture, Beijing 100097, China
  • 2. Key Laboratory of Information Technologies in Agriculture, Ministry of Agriculture and Rural Affairs, Beijing 100097, China

Received date: 2019-08-14

  Revised date: 2019-11-07

  Online published: 2019-12-24




吴华瑞 . 基于深度残差网络的番茄叶片病害识别方法[J]. 智慧农业, 2019 , 1(4) : 42 -49 . DOI: 10.12133/j.smartag.2019.1.4.201908-SA002


Intelligent recognition of greenhouse vegetable diseases plays an important role in the efficient production and management. The color, texture and shape of some diseases in greenhouse vegetables are often very similar, it is necessary to construct a deep neural network to judge vegetable diseases. Based on the massive image data of greenhouse vegetable diseases, the depth learning model can automatically extract image details, which has better disease recognition effect than the artificial design features. For the traditional deep learning model of vegetable disease image recognition, the model recognition accuracy can be improved by increasing the network level. However, as the network level increases to a certain depth, it will lead to the degradation / disappearance of the network gradient, which degrades the recognition performance of the learning model. Therefore, a method of vegetable disease identification based on deep residual network model was studied in this paper. Firstly, considering that the super parameter value in the deep network model has a great influence on the accuracy of network identification, Bayesian optimization algorithm was used to autonomously learn the hyper-parameters such as regularization parameters, network width, stochastic momentum et al, which are difficult to determine in the network, eliminate the complexity of manual parameter adjustment, and reduce the difficulty of network training and saves the time of network construction. On this basis, the gradient could flow directly from the latter layer to the former layer through the identical activation function by adding residual elements to the traditional deep neural network. The deep residual recognition model takes the whole image as the input, and obtains the optimal feature through multi-layer convolution screening in the network, which not only avoids the interference of human factors, but also solves the problem of the performance degradation of the disease recognition model caused by the deep network, and realizes the high-dimensional feature extraction and effective disease recognition of the vegetable image. Relevant simulation results show that compared with other traditional models for vegetable disease identification, the deep residual neural network shows better stability, accuracy and robustness. The deep residual network model based on hyperparametric self-learning achievesd good recognition performance on the open data set of tomato diseases, and the recognition accuracy of 4 common diseases of tomato leaves reached more than 95%. The researth can provide a basic methed for fast and accurate recognition of tomato leaf diseases.

1 引言

视觉技术与数字产品的普及为设施蔬菜图像病害识别带来了新机遇,由计算机自动完成病害诊断,可降低农业人员对植物保护专家的依赖,减少由于病害知识缺乏造成的误判[3]。如张云龙等[4]将叶部病斑颜色特征与差直方图作为分类依据,利用支持向量机(Support Vector Machine,SVM)方法自动识别苹果叶部的3种病害,识别率达96%。夏永泉等[5]引入主颜色符描述病斑颜色特征,同时结合Tamura纹理特征区分小麦的3种病害叶片与健康叶片,实验结果优于同等条件下的SVM。基于高分辨率图像,国外有学者[6]采用简单线性迭代聚类方法检测大豆叶片的颜色、形状、纹理与梯度等视觉属性特征,描述了植物叶片的物理特性,但该方法计算开销过大。魏丽冉等[7]则通过图像预处理,增强了病害部分的明显度,使用基于核函数的支持向量机算法进行病害分类。除此之外,文献[8,9,10,11]等研究与上述方法类似,主要通过病害阈值分割构建有效特征矩阵,然后利用不同分类器识别植物病害。但现实中,植物病害形状位置多变,图像背景复杂,人工设计的特征越来越难以准确识别规模庞大的病害图像数据。
深度学习是目前较先进的机器学习方法,它利用具有隐藏层的人工神经网络,不依靠图像分割与特征提取自动完成高层次的特征学习。深度学习在病害诊断方面已取得了较好的研究成果。Zhang等[12]提出一种基于改进GoogLeNet和Cifar 10网络的深度学习模型用于叶片识别。宋丽娟[13]结合区分深度置信网络对病斑颜色、形状等底层特征进行高层表示,能够在没有充足标注数据时稳定完成四种枸杞病害识别。王艳玲等[14]采用了AlexNet卷积神经网络迁移学习,实现了番茄叶片病害图像快速准确分类。文献[15,16,17,18,19]等将离散小波变换、区域生长法等特征提取技术与深度神经网络学习相结合,利用特征提取技术检索病害特征,然后通过概率神经网络对植物疾病成功进行了分类。

2 基于深度残差网络的病害图像识别方法


2.1 深度残差网络结构

深度卷积神经网络主要由数据输入层、隐藏层与输出层构成。隐藏层中包含多级神经网络,主要依靠Conv卷积层、pooling池化层与全连接层配合搭建,利用卷积特征提取器获得输入图像的边缘、纹理与隐藏的细节特征,最后通过全连接层(Fully Connected layers,FC)根据提取特征进行病害分类,如图1所示。为了提高网络性能,深度卷积神经网络通常都包括非线性激活函数与批量归一化层(Batch Normalization layers,BN)。隐藏层中每层的每个神经单元与下一层所有神经单元相连,所有连接都有一个权值,网络训练过程中,对于每层输出结果需要通过损失函数计算衡量分类错误程度,使用梯度下降更新各层权值。
图1 卷积神经网络结构

Fig.1 Structure of Convolutional Neural Network

L l o s s x 1 = H n ( x L n , W L n , b L n ) x L × × H 2 ( x L 2 , W L 2 , b L 2 ) x 1
其中, L l o s s 代表计算损失, x L n 表示第n层的输入, W L n 为第n层的权重矩阵, b L i 是该层的偏置量。 H n ( x L n , W L n , b L n ) 则为第n层的计算损失。
图2 深度残差网络框架

Fig.2 Framework of deep residual neural network

番茄叶片病害鉴定过程为:将 32 × 32 (宽32像素,高32像素)、通道数为3的RGB番茄叶片图像作为输入,在输入层通过平移、翻转等数据增强方法记忆训练数据的细节特征,扩充作物病害数据集。令扩展训练集依次通过Conv卷积层、ReLU激活函数层与BN批量归一化层,再由多个残差块处理其输出的结果,最后经过平均池化层和全连接层,使用分类器判断蔬菜叶片的健康状态。该模型的具体网络参数如表1所示,它由14个权重层构成,其中包含13个卷积层与一个全连接层,每个残差块有两个残差单元。
表1 网络参数

Table 1 Network parameters

层序号 输出特征图大小 卷积核状态
卷积层1 32 × 32 3 × 3,16
残差块1 32 × 32 4 × 3 × 3,16
残差块2 16 × 16 4 × 3 × 3,32
残差块3 8 × 8 4 × 3 × 3,64
平均池化层 1 × 1 8 × 8
图2左侧为本研究构建的残差单元,每个残差单元的输入与输出维度相同,BN层用其平均值 μ b 和方差 σ b 2 ,标准化激活函数输入,然后进一步利用拉伸参数和偏移参数缩放批量归一化结果,令数据在空间内更加分散,更加均匀;激活函数则用于提取数据的复杂特征,增加各层网络的非线性关系。跳跃连接则将残差单元输入与残差单元内第二个卷积的输出批量归一化结果相加,使原始映射函数表示为H(xk )+xk ,突破了网络深度增加造成的网络退化问题。该深度网络模型中梯度计算公式如下[27]
L l o s s x 1 = ( 1 + H n ( x L n , W L n , b L n ) x L ) ×              × ( 1 + H 2 ( x L 2 , W L 2 , b L 2 ) x 1 )

2.2 基于贝叶斯理论的超参数优化

有研究发现残差网络是由若干浅层网络组合而成,优化其网络宽度比增加网络深度更有意义[14]。因此,如式(3)所示,本研究假设 Ζ 为超参数空间,它包含以下关键参数:网络宽度 N w (残差块1中每个卷积层的滤波器数量),初始化学习速率 κ 、随机梯度下降动量 λ 与L2正则化强度 η
F : Ζ ( N w , κ , λ , η ) R 4 R
z * = a r g m i n z Z F
其中, z * 即为最优超参数,公式(4)的意义在于评估目标函数F的输入 z i 得到对应输出 y i 。贝叶斯优化算法通过执行一个顺序搜索算法,n次迭代后,在建议的新位置 z n + 1 处评估 F 。根据算法已有的评估结果 E n = ( z 1 , y 1 ) , , ( z n , y n ) ,利用高斯建模在给定 z n + 1 Ε n 的基础上得到 y n + 1 。然后,根据似然分布 p ( y n + 1 | z n + 1 , Ε n ) 计算代理函数。通过评估 y n + 1 对优化目标函数F的贡献,代理函数平衡已知的优秀点和未知点空间,进行全局搜索最小化,从而避免局部最优,保证算法快速收敛。

3 试验结果及分析

表2 试验数据库

Table 2 Experimental database

叶片类型 训练数量(张) 验证数量(张) 总数(张)
健康叶片 534 159 693
白粉病叶片 603 184 787
早疫病叶片 316 99 415
晚疫病叶片 569 190 759
叶霉病叶片 259 94 353
总数(张) 2281 726 3007
图3 番茄叶片病害类型表现

Fig.3 Types of tomato leaf diseases

图4 不同网络深度的识别准确率

Fig.4 Recognition accuracies of different network depths

根据2.2节所述,利用贝叶斯优化算法对网络超参数进行调优,其过程如图5所示。基于高斯过程回归对超参数建模得到目标函数的替代概率模型,在代理模型上找到最佳超参数组合(最小预测点),将该组合用于真正目标函数(验证集分类错误率)获得最小观测值,然后更新包含新最小观测点的代理模型,重复上述步骤,得到最优超参数组合。通过贝叶斯优化,本研究确定训练深度残差网络宽度 N w = 16 ,初始化学习速率 κ = 0.0453 ,随机梯度下降动量 λ = 0.8018 ,L2正则化强度 η = 7.61 e - 09
图5 贝叶斯优化超参数过程

Fig.5 Bayesian optimization process of hyperparameters

图6 病害鉴定误差曲线

Fig.6 Error curve for disease identification

基于相同验证集与测试集,构建番茄叶片图像的灰度和GLCM特征矩阵,并分别利用SVM与含5个隐藏节点的误差反向传播(Back Propagation,BP)神经网络进行病害鉴定,结果如表3所示。
表3 不同识别模型对比

Table 3 Comparison of different recognition models



单个病害识别准确率(%) 平均准确率(%)
叶片白粉 叶片早疫 叶片晚疫 叶片叶霉 健康叶片
SVM 83.7 52.5 68.9 66.0 92.5 72.7
BP神经网络 78.8 51.5 71.1 60.6 93.7 74.0
DCNN 95.0 99.5 81.8 94.7 94.7 94.2
本研究模型 96.7 98.9 96.0 95.8 95.7 96.8

4 结论

