三种模型的检测结果如
图6所示。在未添加生成样本时,不同模型在预测集上的
R 2差异显著,其中RF模型的
R 2为0.6967,RMSEP为2.7591;CNN模型的
R 2为0.6729,RMSEP为3.1353;而PLSR模型的
R 2仅为0.5298,RMSEP为3.6646。随后在建模集中逐步添加生成样本,可以看出,在加入生成样本后,3种模型的
R 2在预测集上皆表现出先增大后减小的趋势,RMSEP则先减小后增大。
表3为3种模型的最优训练结果,相较于未添加生成样本的预测精度
Rp 2,CNN模型最高提升11.2%;RF模型最高提升13.7%;PLSR最高提升42.8%,且RF模型可以得到最佳的检测效果。Zhang等
[31]利用近红外光谱对松树叶片的MDA含量进行估测,通过将光谱预处理与重要特征选择算法应用于PLSR,其最佳的
R 2为0.66,但原始
R 2为0.64,二者差距不大。本研究将原始样本进行数据扩增后建立3种回归模型,其检测精度均得到较好的提高。为了更加直观地表示模型的预测能力,
图7为3种模型在最优样本数量下的菌草MDA含量预测值与实测值相关图。结果表明,利用DCGAN模型对原始建模集进行数据扩充可以获得更好的精度与稳定性。同时,充足的数据集有助于得到最优的检测结果。