0 引 言
1 实验与方法
1.1 光谱采集仪器及采集参数
1.2 样品制备与检测原理
1.3 数据预处理
表1 本研究中使用的预处理方法及应用效果概览表Table 1 Pre-treatment methods used in this study and the effects of their application |
预处理方法 | 描述 | 参数设置 | 预期效果 |
---|---|---|---|
标准差标准化 | 将数据转换为均值为0,标准差为1的形式 | 无特定参数 | 消除量纲影响,使不同特征具有可比性 |
标准正态变换 | 转换数据以符合标准正态分布 | 无特定参数 | 改善数据分布,使其更接近正态分布 |
均值中心化 | 从每个数据点中减去整体均值 | 无特定参数 | 消除数据的长期趋势或基线漂移 |
一阶导数 | 计算数据的一阶导数 | 前向差分 | 强调光谱特征的变化,减少基线干扰 |
Savitzky-Golay平滑 | 通过局部多项式拟合来平滑数据 | 平滑窗口大小 | 减少随机噪声,保留信号的基本形状和特征 |
多元散射校正 | 校正由散射引起的光谱变异 | 无特定参数 | 减少或消除光谱变异,提高不同样本间的可比性 |
1.4 特征提取方法
1.5 机器学习模型选择与模型评价指标
2 光谱可视化分析与模型讨论
2.1 光谱曲线分析
2.2 光谱主成分分析
2.3 模型讨论
2.3.1 模型运行环境
2.3.2 模型参数
表2 分辨霉变小麦各模型配置参数Table 2 Configuration parameters of each model for distinguishing mouldy wheat |
模型 | VNIAPD(2分类) | VNIAPD(3分类) | SINO2040(2分类) | SINO2040(3分类) |
---|---|---|---|---|
KNN | Neighbors = 3e-0 | Neighbors = 3e-0 | Neighbors = 5e-0 | Neighbors = 5e-0 |
SVM | C = 1e-0 Gamma = 1.19e-0 | C = 1e-0 Gamma = 1.05e-0 | C = 1.25e-0 Gamma = 1.15e-0 | C = 1.25e-0 Gamma = 1.08e-0 |
RF | n = 2e+1, features = 5e-0 depth = 1.6e+1 | n = 1.5e-1, features = 3e-0 depth = 2e+1 | n = 2e+1, features = 5e-0 depth = 1.8e+1 | n = 1e+1, features = 5e-0 depth = 2e+1 |
Naïve-Bayes | Gaussian | Gaussian | Gaussian | Gaussian |
BPNN | learning-rate = 1e-4 epoch = 3e+2 | learning-rate = 1e-4 epoch = 4e+2 | learning-rate = 1e-4 epoch = 5e+2 | learning-rate = 1e-3 epoch = 6e+2 |
DNN | learning-rate = 1e-5 epoch = 8e+1 | learning-rate = 1e-5 epoch = 1e+2 | learning-rate = 1e--4 epoch = 1e+2 | learning-rate = 1e-4 epoch = 2e+2 |
|
2.3.3 模型结果
表3 基于VNIAPD的新鲜小麦、霉变小麦分类测试集准确率 (%)Table 3 Accuracy of VNIAPD-based test set for classification of fresh and mouldy wheat |
预处理方法 | MSC-1ST | SDN-1ST | 1ST | MC-1ST | SG-1ST |
---|---|---|---|---|---|
KNN | 93.18 | 93.18 | 90.90 | 88.63 | 90.90 |
SVM | 90.90 | 90.90 | 86.36 | 93.18 | 90.90 |
RF | 86.36 | 93.18 | 95.45 | 97.72 | 93.18 |
Naïve-Bayes | 75.00 | 77.27 | 95.45 | 84.09 | 86.36 |
BPNN | 97.72 | 100 | 97.72 | 84.09 | 86.36 |
DNN | 97.72 | 93.18 | 97.70 | 97.70 | 100.00 |
表4 基于VNIAPD的小麦轻度、中度、重度霉变分类测试集准确率 (%)Table 4 Accuracy of VNIAPD-based test set for classification of mild, moderate and severe mould in wheat |
预处理方法 | MSC-1ST | SDN-1ST | 1ST | MC-1ST | SG-1ST |
---|---|---|---|---|---|
KNN | 100.00 | 90.90 | 86.36 | 95.45 | 86.36 |
SVM | 90.90 | 95.45 | 93.18 | 97.72 | 93.18 |
RF | 93.18 | 90.90 | 86.36 | 100.00 | 90.90 |
Naïve-Bayes | 90.90 | 86.36 | 97.72 | 88.63 | 93.18 |
BPNN | 97.72 | 100.00 | 95.45 | 93.18 | 93.18 |
DNN | 95.54 | 97.72 | 93.18 | 97.72 | 100.00 |
表5 基于SINO2040的新鲜小麦、霉变小麦分类测试集准确率 (%)Table 5 Accuracy of SINO2040-based test set for classification of fresh and mouldy wheat |
预处理方法 | MSC-1ST | SDN-1ST | 1ST | MC-1ST | SG-1ST |
---|---|---|---|---|---|
KNN | 97.72 | 97.72 | 93.18 | 93.18 | 93.18 |
SVM | 93.18 | 95.54 | 90.90 | 90.90 | 93.18 |
RF | 95.54 | 93.18 | 90.90 | 95.54 | 95.54 |
Naïve-Bayes | 97.72 | 93.18 | 97.72 | 100.00 | 97.72 |
BPNN | 97.72 | 97.72 | 97.72 | 100.00 | 97.72 |
DNN | 97.72 | 97.72 | 95.54 | 95.54 | 100.00 |
表6 基于SINO2040的小麦轻度、中度、重度霉变分类测试集准确率 (%)Table 6 Accuracy of SINO2040-based test set for classification of mild, moderate and severe mould in wheat |
预处理方法 | MSC-1ST | SDN-1ST | 1ST | MC-1ST | SG-1ST |
---|---|---|---|---|---|
KNN | 97.72 | 97.72 | 95.54 | 95.54 | 97.72 |
SVM | 97.72 | 97.72 | 93.18 | 95.54 | 95.54 |
RF | 93.18 | 90.90 | 90.90 | 93.18 | 93.18 |
Naïve-Bayes | 93.18 | 95.54 | 88.63 | 95.54 | 90.90 |
BPNN | 97.72 | 97.72 | 100.00 | 100.00 | 97.72 |
DNN | 97.72 | 97.72 | 95.54 | 97.72 | 100.00 |
表7 最优预处理建模时间与模型内存大小Table 7 Optimal preprocessing modelling time and model size |
参数 | KNN | SVM | RF | Naïve-bayes | BPNN | DNN |
---|---|---|---|---|---|---|
建模时间/ms | 255 | 4 | 36 | 3 | 3 293 | 18 614 |
模型内存/kb | 324 | 4 | 48 | 7 | 4 028 | 706 |