糯玉米是一种栽培技术简单、周期短的作物,其蛋白质含量比普通玉米高3%~6%,具有较高的经济、营养和加工价值,在我国广泛种植。因其籽粒具有较粗的蜡质胚乳,呈现出有光泽的玻璃状(透明)外观,又称粘玉米或蜡质型玉米。糯玉米作为一种重要的农作物,其种子的品质对于产量和质量具有关键影响。然而,由于不同品种的糯玉米种子在生长速度、营养需求和耐病性等方面存在差异,混合种植可能导致传粉现象,使得某些品种无法充分生长发育,从而对产量和品质产生不利影响。传统的人工挑选分类方法易受到主观因素影响,而且往往需要对种子进行破坏性处理,耗费大量的时间和人力成本。糯玉米种子主要由淀粉、蛋白质、脂肪、维生素和矿物质等成分组成,在不同品种和生长阶段间存在着明显的含量差异,其中淀粉和蛋白质含量较高,可以通过光谱技术进行快速、无损、高效、精准的检测和分类。
1、高光谱图像处理与反射率提取
首先在MatlabR2022a软件中打开校正后的高光谱数据,使用主成分分析(PCA)提取高光谱数据的第一主成分PC1下的灰度图像,然后采用阈值分割法对其进行掩膜处理,去除背景和样本中的高亮反光部分,避免后续提取感兴趣区域(ROI)时产生误差影响光谱数据质量,接着分别使用开运算去除样本边缘的噪点,闭运算填充样本内部的孔洞、平滑样本边缘,对其进行二值化处理,最后使用regionprops函数提取高光谱数据中的每一个样本的连通域(感兴趣区域),将连通域中每个像素点的平均光谱反射率(图1)作为后续建模的输入。
图1糯玉米种子光谱反射率
2、常见高光谱遥感分类
高光谱遥感按照作用空间尺度可划分为卫星遥感、机载高光谱仪、地物光谱遥感以及手持式光谱仪等。基于CGMD便携式光谱仪和地物高光谱探测器对冬小麦冠层生长指标对比研究发现,CGMD光谱仪操作简单,便于携带,精度可靠,而地物高光谱探测器采集信息量大,结合先进预处理,特征提取和机器学习算法可以有效提高模型反演精度。
基于便携式地物光谱仪结合手持式光谱探测器获取冬小麦叶片反射率,并结合推扫式光谱仪波段宽,光谱分辨率高的特点获得冠层反射率,但是受天气条件或野外环境因素,如云层、大气湿度、光线条件和地面高程差等都会影响数据采集和监测结果。
3、可行性理论分析
将每个品种所有糯玉米种子的光谱曲线平均值作为该糯玉米品种的光谱曲线,如图2所示。5种糯玉米种子的光谱曲线整体趋势一致,其中京科糯2000和山农207的反射率比其他品种要低很多,这两个品种相对于其他品种比较容易区分;京科糯3000、必丰白甜糯80B和甜加糯308的光谱曲线差别不大,需要进一步提取特征波段加以分析。
曲线走势方面:在波长860~900nm处的三个小吸收峰,这可能与种子中的某些生物大分子或化学成分有关。例如,蛋白质、淀粉、纤维素、水分等物质在这个区间内都有一定的吸收特性;910~950nm处光谱曲线区分度稍微明显,可在此处提取特征波段。在940nm左右波长处反射率开始下降,并在1010nm处降到最低,在这个波长范围内,水分的吸收特性较强。因此,在这个范围内反射率的变化可能与糯玉米种子中水分的吸收特性有关。同一生产批次下不同品种的糯玉米种子的营养物质有所差别,因此理论上可以通过光谱特征对糯玉米种子进行分类研究。
图2 五种糯玉米种子的光谱曲线
4、结果与分析
4.1光谱预处理建模结果对比
图4为经过一阶中心差分-SG平滑处理后的糯玉米光谱反射率差分图,从图中可以看出原本趋势较为平坦的光谱曲线通过一阶中心差分处理后突出了光谱波段中的峰值、谷值和其他局部变化,通过提取这些变化率和趋势信息,可以捕捉到光谱数据中的重要特征,用于后续的模型训练和预测。
图4一阶中心差分-SG平滑处理后糯玉米光谱反射率差分图
表1不同预处理方法下三种分类器分类结果
将一阶中心差分-SG平滑处理后的光谱数据和多元散射校正(MSC)、标准正态变换(SNV)、一阶中心差分和SG平滑这四种预处理方法处理后的光谱数据分别导入SVM、RF和KNN三种分类器,对比不同预处理方法下的不同分类器的分类准确率。从表1中可以看出一阶中心差分-SG平滑较其他的预处理方法效果最好,同时不同的预处理方法下支持向量机的分类效果最佳,经过一阶中心差分-SG平滑处理后的光谱数据导入支持向量机建立模型训练集的准确率可以达到72.44%,测试集的准确率可以达到61.51%。
4.2特征波段提取建模结果对比
图5为主成分数的自动搜寻结果图,从图中可以看出主成分数从1~14时交叉验证准确率快速增加,达到74.63%,14以后的交叉验证准确率的趋势相对平稳,虽然后续搜索的主成分数对应的交叉验证准确率有更高的值,但是为了避免模型产生过拟合现象,本次实验选用CARS算法联合偏最小二乘判别模型的主成分数为14。
图5 主成分数自动搜寻结果图
图6为自优化CARS算法联合偏最小二乘判别建模的特征波段筛选结果图,其中第一幅子图为不同采样次数下筛选出来的特征波段数,第二幅子图为不同采样次数下筛选出的特征波段建模的交叉验证误差值,从图中可以看出在第16次采样时交叉验证准确率达到最大,为82.27%,此时筛选出了56个重要的特征波段。
图6 自优化CARS算法特征波段筛选结果图
图7 糯玉米种子特征波段图
从糯玉米种子特征波段图(图7)可以看出筛选出来的特征波段几乎覆盖整个可见光波段范围,集中分布在波长920~940nm和970~1026nm范围内,同时筛选出了391nm、883nm和896nm处的几个吸收峰。
表2不同特征波长提取三种分类器分类结果(一阶中心差分-SG平滑处理后)
对比不同特征波段提取方法下的不同分类器的分类准确率。从表2中可以看出自优化CARS算法筛选出的特征,波段相对于SPA算法筛选出的特征波段和全波段来说效果最好,同时不同特征波段提取方法下支持向量机的分类效果最佳,经过一阶中心差分-SG平滑处理后通过CARS算法筛选后的光谱数据导入支持向量机建立模型训练集的准确率可以达到95.81%,测试集的准确率可以达到92.05%。
推荐:
便携式高光谱成像系统 iSpecHyper-VS1000
专门用于公安刑侦、物证鉴定、医学医疗、精准农业、矿物地质勘探等领域的最新产品,主要优势具有体积小、帧率高、高光谱分辨率高、高像质等性价比特点采用了透射光栅内推扫原理高光谱成像,系统集成高性能数据采集与分析处理系统,高速USB3.0接口传输,全靶面高成像质量光学设计,物镜接口为标准C-Mount,可根据用户需求更换物镜。