一、引言
天然牧草是我国草原牧区草食家畜饲料的主要来源,其营养成分直接影响着草食畜的营养状况、生长和发育,也间接影响畜产品的产量和质量,氮(N)、磷(P)、钾(,K)是牧草所需的关键营养元素,其含量对于草地的健康和生长至关重要。因此,精确估算牧草N,P,K含量对评价草地营养价值具有重要意义。
本研究对内蒙古的温性草原和温性荒漠草原开展无人机高光谱数据及同步的地面实测数据的采样。在高光谱数据的不同预处理基础上,采用机器学习算法包括随机森林(RF)和PLSR结合Lasso回归特征选择,对天然草地牧草N,,K含量进行了评估。本研究可为牧场放牧管理和饲料供需管理提供参考,对畜牧业草地的合理利用以及生态环境保护具有重要的参考价值。
二、材料与方法
2.1 研究区概况
研究区位于内蒙古锡林郭勒盟的苏尼特左旗和锡林浩特市,属于温带大陆性气候,冬季漫长严寒,夏季短暂炎热,年均温度在5℃至9℃之间。其中,苏尼特左旗分布在内蒙古锡林郭勒盟的西部,草地类型主要以温性荒漠草原为主,地势整体呈现出西高东低的倾斜趋势,海拔为1000m左右,年降水量为180mm,主要集中在夏季;植被组成以针茅、羊草为优势种的旱丛生小禾草以及混生小灌木为主。锡林浩特市分布在锡林郭勒盟中部,草地类型主要为温性草原,地势相对平坦,海拔高度为1100~1300m,年均降水量约为300~350mm;大针茅、羊草等旱生禾草以及多年生密丛草本植物冰草和冷蒿是该草地的植物群落组成。
图1 研究区海拔高度和草地类型分布图
2.2高光谱数据采集与图像处理
本研究主要通过无人机搭载传感器获取数据,并通过软件分析处理。
2.3 模型评价
采用决定系数(R2)、均方根误差(RMSE)和相对预测偏差(RPD)评估N,P,K含量的估测模型精度。R2范围为0~1,越接近1,模型拟合度越好。RMSE越小,模型预测准确度越高。当RPD在1.4~1.8之间时,表示该模型可用于预测,当RPD在1.8~2之间,模型质量一般;当RPD在2.0~2.5之间时,模型质量较好;当RPD大于2.5时,模型质量极好。
三、结果与分析
3.1两种草地类型下N,P,K含量统计分析
本研究使用蒙特卡洛算法对高光谱反射率数据进行了异常值剔除。共得到CP含量对应实测样本值92个,其中温性荒漠草原43个样本,温性草原49个。然后,采用算法将牧草N,P,K含量实测值分别按照7∶3分为训练集和测试集,结果如表1所示。
表1 两种草地类型下牧草 N,P,K 含量的统计分析
在所有样本集中,相比于P含量(0.04~0.24mg·g-1)和K含量(0.09~0.48mg·g-1),N含量(1.14~3.24mg·g-1)偏高;N,P和K含量在所有样本集中变异系数均较高,范围为17.95%~53.35%,表明样本有一定的离散性;两种草地类型的训练集和测试集中的均值和标准差相近,分布均匀,具有建模的可靠性。
3.2不同方法的高光谱数据预处理结果
对OR光谱和处理后光谱反射率平均,得到光谱反射率曲线。
图2 两种草地类型下不同光谱预处理方法的处理结果
结果如图2所示,不同高光谱处理方法具有不同的光谱特征。在OR光谱中,温性荒漠草原的反射率比温性草原更高;另外,温性草原在红色边缘区域的反射率在695nm处急剧上升,776nm后趋于平稳;而温性荒漠草原的反射率则在蓝光和绿光区域急剧增加,在红外区域缓慢增加。在SG光谱中,光谱曲线相比于OR光谱更加平滑。Log(1/R)处理可以调整数据的尺度,提高数据对细微差异的敏感性,与SG平滑处理的光谱曲线相比具有相反的趋势。此外,FD处理能够有效地突出数据中细微变化、特征峰和谷值,其中在温性荒漠草原在可见光区域的反射率高于温性草原。而在红边区域,温性草原的反射率明显高于温性荒漠草原。
3.3高光谱预处理数据与N,P,K含量的相关性分析
根据地面样方数据的位置和空间坐标信息与高光谱影像中对应位置的反射率结合划分训练和测试样本。将两种草地类型下不同预处理的高光谱反射率数据分别与N,P,K含量作相关性分析,所有光谱曲线与N,P,K含量的显著相关(P<0.05)区域主要在可见光区域和近红外区域。高光谱数据与N含量的相关性结果如图3所示。
图3 不同光谱预处理方法与 N含量的相关性分析结果
在OR光谱中,温性荒漠草原光谱数据与N含量相关性明显高于温性草原,由表2得出,在429nm处相关性最高(r=-0.762),温性草原同样也是在429nm处相关性最高(r=-0.455)。对于SG光谱曲线,温性荒漠草原下光谱数据与N含量在429nm处相关性最高(r=-0.766),温性草原在397nm处相关性最高(r=-0.454)。在Log(1/R)光谱中,温性荒漠草原和温性草原下,N含量与429nm和397nm处的反射率表现出最高的正相关性,r分别为0.767和0.454。在FD光谱曲线中,温性荒漠草原下在482nm处的光谱反射率与N含量相关性最高,呈负相关性关系(r=-0.727),温性草原下在738nm处反射率与N含量相关性最高,且呈正相关(r=0.552)。高光谱数据与P含量的相关性结果如图4所示,相关性曲线趋势与N含量表现一致。
图4 不同光谱预处理方法与 P含量的相关性分析结果
由表2可知,对于OR光谱,温性荒漠草原和温性草原下光谱反射率与P含量的相关性分别在429nm和453nm处的波段表现最高,且均为负相关,r分别为-0.727和-0.390。对于SG光谱曲线,温性荒漠草原下光谱数据与P含量在429nm处相关性最高(r=-0.740),温性草原在429nm处相关性最高(r=-0.376)。对于Log(1/R)光谱,温性荒漠草原和温性草原下均是在429nm处的反射率数据与P含量的相关性最高,均为正相关,相关系数r分别为0.740和0.381。对于FD光谱曲线,温性荒漠草原光谱与P含量在429nm处相关性最高(r=-0.770),温性草原在457nm处相关性最高(r=-0.431)。
表2 不同高光谱预处理数据与 N,P,K 含量最高相关性的统计表
图5 两种草地类型下不同光谱预处理方法与 K 含量的相关性分析结果
高光谱数据与K含量的相关性结果如图5所示,相关性曲线趋势与N,P含量曲线一致。由表2结果看出,对于OR光谱,温性荒漠草原和温性草原下光谱反射率与K含量分别在429nm和397nm处相关性最高,均为负相关,r分别为-0.649和-0.357。对于SG光谱曲线,温性荒漠草原光谱数据与K含量在429nm处相关性最高(r=-0.654),温性草原在397nm处相关性最高(r=-0.357)。对于Log(1/R)光谱,温性荒漠草原和温性草原下分别在429nm和397nm处的光谱反射率与K含量相关性最高,均为正相关,r分别为0.653和0.357。对于FD光谱曲线,温性荒漠草原光谱与K含量在429nm处相关性最高(r=-0.702),温性草原在855nm处相关最高(r=-0.452)。
3.4牧草N,P,K含量的模型构建与精度评价
本研究利用不同处理的高光谱数据分别与N,P,K含量构建了RF和PLSR模型,结果如表3所示。
表3两种草地类型下牧草 N,P,K 含量模型构建结果
N含量构建的16个模型中,在温性荒漠草原下的最优模型为SG-FD-Lasso-RF,该模型在测试集上的R2值为0.90,RMSE分别为0.11mg·g-1,RPD达到3.14,模型效果极好。与OR光谱相比,R2提高了12.22%,RMSE降低了38.89%,RPD提高了43.95%。在温性草原中,最优模型为SGFD-Lasso-RF,该模型在测试集上的R2值为0.82,RMSE分别为0.15mg·g-1,RPD达到2.35,模型效果较好。与OR光谱相比,R2提高了26.59%,RMSE降低了42.31%,RPD提高了38.29%。以上结果表明,FD处理后构建的RF估测模型与OR光谱相比,在两种草地类型下均表现出较好的结果,能够显著改善N含量预测的准确性。
在P含量与光谱数据构建的16个模型中,温性荒漠草原下的最优模型SG-Log(1/R)-LassoPLSR,该模型在测试集上的R2值为0.75,RMSE分别为0.023mg·g-1,RPD达到2.54,模型效果极好。与OR光谱相比,R2提高了10.67%,RMSE降低了17.85%,RPD提高了39.37%。在温性草原中,最优模型为SG-Log(1/R)-Lasso-RF,该模型在测试集上的R2值为0.76,RMSE分别为0.018mg·g-1,RPD达到2.01,模型效果较好。与OR光谱相比,R2提高了10.53%,RMSE降低了5.26%,RPD提高了12.44%。总体而言,在温性荒漠草原下Log(1/R)处理相比于OR光谱构建的PLSR估测模型能够显著改善P含量预测的准确性。而在温性草原下,Log(1/R)处理相比于OR光谱构建的RF估测模型能够显著提高P含量的预测精度。
在K含量与光谱数据构建的16个模型中,温性荒漠草原下的最优模型为SG-FD-Lasso-RF,该模型在测试集上的R2值为0.79,RMSE分别为0.043mg·g-1,RPD达到2.18,模型效果较好。与OR光谱相比,R2提高了18.99%,RMSE降低了31.75%,RPD提高了22.94%。在温性草原中,最优模型为SG-FD-Lasso-RF,该模型在测试集上的R2值为0.80,RMSE分别为0.026mg·g-1,RPD达到2.23,表明模型效果较好。与OR光谱相比,R2提高了31.25%,RMSE降低了38.09%,RPD提高了33.18%。P含量与N含量结果一致,FD处理后构建的RF估测模型与OR光谱相比,在两种草地类型下均表现出较好的结果,能够显著提高P含量预测的准确性。
图6 两种草地类型下牧草 N,P,K 含量最优模型拟合效果
对比了两种草地类型下N,P,K含量构建的最优模型实测值与预测值。结果如图6所示,N和K含量均在FD处理下表现最优,P含量在Log(1/R)处理下表现最好,可以表明,高光谱的FD和Lo(1/R)处理对模型精度具有一定的提高效果。同g时,在构建的这6个最优模型中,只有温性荒漠草原下P含量的PLSR模型效果最好,其余5个最优模型均在RF算法上表现最佳,表明RF模型比PLSR和SVM模型更适用于预测天然牧草的N,P,K含量中,对于实际应用中牧草营养成分的含量反演具有重要的参考价值。另外,N含量拟合效果优于P和K含量,但是其稳定性不如P和K含量。在温性荒漠草原中,N含量预测结果优于温性草原,而P和K含量则在温性草原上表现最佳。
四、结论
本文分析了内蒙古自治区两种草地类型下不同预处理方法的光谱数据与N,P,K含量之间的相关性,发现Log(1/R)预处理和FD处理能提高N,P和K含量的相关性。Lasso回归可以大大降低波段数量。此外,在构建N和K含量模型时,FD被确定为最优预处理方法,而在构建P含量的机器学习模型时,Log(1/R)处理方法表现最佳。在温性荒漠草原下,P含量构建的PLSR模型效果最佳。而在两种草地类型下的N和K含量以及温性草原下P含量构建的RF模型均表现最优。