基于无人机高光谱遥感和机器学习的土壤水盐信息反演V1.0
发布时间:2023-12-23


1、引言

银川平原是我国西部地区重要的耕地保护资源和灌溉农业区。然而,长期引黄灌溉加之干旱少雨、蒸发强烈等因素导致该区形成了大面积盐碱化土壤,成为制约该地区农业可持续发展的主要问题。土壤含水量、pH值和含盐量作为盐碱地农业监测的重要指标,在评估土壤墒情、农作物生长状况和产量方面具有指导作用。因此,快速、准确地获取银川平原土壤水盐信息,对实现盐碱地综合治理至关重要。

本研究以银川平原盐碱化农田为对象,基于无人机高光谱数据进行土壤水盐指标的最优光谱变换形式筛选,采用CARS算法进行建模变量提取,构建偏最小二乘回归(PLSR)、RF和XGBoost模型,最终确定土壤含水量、pH值和土壤含盐量的最佳反演模型,以期通过无人机高光谱实现盐碱化农田土壤水盐指标估测,为精准农业生产提供理论依据和技术支持。

2、研究地区与研究方法

2.1 研究区概况

本研究以位于宁夏回族自治区吴忠市红寺堡区柳泉乡豹子滩村和石嘴山市平罗县渠口乡交济村的盐碱农田为对象(图1),其中,红寺堡区是全国最大的生态移民集中安置区之一,而平罗县则是宁夏盐碱地分布最广的地区。

image.png 

研究区及采样点分布

2.2 土壤样品采集及处理

土壤样品采集时间为2022年7月底,采样时研究区覆盖作物均为玉米(生育期为抽雄期)。采集前布设25m×25m采样网格(实际采样过程中,因道路和沟渠等因素对采样点进行了适当调整),采集表土0~20cm土样。土样采集共80个有效样点,将土样风干后分别采用烘干法、酸度计法和电导法进行土壤含水量、含盐量和pH值的测定。同时测量样点处玉米叶绿素相对含量(SPAD)每株玉米选择植株中上部完全展开叶4片进行测量(避开中脉),每片叶测量6个SPAD值,取平均值为该叶片的SPAD值。

2.3 光谱数据处理

2..1 高光谱数据变换

为挖掘对土壤水盐指标响应更强的光谱形式,对原始光谱进行4种数学变换,得到反射率(R)、SNV、多元散射校正(MSC)、反射率的一阶微分(FDR)和反射率的二阶微分(SDR)5种光谱。

2..2 高光谱特征波段提取

CARS算法是基于迭代统计信息的光谱变量筛选方法,其依据达尔文“适者生存”的思想,逐步淘汰不适应的波长变量,利用蒙特卡罗模型采样进行建模分析,再以PLSR回归系数绝对值的百分比作为目标变量的重要性,在N次迭代过程中逐步确定迭代采样变量,最终对比基于所筛选变量建立的PLSR模型的交互验证均方差值(RMSECV),该值的最小变量集合即为所求敏感变量。

2.4 建模方法与精准评价

利用(K⁃S)算法将2/3的样点(56个)用于建模,1/3的样点(24个)用于验证,选用PLSR、RF和XGBoost进行建模。所建模型精度将通过决定系数(R2)、均方根误差(RMSE)和相对分析误差(RPD)进行评估。其中,R2越大,RMSE越小,模型预测效果越好。RPD≤1.4,表明模型的拟合性和鲁棒性非常差;1.4<RPD≤1.8,表明模型的预测结果较为合理;1.8<RPD≤2.0,表明模型的预测能力较好;RPD>2.0,表明模型具有极佳的预测能力。

3、结果分析

3.1 土壤水盐指标及 SPAD 值统计分析

由研究区土壤含水量、pH值、土壤含盐量和SPAD值统计结果可知(表1),土壤含盐量变化幅度较大,范围为0.41~26.37g·kg-1,呈强变异程度,说明该地区土壤受到不同程度盐化影响较为显著。土壤含水量呈中等变异,这可能是由于采样时处于夏季降雨集中期,土壤含水量较高,数值间波动也较大SPAD值呈中等变异,pH值变异较小。

表1土壤水盐指标及玉米叶片SPAD值统计

image.png 

3.2 土壤水盐指标及玉米叶片 SPAD 值无人机高光谱响应特征

3..1 不同水盐指标和玉米叶片 SPAD 值下高光谱特征

为直观呈现不同指标与玉米冠层光谱之间的响应关系,根据分级方法,将pH值和土壤含盐量划分为不同梯度(表2)。随着土壤含水量增加,反射率呈上升趋势,并在近红外波段(770~1000nm)内差异更显著(图2a)。随着盐碱化程度的加重,植被冠层SPAD值呈现出逐渐降低的趋势。不同盐碱程度下光谱曲线基本上具有相似的趋势,表现出典型绿色植物的独特光谱特征(图2b、2c),在可见光波段(400~700nm)内,光谱反射率呈“先升后降”的变化规律;在绿波段(550nm附近)存在明显的反射峰;在红波段(680nm附近),曲线逐步上升;在770~880nm之间变化趋势较平缓;之后在880~1000nm波动下降。土壤碱化程度越低,其反射率越高,重度碱化土壤反射率最低(图2b);而在土壤盐化程度方面,反射率与土壤含盐量呈反比(图2c)。在可见光范围内,光谱反射率与SPAD值呈负相关,而在近红外波段内,随着SPAD值的增加,反射率也相应提高(图2d)。

表2 土壤盐碱化分级标准

image.png 

image.png 

2 不同土壤含水量(a),pH 值( b)含量(c)和叶片 SPAD 值(d)下植被冠层光谱曲线

3..2 不同光谱变换形式及其与土壤水盐指标间的相关性

对原始光谱R分别进行SNV、MSC、FDR和SDR变换。由图3可知,SNV变换后的光谱曲线整体上吸收谷(950nm附近)和反射峰(550nm附近)的特征明显增强,FDR和SDR显著缩小了不同波段间光谱反射率差异,MSC变换的曲线特征与R趋于一致。将5种光谱类型分别与土壤含水量、pH值和土壤含盐量进行Pearson相关性分析,其最大相关系数绝对值(MACC)如表3所示

表3 不同光谱变换形式与土壤水盐指标最大相关系数绝对值

image.png 

提取不同土壤水盐指标对应的敏感光谱形式,R、FDR和MSC分别为最佳光谱变换形式,所对应的MACC分别为0.730、0.472和0.654,且均通过0.01显著性检验。

image.png 

不同光谱变换方式下冠层光谱曲线

3.3 CARS 算法特征波长选择

利用CARS算法,分别对原始光谱R、FDR和MSC针对土壤含水量、pH和土壤含盐量指标进行特征波长的筛选,基于交叉验证集RMSECV最小值,选择对应采样次数的变量作为优选出的特征子集,即最具代表性的光谱特征波长。以土壤含水量指标的原始光谱选择过程为例:随着CARS算法运行次数逐渐增加,变量个数在前40次采样过程中有明显递减(图4),说明被筛选出的光谱波长数逐渐减少,当采样运行次数为52次时,RMSECV达到最小值,表明此时光谱中与土壤含水量无关的信息或噪声最少。原始光谱R、FDR和MSC的特征选择结果见表4。

表4 CARS 提取后光谱特征波段与运行结果

image.png 

3.4 土壤水盐指标反演模型构建与验证

为探究光谱变换形式与建模方法的效果,以经CARS算法筛选出的原始光谱R、FDR和MSC特征波长分别为输入变量,土壤含水量、pH和土壤含盐量为输出变量,分别构建基于PLSR、RF和XGBoost的土壤水盐指标反演模型,并进行精度验证(表5)

表5 基于 PLSR、RF XGBoost的土壤水盐指标反演模型

image.png 

结果表明,PLSR构建的土壤水盐指标模型验证决定系数(Rp2)为 0.168~ 0.450,相对分析误差(RPD)为1.12 1.17,模型的拟合性和稳定性都非常差。

3.5 土壤水盐指标反演模型构建与验证

为探究光谱变换形式与建模方法的效果,以经 CARS 算法筛选出的原始光谱 R、FDR MSC 特征 波长分别为输入变量,土壤含水量、pH和土壤含盐 量为输出变量,分别构建基于PLSR、RF 和XGBoost的土壤水盐指标反演模型,并进行精度验证(表 5)。结果表明,PLSR 构建的土壤水盐指标模型验证决定系数(R)为 0.168~ 0.450,相对分析误差(RPD) 为1.12 1.17,模型的拟合性和稳定性都非常差。RF和XGBoost的模型精度均显著优于PLSR模型,Rp2在 0.400 以上,其中,土壤含水量和 pH 值均以XGBoost模型表现最佳,Rp2分别达0.927和0.743,RPD分别达 3.93 2.45;土壤含盐量以RF模型为 最优,Rp2和RPD分别为 0.427 1.64。土壤含水量和土壤含盐量最优模型 RPD 均大于 2.0,说明模 型具有极好的预测能力和稳定性。土壤含水量和pH值实测值与预测值拟合度较高(图 5),样点数值集中于趋势线附近,说明XGBoostt算法具有相对较强的学习性能,可以应用于土壤水盐指标遥感反演。

image.png 

图5土壤水盐指标实测值与最优模型预测值对比