区域水稻田土壤-作物系统重金属污染高光谱遥感定量估测
发布时间:2023-07-13

1、引言

传统的土壤-作物重金属检测方法有光学检测法、电化学检测法和生物学检测法,这些传统检测方法虽然检测精度高、检出限低,但取样和检测步骤繁琐、耗费人力和物力,同时大规模土壤采样会破坏农田土壤且难以实现,无法达到快速、实时监测大面积农田土壤的要求。高光谱遥感技术综合了探测器技术、精密光学机械、微弱信号检测、计算机技术和信息处理技术; 与传统遥感技术相比,高光谱遥感技术具有波段多、光谱分辨率高、空间分辨率高等优势。大量研究表明,利用高光谱遥感技术可以定量反演作物中化学物质的含量。袁自然等通过暗室中测定的土壤反射率光谱,分析了洪湖市燕窝镇土壤重金属砷( As) 的含量和分布。张霞等采集河北省雄安新区雄县和安新县70个耕地土壤样点地面光谱,构建了土壤Pb含量的反演模型,并获得了良好的精度。

当植物受到土壤中重金属污染胁迫时,会影响其叶绿素的合成,同时也会使植物的细胞结构和水分含量发生变化,从而改变植物叶片的光谱特性。已有研究表明利用作物光谱可以反演土壤中重金属元素的含量。

2、材料与方法

2.1研究区概况

研究区位于江苏省宜兴市徐舍镇( 1)。宜兴市(地理位置31°07' 31°37'N119°31' 120°03'E)位于江苏省南部,属亚热带季风气候,年均气温和降水分别为160℃和14340mm,农田主要分布在西部、北部的平原地区和低洼圩区,主要作物为水稻、冬小麦等。徐舍镇位于宜兴市西部,是该市最大的农业镇,耕地面积达12hm2,土壤类型主要为水稻土、黄棕壤和潮土等。

image.png 

1 研究区概况及采样点分布

2.2样品采集与数据测定

在宜兴市徐舍镇农田区域内均匀设置22个采样地( 1) ,每个采样点用五点采样法采集020cm 的水下表层土壤样品进行混合。利用田间便携式光谱仪采集水稻叶片光谱,光谱仪的光谱范围为3011 145nm,光谱分辨率为33nm。测量时间为北京时间11: 0013: 00,每次光谱测定前进行白板标定。在每个采样点内随机选择 5 株水稻,每株水稻选择3张完全展开的叶片分别测量5次叶片光谱,同一采样地点共测量75次叶片光谱。采集的土壤样品在实验室 60 ℃烘干,去除小石子和植物残体后研磨并过100目筛,一部分土壤样品用电位法测量 pH 值,另一部分采用电感耦合等离子质谱 ( ICPMS) 法测定土壤样品总Cd和总As含量。

2.3高光谱预处理

由于光谱数据在紫外部分有较大噪声,选取3801145nm 范围内的光谱反射率进行数据分析。将同一采样点采集的75条光谱曲线剔除异常值后取平均值得到该采样点的水稻叶片光谱。由于光谱仪在不同波段之间在能量响应上存在一定差别,某些波段测量的光谱反射率可能发生急剧变化,导致光谱曲线存在“毛刺”,掩盖了光谱特征信息。同时,在对水稻叶片进行光谱测定的过程中,大气、光照条件、水面反射和光谱仪等因素都可能影响覆盖目标的光谱特征信息。因此,须要对水稻叶片光谱依次进行平滑处理和光谱变换,以去除“毛刺”和 减弱背景噪声,从而突出光谱特征。本研究对片光谱进行savitzkygolay ( SG) 平 滑,平滑处理后的光谱称为原始光谱( ) 。对原始光谱进行一阶微分( FD) 、二阶微分( SD) 、倒数对数变换( AT) 、倒数对数的一阶微分( AFD) 、倒数对数的二阶微分( ASD) 、多元散射校正( MSC) 和标准正态变量变换( SNV) 7 种光谱变换。

2.4 水稻叶片光谱与土壤重金属含量相关性分析

本研究采用皮尔逊相关系数对预处理的光谱与重金属含量进行相关性分析。如果拒绝原假设的概率结果( P 005) ,则认为光谱数据与重金属含量之间存在显著的相关关系。

2.5 土壤重金属污染估测模型构建

2.5.1 遗传算法波段筛选

本研究将原始光谱和7种变换光谱采用遗传算法( GA)筛选连续波 长。光谱数据用偏最小二乘法建模前,利用遗传算法进行波长筛选,可以减少冗余波长,优化模型预测性能,提高模型稳定性。本研究设置GA参数值为种群大小40,交叉概率 05,突变概率 001,遗 传代数 100,为减少随机性影响每种预处理光谱与重金属含量的组合重复运行 10 次。以偏最小二乘回归的留一交叉验证法均方根误差( MSECV) 作为 适应度判据,RMSECV 越低,个体适应度越高。

2.5.2 偏最小二乘回归法构建模型 

22个光谱和重金属含量数据样本分为2个部分,每4个样本挑选一个作为验证,共有17个样本作为建模集用于建模分析,5个样本作为验证集用于模型精度验证。将GA选择的光谱波段用偏最小二乘回归法 ( PLS) 进行建模分析。PLSR通过将自变量和因变量同时投影到新的坐标系中,提取对变量解释性最强的自变量作为主成分,来构造一个新的线性模型,可以减少共线性和噪声影响,提升模型鲁 棒性。在 PLSR 建模分析过程中,成分过多引入会导致解释模型检验过程方差的能力降低,增加额外的噪音而导致模型的预测精度下降。本研究中采用留一交叉验证法确定主成分( PC) 的最佳数量, 即以主成分少、决定系数( r2) 高、RMSECV低作为较优模型判据确定主成分个数。

2.5.3 模型精度验证

模型精度验证采用内部验 证和外部验证结合。内部验证采用交叉验证决定系数(r2cv) 、交叉验证均方根误差(MSECV) ,对比一般 PLSR方法建模和GAPLSR建模,评价模型精度。r2cv越接近 1,说明模型拟合程度和稳定性更好。RMSECV 越低说明模型精度越高。将验证集5个样本数据代入GAPLSR模型得到模型的外部验证值,以外部验证决定系数( r2pre) 、 外部验证均方根误差( MSEP) 和相对分析误差 (PD) 评价模型估测精度。r2pre越接近 1,说明模型拟合程度和稳定性更好。RMSEP越低说明模型精度越高。RPD评价标准采用RPD5层解释方法: 当RPD3.0 时,表明模型具有 优秀的预测能力; 2.5≤RPD 30 时,表明模型 具有良好的预测能力; 2.0≤RPD 25 时,表明模型可以近似定量预测; 1.5≤RPD 2. 0 时,表 明模型具有区分高值和低值的可能性; PD 15 时,表明模型预测能力较差。

3、结果与分析

3.1 水稻田土壤重金属含量分析

如表 1 所示,研究区内农田土壤 pH 值变化范 围在 435 813 之间,818% 土壤样本呈酸性。样 本中 Cd 含量离散程度较大,As 元素离散程度较小。

1 土壤样本化学成分统计

image.png 

3.2 水稻叶片光谱与土壤重金属含量相关分析

将原始光谱和 7 种变换光谱分别与土壤 CdAs 含量进行 Pearson 相关性分析,相关系数超过蓝色、 绿色虚线分别表示通过 005001 水平的显著性检 验,通过 005 水平的显著性检验则认为光谱与重金 属含量显著相关。如图 2 所示,

image.pngimage.png 

2 不同处理后水稻叶片光谱和土壤 Cd 含量的相关关系

原始光谱与土壤 Cd 含量间相关 系数均为负值,无显著相关波段; FD 光谱与土壤 Cd 含量的显著相关波段主要分布在 519 530 nm; SD 光谱与土壤 Cd 含量的显著相关波段主要分布在 402 439 nm 502 546 nm; AT 光谱与土壤 Cd 含 量的显著相关波段主要分布在 406 416 nm; AFD 光谱与土壤 Cd 含量无显著相关波段; ASD 光谱与 土壤 Cd 含量的显著相关波段主要分布在 389 469 nm 812 858 nm; MSC 光谱与土壤 Cd 含量 无显著相关波段; SNV 光谱与土壤 Cd 含量的显著 相关波段主要分布在 1 087 1 053 nm。原始光谱 与土壤 Cd 含量间相关性较弱,不同预处理光谱中 只有 SD 光谱和 ASD 光谱与土壤 Cd 含量的显著相关 波段达到 24 个,FD 光谱、AT 光谱、AFD 光谱、MSC 光 谱和 SNV 光谱与土壤 Cd 含量间相关波段较少。

image.pngimage.png 

image.png 

3 不同处理后水稻叶片光谱和土壤 As 含量的相关关系

如图 3 所示,原始光谱与土壤 As 含量的显著相 关波段主要分布在 946 1 044 nm; FD 光谱与土壤 As 含量的显著相关波段主要分布在 759 1 123 nm; SD 光谱与土壤 As 含量的显著相关波段 主要分布在 509 590 nm589 726 nm 870 1 077 nm; AT 光谱与土壤 As 含量的显著相关波段 主要分布在 910 1 048 nm; AFD 光谱与土壤 As 含 量的显著相关波段主要分布在 432 540 nm759 1 119 nm; ASD 光谱与土壤 As 含量的显著相关波段 主要分布在 449 546 nm 801 1 077 nm; MSC 光 谱与土 壤 As 含量的显著相关波段主要分布在 933 1 106 nm; SNV 光谱与土壤 As 含量的显著相 关波段主要分布在 838 1 139 nm。相关分析结果表明,经过不同数学方法变换的 光谱与土壤 CdAs 含量之间的显著相关波段多于 原始光谱,说明数学变换可以较好地消除背景噪 声、增强相似光谱之间的差别、突出光谱的特征值。

3.3 水稻叶片光谱与土壤重金属含量相关分析构建水稻叶片光谱反演土壤Cd\As含量估测模型

3.3.1 遗传算法波段筛选 

将原始光谱和7种变换光谱作为输入光谱,利用建模集的17个样本的重金属含量代入遗传算法进行波段筛选,结果见表 2

2 GA 筛选的水稻叶片光谱特征波段

image.png 

对于不同预处理的光谱,遗传算法从的全波段共230个波段中挑选了 15 30个特征波段用于偏最小二乘回归法构建模型。

3.3.2 GA - PLSR 模型和 PLSR 模型

GA 筛选的特征波段和全波段的原始光谱及7种变换光谱分别使用 PLSR方法进行建模分析,交叉验证结果见表 3

3 GA - PLSR 和 PLSR 模型估测土壤重金属含量的交叉验证结果

image.png 

相比于使用全波段进行偏最小二乘回归法建立的PLSR模型,经过遗传算法波段筛选再进行偏最小二乘回归的预测土壤重金属含量模型主成分数不变或降低。GA PLSR模型原始光谱和7种变换光谱预测土壤Cd含量的r2cv相比于PLSR模型提高了6.25% 3396% 、RMSECV降低了 000% 5352% ,预测土壤As含量的r2cv提高了1429% 5319% 、RMSECV降低了351% 6935% 。结果表明,在建立光谱估测土壤重金属含量模型前,运用遗传算法以挑选出对PLSR更有意义的波段,提高了模型精度和稳定性。

3.3.3 土 壤 Cd、As 含量的最佳估测模型

GA PLSR模型估测土壤重金属含量进行交叉验证 和外部验证,结果见表 4

4 GA - PLSR 模型估测土壤重金属含量的交叉验证和外部验证结果

image.png 

相比于原始光谱,光谱经 过不同形式的预处理提高了预测土壤 Cd 含量估测 模型的r2cv,降低了RMSECV; 同时提高了r2pre,降低了RMSEP,提高了RPD,表明经数学变换的光谱提高了土壤 Cd 含量估测模型的精度和稳定性。外部结果验证中,原始光谱模型、FD 模型、SD 模型、ASD 模 型和 MSC 模型r2pre041 052 之间,RMSEP0. 094 0105 之间,RPD 10 15 之间,预测土壤 Cd 含量能力较差。AT 模型和SNV模型 r2pre分别为 059 062,RMSEP分别为 0087 0. 084,RPD 分别为 156 162,具有区分土壤 Cd 含量高 值和低值的可能性。AFD 模型r2cv最高、RMSECV最低,且r2pre最高、RMSEP最低,RPD 最高( 209) ,具 有近似定量预测土壤 Cd 含量的能力。7 种变换光谱相比于原始光谱,RPDr2cv r2pre有所提高,RMSECV和RMSEP降低,表明经数学变换的光谱提高了土壤 As 含量估测模型的精度和稳定性。其中,原始光谱模型、FD 模型、SD 模型、AT 模 型、ASD 模型和MSC模型r2pre057 0. 71 之间, RMSEP0530 0647 之间,RPD 1520 之 间,具有区分土壤 As 含量高值和低值的可能性。SNV模 型r2pre 076,RMSEP0479,RPD2. 06,具有近似定量预测土壤 As 含量的能力。AFD 模型r2cv最高、RMSECV 最低,且r2pre最高、RMSEP最低,RPD 最高( 297) ,具有良好的预测土壤 As 含量能力。

基于光谱构建的土壤Cd含量的GA PLSR估测模型,其内部交叉验证和外部验证的真实值和预测值的 1 1 散点见图 4

image.png 

4土壤Cd含量最佳估测模型交叉验证和外部验证的真实值和预测值散点

利用光谱构建的土壤 Cd 含量估测模型,其r2cv 071,RMSECV0066; r2pre 077,RMSEP 0 058,RPD2. 09, 在所有变换光谱中均最高,具有近似定量预测土壤 Cd 含量的能力,为基于水稻叶片光谱的土壤 Cd 含 量的最佳估测模型。光谱构建的土壤 As 含量的GA PLSR估测模型,其内部交叉验证和外部验证的实测值和预测值的 1 1 散点见图 5

image.png 

5土壤As含量最佳估测模型交叉验证和外部验证的真实值和预测值散点

利用光谱构建的土壤 As 含量估测模型,其r2cv 089,RMSECV 0. 343r2pre 089,RMSEP 0297,RPD 2. 97,在所有变换光谱中均最高,具有良好的预测精度和稳定 性,为基于水稻叶片光谱的土壤 As 含量的最佳估测模型。

4、结语

研究结果表明,采用GAPLAR方法构建的土壤 Cd 含量的最佳估测模型为倒数对数的一阶微分光谱模型,r2 077,RMSEP0058,RPD 2. 09,具备近似定量预测土壤 Cd 含量的能力; 土壤 As 含量的最佳估测模型为倒数对数的一阶微分光谱模型,r2 089,RMSEP0297,RPD297, 具有良好的预测精度。经过一阶微分、二阶微分、倒数对数变换、倒数对数的一阶微分、倒数对数的二阶微分、多元散射校正和标准正态化等7种数学方法变换的光谱相比于原始光谱r2cvr2pre 高,RMSECV 和 RMSEP降低,RPD提高,表明经数学变换处理的光谱提高了土壤 CdAs含量估测模型的精度和稳定性。采用GAPLAR方法相比于一般的PLSR方法构建的土壤 CdAs 含量的估测模型的r2cv均明显提高、RMSECV均明显降低。说明在建立土壤重金属含量估测模型前,利用遗传算法进行光谱波长筛选可以挑选出对PLSR更有意义的波段,从而提升模型精度,提高模型稳定性,即GAPLSR 方法相较于一般的PLSR方法能够提高构建估测模型的精度和稳定性。基于遗传算法优化的偏最小二乘回归法构建水稻叶片高光谱的土壤重金属 CdAs 含量估测模型,Cd 预测精度达到70%以上、As 预测精度达到80%以上。说明水稻叶片高光谱的GA PLAR模 型具有估测农田土壤CdAs含量的潜力,为实现作物叶片光谱预测区域农田土壤重金属污染遥感 监测提供了科学依据和可行方案。