基于LIBS技术的煤炭灰分、挥发分和热值定量分析及特征工程研究
发布时间:2024-11-30

一、引言

煤质分析对于促进煤炭资源的合理利用具有重要意义,其中煤炭的灰分、挥发分和热值是影响燃煤电厂混煤入炉、炉膛燃烧等工作的关键信息。传统的LIBS光谱检测需要耗费很长时间从煤样光谱中筛选元素的特征谱线。这种选择特征谱线的方法费时费力,而且对于不同锅炉的煤炭样品,需要重新根据LIBS光谱数据来选择特征谱线。为解决上述问题,本章基于原位LIBS技术利用煤炭全光谱波点与目标校准值之间的相关性对独立变量进行重组,并分别建立了测定煤样灰分、挥发分和热值的定量模型。为了评估这种特征工程方法的合理性,又从物质成分的角度对重组变量光谱进行了可解释性实验。


  1. 定量分析方法

本章采用主成分分析法来获取LIBS全光谱中的特征信息作为独立变量,然后通过普通最小二乘回归法来构建煤炭灰分、挥发分和热值的定量模型。为解决独立变量中的高阶噪声问题,提出一种基于变量重组的特征选择方法来提取LIBS光谱中的关键信息,并通过波点载荷提取的元素特征谱线对这种特征选择方法进行验证。

1、主成分分析法

主成分分析(PCA)是一种常用的多元数据统计分析方法。主成分表示原始数据在正交方向上的分解,主成分分析可以在保留最大信息量的前提下消除共线性问题、同时降低输入变量的维度。

2、基于变量重组的特征选择方法

主成分分析是遵循解释方差大小的顺序对主成分PC进行排序,通常只选择少数主成分来校准模型,因为高阶的主成分会存在较大噪音。传统PCA只根据光谱数据无法保证所选择的主成分与校准值更相关,而且随着主成分幅度的减小,无法在循环中选择原始主成分的最优数量。因此,通过引入校准值与每个主成分全谱波点解释方差的相关性得分,并对输入变量进行特定排序、筛选。使用这种重组方式可以选择与校准值更相关的主成分,实现最大化回归指标,而不是仅限于选择少数的原始主成分作为定量模型的输入变量。

3、基于波点载荷提取元素特征谱线

主成分载荷是一种用于衡量每个变量对主成分贡献程度的统计量,通过计算变量在主成分上的权重或系数来解释两者之间的关系。

4、普通最小二乘回归法

普通最小二乘法(OLS)是一种用于估计线性回归中未知参数的方法。线性回归的目标是找到最佳的参数向量,使得预测值和真实值之间的误差最小化。可以选择不同的损失函数来衡量误差,并通过最小化损失函数求解最佳回归参数。

本章的数据处理及定量分析过程可以分为4个部分:(1)根光谱预处理方法对采集到的LIBS煤炭光谱进行处理,包括背景光谱去除、多通道光谱归一化、基于极小值点筛选法的基线校正、异常光谱处理以及元素特征光谱峰值的洛伦兹拟合。(2)划分煤炭光谱数据集,并基于校准值相关性和建模结果对主成分进行特定排序、筛选,从而实现变量重组。(3)变量重组后的普通最小二乘法建模以及定量分析。(4)基于全光谱变量重组后的载荷信息及相关性提取元素特征谱线。上述处理过程中的第(2)部分使用R和RMSECV用于变量重组后定量模型的性能分析,第(3)部分使用R、RMSECV和RMSEP来评估回归模型的性能,第(4)部分使用NIST数据库与元素特征谱线进行对比。


  1. 煤炭灰分、挥发分和热值定量分析

本章使用135个煤样作为训练集,用于构建灰分、挥发分和热值定量模型并完成十折交叉验证,33个煤样用于模型测试。其中,需要分别选择不同数量未重组和重组后的主成分作为定量模型的独立变量。然后,对训练集样本进行10折交叉验证,获得R2和RMSECV的平均值。如图1所示,当选择前40个未重组的主成分作为独立变量时,独立变量对全部光谱波点的累积解释率达99.0321%。

1LIBS煤样全光谱的主成分分析结果

对于不同的定量任务,重组变量的数量需要根据独特模型来选择,灰分、挥发分和热值定量模型所最终选择的独立变量个数如图2所示。随着独立变量数量的增加,定量模型R的总体趋势先变大后变小,而RMSECV总体趋势先变小后变大。值得注意的是,变量未重组和变量重组后的定量模型在交叉验证曲线上存在巨大差异。这是因为,随着未重组变量数量的增加,累积解释率的方向不一定更好解释校准值的变化。而且,更高阶的未重组变量会存在更多噪声,这会降低回归模型的性能,从而导致RMSECV增加。通过变量重组,可以选择更多真实特征而不是噪声作为独立变量,得到更平坦的收敛曲线。在交叉验证过程中,R、RMSECV和N(独立变量的个数)同时考虑。当R最大、RMSECV最小时,此时所选择的N对应回归模型的校准效果越好。

2变量重组前后独立变量个数的提取结果

变量重组前后,普通最小二乘定量模型分析煤质参数的流程为:首先,对煤样中的训练集样本进行交叉验证,得到R和RMSECV。然后,使用训练模型对33个测试样本进行分析,定量结果如图3所示。其中,误差棒是10次重复测量测试集RMSEP的结果。从图3可以明显看出,灰分、挥发分和热值的预测结果都优于定量模型在变量未重组时获得的结果。对于变量重组后的灰分定量模型,训练集和测试集的R、RMSECV、RMSEP分别为0.9701,0.9818,0.7153wt%,0.7037wt%。其中灰分的RMSECV下降59.91%,RMSEP下降60.23%。对于变量重组后的挥发分定量模型,训练集和测试集的R、RMSECV、RMSEP分别为0.9458,0.9429,0.5678wt%,0.6628wt%。挥发分的RMSECV下降51.87%,RMSEP下降53.65%。对于变量重组后的热值定量模型,训练集和测试集的R、RMSECV、RMSEP分别为0.9858,0.9811,0.1518MJ/kg,0.1613MJ/kg。其中,RMSECV下降84.06%,RMSEP下降84.15%。表1为变量重组前后的定量模型评估指标,表中灰分和挥发分含量的单位为wt%,热值的单位为MJ/kg。综上所述,变量重组后灰分、挥发性物质和热值校准模型的RMSEP降低53~84%,这意味着变量重组后的定量模型可以更好的预测煤质工业指标含量。

3变量重组前后的定量分析结果

1变量重组前后OLS定量模型的评估指标

四、特征工程的可解释性实验

为了验证这种全光谱特征选择方法对于LIBS煤炭原始光谱数据集的可解释性,分别对灰分、挥发分和热值校准模型中获取的重组变量进行相关性排序。并基于煤样LIBS全光谱波点载荷的累积值,来提取三种煤质指标相关的原子或分子特征谱线。首先,对每个校准模型重组变量的相关性进行排序,排序结果如图4中的(a)、(c)和(e)所示。由图可知,前20个重组变量与目标校准值的相关性较高。但是,随着重组变量个数的增加,可以看到重组变量的相关性曲线并不平坦。这是因为解释原始光谱方差的方向不一定与校准值更相关。虽然,后续重组变量的相关性减弱,但是依旧包含与目标校准值相关的真实信息。经过重组变量,从煤炭光谱数据中提取了更多的相关特征作为输入变量。

4变量重组的相关性排序和全光谱波点的筛选结果

然后,计算每个校准模型中重组变量在全光谱波点载荷上的累积相关值,并将每个波点载荷的累积相关值调整到区间[1,-1]。最后再分为以下四个步骤:(1)对LIBS全光谱进行寻峰,得到283个谱线。(2)选定C@761.21nm和O@764.86nm两条连续元素特征谱线进行洛伦兹峰值拟合。(3)对累积相关值中绝对值较大的波点进行筛选。(4)根据NIST原子光谱数据库对筛选后的波点进行判定,从而得到三种煤质指标相关的元素特征谱线。基于全光谱波点载荷筛选后的结果如图4中的(b)、(d)和(f)所示,从灰分、挥发分和热值定量模型的输入变量中提取的元素特征谱线如表2所示。

2NIST数据库中提取灰分、挥发分和热值的特征谱线波长

煤中的灰分主要由金属元素氧化物组成,包括CaO、MgO、KO、NaO、SiO、TiO、AlO、FeO等。因此,Ca、Mg、K、Na、Si、Ti、Al、Fe和Zn等金属元素可作为影响灰分含量的关键指标。类似地,C、H、O、N、S等非金属元素和Si、Fe、Ca、Mg和Ti等金属元素决定了煤的挥发性成分和热值。变量重组后,提取煤炭灰分、挥发分和热值相关的元素特征谱线分别如图5中的(a)、(b)和(c)所示。对于灰分含量,获得了二十九条特征谱线,包括八种金属元素(K、Ti、Fe、Zn、Na、Mg、Ca、Si)、三种非金属元素(C、N、O)和一条CN双分子谱线。其中,金属元素对应于灰分的主要成分,非金属元素和CN@387.25nm均与灰分呈负相关。对于挥发分,获得了包括金属和非金属元素在内的25条特征谱线。其中,有五种金属元素(Ti、Fe、Ca、Si、Na),五种非金属元素(C、H、O、N、S)和三种CN双分子谱线。值得注意的是,C@260.08nm、CN@385.10nm、CN@387.25nm、CN@387.64nm、H@486.13nm、C@581.83nm、C@761.21nm、O@764.86nm与挥发性物质呈正相关,S@579.75nm呈负相关。

5变量重组后元素特征谱线的提取结果

这是因为挥发分的组成成分主要包括碳氢化合物、氢气和一氧化碳等物质。而在高温下,硫与碳会反应形成硫化物,从而抑制煤中挥发性物质的释放。因此,随着煤中硫含量的增加,煤中的挥发分会减少。C@193.04nm、C@247.86nm和N@493.51nm的负相关可能是挥发分测试集拟合系数仅为94.29%的主要原因。对于热值,获得了包括金属元素、非金属元素和CN双分子谱线在内的27条特征谱线。其中,有五种非金属元素(C、H、O、N、S)和六种金属元素(Fe、Mg、Ca、Si、Ti、Na)。C、H、O、N和CN的谱线与热值呈正相关,而S@579.75nm与热值呈负相关。这是因为煤中的C、H、O、N是产生热量的主要来源,硫化物的形成会导致煤的热值下降。因此,降低煤中的硫含量可以增加其挥发分和热值。而当煤炭在正常空气氛围下进行LIBS实验时,碳和氮反应产生的CN双分子线也会通过碳元素间接影响挥发分和热值。

五、结论

对于煤炭的灰分、挥发分和热值,利用LIBS技术并基于全谱点解释方差与校准值之间的相关性,对输入变量进行了重组处理,分别建立了三种定量检测模型。经变量重组后,从原始光谱中提取了更多与目标任务相关的元素特征谱线来预测灰分(从18到100)、挥发分(从7到99)和热值(从18至113)。结果表明,变量重组后灰分、挥发分和热值定量模型的R分别为0.9818、0.9429和0.9811,RMSECV和RMSEP分别降低了51.87~84.06%和53.65~84.15%。为了证明变量重组对于煤炭LIBS光谱的可解释性,本章又基于全光谱波点载荷和变量重组的相关性完成了进一步的可解释性实验。结果表明,八种金属元素与灰分的主要成分相对应,三种非金属元素与CN双分子谱线均呈负相关。挥发分包括五种非金属元素和五种金属元素,其中氮和一些碳元素的负相关性降低了校准模型的预测能力。热值包括五种非金属元素和六种金属元素。挥发分和热值与非金属元素的正相关性符合其物质组成成分。硫元素的负相关性是由于煤在燃烧过程中产生了硫酸盐和含硫氧化物,而较高的硫元素水平会导致煤炭挥发量和热值较低。上述定量分析过程证明了LIBS技术结合变量重组后的定量模型能够准确煤炭的灰分、挥发分和热值。后续对于不同类型的煤样,该方法还可以通过基体效应校正进行优化。此外,该方法还可以推广到煤炭和其他物质中主要元素的检测。