紫外/可见光下海洋溢油油种光谱识别方法
发布时间:2021-08-18

紫外可见光下海洋溢油油种光谱识别方法


0 引言

  

  近年来,海洋溢油事故频发,及时准确地对溢油种类进行分析和鉴别,确定责任归属,采取合适的应急响应,是一项复杂而具有挑战性的工作。现行的溢油鉴别标准多以相色谱/质谱分析为代表的实验室化学鉴别手段,虽然能够对油种和组分进行精确解析,但检测速度慢,代价高。

  近几年来,光谱分析成为溢油鉴别的新兴手段,受到普遍关注。特别是近红外光谱(NIR)应用广泛,可应用于是由极其制品的组分预测中。Kim M等人最早应用近红外光谱进行石油产品的分类,他们利用PCA和贝叶斯分类器实现了柴油、煤油、粗汽油等6个油种的识别;王丽等人利用近红外光谱技术鉴别模拟海面溢油,对自行配制的56个汽油、柴油、润滑油的模拟海水样品进行正确的溢油类别判别。油品在紫外光的激发下具有荧光现象,2011年《Science》报导了可根据这一特性探测溢油。在实验室情况下,王春艳等人提出了使用基于浓度参量同步荧光光谱技术,可以实现实验室不同溢油类型及不同油源原油的准确分类。尹晓楠利用小波分析方法分析了4大量6种油品的三维荧光光谱,并对油品种类进行了识别研究,三维荧光技术也是现行水上溢油快速鉴别规程的可选技术。上述的技术手段均不能从本质上做到现场、快速的原位探测。

  海洋溢油往往是突发事件,通过遥感手段进行海洋溢油的快速原位探测是快速响应的重要组成部分。传统的遥感手段,如星载、机载、SAR等,只能探测溢油面积,不能区分各个油种,且受环境影响较大。由于荧光很微弱,所以国内外均开展了激光诱导荧光的探测方法,可同时实现面积和油种的探测,但该仪器太重(200kg),需要搭载海监的飞机才可以使用,费用太高。

  上述研究主要是通过常规可见光的光谱数据。由于油品具有紫外荧光特性,所以文本采集了紫外波段的三种光源以及常规日光灯和阳光不同光源下的光谱数据,以期获得更精细的光谱识别能力。本文利用小型化的地物光谱仪开展了紫外和可见光下的油种识别研究,不仅重复利用了无人机载和对油种的精细化遥感特测提供技术支持。


1 材料与方法


1.1 实验数据


  准备5种油样和海水(煤油、机油、93#汽油、0#柴油和花生油其中汽油和柴油购置于青岛当地某加油站花生油购置于某超市机油购置于某汽车修理厂煤油购置于某化学品商店海水取自胶州湾海域选择45mm直径的圆桶形玻璃皿避免光的干扰桶壁用黑色胶带贴上为避免底部反射光影像将玻璃皿放置在黑色胶皮垫上用千分之一天平根据密度换算分别量取海水5ml量取各种(15:2515:35每个样品的数据均控制在2min左右测量完毕每次测量前对光谱仪进行白板矫正计算机存储光谱数据备用光谱曲线如图所示


1.2 方法

  本文做识别时主要使用的是支持向量机算法。支持向量机算法可描述为

1629252134(1).png

  式中αk为拉格朗日乘子;K(x,xk)为核函数,本文选自RBF核函数;b为偏置系数。支持向量的两个参数C和gamma的参数寻优主要使用网格化寻优方法,做特征优化和选择主要涉及主分量分析算法,这些算法的详细解释可参见文献[13],算法全部通过自的Matlab为Mat-lab 2010(b),想ideaCentreKx8160


2 结果与分析

2.1  特征和参数优化

特征优化和选择在一定程度上可以降低数据维数,提高算法的效率,本节主要使用主成分分析PCA进行特征优化

  图2 是阳光下测量数据采用PCA算法进行特征提取进行数据降维的主分量贡献和累计贡献率

1629253140(1).png

  从图中可以看出,第1主分量贡献最大,已超过58%,前10个主分量的累计贡献率已达到了95%以上,这样就将原始特征数据1646个点降到10个特征主分量,数据压缩后不到原来的1%。采用PCA数据特征优化降维,表1是在不同紫外波长和可见光情况下使用前10个主分量的累计贡献率表。

通过PCA和SPA优化后的训练样本和测试样本,其均方误差(MSE)均有所升高,平均相关系数R2均有所降低,表明模型的预测性能有所下降,然而总体最佳均方误差有所降低。虽然SPA对训练集效果很好,但测试性能较差,总的来看PCA的泛化能力要优于SPA的性能。维数的降低使得两种方法的测试时间变短,测试所用的时间短将有益于将来应用到石油工业在线快速的场合,提高全程监测的自动化。

1629253495(1).png

表1 列出了各种光照情况下前10个主分量的累积贡献率,阳光的前10个主分量的累积贡献率最大,达到了95.5%,灯光最差,仅为67.5%,说明阳光前10个主分量包含的信息量最大。

1629254377(1).png

SVM模型惩罚参数C和RBF核函数gamma是采用支持向量机进行预测的两个关键参数,参数的选择直接影响到模型的预测性能。目前主流的参数优化方法是网格法(Grid)寻优的方法[14]。

采用网格法优化的最佳参数C(Best-C)和最佳参数gamma(Best-g)如表2所示。由于采用的是5折交叉验证法,所以每次取的训练机和测试集均不同,优化的参数和得到的模型性能也不尽相同。但也发现多数情况下优化参数表现出一定的一致性。

1629254619(1).png

图3形象地表示了阳光下数据使用网格法寻优的过程,其中图3(a)为二维图,图3(b)为三维图。 


2.2 识别模型

  在构建SVM模型时,支持向量机模型选用C-SVC模型,选用的核函数是径向基RBF核函数,其中两个参数C和gamma可由系统的上述步骤给出。

  训练和测试过程采用折交叉验证法即随机选取50组数据中的40组作为训练集,10组作为测试集

  图4显示了其中一次训练集和预测识别结果,

1629254955.png

  图4(a)为训练集数据识别结果,图4(b)为测试集数据识别结果。总体来看训练集识别效果均比较好。图4(c)是训练数据和测试数据的相对误差,其中前200个数据为训练数据,后50个数据为测试数据,可以看出训练数据的预测误差比较小,绝对值均小于0.1,但是测试误差普遍较大,有的甚至达到了0.5。

  为了详细比较SVM模型的预测性能参数,主要采用两个参数指标即均方误差MSE和平均相关系数R2来衡量模型对识别问题的性能。MSE、R2越接近于1模型的识别性能越好模型的性能结果见表3

1629255529(1).png


表3列出了5次优化后的预测平均性能指标。从总体来看,最优均方误差(BestCVmse)和GA算法最优秀,其次是Gird,最差是PSO。另外,分别从训练集(Train)和测试集(Test)的MSE和R2来看,采用GA方法优化参数优于Gird,PSO最差。

  表4中的模型预测性能指标对模型的性能进行了量化。从表中不难看出,SVM的总体性能好,

1629255714(1).png

  训练集的性能普遍比测试集好测试集预测性能表明了模型的泛华能力,SVM训练集性能的相关系数R2为0.999以上其最小均方误差为0.0001测试集性能的相关系数R2普遍也达到了90% 以上是灯光下的测试效果较差说明在日光灯下对油种进行识别难度较大

1629255879(1).png

3 讨 论

实验室模拟只是海洋溢油的一种理想情况,通过在玻璃皿中布置海水油膜是对海洋溢油模型的合理简化,在这个过程中既没有考虑海上自然环境的风、浪、流等复杂自然情况对识别效果的影响,同时也没有考虑海洋基底反射光、天空光等对溢油光谱的影响。要想得到实际的可推广应用的结果,必然 需要对实验结果进行海试,今后我们将进一步进行实验验证。本文是在实验室模拟海洋溢油的场景,真实的溢油场景数据可遇不可求,只有在发生溢油事故中才能采集。另外,在真实溢油场景中较难搭建负责的紫外光谱采集系统,对海洋溢油的一些关键要素进行合理的简化是一种很好的选择,有助于对油种识别性能进行定量化分析,进而在溢油场景发生时推广应用。

油的光谱表现型反应的是某波长的吸光度,它是油的不同组分以及每个组分的不同含量的综合表现结果,它与组分及含量、产地及其产地底层地质环境、存放环境、风化光照时间、数据采集仪器及采集装置、操作环境等多种因素相关。本文只是将油种的识别归类为汽油、柴油、煤油、机油、植物油等,然而各种油的采集区域不同,采集环境不同都会影响到识别结果。对采用高光谱方法对油的亚类的识别,比如不同作物的植物油的识别,汽油的不同号牌和不同产地的识别,都有待深入的研究。原油的不同井号是原油开采不同地质环境底层的反应,我们将在今后做进一步的研究。

对石油及其产品组分的精确解析一直是石油工业的重点和难点,是准确识别油种、鉴别产地和真伪的重要手段,准确识别石油的组分有助于同时对石油关键组分的解析,有助于石油生产工艺的在线同质化生产,同时还有助于对海洋溢油违法油源的快速鉴定。石油是一种复杂的混合物,其光谱应该是其各个组分的综合反映,光谱与某种组分间存在着复杂的非线性映射,理论上能够通过非线性回归分析找到这种非线性回归的精确表达式。运用光谱技术对油组分的分析,往往是基于一个基本的假设,也就是组分光谱之间满足Beer-Lambert定律,即组分光谱满足线性叠加原理,然而由于石油组分的复杂性,组分光谱之间往往存在着光谱耦合现象,并不是严格满足这一定律,这在光谱分析上往往存在着一定的模型误差。

溢油的发生时间具有不确定性,既可能发生在白天,也可能发生在夜间,因此研究不同光照情况下的油种识别更具有意义。本文的研究表明,在夜间检测溢油,使用可见光的日光灯光源进行油种识别的效果较差,是不可取的,原因可能是由普通日光灯管的光谱不确定性引起的,其机理有待深入的探讨。

另外,由于紫外分析仪器本身的限制,我们在做不同波长的实验时,302nm紫外灯选用的是透射光谱,当然只有都在反射光下才有可比性,但从另外一个角度也说明,透射光谱在一定程度上具有更强的区分能力,可有效地应用到油种识别中。但在现实海洋溢油中,透射检测在工程上实现起来是比较困难的。


4 结 论

为了研究不同光源下的海洋溢油油种的识别问题,本文搭建了模拟的实验室环境,在不同紫外波长和可见光下,使用地物光谱仪进行光谱测量,并基于次光谱进行油种识别。筛选了对油种识别有意义的光源,这对溢油的油种识别具有一定的意义。