主题:【第十三届原创】光谱选择在流化床混合过程监测中的应用

浏览 |回复0 电梯直达
导演叫我趴下脸着地
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
维权声明:本文为Insp_f6c3db88原创作品,本作者与仪器信息网是该作品合法使用者,该作品暂不对外授权转载。其他任何网站、组织、单位或个人等将该作品在本站以外的任何媒体任何形式出现均属侵权违法行为,我们将追究法律责任。
光谱选择在流化床混合过程监测中的应用

异常光谱的出现,会使模型精度降低。由于混合过程中同一批次采集到的动态光谱差异非常明显,故对动态光谱进行选择是非常必要的。光谱选择中最困难的部分是如何有效、准确地滤除异常光谱,获得真实稳定的建模光谱。在本研究中,近红外光谱仪每3 s自动采集一张光谱。在一个典型的混合过程中,收集了超过300张近红外光谱,只有与取样时间相对应的光谱被记录下来并用于后续的光谱选择。整个取样过程约为2分钟,所以每个混合过程记录的校正集光谱矩阵约为40×125,其中40为获得的光谱数,125为近红外光谱仪的波长通道数。记录每个样品取样起始对应的光谱序号,然后将对应取样时间自动采集的光谱用于光谱选择研究。光谱选择剔除了由于物料的理化因素和近红外测量因素导致的异常光谱,这使得建立的模型更精确、合理。本文研究了五种光谱选择方法,将其应用于原始光谱的选择,其原理及方法简述如下。

同一批次采集的一簇动态光谱



1 PCA

主成分分析(PCA)是一种经典的离群点检测方法。一般情况下,如果样本位于置信区间(95%)之外,根据PCA得分图,该样本被确定为异常样本。在本研究中,对同一批次对应取样时间采集的一簇动态光谱进行PCA分析如图3-4a所示PCA得分图中置信区间(95%)内的光谱选择出来用于后续的建模研究,95%置信线外的光谱被确定为异常光谱。

2 诊断图法

引入F残差和Hotelling′s T2统计量来识别异常光谱,对每个批次取样时采集的一簇近红外光谱进行诊断。Hotelling′s T2分布的置信线设定为95%F检验的α残差控制在0.05以内。F残差和Hotelling′s T2阈值以外的光谱都被确定为异常光谱。

3 基线信息法

在光谱采集过程中,近红外光谱仪工作距离、测量角度、粉末物理性质(如密度等)的变化会引起光谱不规则的基线漂移,这是光谱不稳定的主要因素之一。为了滤除异常光谱,本文采用了一种新的光谱离群点算法,即基线信息法对光谱进行选择,具体计算步骤如下:通过计算同一批次所有的建模光谱在每个变量点下吸光度值的标准偏差(SD),选择出吸光度SD值最小的变量点作为代表基线信息的变量点。然后,选择±1SD作为阈值,如果该变量点下光谱的吸光度值高于允许的最大吸光度值或偏离允许的最低吸光度值,则光谱将被作为异常光谱滤除,阈值范围内的光谱被选择出来用于后续建模研究。

4 光谱标准偏差法(SDoS

同一混合批次理想的建模光谱应该由一些高度相似的光谱组成,这意味着这些光谱的标准偏差应该趋近于零,SDoS确定光谱一致性的方法类似于计算移动块标准偏差(Moving Block Standard Deviation, MBSD)。每个批次取样时采集的一簇近红外光谱被看作是一个矩阵(X),计算矩阵X的标准偏差为STD。使用留一法每次拿出一张光谱,然后计算剩余光谱的标准偏差为S。如果S<STD,则将剔除的一张光谱视为异常谱,以此类推,直至检测完所有的光谱。

5 向量夹角余弦距离法

在本研究中,引用向量夹角余弦距离来评估光谱的相似度,并根据相似度来剔除异常光谱。光谱相似度计算基于同一批次所有的建模光谱与其平均光谱的夹角余弦距离所得。具体计算过程如下:每张光谱被视为一个多维向量,计算矩阵X中每张光谱与平均光谱的夹角余弦距离M,同一批次每张光谱与平均光谱夹角余弦距离的标准偏差SD被设置为阈值。当M大于1倍的SD时,光谱被拒绝,剩余的光谱被选择出来用于后续的建模研究。

光谱选择结果分析

膨胀室中物料的动态特性使得一些光谱揭示了一些与API含量无关的信息,这些光谱应该被滤除来提高模型的稳定性。为了减少动态扰动因素的影响,获得相对准确的校正集光谱,提高近红外模型的预测能力,本文研究了5种光谱选择方法,用于检测校正集光谱。以第一个混合批次为例,光谱选择结果如图所示。

(a)

(b)

(c)

(d)

(e)

(f)

(a)-(e)不同光谱选择方法对第一个批次混合过程中建模光谱选择的结果;(f) 不同光谱选择方法处理后近红外模型RMSECV



(a)PCA光谱选择结果,由于光谱36超出了得分图95%的置信线,故光谱36被识别为异常光谱。PCA能够成功地移除某些远离中心的样本(36),避免了建模光谱的明显偏差,降低了干扰因素的影响。

在使用诊断图进行选择光谱时,发现了三张异常光谱,如图(b)所示。诊断图显示了F残差与Hotelling′s T2统计量的关系,这代表了两种不同的离群点检测标准。如图(b)所示,如果光谱位于蓝色置信区间之外,则将其识别为异常光谱。这类光谱在校正集中是“危险”的,会使模型变得不可靠。

通过计算校正集光谱基线波段每个变量点下吸光度值的标准偏差,确定在波长1038 nm处进行离群值检测,该变量点代表基线信息。基线信息选择方法结果如图(c)所示。该方法消除了不规则的基线漂移造成的异常光谱。用该方法检测出了6个异常光谱,与Margot[44]的研究相比,本文提出的方法更合理,因为基线信息和吸光度阈值的选择具有显著的统计学意义。

标准偏差光谱选择方法结果如图(d)所示,共观察到14条异常光谱。确定光谱一致性的方法类似于计算移动块光谱的标准偏差[70]

余弦距离法进行光谱选择的结果如图(e)所示,用此方法发现了9条异常光谱。余弦距离用于测量两个向量方向上的相似度,广泛应用于色谱指纹图谱的相似度评价[71, 72]。该方法消除了由于干扰因素产生的具有不同矢量方向的异常光谱。

最后,所有的混合批次采集的建模光谱都按照相同的程序进行处理,并建立PLS模型来评价这些光谱选择方法,结果如图(f)所示。可以发现,与原始数据相比,光谱选择后模型的预测能力都有一定程度的提高。与夹角余弦距离光谱选择方法相比,主成分分析光谱选择法、诊断图光谱选择法和基线信息光谱选择方法结果稍差,这可能是由于后者未能完全消除异常光谱。然而,由于成功地消除了干扰因素引起的异常光谱,其余两种方法可以显著降低模型的RMSECV值,提高模型的质量。余弦距离法处理后建立的模型与未经光谱选择处理的原始光谱建立的模型相比,RMSECV值减小了4.46%
附件:
为您推荐