主题:【第十三届原创】CC)法、UVE、VIP法和RATC波段选择在混合动态光谱模型中的应用

浏览 |回复0 电梯直达
导演叫我趴下脸着地
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
维权声明:本文为Insp_f6c3db88原创作品,本作者与仪器信息网是该作品合法使用者,该作品暂不对外授权转载。其他任何网站、组织、单位或个人等将该作品在本站以外的任何媒体任何形式出现均属侵权违法行为,我们将追究法律责任。

CC)法、UVEVIP法和RATC波段选择在混合动态光谱模型中的应用



为了提高模型的准确性和稳定性,采用了多种波段选择方法,相关系数(CC)法、无信息变量消除算法(UVE)VIP法和吸光度-浓度变化率(RATC)等对波段进行选择。在选择过程中,RMSECVRMSEP被用来评估PLS模型的预测能力。

相关系数

相关系数法是用光谱矩阵中的每列吸光度数值与一级数据之间进行回归,得出每个变量点对应的吸光度与一级数据的回归系数R,然后根据|R|进行波段选择[61]图为波长与相关系数R关系图。对于CC法,相关系数阈值过大会丢失有用的变量,相关系数阈值过小,无关变量的入选会带来误差。如表|R|范围为0.0055-0.9839,故相关系数阈值设置为0.1-0.9,间隔为0.1。据表2-9|R|阈值为0.8时模型的预测能力最佳,R2cR2cvRMSECRMSECVR2pRMSEP分别为0.9800.9721.56311.87120.9781.6475模型预测能力较之前有所提高。2-9(b)|R|阈值为0.8时相关系数法波段选择结果

表相关系数波段选择结果比较

|R|阈值

R2c

R2cv

RMSEC

RMSECV

R2p

RMSEP

LVs

变量点个数

0.1

0.972

0.961

1.8714

2.2342

0.977

1.6925

3

118

0.2

0.973

0.963

1.8431

2.1814

0.977

1.7105

3

110

0.3

0.973

0.965

1.8250

2.1527

0.976

1.7280

3

101

0.4

0.975

0.964

1.7834

2.1439

0.975

1.7635

3

89

0.5

0.976

0.967

1.7402

2.0520

0.974

1.7859

3

82

0.6

0.976

0.966

1.7188

2.0738

0.974

1.7908

3

76

0..7

0.979

0.969

1.6059

2.0404

0.973

1.8201

3

68

0.8

0.980

0.972

1.5631

1.8712

0.978

1.6475

3

62

0.9

0.969

0.957

1.9637

2.3310

0.978

1.6745

2

44



(a)

(b)

(a) 波长与相关系数R关系图;(b)相关系数法波段选择结果图



VIP

VIP法是基于PLS[62, 63]回归中参数VIP的算法,用于挑选出VIP得分响应较高的变量点。图2-10(a)VIP得分与波长的关系图,选取VIP得分超过1所对应的变量点作为后续建模的变量。图2-10(b)VIP法波段选择的结果,共选出了32个变量点,参数R2cR2cvRMSECRMSECVR2pRMSEP分别为0.9690.9522.03282.17220.9801.6004,模型预测能力有所提高。

(a)

(b)

(a) VIP得分与波长关系图(b)VIP法波段选择结果图



吸光度-浓度变化率(RATC

吸光度-浓度变化率(RATC[64]波段选择方法是基于每个变量点下样品的吸光系数来进行选择,选取吸光系数较大的变量点用于后续建模研究。具体原理为:校正集光谱矩阵为m×nm为光谱的条数,n为光谱的变量点数,其中,mn为大于1的正整数。根据比尔定律可得,在第n变量点处有如下关系:

                                  (1)

                                    (2)

                              (3)

                                (4)

                                (5)



该方法的具体步骤为:计算每个变量点下相邻光谱的吸光度差值和浓度差值的比值V,每个变量下得到(n-1比值V;将V进行平均得Vmean;图2-11(a)为每个变量点下的Vmean值,按照Vmean降序排列对应的变量点,依次递增一个变量点进行PLS建模,2-11(a)不同变量点的Vmean(b)RATC建模结果。得到的最佳模型的R2cR2cvRMSECRMSECVR2pRMSEP分别为0.9670.9542.03982.19960.9801.5998,模型预测能力有所提高。

(a)

(b)

(a) 不同变量点的Vmean(b) RATC法波段选择结果图



UVE

无信息变量消除算法(UVE)是基于PLS回归系数b的算法[65, 66],用于消除与CQA变化无关的变量。对于UVE方法,建模结果与蒙特卡洛模拟数和校正集样品占总样品的比率有关,本研究将蒙特卡洛模拟数设置100-500,间隔为100;校正集样品占比为0.6-0.9,间隔为0.12-12UVE法波段选择结果,从图中可以看出,当蒙特卡洛模拟数为500,校正集占比为0.7时得到的模型最佳,R2cR2cvRMSECRMSECVR2pRMSEP分别为0.9770.9731.67761.85880.9811.5296,模型预测能力有所提高。

(a)

(b)

UVE法波段选择结果图(见实验记录0009535-p49



不同波长选择方法的PLS模型结果如表2-12所示。可以发现,与未进行波段选择相比,模型的预测能力都有一定程度的提高。与其他波段选择方法相比,相关系数波段选择方法的结果不尽人意,可能是该方法未能完全剔除无关变量所致。其余三种方法可以显著降低RMSEP值,提高模型的质量。UVE法与未经波段选择的光谱建模相比,RMSEP值提高9.06%。从图2-12(b)中可以看出所选变量点也是API纯组分光谱的特征峰处,表明该结果对API含量有特异选择性。波段选择简化了模型,减少了计算量,提高了模型的特异性。

不同波段选择方法的API含量模型结果

序号

波段选择方法

R2c

R2cv

RMSEC

RMSECV

R2p

RMSEP

LVs

1

raw

0.971

0.961

1.8904

2.2385

0.977

1.6820

3

2

CC

0.980

0.972

1.5631

1.8712

0.978

1.6475

3

3

VIP

0.969

0.952

2.0328

2.1722

0.980

1.6004

3

4

RATC

0.967

0.954

2.0398

2.1996

0.980

1.5998

3

5

UVE 500-0.7

0.977

0.973

1.6776

1.8588

0.981

1.5296

3

附件:
为您推荐