主题:【第六届原创】基于ICP-MS对不同产地某药材无机元素的主成分分析(更新完毕)

浏览0 回复17 电梯直达
阶前尘
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
该帖子已被新窦设置为精华; 奖励积分记录: 新窦(20分)
维权声明:本文为jieqian1211原创作品,本作者与仪器信息网是该作品合法使用者,该作品暂不对外授权转载。其他任何网站、组织、单位或个人等将该作品在本站以外的任何媒体任何形式出现均属侵权违法行为,我们将追究法律责任。
          这篇文章准备投国外杂志的,目前还在修改中,故药材名称暂时保密,只是以此药材为例来探讨化学计量学I在CP-MS分析结果中的妙用。化学计量学所谓为何?我自己给的定义就是利用数学、统计学知识等对分析结果做一个综合性的分析,然后通过分析找出差异,并对差异进行评估的一门科学。我所了解的不多,但是常用的就是主成分分析和聚类分析,当然现在很多人在做指纹图谱,其实也属于化学计量学。 单就我这次的分析给大家做个汇报,以期对战友们有所启发和帮助,也欢迎同行者提出不同意见。

      药材采自三个不同地区,分别用A、B、C来标示,共采53个样品。用ICP-MS分析其中的Be、Mg、Al、Ca、V、Cr、Mn、Fe、Co、Ni、Cu、Zn、Ga、As、Se、Ag、Cd、Cs、Ba、Pb等。

第一、样品前处理。所有样品均为烘干制品,通过研磨、过筛来保证期均匀性。

粉碎用FOss的粉碎机,对韧性比较大的样品具有相当好的粉碎效果,粉碎完以后烘干,过80目筛,然后分装至塑料离心管中等待消解处理。



称取0.5g样品至石英玻璃烧杯中,加入(1+4)的高氯酸:硝酸10ml浸泡过夜,于第二天石墨电热板上150度消解2h,180度消解2.0h至所剩液体透明无色或淡黄色,加去离子水赶酸,再转移至塑料管中,定容至50ml。该液体上机待测!TDS在1%,故用HMI模式进样。

第二、上机分析。因为很多元素含量差别较大,故分批进行检测。采用内标矫正。



考虑到TDS在1%左右,故选择HMI模式进样,无氦模式下调谐可以发现,双电荷(Ce++/Ce+)<1%,多原子离子干扰(CeO+/Ce)<!%,内标选用In、Ge、Bi虚拟内标。因考虑样品量较大,每做20个样品重新做一次标准曲线,内标回收率在85%至110%之间。所测结果(部分数据)经整理如下:



第三、统计分析。
考虑到某些元素的毒性较大,含量较低,或者有些常量元素含量太高,导致即使进行数据化标准转换也无法消除数量级的影响,故筛选了10个元素
vcrconicuzngasrcsba


来进行统计分析,找出对产地分类的主成分。那么首先来普及一下主成分的相关原理,以下红色内容为引用360百科:主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差值来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。“

从以上思路可以看出,有些药材因为生长的地理环境因素不同,导致其本身某种或某些元素含量会有所差异,反过来,通过对药材中某个或某些元素的含量进行分析,并根据结果可以间接反映出该药材的产地。那么如何来根据元素的含量来进行判断呢,因为药材体内含有的不止一种元素,要让这些元素的含量归纳出一个主要因素即第一主成分,就要进行主成分分析,在来提取因子。一般只要影响因素在第一主成分和第二主成分的特征值大于80%,那么第一主成分和第二主成分基本上能反应全部信息。所以我们就可以利用两个新的变量来代表开始的10个变量。即利用各个变量在2个主成分上的载荷图,来区分各个药材的产地,也即可以对药材产地进行归类。

我用SPSS16.0举例来加以说明,如何来进行这一过程。

1,变量的定义,这里有11个变量,产地变量和10个元素变量。启动SPSS16.0,定义变量并输入变量值。如下图:






数据输入完毕以后,下面开始具体的主成分分析,不熟悉SPSS的可以跟着我做

(1)Analyze Data Reduction Factor Analysis弹出Factor Analysis 对话框:






(2)指标数据选入Variables 框,Descriptives:Correlation Matrix 框组中选中Coefficients,然后点击Continue,返回Factor Analysis 对话框,单击OK。SPSS很快就将这些数据的分析结果以表格形式输出,如下:




从以上分析结果我们可以看出:前两个主成分特征值大于80%,因此第一主成成分和第二主成成分可以反映出变量对产地的关系。然后就可以根据各个变量在2个主成分的载荷,绘制出载荷图,从载荷图上可以看出某个变量在产地上的贡献。由于我还没有摸索出用SPSS绘制载荷图的方法,因此我请朋友用Matlab绘制了PCA图(筛选了部分变量):

如下:

第四、结论。根据载荷图,我们可以把这批药材划分出3个产地,与我们采集的样品产地基本吻合。本分样品有所偏离,可能与购买时药店说错了产地有关系!

以上只是我简单地用SPSS说明了下主成成分析的实现的大致过程,但是有些细节和分析结果我未做详细解答,有不明白的战友可以看一下专业书籍或者私下站短我,当然我也不是完全吃透的,有说得不好的地方还请见谅,同事欢迎大家提出宝贵意见。

另:SPSS实现聚类分析也比较简单,但是在此帖继续说下去,未免篇幅过长,我将适时另开新帖与大家分享。
该帖子作者被版主 envirend10积分, 2经验,加分理由:好文章
为您推荐
专属顾问快速对接
获取验证码
立即提交
huangza
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
wuyuandaai
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
wulin321
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
srp20100708
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
envirend
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
原文由 huangza(huangza) 发表:

支持原创,可以看出版主的统计学功底,很厉害!


版主的统计学功底确实深不可测,我见到统计都头大--从版主的详细步骤中,我以后可以试着用SPSS软件啦
envirend
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
主成分分析,根据版主所讲和百度查询,就是将降变量,寻找关键因子。期待版主今后分享载荷图的详细步骤及如何看这个图。
timstoicpms
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
原文由 envirend(envirend) 发表:
主成分分析,根据版主所讲和百度查询,就是将降变量,寻找关键因子。期待版主今后分享载荷图的详细步骤及如何看这个图。


用SAS/SPSS进行聚类分析,能把本无关系的若干变量强硬扯上关系。用同位素比值信息示踪都不算靠谱,用元素浓度就更扯淡了。
该帖子作者被版主 envirend5积分, 2经验,加分理由:讨论
阶前尘
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
原文由 timstoICPMS(timstoICPMS) 发表:
原文由 envirend(envirend) 发表:
主成分分析,根据版主所讲和百度查询,就是将降变量,寻找关键因子。期待版主今后分享载荷图的详细步骤及如何看这个图。


用SAS/SPSS进行聚类分析,能把本无关系的若干变量强硬扯上关系。用同位素比值信息示踪都不算靠谱,用元素浓度就更扯淡了。


也不能说强硬扯上关系,不同的地理环境本身本身土壤元素含量可能就不一致,那么生长的植物其元素含量也会各有不同,当然并不是所有的植物都这样,要经过筛选。timstoICPMS老师能这样说来是做过这方面的研究了,不妨给我们说道说道,我还不是很熟呢!
该帖子作者被版主 envirend5积分, 2经验,加分理由:讨论
ntnt
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
chemxuxm
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
猜你喜欢 最新推荐 热门推荐
品牌合作伙伴