主题:【讨论】什么是主成分分析法即principal component analysis及其适用的范围?

浏览0 回复41 电梯直达
yuduoling
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
JazzBlue
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
最近碰到一个产品产地判别的案例,用的就是PCA法。软件叫Unscrambler。通过PCA区分不同产地的产品。主成分分析是采用对数个特征峰合并为同一主成分进行判断(个人理解)使用大量已知数据建立数学模型,被测样品与模型中数据对比,推导出最可能的原产地。
赞贴
0
收藏
0
拍砖
0
2012/2/22 16:10:18 Last edit by sezilu
wendy_haohao
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
比如具体到不同地域牛奶分类的例子上,NIRQUEST256 的得到256个数据,并非是全部有用的,通过主成分分析,会得到需要两个成分就可以判断牛奶产自哪个地方,首先主要特征是蛋白与水的比例,第二主要特征是蛋白质B的含量。那么该比例就是主成分,而B含量就是主成分二,这样一来对于光谱数据的处理就会大大简化了,假如第20和第200个数据的比例可以告知比例值,第100个数据可以告知B含量,那么只需要知道三个数据就可以进行牛奶地域的划分了。当然这是最简单的情况,实际上牛奶分类可能的主成分不只是两个数据的比值,而是数据在特征空间的投影的比值。矩阵的方法是用来计算特征是什么的工具,关键是理解其中的过程
dahua1981
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
chauchylan
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
savedown
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
原文由 chauchylan(chauchylan) 发表:
维度是否体现在分析化学中就是影响定量分析准确度的主要因素?第一主元也就是影响最明显的因素,第二主元也就是影响次之的因素???


空间是无穷维的,我们的测量数据存在于有限维的子空间,如果空间的维度不对,就意味着损失了数据或者增加了不必要的干扰。所以确定维度对于子空间描述是至关重要的,但是维度对了,并不能确保子空间的划定就是准确的,所以维度的正确是定量准确的必要条件。

有点晕?  :) 没关系,这个可以不懂。

第一主元可以被认为是最明显因素,但实际上,这样会误导人。PCA实际上是数据驱动方法,不太讲理,分量的可解释性差是其软肋。相较之下,ICA更讲理一些,有兴趣可以看看。
chauchylan
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
维度是否体现在分析化学中就是影响定量分析准确度的主要因素?第一主元也就是影响最明显的因素,第二主元也就是影响次之的因素???
dahua1981
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
原文由 savedown(savedown) 发表:
原文由 chauchylan(chauchylan) 发表:
感觉有点像线性代数中的基向量,这个基向量就是PCA吗?????


一个子空间可以被无穷组基向量描述,PCA得到其中一组基向量,该组基向量的第一个称为第一主元(主成分),是空间中数据分布的最大方向,第二主元是次大的正交方向,以此类推,直至空间所有的维度被描述完毕。

感觉博士对数学研究的很深啊
savedown
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
原文由 chauchylan(chauchylan) 发表:
感觉有点像线性代数中的基向量,这个基向量就是PCA吗?????


一个子空间可以被无穷组基向量描述,PCA得到其中一组基向量,该组基向量的第一个称为第一主元(主成分),是空间中数据分布的最大方向,第二主元是次大的正交方向,以此类推,直至空间所有的维度被描述完毕。
chauchylan
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
感觉有点像线性代数中的基向量,这个基向量就是PCA吗?????
猜你喜欢 最新推荐 热门推荐
品牌合作伙伴