原文由 savedown(savedown) 发表:
前面谈到了样本组成配比的差异性,有建议说怎么才能实现样本选择问题。
为了好理解,又回到一元的情形,要一条标准曲线做得好,大家自然会在标准曲线上均衡取点,让点散落在曲线的各个位置上。
不知道大家注意到没有,其实此时不自觉的就用到了距离的概念,在标准曲线上如果点挤作一团,实际上就是距离没有拉开,如果拉开了距离,样本的质量也就保证了。
同样的,多元方法也存在距离的概念,而且是更关键、更基本的概念。
距离从何而来呢?
一元的问题,数据存在于一元的空间,也就是直线上。
那么二元的问题呢? 当然存在于二元的空间上,也就是平面上。
三元的? 那就是立方体内了。
四元的? 想象不出来了吧? 想不出来具象的没关系,你知道是一个四维空间就行了。 同样的n元的就是n维空间。
当年笛卡尔就想到了这个问题,谦虚的把这种空间描述方法归功于欧几里得,称为欧几里得空间,空间中点的距离度量采用毕达哥拉斯定理规定的度量方法(毕氏定理不知道? 勾股定理知道吧? 勾股定理的西洋叫法)。
欧氏距离测量,也就是利用笛卡尔坐标描述的空间点,空间点的距离可以用尺子量的线性度量方法。
勾股定理是两维的,对于多维的:欧氏距离=(西格玛(两点的坐标差值的平方)的平方根。
最直接也最省事判断样本点的分散度的方法就是欧氏距离,如果距离太小,就表明样本点挤在一团了。
后来Mahalanobis,一个印度人提出了直接欧氏距离会因为度量标准不一样引起麻烦,又提出了马氏距离。
马氏的想法用理论描述挺绕的,为了直观举个例子,壹佰万元,有钱吧?
如果是津巴布韦元呢?
为了避免这种由于度量不同导致因素被压制或夸大的风险,就有必要对空间进行方差标准化。标准化以后的距离就是马氏距离。
马氏距离不用刻意去算,只需要在样本数据做了标准化以后,仍然按照欧氏距离去算就行了。
matlab里面的空间标准化命令: zscore
怎么用? 在matlab中输入 help zscore
原文由 阳光不锈(yangguangbuxiu) 发表:原文由 b-j_s-h(b-j_s-h) 发表:原文由 闲鹤野云(ruojun) 发表:原文由 土老冒豆豆(土老冒豆豆) 发表:
近红外对温度敏感的啊?
不过一般我们都是在室温下测定了。
听了楼主生动的讲解收益不小啊,有时间再认真回味学习下。
这主要和检测器的类型有关,有的检测范围很大,可以从零上40度到零下70度。
意思是从+40~-70都不需要控温装置???
这是哪种检测器呢?现在比较多的是GaInSn吧?
(*^__^*) 嘻嘻…… 版主是不是应该是InGaAs