原文由 reeroo(reeroo) 发表:
GH(Global H)是指某样品到样品集中心点的距离,或者说是某光谱到平均光谱的距离。NH(Neighborhood H)是指某样品据其最近样品的距离。
这里的距离是用的马氏距离,计算出建模样品集中每个样品到平均光谱的马氏距离,根据统计学规律,设定一个马氏距离的阈值,使99.9%的光谱能落入其中。在不同样品集中,这个马氏距离阈值的绝对值是不同的,而软件默认将这个绝对值用同一相对值来表示,即3,作为默认的阈值。以这个3为标准的1/5即0.6默认为NH的距离的阈值。这样,GH距离超过3,认为是离群样品,NH距离小于0.6的两个样品,认为是相似样品或重复样品,都可以剔除掉。
至于马氏距离具体计算方法就不写了,任何一本化学计量学的书都有。
GN判断法不是winISI的专利,matlab和umscranbler都可以做。所以说中国只有foss有一个人懂是不可能的,大学里研究近红外算法的老师和不少学生都懂。