快速导航采购仪器提醒

近红外光谱（NIR）

版主:

入住本版

专家:

仪器信息网

居民列表

仪器社区 > 光谱 > 近红外光谱（NIR）帖子详情

快速回复发表新帖最新帖

返回列表

主题：【求助】内部交叉检验和检验集检验的区别是什么

浏览0 回复5 电梯直达

雪未霁

结帖率：

100%

关注：0 |粉丝：0

新手级：新兵

发表于：2014/03/20 18:10:00 楼主管理分享倒序浏览只看楼主回复私聊

光谱分析的时候要把样本分为预测集（检验集）和校正集

内部交叉检验只需要校正集就可以了，那运用这种方法的时候预测集有什么用？

两种检验方法的区别是什么？或者说是之间的关系？

该帖子作者被版主武灵加 2积分， 2经验，加分理由：鼓励发帖

0
赞贴
5
回帖
0
收藏
0
拍砖
版主
招募

为您推荐

近期热榜

热门活动

您可能想找: 气相色谱仪(GC) 询底价

选参数看心得找厂商查方案

专属顾问快速对接

立即提交

可能感兴趣

picard

禁止发帖修改昵称

ID：yuan314159

行业：其他

积分：0升级还需100积分

声望：0升级还需100声望

注册时间：0000-00-00

最后登录时间：0000-00-00

进入iLog 私信关注

结帖率：

100%

关注：0 |粉丝：0

新手级：新兵

2014/3/21 11:27:27 沙发管理分享倒序浏览只看楼主回复私聊

用交叉验证建模的时候，不是没有预测集，而是它的预测集是不断变化的。
以交叉验证最常见的留一验证为例。你留的那个样品实际上就算是待在预测集中的。

赞贴

拍砖

雪未霁

禁止发帖修改昵称

ID：v2854560

行业：其他

积分：0升级还需100积分

声望：0升级还需100声望

注册时间：0000-00-00

最后登录时间：0000-00-00

进入iLog 私信关注

结帖率：

100%

关注：0 |粉丝：0

新手级：新兵

2014/3/23 11:13:38 板凳管理分享倒序浏览只看楼主回复私聊

原文由 picard(yuan314159) 发表:
用交叉验证建模的时候，不是没有预测集，而是它的预测集是不断变化的。

以交叉验证最常见的留一验证为例。你留的那个样品实际上就算是待在预测集中的。

这点我明白了，那请问这两种检验的关系呢？我是指RMSECV和RMSEP的关系

比如说在一阶导数的预处理下RMSECV最小，二阶导数的预处理下RMESP最小

那我最终选择那种预处理方法呢？

还有主因子数的选择是不是在内部交叉检验中确定的，和外部检验没有关系？

赞贴

拍砖

picard

禁止发帖修改昵称

ID：yuan314159

行业：其他

积分：0升级还需100积分

声望：0升级还需100声望

注册时间：0000-00-00

最后登录时间：0000-00-00

进入iLog 私信关注

结帖率：

100%

关注：0 |粉丝：0

新手级：新兵

2014/3/23 14:04:51 马扎管理分享倒序浏览只看楼主回复私聊

原文由 雪未霁(v2854560) 发表:
原文由 picard(yuan314159) 发表:
用交叉验证建模的时候，不是没有预测集，而是它的预测集是不断变化的。

以交叉验证最常见的留一验证为例。你留的那个样品实际上就算是待在预测集中的。

这点我明白了，那请问这两种检验的关系呢？我是指RMSECV和RMSEP的关系

比如说在一阶导数的预处理下RMSECV最小，二阶导数的预处理下RMESP最小

那我最终选择那种预处理方法呢？

还有主因子数的选择是不是在内部交叉检验中确定的，和外部检验没有关系？

不同处理方法之间的比较，我们一般以同样指标进行比较。就是SEC和SEC比，SEP和SEP比，不过一般比较稳健的模型，SEP和SEC基本上差不多。这两个参数只看一个就行。

主因子数得选定主要考虑是是否过拟合或者是否选的不够。这些是通过增加主成分数来查看SEC和线性度是否有明显差异来选定，

比如你刚开始选定4个主成分，然后你发现到5个主成分时，线性度和SEC有明显增加，那说明选4个是不够的。反之如果你发现增加主成分后，SEC只有微小变化，那你就得考虑是不是得到合适的主成分了。

主成分是否合适是通过后期的验证可以发现的。过拟合的模型，一旦验证，你就会发现预测结果非常差。

赞贴

拍砖

第四桥边

禁止发帖修改昵称

ID：v2803872

行业：其他

积分：0升级还需100积分

声望：0升级还需100声望

注册时间：0000-00-00

最后登录时间：0000-00-00

进入iLog 私信关注

结帖率：

100%

关注：0 |粉丝：0

新手级：新兵

2014/4/3 10:31:28 地毯管理分享倒序浏览只看楼主回复私聊

原文由 picard(yuan314159) 发表:
原文由 雪未霁(v2854560) 发表:
原文由 picard(yuan314159) 发表:
用交叉验证建模的时候，不是没有预测集，而是它的预测集是不断变化的。

以交叉验证最常见的留一验证为例。你留的那个样品实际上就算是待在预测集中的。

这点我明白了，那请问这两种检验的关系呢？我是指RMSECV和RMSEP的关系

比如说在一阶导数的预处理下RMSECV最小，二阶导数的预处理下RMESP最小

那我最终选择那种预处理方法呢？

还有主因子数的选择是不是在内部交叉检验中确定的，和外部检验没有关系？

不同处理方法之间的比较，我们一般以同样指标进行比较。就是SEC和SEC比，SEP和SEP比，不过一般比较稳健的模型，SEP和SEC基本上差不多。这两个参数只看一个就行。

主因子数得选定主要考虑是是否过拟合或者是否选的不够。这些是通过增加主成分数来查看SEC和线性度是否有明显差异来选定，

比如你刚开始选定4个主成分，然后你发现到5个主成分时，线性度和SEC有明显增加，那说明选4个是不够的。反之如果你发现增加主成分后，SEC只有微小变化，那你就得考虑是不是得到合适的主成分了。

主成分是否合适是通过后期的验证可以发现的。过拟合的模型，一旦验证，你就会发现预测结果非常差。

SEC明显增加？sec不是越小越好吗

赞贴

拍砖

picard

禁止发帖修改昵称

ID：yuan314159

行业：其他

积分：0升级还需100积分

声望：0升级还需100声望

注册时间：0000-00-00

最后登录时间：0000-00-00

进入iLog 私信关注

结帖率：

100%

关注：0 |粉丝：0

新手级：新兵

2014/4/3 11:30:23 地板管理分享倒序浏览只看楼主回复私聊

原文由 第四桥边(v2803872) 发表:
原文由 picard(yuan314159) 发表:
原文由 雪未霁(v2854560) 发表:
原文由 picard(yuan314159) 发表:
用交叉验证建模的时候，不是没有预测集，而是它的预测集是不断变化的。

以交叉验证最常见的留一验证为例。你留的那个样品实际上就算是待在预测集中的。

这点我明白了，那请问这两种检验的关系呢？我是指RMSECV和RMSEP的关系

比如说在一阶导数的预处理下RMSECV最小，二阶导数的预处理下RMESP最小

那我最终选择那种预处理方法呢？

还有主因子数的选择是不是在内部交叉检验中确定的，和外部检验没有关系？

不同处理方法之间的比较，我们一般以同样指标进行比较。就是SEC和SEC比，SEP和SEP比，不过一般比较稳健的模型，SEP和SEC基本上差不多。这两个参数只看一个就行。

主因子数得选定主要考虑是是否过拟合或者是否选的不够。这些是通过增加主成分数来查看SEC和线性度是否有明显差异来选定，

比如你刚开始选定4个主成分，然后你发现到5个主成分时，线性度和SEC有明显增加，那说明选4个是不够的。反之如果你发现增加主成分后，SEC只有微小变化，那你就得考虑是不是得到合适的主成分了。

主成分是否合适是通过后期的验证可以发现的。过拟合的模型，一旦验证，你就会发现预测结果非常差。

SEC明显增加？sec不是越小越好吗