主题:【原创】曲线拟合中的合理法原理

浏览0 回复19 电梯直达
jack510070
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
该帖子已被tianyamingye设置为精华;
本人最早看到合理法一说大约在去年本坛的一个帖子上,据说是瓦里安采用的一种新的回归模型。当时就对此产生兴趣,不过一直没有机会接触瓦里安的仪器,这件事也就搁下来了。最近几天看到坛子里又有议论这种方法的帖子,感谢cwk_12网友提供的贴图以及附件中的材料,终于了解了这种方法的原理。

启发我的是材料中的拟合过程:先01点拟合一条直线,然后012三点拟合一条三次曲线,然后123以此类推。这一下子就激活了我以前研究S样条曲线插值算法中的一些回忆。不敢自密,这里把所谓合理拟合的算法原理写出来,供同好们议论。

如果给定一组自/因变量实验点,要求你算出一条曲线通过所有这些采样点,你会怎样做呢?常用的多项式最小二乘线性回归法是无能为力的,它们只能做出一条曲线,使这些点离这条曲线的距离之平方和最小,而不是通过这些数据点。要得到通过这些实验点的曲线,只能采用分段样条曲线的形式,而最常用的就是3次样条曲线。

最原始的样条曲线插值法在网上很容易找到,它的原理是这样的:对于一组n点实验样本,它们在自变量轴上可以分成n-1个小区间,对于这n-1个区间,每一个都定义一个三次多项式回归函数,形如yi=ai(x-xi)^3+bi(x-xi)^2+ci(x-xi)+di,这里xi是第i个实验样本的自变量。为了计算每个区间的aibicidi系数,要求这些回归方程有以下约束:1)它们都通过(xi,yi)(xi+1,yi+1)2)它们在xi上与前一区间的一阶导数和二阶导数连续。只有同时满足这两个条件,才能保证整体的光滑性。

这两个约束使得每一个区间的4个参数能够求解出来,但是导致3对角线矩阵的求逆过程。如果实验样本数量很大,这个逆矩阵的求解是很困难的。于是就有了“合理法”这种简化模型。

它的原理是这样的,对于n点实验样本(x1,y1)、(x2,y2xn,yn),为了使整体模型通过原点,在前面插入一个零点,即(0,0)。

对于第i点,把它与前后两点共三点用回归方程yi=ai(x-xi)^3+bi(x-xi)^2+ci(x-xi)+di表达,要求方程通过(xi-1,yi-1)、(xi,yi)和(xi+1,yi+1)。我们知道,把这三点代入回归方程并不足以求出4个参数,为次强迫曲线过i点的一阶倒数为Si,这样就有Si=ci,于是4个方程联立就可以求出4个参数。需要强调一下,因为di=yici=Si,实际上只需要解二元一次方程组。

Si如何确定呢?对于012这三点,S1(y1-0)/(x1-0)确定,对于i-1ii+1i>1),则用前一组算出的方程在其i+1点上的导数确定Si。第i个多项式方程只管xi-1xi之间的插值。

由于这种算法不需要求解大矩阵的逆,尽管3对角矩阵的逆不难解,但是还是使计算复杂度控制在很简单的层次上,实际上人工计算就可以完成。在计量学和信号处理理论中,这种算法称为有理法或有理解(Rational)。

以上是我对“合理法”的理解,权作引玉之砖耳。
为您推荐
您可能想找: 气相色谱仪(GC) 询底价
专属顾问快速对接
立即提交
可能感兴趣
ldgfive
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
这种方法的拟合好复杂,好象与二次拟合、三次拟合不太一样
不过,曲线拟合方式,还是有一定意义的
suiniubei
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
悠旸
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
佩服楼主的深厚理论和钻研精神,遇到理论上的问题还要jack510070专家指点呀。
赞贴
0
收藏
0
拍砖
0
2012/3/19 19:33:26 Last edit by ihqs
wmj31
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
拟合方式挺复杂的,估计用EXCEL没法拟合。文章很好,很精辟。
童话仙子
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
很经典,这种拟合方法估计是独家的吧,毕竟多数仪器估计没有的拟合方式了
cwk_12
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
分析的很不错,其实到现在我对这个新合理拟合的理解还不是很透彻啊,看样子还得钻研啊
jack510070
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
有一个小漏洞:一阶导数约束应该施加于i-1点而非中间的第i点。
谈谈我对这种方法的看法:
先说它的使用: 如果实验样本点有5个,加上零点是6个。这种方法将给出5个分段的3次多项式,分别管0/1、1/2、2/3、3/4和4以后的浓度预报,这就要求实验点的吸光值是单调增的,即浓度越高,吸光值越大。遇到塞曼仪器的吸光度反转问题时,这种方法就不适用了。
样品测定时,得到样品的吸光度,在这种方法中,首先确定吸光度落在那一个区间上,然后用牛顿法就可以算出其浓度值来了。对于三次方程,应该用诸如牛顿法这样的数值算法,而不是从数学手册上抄下3次方程的3个解公式,因为你还得费劲解释那一个解才是正确的。
关键一点是: 这种方法强迫“工作曲线”通过所有实验样本点。我们知道,实验总会存在噪声和误差的,因此这种定量方式实际上放大了噪声和误差的影响,所以本人不建议采用这种定量方式。不过,“新合理法”貌似很有道理,似乎可以采用。
我现在对新合理法有一种矛盾未能理解:它只用一个确定的公式,那么肯定无法通过所有实验点,这样的模型相关系数是不可能等于1的。
qqqid
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
楼主原文“要求你算出一条曲线通过所有这些采样点”,曲线通过所有采样点,本身就不合理,没有什么实用性,这种“要求”有点无聊了。

讨论问题的前提不好,楼主的理论也只能自娱自乐一下。
jack510070
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
原文由 qqqid(qqqid) 发表:
楼主原文“要求你算出一条曲线通过所有这些采样点”,曲线通过所有采样点,本身就不合理,没有什么实用性,这种“要求”有点无聊了。

讨论问题的前提不好,楼主的理论也只能自娱自乐一下。

拜托你了解清楚这个问题的来龙去脉再作这样的评论好吗?
桌子下面少个八
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
文章很好,虽然没看得完全明白。
这些完全是数学上的问题,有没有数学造诣比较高的人能够更深入浅出的解释一下。
猜你喜欢最新推荐热门推荐更多推荐
品牌合作伙伴