原文由 jack510070(jack510070) 发表:
当我们处理分析数据时,有一点必须承认,由于误差和干扰的存在,测量值总是不等于真值的。通常的做法是重复测定一个信号多次,取其算术平均值作为测量值,因为按照正态分布,算术平均值是随机变量真值的无偏估计。
然而,因为测量次数实在有限,简单地拿算术平均值来代替真值是不可靠的。按照正态分布的数学函数特性,随机变量的采样值落在其左右一倍中心矩(即标准偏差)内的概率是68.3%,二倍中心矩内的概率是99.5%,三倍是99.7%。
另一方面,采样值的数学标准差也是标准偏差的无偏估计。于是,根据随机变量有限测量次数内的算术平均值和标准差,可以预测真值出现的范围。
置信度的定义是:以测量值为中心,在一定范围内真值存在的概率。显然,对于正态分布信号而言,在其数学平均值正负一倍标准差的范围内,真值存在的置信度为68.3%,二倍标准差区间内的置信度为99.5%,三倍则为99.7%。
所谓置信度区间,指以测量平均值为中心,一定置信度水平下,真值存在的区间。
在一个支持置信度处理的分析软件中,其定量分析参数设定中必定有一项设定置信度。例如置信度设定为95%时,如果结果给出10+/-0.2,其含义就是真值出现在9.8~10.2之间的概率为95%。
置信度区间的计算公式是:置信度区间=算术平均值+/-t*s/sqrt(n),其中s为算术标准差,sqrt(n)为测量次数的开方根,t则是t分布函数的值,其确切的写法应该是t(n,CF),即这个值因测量次数和置信度而变,邓勃老师的《分析测试数据统计处理中计算机的应用》一书中有t分布表。
其实,工作曲线也存在置信度区间。严格要求下,每一条工作曲线都应该给出其上下置信度曲线。如果理解了置信度和置信区间,那么这两条曲线救不难画出了。