测量结果的不确定度or误差的不确定度?
武汉大学 叶晓明
不确定度概念作为法定计量术语已经20多年,其定义是测量结果的“分散性”内涵。这一概念内涵被许多人津津乐道,但实际上几乎从来没有人真正讲清楚这个“分散性”,也几乎没有人真正理解它。因为它本身实际是个错误的概念定义,就如同皇帝的新衣,在千万人簇拥下,谁敢相信皇帝实际什么也没有穿?现在,老叶就当回质疑皇帝新衣的那个男孩。
一个测量完成后,给出一个具有确定数值的测量结果,一个确定的数值凭什么还有不确定性?什么叫确定?什么叫不确定?什么叫确定的不确定?
不确定度是用标准偏差(方差)或多倍标准偏差来表达的,那么,我们现在就从标准偏差(方差)的数学概念说起。把方差的概念说明白了,不确定度概念的真实内涵自然也就清楚了。
首先明确随机变量这个概念。所谓随机变量就是未知量或者数值不确定的量。请注意,随机变量不是指随机不停地变化的量!正因为随机变量的数值未知,我们只有针对其所有可能取值进行研究,因而才有了用数学期望和方差二个数字指标来描述随机变量所存在的概率范围。
对于一个随机变量L而言,其所有可能取值为序列{L
i},于是,其数学期望定义为EL=∑L
i /n,其方差定义为σ
2(L)=E(L-EL)
2。数学期望是其所有可能取值的均值,方差是其所有可能取值的分散性。这样,数学期望和方差就共同描述了随机变量L所存在的概率范围。
一个重要的特殊情形:对于一个确定的常量C而言,其所有可能取值都是C。于是,其数学期望就是EC=C,其方差就是σ
2(C)=E(C-EC)
2=0。这当然是一个最基本的数学常识了。
但是,方差概念被用于测量理论后,我们早期的测量理论界却把数学经给念歪了。譬如:珠峰高程的测量结果x=8844.43m,其标准偏差σ(x)=±0.21m。这不就成了σ(8844.43)=±0.21了吗?8844.43难道不是确定的常量C吗?为什么会出现σ(8844.43)≠0了?
相信有的朋友已经看明白了,此x非彼x也!x=8844.43m中的此x仅仅是指8844.43,不代表任何其它可能取值,但σ(x)中的那个彼x却不是仅指8844.43。----偷换概念了,把别的随机变量的方差偷换成了测量结果8844.43的方差!
方差的概念原来是移花接木到测量结果头上的,不确定度概念自然也被移花接木了。
一个更乱伦的问题是,随机变量需要方差和数学期望二个参数来描述,给测量结果偷了一个方差却没有给它偷一个数学期望,一个没有数学期望的孤立的方差有什么用呢?这种仅有所谓发散性却没有数学期望的不确定度能表示出什么含义来呢?
进一步的问题:这个σ(x)中的x实际是什么东西?它是从哪里偷来的?那个被盗的主人又是谁?
请看图1。首先,测量结果
x给出后,测量结果
x是确定量。虽然测量结果
x的确是其所有可能取值{
xi}中的一个成员,但以其所有可能取值{
xi}的方差和数学期望来表达
x是没有意义的,因为确定量
x丧失了使用{
xi}的方差和数学期望来表达的资格和需要。就如同明确知道一个婴儿已经顺利降生却还要去估计这个婴儿发生难产的概率一样,是没有意义的。概率针对的是不确定的未知事件,只是以确定的已知事件作为统计样本而已。
但是,图1中的误差∆
A、∆
B和∆都是不确定量,是随机变量。研究这些未知误差的概率分布才是有意义的事情。
因为测量结果
x是其所有可能取值{
xi}中的任意一员,误差(偏差)∆
A=
x-
Ex也就是{
xi-
Ex}中的任意一员。就是说,序列{
xi-
Ex}是误差∆
A=
x-
Ex的所有可能取值的集合。这样,针对随机变量∆
A=
x-
Ex,就有:
其数学期望:E∆
A=E(x-Ex)
=Ex-Ex=0
其方差: σ
2(∆
A )=E(∆
A-E∆
A )
2 =E(∆
A )
2 =E(x-Ex)
2 就是说,误差(偏差)∆
A=x-Ex存在于一个数学期望为0方差为σ
2(∆
A)的概率区间内,或者说,方差σ
2(∆
A)是误差∆
A的概率区间的评价值。
同理,误差(偏差)∆
B=Ex-x
T也是测量产生的,是上游测量的随机变量,也有E∆
B=0,且也有其概率范围评价σ
2(∆
B)。于是:
∆=∆A+∆B
E∆=E∆A+E∆B=0
σ2(∆)=E(∆)2
=E(∆A+∆B)2
=σ2(∆A )+σ2(∆B )
可见,方差(标准偏差)是误差的概率区间的数字评价而已,表达误差的取值不能被确定的程度。人们做不确定度分析时不都是这样通过误差方程获得方差传播关系来合成方差吗?却原来,现有测量理论实际上是把误差的方差(标准偏差)强行筐到了测量结果的脑袋上。
所以,前边珠峰案例的严格表达应该是:测量结果x=8844.43m,标准偏差σ(∆x)=±0.21m。 朋友们若不信,可以去翻翻现有的测量学教科书,无论仪器学还是测绘学的,看看哪些教科书是用σ
2(x)或σ
x2的形式表示方差,看看有没有教科书用σ
2(∆x)或σ
∆x2的形式表示方差。
不确定度实际是误差的概率区间评价,这个评价有何意义?
因为误差是测量结果与真值之差,即∆=x-x
T,所以
xT=x-∆
这样,真值x
T的数学期望: Ex
T=Ex-E∆=x
真值x
T的方差: σ
2(x
T )=E(x-∆)
2 =E(x)
2+E(∆)
2 =σ
2(∆)
这就是说,真值x
T存在于一个以测量结果x为数学期望以σ
2(∆)为方差的概率区间内,不确定度实际反映了测量结果与真值的可能接近程度!也就是说,我们只能说“误差的不确定度”或“真值的不确定度”,而不能说“测量结果的不确定度”!测量结果作为一个具有确定数值的常数,本身就不存在不确定度这个问题。
呵呵,测量理论界干了一件丢人的事情:把误差的不确定度偷换成了测量结果的不确定度,把基层测量工作者甚至整个科学界都给坑了。错了就赶紧改正呗,继续将错就错、误人子弟就不应该了。
2018 6 26 于武汉大学