不清不白的测量不确定度
武汉大学 叶晓明
不确定度是什么?《国际通用计量学基本术语》(VIM)给出的定义是:non-negative parametercharacterizing the dispersion of the quantity values being attributed to a measurand,based on the information used. 我国《通用计量术语及定义》(JJF1001-2011)给出的定义是:根据所用到的信息,表征赋予被测量量值分散性的非负参数。二种定义当然是同一个意思。
或许您会说,这不是很明白的吗?一个参数,一个表达分散性的参数;谁的分散性?被测量量值的分散性。但问题是,什么是分散性?当人们给出一个测量结果的时候,一个身高值,一个体重值,一个距离值,一个面积值,一个温度值,一个时间值……,任何平民百姓都知道这就是一个唯一值,而我们的测量界却都说它是分散的。也许您会说,这其中的学术奥妙当然是普通平民百姓所不能理解的。
不过且慢,我这个人就爱向着平民百姓说话。您总该记得计量术语中还有系统误差、随机误差、正确度、精密度这些概念吧?所有教科书、论著在讲解不确定度的同时还讲解了这套误差理论最基本的概念逻辑:系统误差没有方差,无法和随机误差的方差进行合成;系统误差产生正确度,随机误差产生精密度;精密度就是测量结果的分散度。
您请接着看。不确定度合成是按照方差传播律进行方差合成,按照误差理论的这种基本逻辑——系统误差没有方差,不确定度当然也就不可能包含系统误差的贡献了,那样不确定度岂不和精密度是同一个东西?都是对随机误差的评价,都是评价的分散性。那不确定度概念还有什么用?完全多余了嘛!
当然,的确有学者说过不确定度是包含系统误差的贡献的,但问题是,系统误差的方差在哪里体现?谁干过用系统误差值和随机误差的方差做合成的事?
整个测量理论体系实际都是逻辑不清、东扯西拉!
一个家庭妇女去菜场买了个西瓜,摊贩说西瓜重量5kg。连家庭妇女都很明白这个西瓜的实际重量(真值)不会恰巧就是5kg,究竟是多少反正不知道,但肯定实际重量与5kg之间就是个恒差,这个恒差不可能随机变化。可现在来了过搞测量的学者,翻了一下电子秤的说明书,给出了个±0.1kg的标准偏差(标准不确定度)评价,然后硬说其中存在±0.1kg的随机误差。而瓜贩子说,我就只给了一个5kg的值,没有给过其他任何值;而家庭妇女说,这个西瓜的实际重量(真值)如果真有±0.1kg的随机变化用手都应该能感觉得到。
于是,学者赶紧换了个说法:随机误差是指你反复多次去测量这个西瓜时,那结果就是在±0.1kg的标准偏差内随机变化的了。于是家庭妇女把西瓜又交给贩子,贩子又称了很多次,可每次都是一模一样的5kg,根本没有随机变化。
学者又说,反复多次测量要每次改变测量条件。贩子反问:是换个其他类型的秤来称?还是要把西瓜吃掉再称?你的目的究竟是什么?
——这种东扯西拉的东西也能叫科学理论吗?
我出了道误差理论题目:
2005年国家测绘局公布的珠峰高程测量结果为8844.43米,精度(标准偏差)为±0.21米。现有二种说法:1、该结果的误差是随机误差,因为精度是对随机误差的评价。2、该结果的误差是系统误差,因为测量结果是唯一的且真值也是唯一的,根据误差的概念定义该误差只是一个未知的唯一的恒定的常数,是常数规律的误差,不是随机规律的误差。请发表你的看法。
二种说法都是严格遵循现有误差理论的概念逻辑推理出来的结论,个别看都没有错,放在一起看却出现了对立矛盾。这当然是测量理论本身的逻辑缺陷而不是推理者的对错问题。出这道题目的目的本来就是要让人们意识到现有误差理论的概念存在逻辑缺陷。
我把这题目放到了计量论坛,引来了热议。有的说国家测绘局给出的并不只一个8844.43的结果,±0.21米表示有很多的结果;有的说标准偏差±0.21米表达的意思是,未来重复测量珠峰时的测量结果的离散度;有的说不排除国家测绘局测量期间就在发地震,真值在随机变化,相对8千多米高程来说±0.21米的地震没什么了不起;有的说恒差是系统误差,没有方差。有方差的就不可能是恒差……
我就不明白了。就这么一个概率论中的标准偏差概念,怎么就被解释成这样乌七八糟?
那么,什么是标准偏差?恒差没有方差吗?
对一批同型号的电子秤进行检测,对每台电子秤随机抽取多个不同量程用标准重量进行比测,对所获得的误差样本序列进行合并统计,获得一个总标准偏差σ。这个总标准偏差σ就表示,任意抽出其中一台秤的任意一个量程点,其测量结果与真值之差——一个恒差就存在于一个以0为数学期望以σ为标准偏差的概率区间内。
标准偏差实际是一个含有概率意义的误差存在范围的概念。就是说,±0.1kg的标准偏差仅仅是这个5kg西瓜的误差的概率区间的评价值——仅此而已。既没有5kg的测量结果的“分散”问题, 也没有真值在随机变化的问题,更没有将来重复测量的什么事。
总标准差±0.1kg是用大量电子秤的许多不同测点的误差样本统计出来的,甚至还没有把这台秤的5kg处的误差作为统计样本,单揪这台秤的一个5kg的测点折腾自然很难凑出那个±0.1kg的分散度。
国家测绘局获取了诸多不同条件下的原始测量值,按照概率估计法则给出了唯一的最佳值8844.43米,同时也导出了其标准偏差为±0.21米。这就是表达结果8844.43米与珠峰真值之差——一个恒差存在于一个以0为数学期望以±0.21米为标准偏差的概率区间内。±0.21米恰恰就是一个唯一测量结果的唯一恒差的标准偏差!这哪有地震的什么事?
标准偏差恰恰就是跟恒差联系在一起,恒差没有方差本身就是个伪命题!——珠峰高程题目明明白白提示了恒差和标准偏差的关系,但现有误差理论居然让人变得视而不见。几乎所有平民百姓都能理解唯一结果与真值(测量实施时刻的真值)之差是个恒差,而学过测量理论的人却反而普遍理解不了。
所谓系统误差——数学期望与真值之差是恒差,所谓随机误差——唯一测量结果与数学期望之差同样也是恒差,它们之间本来就不存在什么性质上的差异!而且,它们的叠加值——测量结果的总误差同样还是恒差!
测量结果的误差是恒差,这是整个测量学界必须重修的课程! 测量结果的误差是恒差,这个恒差的具体数值是当前不知道的、不能确定的,这种不能确定的程度就是不确定度,用其概率区间的评价值——标准偏差或多倍标准偏差来表达。同时,唯一测量结果的数值是确定的,误差的数值是不确定的,不确定度也就同时表达了真值不能被确定的程度!
然后再把真值的未来变化问题、真值定义的模糊不完整等问题都看成误差问题,从而给出不确定度概念的广义理解。
真值不能被确定的程度或测量结果与真值的接近程度——这就是我给出的测量不确定度概念解释。
可见,那些诸于分散呀、随机变化呀、系统误差没有方差呀、将来重复测量离散呀……,都是鬼扯!——包括它的那个概念定义。
相信您已经注意到,这里提到了一个与传统测量理论完全不同的误差认识论——误差没有系统/随机的类别之分,这就开启了一种新型测量理论概念体系的大门。详见我的论文《The new concepts of measurement error theory》(《Measurement》杂志 Volume 83, April 2016, Pages 96-105),本博客上载有中文版,请见
http://blog.sciencenet.cn/blog-630565-969989.html。
2016 6 30于武汉大学