chunkexue的个人博客分享 http://blog.sciencenet.cn/u/chunkexue

博文

叶晓明新测量学中的概念误解及澄清

已有 3746 次阅读 2018-3-23 19:02 |个人分类:纯科学|系统分类:科研笔记| 误差, 系统误差, 测量, 科学, 分布

 



什么是科学?

《实验、测量与科学》 

给出有史以来最科学的答案!

 



内容摘要: 

测量学是一切科学的基础,深刻理解测量学对科学素养的提升是至关重要的。

    1. 叶晓明先生的确充分地提出了对测量学最基本概念的深刻思考,并作了很深入的分析研究。

    2. 他对系统误差并没有给予最精确的解释。他认为应当取消系统误差的观点,正是从他一再强调的认识论哲学层面来说不能成立。

    3. 测量学对系统误差、随机误差、相同测量条件(或等精度多余测量)等概念的确在过去没有给予最严格的描述,叶晓明先生的研究对澄清这些基本概念有非常重要的价值。

本文通过对系统误差的最严格定义和分析,澄清了叶晓明先生所提出的所有针对测量学的挑战。


关键词系统误差的定义,第一类与第二类系统误差,等精度多余测量,准确度,误差的分布。

 

通过与叶晓明先生的反复交流③④,以及更多详细阅读他的相关文献,我们基本可以确认充分理解了叶晓明先生的新测量学思想是如何形成,以及他的新测量学详细的内涵。并可确信得出本文的结论。

在科学网上有叶晓明先生讲解他新测量学的视频①。建议读者参考这个视频,以及在科学网可下载的他介绍自己新测量学基本概念的论文②。

 

系统误差的最严格定义


image001.png

                         

叶晓明先生视频讲解中解释测量学教科书的截图。

 

1直接去理解其实是存在问题的。叶晓明先生的“误解”产生的根源并不在于误差和测量结果,而在于认识论上什么是真值?从认识论上说,真值原则上是不可能完全精确获得的,它是测量学的一个最基本理论假设。既然我们不能绝对精确地获得真值,那么从认识论上说,我们测量的结果(事实上最好的假设只能是数学期望)就有可能存在一个与真值之间的偏差。这个偏差并不能完全以“准确度”来表达。无论“精密度”“准确度”还是“不确定度”,事实上并不是“完全没有任何确定”,这一点非常重要。通过均方差以及对误差分布的研究给出一个精密度、准确度或叶晓明先生所说的“不确定度”,事实上还是有一个“度”。这样从认识论的哲学上说就不是绝对未知。真正完全未知的系统误差,是根本就没有“度”,是真的完全不知道的,无法给出任何“不确定度”评估。

以我在文章中所举碳14测年法为例,最初在假设大气中碳14含量水量历史上完全一致前提下,对某个文物的一系列测年结果,可以进行随机误差的统计处理,从而得出一个数学期望和均方差,从而可以对其测量误差进行评估。但是,因为不知道历史上各个年份大气中的碳14初始含量,会导致这样测量出来的年份存在一个不知道的系统误差。但是,当后来人们通过树木年轮获得了历史上各个年份的碳14大气含量后,就可以此对原来碳14测年法测量结果中的系统误差进行扣除。

从以上案例中我们可以得出系统误差最精确含义的严格定义和理解。

 

系统误差是相对于特定测量系统,在特定历史条件下存在的,最佳测量结果与真值之间显著超出随机误差置信区间范围的,暂时未知的偏差。

 

这个定义中读者一定要清楚系统误差的这样几个基本特点:

  • 它是最佳测量结果与真值之间的偏差。因此一定要从真值的角度来理解系统误差。

  • 暂时未知,就是不代表永远未知。

  • 一定要相对于特定的测量系统来理解。

  • 测量系统不同,系统误差也就不同,从而会使系统误差在不同测量系统中呈现出不同的性质。这一特性事实上可利用来作为发现系统误差,并借用随机误差的处理方法来处理系统误差。这正是很容易让人产生概念混乱的根源所在,也是叶晓明先生误解的根源所在

  • 系统误差的偏差水平要显著超出随机误差的置信区间范围。因此,严格来说,系统误差并不是简单地数学期望与真值之间的偏差,而是造成系统误差的因素引起的偏差量大于数学期望与置信区间的差值,从而导致实际测量结果与真值之间的偏差显著偏离出置信区间。如果真值数学期望之间的偏差在置信区间之内,可认为没有系统误差。

 

以上对系统误差的最严格定义可发现一个非常显著的特点,就是它依赖于真值和随机误差两个概念为基础来定义。而随机误差可以只依赖于真值和数学分布来定义。数学期望与真值之间的偏差一般来说是随机误差,而不是系统误差。因此,真正的理解应当是图2与图3所示的那样,它们简要显示了存在系统误差和没有系统误差两种情况。所以,不能简单地说数学期望与真值之间的偏差就一定是系统误差。并且存在系统误差也不一定就能用“准确度”来表达。

为什么真值落在置信区间内就不认为有系统误差呢?因为从本质上讲,一切不可控制的因素都会产生误差。但是,如果大量的误差因素导致的影响都相对较小,只减少其中任何一个,对总的误差影响也非常小,此时就用随机误差将它们放在一个统一的框架内来考虑。但是,如果有某一个或若干个因素导致的误差比较显著,并且未知,就会对测量结果产生显著超出以随机误差方法进行的置信区间估计范围。当我们发现了该误差后,对它进行控制并消除,就可以使测量结果出现显著的,超过原来置信区间的测量有效值数据修正。如果某个因素导致的误差远小于置信区间值,将其消除后对测量结果的有效值和置信区间评估几乎不会发生变化。此时就统一按随机误差进行处理。

 

image002.png


    2  有系统误差情况

 

 image003.png

     3  没有系统误差的情况

 

以上我们说到系统误差的“暂时未知”,可能是由两种原因引起的。

一是从科学研究上来说,在某个历史阶段,人类最高水平的研究结果也无法发现的某些系统误差。随着科学研究的不断进步,在一定历史时期科学研究暂时未知的偏差,到后来就被发现并消除了。在不同历史时期,人类对宇宙年龄,宇宙尺度,地球上各个地层的年代等数据不断进行大幅度地修正,这就表明随着科学研究水平的不断提升,在过去科学测量中存在的显著系统误差不断获得了发现并校正。

二是在测量实践中,仅以特定测量系统角度来说,存在暂时未知的系统误差。例如,只有某一台测量设备A,因该测量设备使用时间较长,出现漂移,这样就出现一个系统误差。如果仅仅从这台测量仪器本身来说,无论如何进行多余测量,只能发现随机偏差,而其本身存在的漂移导致的系统误差是无法仅靠A自己发现的。但另一方面,这个系统误差是相对的,只相对于测量系统A。因为相对于更高水平的计量仪器B来说,是可以测出A的系统偏差的。

 

image004.png

    叶晓明视频讲解截图,将已知系统误差看作测量结果

 

叶晓明先生在这个PPT中所说的某测距仪的1mm加常数,显然并不是这台测距仪本身自己测量到的,而是通过更高计量仪器的计量工作(叶晓明先生称“上游测量”)才能发现并确定。因此,当我们要谈到某个值到底是测量结果还是误差时,一定要非常清楚它是相对于哪个“测量系统”来说的。

 

为什么叶晓明先生发现不了系统误差?


 

前述的PPT中,叶晓明先生为什么会认为“近20多年的不确定评定实践也证......系统误差从来没有出现过”呢?因为我们前面说过,系统误差一定要以真值为基础来进行理解,而不是不确定度。系统误差的存在是在科学研究水平的限制和特定测量系统的约束两种情况下才会出现的。随着今天科学研究水平在过去数百年甚至数千年的积累,叶晓明先生所做工作中涉及到的几乎所有测量问题,科学界基本是有信心保证不会有科学研究水平决定的第一类系统误差存在的。

image005.png

     5  叶晓明先生视频讲解截图,珠峰高程测量数据的案例

 

珠峰高程测量数据是叶晓明先生最喜欢在他的文章中引用的案例。为什么这个案例中采用的是“精度”而不是说精确度?这个说法事实上是排除了存在系统误差的问题。现在我们来假设,如果存在一种目前我们还不知道的某种物理学效应,比如说新的统一场论等,在所有珠峰测量中导致了还有一个与8844.43米之间0.75米的偏差,这就是系统误差。但是,科学发展到今天,我们已经比较有信心认为不可能存在大到这种程度的系统偏差。的确有可能存在某种目前还不知道的物理学效应,但它有可能造成的偏差不会大到0.75米,而可能会是比如说0.01米。这种系统误差远小于测量精度,现有的科学测量技术根本无法发现。因此,就可以认为“没有”系统误差。这是很多严格的科学测量结果(包括珠峰高度测量结果)中对误差的表述为什么可以只称为“精度”的合理原因所在。叶晓明先生认为,8844.43米与真值之间肯定存在唯一的一个恒定的偏差,为什么这个偏差是随机误差,而不是系统误差。这是因为:

一个完善的测量数据结果是有三个部分表达的:有效值,误差,置信度。一般来说,误差是采用均方差的2倍来确定,对应的置信度为95%。但要加上一个严格的前提,这个是针对误差呈高斯分布情况来说的。上述珠峰测量数据有效值8844.43米后面跟着的正负0.21米是一个置信区间,最严格地来说并不是误差。并且这个数据也没有给出置信度的数据,一般情况下,如果没给出置信度,就是按95%缺损值来确定的,也就是高斯分布前提下2倍均方差。这相当于这个测量结果的均方差为0.105米。但是,绝大多数情况下普通人看测量数据只看有效值,能加上误差(置信区间)就不错了。即使专业工程技术人员有时都会忽视置信度的问题。正负0.21米本来最严格地说应当是95%置信度前提下的置信区间。但如果老是这么说的话,实在是在太拗口了,因此往往就不那么严格地说正负0.21米就是“误差”。这个一般称作“绝对误差”,如果用0.21/8844.43=0.00237%来表示就是“相对误差”。

8844.43米的测量值与真值之间是存在一个偏差的,并且这个偏差我们也不能准确地知道。但为什么我们将这个不知道的固定偏差归为随机误差,而前面所说的暂时未知的偏差就是系统误差呢?那是因为前面的误差真的是连“不确定度”都完全不确定,是真的“一点儿都不知道”。而随机误差造成的测量有效值与真值之间的偏差虽然也不能绝对准确地知道,但好歹我们还是可以评估、甚至相当精密地评估出一个范围的。在8844.43米这个有效值中,虽然从纯理论上说也可能存在某种意义上第一类系统误差,但我们今天的科学研究水平基本可以确定即使存在任何这类系统误差,其大小也是显著地小于随机误差的置信区间。这就是叶晓明先生20多年一直都发现不了系统误差的原因所在。

但是,如果未来对珠峰的测量精度不断提升,比如说达到了正负0.00043米,那么前面所述的0.01米的误差就会显著地呈现出来,从而变成系统误差了。由此就会明白,一切误差影响首先都是误差因素,只是因为其大小和人类控制发现误差的能力差异,从而采用系统误差和随机误差的不同方法加以处理的。

 

准确度是怎么回事?


 

细心的读者可能很快发现了,如果说第一类系统误差是完全无法评估,是接近绝对地不知道,那就是连准确度也不应该有的。为什么我们还会有系统误差的准确度问题呢?前面我们说了,系统误差还有更广泛的第二类情况存在,就是虽然从全人类科学研究角度说不存在系统误差,但如果只从特定的实际测量系统来说,还是可能存在系统误差,并且这种系统误差从超越这个特定实际测量系统层次看,又是可以进行评估的。

例如某厂生产了一种测距仪,它在市场上有大量销售。在出厂之前,我们假设它都进行了严格的计量和校准,从而不存在系统误差(请读者一定注意,当我们说到不存在系统误差的最严格含义,就是系统误差显著地小于随机误差,从而即不能被发现,也没有发现的必要)。但是,随着这批测距仪在市场上大量不同地方实际运行一段时间以后,因为环境的不同影响,它们各自向不同方向产生漂移,导致出现各种不同程度的系统误差。

从单一的某一个测距仪来说,它的系统误差是固定的某一个值。但对于该厂家的大批测距仪来说,它们向不同方向偏离的系统误差又会呈现一个随机分布。它们的不确定度是根据对大量不同测距仪系统误差的统计处理才会出现的。

因此,第一类系统误差是完全未知的,连准确度也无法评估。但第二类经常遇到的特定测量仪器的系统误差,却可以进行准确度的计算。甚至这些系统误差的分布也很可能呈现高斯分布,从而其误差处理也完全以随机误差的方法来进行。

image006.png

6  叶晓明先生视频讲解截图,用不确定度合成随机误差不确定度与系统误差不确定度

image007.png

叶晓明论文截图,他的新测量理论概念逻辑

 

叶晓明先生的新测量理论认为“一切误差全都只是一个不确定度的问题,未知系统误差与随机误差实际没有区别,都可以统一用不确定度来进行处理。已知系统误差本质上并不是误差,而是测量结果”。必须要注意,用不确定度统一系统误差和随机误差只在系统误差的第二类情况下才是有可能的,第一类系统误差根本就不可能有任何“不确定度”,更谈不让如何去合成了,从认识论的哲学上说是纯粹的未知。这与随机误差性质完全不同,因此,说未知系统误差与随机误差之间没有区别显然是不能成立的。另一方面也一定要注意,即使在可以统一用不确定度来处理的第二类系统误差情况下,也必须区分不同测量系统情况下系统误差意义的不同。 

image008.png

8  叶晓明先生视频讲解截图,事实上是第二类系统误差案例

 

在这个PPT中,“水准网”和网上的“每个水准路径”是两个完全不同的测量系统。单个水准路径存在的系统误差,从水准网的测量系统角度看,大量不同水准路径的系统误差就会呈现随机分布。之所以会有这种变化,是因为系统误差必须是针对特定测量系统来说的。

 

为什么系统误差概念不能废除?


 

正是从叶晓明先生一再强调的认识论的哲学角度来说,系统误差代表了科学认识中未知的部分,如果消除了系统误差,就消除了科学认识论中非常重要的一环。尽管科学对世界的认识越来越精确,但永远不能说绝对不再存在第一类系统误差了。

在第二类系统误差情况里,保留系统误差这个概念对理解误差依然是有重要价值的。其原因在于,虽然从整个人类科学研究的水平来说,某一物理量的测量可以认为不再存在系统误差了,但对于特定的某个人或群体采用某特定测量手段进行的测量过程来说,他们能够利用的测量资源是有限的。有可能因其存在的漂移、特定的显著干扰、特定测量系统差错造成的显著原理误差等,还是有可能产生他们暂时不能发现(只是他们暂时不能发现)的系统误差。因此,意识到有系统误差存在的可能,将会避免他们完全盲目依据叶晓明先生所提供的方法计算出的不确定度,就绝对相信该测量数据去作出决策。能够计算出不确定度,事实上就是在一定程度上已经“确定了”误差在一定的置信度前提下不会超过一定范围,这显然是不合适的。

 

再论系统误差的定义


 

可能有读者会更进一步较真:凭什么你就说偏差小到低于随机误差的置信区间就不再是系统误差,而大于这个置信区间就成系统误差了?这不是自己想怎么定义就怎么定义吗?这么定义的更严格依据是什么?

如果真有读者这么较真是正确的,我之所以这么定义是依据更基本的科学原理,就是:一切科学的概念必须都是“可测量”的。即使研究测量学本身,所有的概念也都必须建立在可测量的前提之上。如果系统误差不能显著地超出随机误差置信区间,它就无法被测量到。一个不能被测量到的值不是科学定义的概念。我们将系统误差定义为数量大小上与真值的偏差超出随机误差置信区间,原因就在于这样定义的系统误差是可测量的。

 

如何理解真值?


 

这里又涉及一个测量学最基本的概念,就是真值。因为真值是无法准确获得的,那我们怎么理解真值呢?一般情况下,更高精度计量仪器的存在,是我们理解真值的一个有效途径。精度越来越高,置信区间越来越小,会使我们“感受到”测量数据更加趋近真值。真值本身是测量最基本的,它本身是不定义的概念,其它的概念都是在它基础上进行定义的。

 

什么是“相同测量条件”或“等精度多余测量”?


 

叶晓明先生对“相同测量条件”概念的批判是很有道理的,但一定程度上也有些自己设目标自已攻击的意味,因为对“相同测量条件”从来不可能会有任何人做叶晓明先生设立的那种理解。从认识论的哲学上说,如果真的是绝对相同的测量条件,测量的结果的确应该完全相同,而不会出现离散。这样说真的有点“太较真”了,但在测量学上特别地较真不能说没道理。的确绝大多数人对“等精度多余测量”这个前提到底是什么含义没有进行最深入地思考。因此,在这一点上我们认为叶晓明先生所进行的概念追究和较真是有价值的。

image009.png

9  叶晓明先生视频讲解截图,对相同测量条件的绝对理解

 

多余”这个很好理解,就是测量的次数不止一个。相同测量条件里的“相同”,或等精度多余测量中的“等”显然都是相对的说法。但这个“相对”该怎么来最严格准确地理解呢?如果不能给予非常严格地定义,的确就会出现叶晓明先生所提到的问题。科学的测量是对误差因素尽最大努力控制条件下进行的。对误差的控制不可能意味着没有误差。测不准原理就是否定这一点的理论依据之一。事实上一切测量都是测不准的,都存在误差。我更倾向于采用“等精度”这个概念。因为这个概念本身就否定了哲学上“测量条件绝对相同”的说法,它是指在特定测量技术条件下,尽最大控制能力所能达到的对误差控制的程度。

既然是一种对误差的控制,就不是绝对不变地“相同条件”,而是尽最大可能地使误差呈现对称性和抵偿性地离散分布。这样在进行大量测量数据平均后,其误差可相互抵消,从而可获得较好的测量数据。因此,如果一定要用“相同条件”这个概念和词汇,其中的“条件”一词应当说是指对误差控制能力相同,但却不意味着说什么都不动,什么都不变。既然我们是要获得误差分布尽可能是对称和具有抵偿性的分布,因此不仅是不变,而且会在实际测量中如叶晓明先生所提到的尽可能调整测量系统使其误差分布更加对称和具有抵偿性。这才是对“等精度”的准确理解。因此,叶晓明先生用了一个本身不够严格的通俗词汇——“相同条件”,又将其立为目标进行攻击。如果采用更严格的“等精度”概念,其实就不会有这个问题。

image010.png

10  叶晓明先生视频讲解截图,同样承认系统误差,只是它不是终身的

 

事实上,叶晓明先生还是无法脱离系统和随机这些概念。但他强调不能用影响性质来对误差进行“终身”分类。事实上也从来就没有任何人认为系统误差是绝对和终身的,最多可以说是没有用最清晰的概念定义来明确这一点。

 

误差的分布问题


image011.png

11  叶晓明先生视频讲解截图,几个规律误差因素导致的误差分布案例

 

叶晓明先生讨论了很多种有规律误差因素作用下会形成随机分布的案例。但是,科学研究必须从数学上完备地考虑“一切可能的情况”。如果干扰是呈单调上升的函数类型,显然就不可能呈对称型的随机分布。叶晓明先生在上图中提到的前三种非高斯分布的类型都具有对称性,但是否具有很好的抵偿性是存在问题的。具有较好抵偿性的随机分布是呈现较小误差值出现概率较高,较大误差值出现概念较低这样一种形态。如高斯分布和叶晓明先生没有提到的三角形分布。


image012.png

12  叶晓明先生视频讲解截图,测量条件不同,相同规律误差的分布完全不同

 

但叶晓明先生讨论这个问题并不是要说明以上情况,而是要通过枚举这几个案例来证明这样一个结论:规律性的误差因素形成的误差是固定误差还是离散性的误差不是绝对的,完全取决于特定的测量条件。但是,这只是说明了系统误差的高度复杂性,而不能以此否认系统误差这个概念的价值。系统误差与随机误差的区别是一个量的问题。如果其影响大小超出除此之外其他误差因素的置信区间,它就需要被当作系统误差来看待。如果其影响小于除此之外的其他误差置信区间,它就需要被当成随机误差来看待。

 

本文最终结论


 

没有任何人认为系统误差是绝对的,它是相对的,只是过去人们不太能清楚地说明它的相对性该如何理解。总结起来,系统误差的相对性,就是相对于误差量的大小,相对于测量系统,相对于科学研究的历史水平和阶段。叶晓明先生所作的研究,有助于人们深刻理解系统误差的相对性,但显然完全不能达到消除系统误差这个概念的程度。本文通过与叶晓明先生的讨论,反而是更加明确了系统误差的价值、概念定义和意义。在此也向叶晓明先生深表谢意! 

 

参考文献:


叶晓明:视频讲解:测量误差理论的新概念

  http://blog.sciencenet.cn/blog-630565-1101304.html

The new concepts ofmeasurement error theory》中文版。

http://blog.sciencenet.cn/blog-630565-969989.html

③汪涛,关于叶晓明先生“新测量学理论”的专业解释。

http://blog.sciencenet.cn/home.php?mod=space&uid=3363057&do=blog&id=1104320

④汪涛,与叶晓明教授就测量问题的相关讨论。

http://blog.sciencenet.cn/home.php?mod=space&uid=3363057&do=blog&id=1104672





作者简介:汪涛




独立学者

人类第三次科学革命倡导者,纯科学理论体系创始人

云铝股份(000807)独立董事

浙江宇视科技 顾问

上海析易船舶 联合创始人、总经理

中央民族大学中俄能源研究院 客座教授

中关村长风联盟 国际化导师

中国农投会、中关村京港澳青年创新中心等创业导师

曾为中兴通讯(000063)国际市场管理体系的奠基人

 

著 作:

《通播网宣言》

《生态社会人口论》

《超越战争论——战争与和平的数学原理》

《实验、测量与科学》

《即将来临的粮食世界大战》(即将出版

《纯电动:一统天下》(即将重新出版

《科学经济学——看见看不见的手》(即将出版) 


微信公众号:纯科学

新浪微博@ 汪涛_纯科学






http://blog.sciencenet.cn/blog-3363057-1105376.html

上一篇:找到伽利略——中国科技体制往何处去
下一篇:中美贸易战会开打吗?别想多了,肯定不会

10 刘成渝 王龙 李学东 刘军 宁晓民 侯圣玉 王德生 李子武 赵化国 黄河宁

该博文允许注册用户评论 请点击登录 评论 (36 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-3-8 05:58

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部