||
因为是简要地、非系统地,无法按具有专业测量科研背景的专家标准来谈“真值、测量值、与测量误差”,所以是杂谈。但是杂谈不是不按科学技术基本原则与规范地乱谈,因此希望以下所谈的话题与内容值得看官您宝贵的时间与精力来阅读、思考,甚至参与讨论或提出建议。
由茆诗松、王静龙、濮晓龙编著的“高等数理统计”(高教出版社,1998)正文的第一页给出的第一个例子就是关于测量问题。原文摘录如下:
“一个试验者对未知的物理量μ进行测量,为了对μ作出估计,大家知道,他的测量值x会受到各种随机因素的影响,以至于使x可认为是μ加上随机误差ε后而得到的, 即
这里的“可加性“是人们对测量数据构成所作的一个假设,经过多次使用经验,说明这个假设是合理的。另外,由于测量误差ε是受到测量仪器、环境温度、光线、视觉、心理等因素的微小变化而引起的综合结果,根据中心极限定理,又可认为ε是服从均值为0和方差为σ2的正态分布N(0,σ2)。这是人们对测量数据的另一个假设(认识)。至此,我们对这个测量值问题的认识有如下三点:
1. 测量值x可取任何实数,实数集R组成样本空间;
2. 实数集R上的Borel集的全体组成的σ代数ВR ;
3. 在可测空间{R ,ВR }上的一个概率分布族 Р1 = {N(0,σ2):(μ,σ)∈R ◊ R+},其中R+是正实数集。”
(对概率论的标准数学语言表达方式不熟悉/不习惯的读者可以忽略上述摘录内容的最后的1. ,2., 3.点(以概率空间来描述测量问题)的技术细节,不会从根本上影响您对本博文所想传递的信息(表达的观点)的理解/正确解读。或者也可以阅读科学网—杂谈常用的概率分布(common probability distributions) - 谢钢的博文 (sciencenet.cn)的前半部分来帮助您理解概率空间的概念。)
在我们谈论/讨论测量的技术性的问题之前必须先确定一个公理性/哲学性/定义性问题的结论,那就是‘真值’的存在性与不变性的确认。如同黄河宁老师的博文所述:“事实上,无论频率学派还是贝叶斯学派都承认测验物理量存在一个真值,这个真值是常数,比如万有引力系数就是一个常数。在实际测量中,真值是未知的,否则就不需要测量了。”科学网—《测量不确定度表示指南》现行版与修订版:挑战与机遇 - 黄河宁的博文 (sciencenet.cn) 我完全赞同这个观点,因此,以下的谈论/讨论都是以“真值是存在的,虽然是未知且不可知,但是真值是固定的,是一个常量”作为公理性基础进行的。
或许很多读者没有注意到一个规范的数理统计教科书对随机变量及其对应的样本数值的标准表达方式的重要细节:随机变量统一用大写的英文字母,如W, X, Y,Z,代表; 随机变量的值用对应的小写字母代表;一个统计模型中的参数则用希腊字母表示,同样的若某个参数在表达式中是代表一个随机变量用大写字母,参数的值用小写字母表示。比如P(X= x)表示这是一个随机变量X取值为x时的概率值;又比如,在数理统计的理论部分的定律的描述用一个随机样本{X1, X2, …, Xn} 来构造一个统计量T(X),而其对应的观察到的某一个随机样本的值则表示为{x1, x2, …, xn}, T(X=x)。同样的对于测量值公式x = μ + ε从随机变量的角度可以写做: X = μ + E, 其中X 和E均为随机变量,而μ是一个数值/常数;从观察到的测量值的角度可以写做:xi = μ + ei, 其中i = 1, 2, …, n。当然这里的xi , μ ,及 ei都是具体的数值而不是随机变量。
由于我们人类认知能力的根本局限性,任何一个被测量的对象的真值都无法确定。然而,从实际应用的角度这个问题/难题很容易解决/回避。类似于用信息准则法来评价一个回归模型拟合程度的好坏科学网—“最佳”回归(或‘最佳拟合’)模型与AIC(赤池信息准则)及其它信息准则 - 谢钢的博文 (sciencenet.cn)的哲学思路(AIC只能告诉我们所比较模型的相对好坏无法确定其绝对好坏程度因为无法确定‘真实模型‘的绝对位置),我们可以很合理地把国际或国家现行的一级标准计量器具的测量值作为相对所有下游(各个次级测量标准的)测量结果的’真值‘。至于相对’真值‘与绝对’真值‘之间的差别,虽然不可知但是已被认定为固定的,因此这样的处理对于所有的我们的实际应用的需要从理论到实践都是说得通行得通的,测量值的准确度/精度完全能够满足科学研究的标准要求。
在X = μ + E这个式子中我们用X表示一个测量值的随机变量,这里的X其实是针对某个不确定因素而言所有可能的测量结果取值的集合,所以是一个随机变量。简单化地说“测量值是随机变量”是造成‘真值、测量值、测量误差‘问题无法进行有意义的讨论的原因之一。这里的X之所以是随机变量是因为式子里的E是随机变量。因此要理解X的含义/定义,首先要把E定义出来。
如果说测量误差可以归纳为来源于三个方面:测量工具的精度(因素一)、测量人员及实施方法的不确定性(因素二)、以及环境因素带来的不确定性(因素三),那么我们若想从随机变量的角度来定义解释测量值的不确定性程度(measurement uncertainty level)的话,首先必须先明确是针对以上的三个不确定性因素的哪一个来做分析,第二步是定义随机变量,最后是建立一个统计模型来估算测量值的不确定性程度。
让我们从不确定性因素的角度来看看该/可以如何做。因素三:通过规定标准测试条件来最大程度地减小因素三带来的不确定性。比如我们说某个牌子及型号的汽车发动机的功率是xxx,指的是标准测试条件下获得的标定测量值。若我们又说该车的每百公里油耗是xxx, 同样应该理解为标准路况/驾驶模式等等条件下的标定测量值。因素二,也许可以合理地假设测量工具的标准设计与规范使用使得因素二造成的测量结果的不确定性也可以忽略不计。这样我们就可以把估算测量误差的不确定性问题简化为如何确定测量工具的精度的问题。由于在前面我们已经主张可以很合理地把国际或国家现行的一级标准计量器具的测量值作为相对所有下游(各个次级测量标准的)测量结果的’真值‘,问题的答案似乎变得非常简单了。如果我的理解没错的话,目前所有正规厂家生产销售的各种测量器具都是100%经过更高一个等级的标准量具的校调标定质量检测合格后的产品/商品。所以完全避免了统计推断的麻烦/争议。测量器具的精度不是什么根据抽样标准误算出的99%(或95%)的置信度的精度,而是100%的(以相对‘真值’为基准的)经过更高等级量具检测标定的测量器具,除非是混入的不合格的次品,否则精度是多少就是多少。
假如这位读者您不能同意我上述的假设条件,比如对上述不确定因素二的假定不能接受,我们必须要把使用者与使用方法的不确定因素的大小从随机变量的角度做一个合理的估计。让我们来看看结果会如何。首先我们需要定义这个随机变量。相对于任何一个测量器具,使用者与使用方法的不确定因素是指所有不同的使用者在任何时候任何地点用任何方法测量同一个物品的结果吗?这样一个随机变量它的抽样总体如何确定,有代表性的随机抽样如何实现?如果我们只抽取一组样本数据,其统计推断的分析结果,比如95%的置信区间该如何解释?对这些问题的考虑让我们一下子回到了科学网—统计显著性问题的历史由来及最新进展 - 谢钢的博文 (sciencenet.cn)所详细叙述讨论过的东西。结论就是我们不得不要面对所有那些与“置信区间”有关的从理论到实践都还未取得共识的困难/争议。所以我才会说把测量的精度与统计分析的置信区间扯到一起既扯不清也完全无必要。换句话说,我们现实生活中的测量值的不确定性的确定其实根本与所谓的“置信区间”可以是两个完全不相关的东西。
作为一个完全没有专业测量科研背景但也在学术圈里讨生活的普通一员,非常欢迎有关的专家学者对我上述的关于科学测量/计量问题的观点想法进行批评指正。特别欢迎有博友/专家能向我指出关于统计推断(统计假设检验与置信区间或信用区间credible interval)在真值、测量值、与测量误差方面的实际应用与成效,以纠正我可能存在的对统计推断在科学研究过程中的角色与作用的偏见。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 19:49
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社