|||
半年前“新语丝读书论坛”曾为一个测量问题大起争论。争论的起因是,按照一百年来温度计的精度,“全球变暖”理论(全称是“人类排放温室气体导致灾难性的全球变暖”)的数据基础——每百年上升不到一度——到底多大可能应该归于误差。争论的焦点随后转移到这个问题:用一把刻度精度有限的尺子,可否通过随机扔棍子的办法,无限提高对棍子长度的测量精度?
http://xys.cnhub.net/bbs/read.php?forum=0&id=775717
送交者: james_hussein_bond 于 2011-01-04 18:38:31:
008尺子的定义:
_____1_____2_____3_____4_____5_____6_____7_____8
我上面画的是一个尺子. 在每一个数字的地方有一个sensor. 每个sensor的输入是盖住和不盖住两个状态. 如果实测的长度盖住3, 没盖住4, 那我们说这个长度是3.5+-0.5.
由于每个sensor本身的尺寸很小, 如果被测的长度位于4和5中间, 测一万遍都会得出同样的结果, 4盖住, 5不盖住. 结果是4.5+-0.5. 同一个数字, 平均不平均都没区别.
但是如果被测的长度正好在4上, 由于sensor本身有大小, 可能有时候输出盖住, 有时候输出不盖住, 测量会有两种结果, 3.5+-0.5 和4.5+-0.5. 由于有了随机性, 测一万次可以平均一下, 这样得出的结果可能是3.8+-0.5, 无论如果, 比不平均的结果要更接近真值, 但是误差还是+-0.5
湘女的东西:长度大约0.1。
问题:如何通过对多次测量的平均将此物长度确定到任意精度?
首先,尺子是唯一测量工具,不允许做什么"对准一端"这种额外加的条件。你拿什么判断一端是否对准了?所以唯一正确的解法,是让物体随机地落在尺子上,看有几个sensor被盖住。
假设物体长L<1,sensor长S<<1,L>S,sensor完全盖住时100%给信号,部分盖住时50%给信号,只考虑物体左端落在1和2之间的情况,那么sensor发信号的几率是:
0.5*(S/2) + 1*(L-S/2) + 0.5*(S/2) = L
左边第一项是左端落在sensor 1上的贡献,第二项是sensor 2被完全盖住的几率,第三项是左端落在sensor 2上的贡献。
结论:只要看sensor发信号的几率,就得出物体长度L。
实验上,每次测量得到的结果是0或1,几率分别是1-L和L。N次测量后variance是NL(1-L),误差是sqrt[l(1-l)/n]。只要增加测量次数,精度就可以任意提高。
当时我对这种测量问题并没有亲身经验,因而插不上嘴。而最近几个月,我们完成了一个标准化的工作——标定氢同位素的天然气标准样品的氢同位素比值,其间要不断参考美国标准和技术研究院(NIST)的定义和规范,对这类问题才有了切身体会。
按照NIST标准的描述,测量值与真实值的差别包括两部分——偶然误差和偏差。偏差不但来自仪器的系统误差,也可能来自测量手段。比如,上面那个扔棍子的方法,尺子刻度本身会带来系统误差,而如果测量场所的风向在某一方向上有优势,那么也会带来偏差。
偶然误差可以通过统计方法来减少,那就是增加测量次数,而不确定性反比于测量次数的平方根。
与偶然误差相比,偏差的最大问题是,并不必然地遵从正态分布。对于上面那把尺子,“2和3之间的距离”与“4和5之间的距离”并不绝对相等,而且也并不绝对等于一个真实的单位长度。也就是说,任何两个刻度之间的长度都存在偏差,而且这些偏差之间也并不一致。仅就这把尺子而言,我们不但不知道每个单元格的偏差多大,甚至也无法知道哪个单元格的偏差更小。现在从权的办法,只能假定真实的单元格长度处于最窄的和最宽的单元格之间,并且其概率分布是矩形分布,而不是正态分布。——当然最重要的结论是,偏差是无法通过增加测量次数来消除的。
所以,就这个测量方法而言,增加扔棍子的次数,并不必然导致棍子长度测量结果的不确定性减少。它固然不取决于尺子精度,但是它最终取决于尺子单元格本身的不确定性。
再到起始的问题:全球地表平均温度“每百年上升不到一度”的观测结果到底多大可能应该归于误差?我们依然需要从偶然误差和偏差两方面来考虑。从偶然误差考虑,仪器精度并不是个问题,因为数据点和观测次数非常之多,总可以把方差降得足够低。温度表误差假设是0.5度,100次的观察就可以将不确定性降低到0.05度以下,所以仪器精度本身不是一个问题。
问题仍然在偏差部分。对偏差的校正,更多地不是依赖统计,而是依赖背景知识。而IPCC公布的地表温度值的定量变化,至少包括以下偏差:1)仪器更新(http://www.nature.com/nature/journal/v453/n7195/full/nature06982.html);2)热岛效应(Anthony Watts的项目就是考虑这个问题的影响);3)对每种环境的温度点该如何加权(这是Pielke Sr.的研究范围);4)权威温度数据库对温度资料的校正和取舍(气候门丑闻暴露出这样的问题)。
所以,尽管我们知道最近100年来地表温度上升速度有一个数值,但是这个数值的不确定性有多大,并没有一个可靠的数字(IPCC报告的主要结论在统计上经常通不过,比如所谓“全球变暖‘90%可能’由人类活动造成”就是一个例子)。
参考资料:
http://physics.nist.gov/cuu/Uncertainty/
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 23:01
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社