|
保持恒定的量可以是随机变量,随机变化的量也可以是常量。---请看数学根据。
随机变量是随机变化的物理量吗?
武汉大学 叶晓明
见到这个标题,许多测量学家几乎都是斩钉截铁地回答“当然是”。然而,非常遗憾,按照纯正的概率论概念,这一问题的答案其实是否定的。
这个问题恰恰就是新概念测量理论和传统测量理论对决的焦点,如表1。
表1
传统测量理论 | 新概念测量理论 | |
常量 | 真值和系统误差 | 测量结果 |
随机变量 | 随机误差和测量结果 | 误差和真值 |
那么,究竟什么是常量?什么是随机变量?这是二个基本的概率论概念,我们这时当然要退回到概率论重新梳理概念逻辑。
1.随机变量
以下是浙江大学《概率论与数理统计》教科书对随机变量概念给出的定义:
设随机试验的样本空间为S={e},若X=X(e)为定义在S上的实值单值函数,则称X(e)为随机变量,简写为X。
定义所描述的要点是,随机变量是个未知数,其值域存在于数轴上的一段区间内,该值域由其样本空间内的每个样本对应于数轴上的实值点集合而成。
首先,随机变量不只针对物理量,而是比物理量更广泛的事件,是以数值来描述和研究未知事件的规律性。
重点是,随机变量的数值未知,但未必是客观上处于随机变化的状态;也正因为一个随机变量的数值是未知的,只能通过大量试验样本的密度分布来描述研究其概率分布,所谓随机变化问题只是表明在随机试验时其各个样本的出现顺序是随机性的。表2是教科书对离散型随机变量的概率分布的直观描述。
表2
X | x1 | x2 | … | xi | … |
pk | p1 | p2 | … | pi | … |
其中,X是随机变量,x1, x2, …, xi, …是随机变量X的所有可能取值——样本,所有样本的集合就构成随机变量X的样本空间,而pk则是事件{X=xk}发生的概率,即pk=P{X=xk}。
请特别注意,随机变量X和样本x1, x2, …, xi, …是二个完全不同的数学概念!
于是,在此基础上定义了数学期望和方差分别为:E(X)=∑pi xi和σ2 (X)=E[X-E(X)]2,分别是随机变量X的所有可能取值的均值和发散性。其含义是,随机变量X虽然未知,但其存在于一个以E(X)为中心以σ2 (X)为宽度评价的概率区间内。或者说,数学期望E(X)和方差σ2 (X)是随机变量X所存在的概率区间的评价值。
连续型随机变量的概念原理雷同,无非是样本点之间是连续的,需要用概率密度函数来描述。
表2只是说明一个随机变量X的实际值是未知的,在随机试验时其将以一定的概率p1, p2, …, pi, …出现在各个样本点x1, x2, …, xi, …上,但并没有肯定说X客观上在各个样本点之间始终处于随机变化的状态。
请看实际案例。
例如,密封罐中的骰子处于静止状态,其显示值X是数值1~6中间的某个唯一值,不可能随机变化,仅仅是人主观不知道其数值而已,其所有可能取值的概率分布如表3,该分布来自于大量随机试验结果的统计。
表3
X | 1 | 2 | 3 | 4 | 5 | 6 |
pk | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 |
根据数学期望和方差的定义,有E(X)=3.5和σ2 (X)=2.92。其含义是未知量X存在于一个以3.5为中心以2.92为宽度评价的概率区间内。
再例如,一个未出生的胎儿的性别X在其受孕时就确定了,男女性别只有其一,不可能随机变化,只是其降生前我们主观不知道其值而已,其概率分布如表4(男女分别用数值0和1表示),该分布来自于我国人口性别的统计。
表4
X | x1=0 | x2=1 |
pk | p1=51.27% | p2=48.73% |
其数学期望和方差分别是E(X)=0.4873和σ2 (X)=0.2498。
再例如,薛定谔猫的死活问题,等等。
很显然,这些随机变量X客观上都是恒定量,一定是所有样本中的某一个唯一值,只因为我们主观未知,才用大量已知样本的统计来描述其概率分布:骰子的一个未知显示值X的概率分布来自于大量抛掷试验结果的统计,一个胎儿性别X的概率分布来自于大量人口的性别统计,一个薛定谔猫死活X的概率分布来自于大量薛定谔猫的实际死活比例统计等等。可见,把大量样本x1, x2, …, xi, …的彼此不同偷换成一个未知值X的随机变化当然是对概率论概念的曲解。
反过来说,如果非要坚持说随机变量就是处于随机变化的状态:密封罐中静止骰子的显示值是在数字1~6之间随机变化,胎儿的性别在孕妇肚子里随机变化,薛定谔猫在箱子里来回死活等等,那么,造成这些变化的能量从何而来?这从物理学上本身也解释不通。
所以,随机变量只是一个未知的数值,许多时候实际还是一个恒定值!所谓随机变化只不过是说在随机试验的时候各个样本值是随机地出现。
2.常量
但是,概率论中还有一个常量(常数)概念!
不同于随机变量是未知值,常量就是指一个具体的数值。对于一个表示具体数值的常量C而言,因为其所有可能取值都是它自己,100%的概率,所以有E(C)=C和σ2 (C)=0。
显然,在表1中,样本空间里的每个样本x1, x2, …, xi, …都是数值,所以它们都是常量,即使它们在随机试验时是随机地出现。即,处于随机变化状态的样本反而恰恰是常量!!!
例如,骰子的6个面的数值1、2、3、4、5、6都是数值,它们虽然彼此不同并在随机试验时随机出现,但这6个数值却都是常量。
再例如,胎儿性别样本0和1也是数值,它们也彼此不同并在随机试验时随机出现,却也是常量。
现在回到测量学的问题上来。测量仪器获得的观测值也是数值,当然也属于常量;由多个观测值进行数据处理给出的测量结果还是数值,当然还是常量。
所以,传统测量理论纠缠于这些常量在重复测量(试验)中的随机改变,把测量结果和观测值都归类为随机变量,恰恰是把常量和随机变量搞混了。
例如:珠峰高程的测量结果是8844.43米,即使未来重复测量珠峰高程的测量结果会发生随机改变,假设变成了8844.44,8844.45,…,那么按照表2的描述方法,必然得到表5。
表5
x0=8844.43 | x0=8844.43 | x1=8844.44 | x2=8844.45 | … |
pk | p0=100% | p1=0% | p2=0% | … |
这里的所谓随机变量---测量结果x0被赋予了数值8844.43,不是未知值,因此,除了样本8844.43自己和自己相等(100%概率)以外,任何其他数值和这个8844.43相等的概率当然绝对是0%。根据数学期望和方差的定义,必然有E(x0)=∑pixi=8844.43和σ2(x0)=σ2 (8844.43)=0。可见,传统测量理论对珠峰高程案例给出的数学表达式x0=8844.43和σ(x0 )=±0.21m实际是给出了一个错误等式σ(8844.43)=±0.21。
3.总结
总之,在概率论中,随机变量只是一个未知值,甚至通常还是恒定的未知值,根本无法判定一个未知值是否处于随机变化的状态;真正处于随机变化状态的只是随机试验中的试验样本,而样本都是具体的数值,反而属于常量。即,随机变化的量恰恰是常量而不是随机变量!对于测量领域而言,无论测量结果(观测值)在重复测量中如何随机变化,按照纯正的概率论概念,测量结果(观测值)是数值,只能属于常量。传统测量理论忽视了测量结果(观测值)是数值、纠结于它们在重复测量中的随机变化从而把它们归类为随机变量,这违背了概率论概念,如表6。
表6
传统测量理论 | 概率论 | |
常量 | 保持恒定的量 | 数值 |
随机变量 | 随机变化的量 | 数值未知的量 |
传统测量理论歪曲了随机变量概念,而新概念测量理论则是基于纯正的概率论概念而解释的。现在,学术建议书已经提交几个月了,道理已经讲得很清楚了,请测量学家们赶紧做决定吧,数学家们都在看着呢。
2020 11 5于武汉大学
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 05:58
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社