||
——随机游走定义中的概念错误及纠正
一、随机现象与统计规律
随机现象是指在个别试验中其结果呈现出不确定性,但是在大量重复试验中其结果又具有某种固有规律性的现象。
图1 抛硬币试验
例如在抛硬币试验中,如果只抛掷一次硬币,其结果完全随机,无法预测,不存在任何固有规律;但是随着抛掷次数 的逐渐增大,硬币正反面出现的频率会逐渐稳定于常数 。
这种在大量重复试验或观察中所呈现出的固有规律,称为随机现象的统计规律。
二、概率定义及应用范围
概率定义:在相同条件下重复进行 次试验,其中事件 发生的次数为 ,如果随着试验次数 的增多,事件 发生的频率 会稳定在某个常数 附近,那么这个常数 就叫做事件 的概率。
从概率定义可以看出,概率是描述随机试验次数 充分大时的统计参数。对于抛硬币试验,概率 描述了下述两个现象:
(1)在随机试验结果中,硬币正面向上和反面向上这两种事件都会发生;
(2)试验次数 充分大时,硬币正、反面出现的频率趋于常数 。
图2 抛硬币试验统计规律
当随机试验的次数 较小时,事件发生的频率随机波动的幅度很大,根本不存在频率的稳定值,因此也就不存在概率所描述的统计规律。例如在抛硬币试验次数 时,硬币正面出现的频率在 和 之间随机跳变,没有任何固有规律,概率 描述的两个现象均不存在。
概率不能用来描述随机试验次数 较小,特别是 时的随机事件发生可能性大小。若将概率 用于度量 时的抛硬币试验,意味着如果只抛掷一次硬币,会同时出现正、反面向上的试验结果。
但是,《随机过程》教科书恰恰就用概率 来度量 时的随机事件发生可能性的大小,认为随机试验在 时存在统计规律,并由此推导出了一系列与事实不符的结论。
三、随机游走定义概念错误分析
随机游走(Random Walk)是《随机过程》教科书中用于描述动态随机现象的一种基本随机过程,许多重要的随机过程都可由它派生出来,其理论不仅在随机过程中占有相当重要的地位,而且也是自然科学、工程技术和社会科学研究动态随机现象的重要数学工具。液体中悬浮微粒的布朗运动、光纤陀螺中的随机游走误差和股票市场中的价格波动等随机现象均可用随机游走过程进行描述。
樊平毅教授在为清华大学电子工程系本科生及研究生编著的《随机过程理论与应用》教材中,对一维简单随机游走做了如下的定义:
考虑在一直线上的对称随机移动,假设质点每一时刻向左或向右移动一格的概率相同,每次移动是相互独立的。假定最初质点位于原点,令 表示第 次质点移动的距离,且 , ,那么,在时刻 ,质点离开原点的距离为
其中 。
图3 随机游走定义
为了便于学生理解并掌握随机游走定义,钱敏平、龚光鲁、陈大岳和章复熹四位教授在为北京大学数学学院三年级学生合编的《应用随机过程》教材中,用抛硬币过程对一维简单对称随机游走定义做了非常直观形象的描述和解释:
质点从原点出发,每一次等可能地向左或向右移动一步。可以设想,在抛掷一枚质量均匀的硬币的情况下,每次投币得正面则该质点往右走,投得反面则往左走。
图4 抛硬币模拟随机游走
显然,《随机过程理论与应用》和《应用随机过程》两本教材对概率定义及其应用范围的理解出现了严重的偏差,用描述随机试验次数 充分大时的统计参数——概率,来描述试验次数 时的随机事件发生可能性大小,这意味着随机试验在 时存在统计规律,与概率定义和随机现象在个别试验中其结果呈现出不确定性的客观事实不符。
事实上,当随机游走的步数 充分大时,假设质点向左和向右移动的步数分别为 和 ,根据概率定义,有
表明随机游走步数 充分大时,质点向右移动的频率和向左移动的频率分别趋于 和 ,而不是质点向右或向左移动一步的概率分别为 和 。
从随机过程定义的角度分析随机游走过程,假设有大量的质点同时从原点出发做一维简单对称随机游走,则每个质点的位移 均为步数 的函数,所有质点在第 步的位置 就是随机变量 在第 步时的状态或取值。
随机游走定义将描述大量质点空间位置的随机变量 在用来描述一个质点的位移 ,混淆了随机变量与样本函数的区别,无形中导致研究对象从一个质点改变为大量质点。
事实上,当随机游走的质点数量充分大时,所有质点每移动一步后,向左或向右移动的质点数量与质点总数之比趋于常数 。
概率要么用来描述一个质点在步数 充分大时的统计规律,要么用来描述质点数量充分大时,所有质点每移动一步或 步后的统计规律。
随机游走定义的概念错误在于,用统计参数来描述一个质点在移动一步后的“统计规律”,这就如同用温度来度量一个分子的动能一样荒谬。
四、重新定义随机游走
假设一维随机游走的质点向右和向左移动的概率分别为 和 ,则时间序列 的算数平均值可表示为
式中算数平均值 的物理意义为时间序列 中的直流分量。
因此,对于一维对称简单随机游走, , 的均值 和方差 分别为
另外,随机游走的质点位移在各个 区间上的位移变化 相互独立,用数学语言表达,就是不同时刻的 互不相关,因此有
式中式中 为 的自相关函数, 为单位冲击序列,其定义为
表明 仅在时间间隔 时才有相关性,只要 两个取值之间的时间间隔不为零,就互不相关。
由维纳-欣钦定理,广义平稳随机信号的功率谱密度是其自相关函数的傅立叶变换,可得 的功率谱密度函数
的功率谱密度在整个频率轴(-∞,+∞)上为常数,表明 为白噪声序列。
白噪声序列是一个理想化的数学模型,由于其自相关函数是一个“单位冲击序列”,功率谱密度为“常数”,因此在数学上具有处理简单、计算方便等优点,在随机现象的理论研究中占有相当重要的地位。
基于白噪声序列的基本概念,可给出随机游走样本函数 的定义:
定义:若质点位移 的一阶差分 , 为定义在[-∞,+∞]上的零均值不相关白噪声序列,则称 为随机游走。
这个定义包含了质点随机游走的所有特征,可作为推导随机游走其他命题的基本假设(公理),或称为随机游走运动定律。
五、随机游走问题重新求解
卡尔·皮尔逊(Karl Pearson)是英国应用数学家,近代数理统计的奠基人,被公认为现代统计学之父,我们今天在概率统计中广泛使用的标准差(Standard Deviation)就是由皮尔逊于1893年提出的。
1905年,皮尔逊在《自然》杂志上公开求解随机游走问题(Random Walk Problem):如果一个醉汉走路时每步的方向完全随机(图5),问经过一段时间之后,他离出发点的距离是多少?
图5 醉汉随机游走
1921 年,匈牙利数学家乔治·波利亚(George Polya)在研究随机游走问题后,假设一维简单随机游走每一步向左和向右的概率均为0.5,证明了质点(醉汉)返回原点的概率为 1。日本数学家角谷静夫通俗地将其表述为:喝醉的酒鬼最终会找到回家的路(A drunk man will eventually find his way home)。
根据质点随机游走位移的一阶差分为白噪声的新定义,可证明从原点出发的一维简单随机游走质点位移与步数 成正比,表明随着步数 的增加,喝醉的酒鬼会逐渐远离原点。
究竟喝醉的酒鬼是返回原点还是远离原点?我们可用高尔顿板进行实验验证。
高尔顿板是英国生物统计学家弗朗西斯·高尔顿(Francis Galton)在1873年专门设计用来演示一维简单对称随机游走的实验装置(图6)。
图6 高尔顿板
高尔顿板上的每一个圆点表示钉在板上的钉子,钉子之间的距离彼此相等,呈三角形排列,上一层每一颗钉子的位置恰好位于下一层两颗钉子的正中间。
当小球从最上方的入口落下时,小球每次碰到钉子后,随机地向左或向右落下,直到最后落入底部的一个格子内。
显然,一个小球从入口处经过 层钉子后落入底部格子的过程,就相当于一个质点的 步随机游走过程。小球所在底部格子偏离中心的距离,就是随机游走质点相对原点的位移。
把大量小球逐个从入口处放下,只要高尔顿板的面积足够大、钉子数量足够多,落在格子内的小球将形成与正态分布曲线相似的中间高、两边低的钟形曲线。
根据质点随机游走位移的一阶差分为白噪声的新定义,可以证明所有质点在第 步时的空间位置服从 正态分布,与大量布朗粒子的空间位置分布规律相同,表明大量质点的随机游走是一种与布朗运动类似的扩散现象。
如果高尔顿板面积足够大,小球在下落过程中将逐渐向左右两个方向扩散,表明喝醉的酒鬼随时间远离原点,永远也找不到回家的路。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-26 10:33
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社