||
本文从《概率论》教科书的随机变量定义出发,分析了《随机过程》教科书中随机游走定义的基本概念错误,并基于《概率论》教科书中的概率定义及基本概念,重新定义了随机游走。
一、引言
随机游走(Random Walk)是随机过程学科中用于描述动态随机现象的一种基本随机过程,其它重要的随机过程都可由它构造出来,随机游走不仅在随机过程理论中占有相当重要的地位,而且也是自然科学、工程技术和社会科学研究动态随机现象的重要数学工具。液体中悬浮微粒的布朗运动、光纤陀螺中的随机游走误差和股票市场中的价格波动等随机现象均可用随机游走模型进行描述。
二、随机变量定义
随机变量是概率论中一个极为重要的基本概念,也是研究随机现象的基本工具。引入随机变量的主要目的是:把随机试验的结果数量化,将随机事件的结果映射为实数,这样就可以利用数学分析方法来研究随机现象的统计规律。
随机变量的定义涉及随机试验、样本点和样本空间三个基本概念。
随机试验是指人们对随机现象进行的观察或观测,随机试验具有以下3个特征:
(1)可重复性:在相同条件下可重复进行;
(2)多结果性:试验结果不止一个,但所有可能的结果都是事先明确可知的;
(3)不确定性:每次试验之前不能确定会出现哪一个结果,但可以肯定会出现上述所有可能结果中的一个。
尽管一次随机试验将要出现的结果是不确定的,但其所有可能结果是明确的。我们把大量重复随机试验会出现的每一种可能的结果称为一个样本点,一般记为 ;全部样本点的集合称为样本空间,一般记为 。
定义:设随机试验的样本空间为 { },若 为定义在样本空间 上的单值实数函数,则称 为随机变量,简记为 。
随机变量的取值可以是连续的,也可以是离散的,根据随机变量取值的不同,可以分为连续型随机变量和离散型随机变量。
通常用大写英文字母 , , ,…来表示随机变量,用小写英文字母 , , ,…表示实数。如果随机试验的结果本省就是一个实数 ,即样本点 本身是一个实数,这时常定义 。
对于抛硬币试验,试验结果可能是硬币正面向上,也可能是硬币反面向上,即有两种可能的结果,而且只有这两种结果,事先可以明确。因此该试验所对应的样本空间 由 和 两个样本点构成,我们指定实数 和 分别与样本点 和 对应(图1),则随机变量可写成
图1随机变量定义示意图
从上述随机变量的定义可以看出,随机变量 的取值由样本点 决定,也就是说,随机变量 是样本点 的函数,即有 ,因此,随机变量的定义域为样本空间 。
随机变量实质上是一个定义在“随机试验所有可能结果集合”上的单值实数函数,随机变量的不同取值与随机试验的所有可能结果一一对应,随机变量的值随试验结果的不同而变化。从数学上讲,随机变量就是一个从随机试验结果的集合到实数集的映射。
三、离散随机变量的概率分布
我们描述一个随机变量时,不仅要说明它能取哪些值,而且还要研究其取值的统计规律性,指出它取这些值的概率。只有这样,才能真正完整地刻画一个随机变量。
概率定义:在相同条件下重复进行 次试验,其中事件 发生的次数为 ,如果随着试验次数 的增多,事件 发生的频率 会稳定在某个常数 附近,那么这个常数 就叫做事件 的概率。
设 ( )是随机变量 的所有可能取值,对每个取值 是其样本空间 上的一个事件,定义
为 的概率分布。
常用表格形式来表示离散随机变量 的概率分布:
由概率定义, 必然满足
随机变量的引入,使随机试验中的各种事件可通过随机变量的关系式表达出来,对随机现象统计规律的研究,就由对事件及事件概率的研究转化为对随机变量及其取值规律的研究,使人们可利用数学分析的方法对随机试验的结果进行广泛而深入的研究。
四、随机变量应用问题
以抛硬币试验为例,说明随机变量在实际应用中经常出现的概念错误。
假设抛硬币试验次数为 ,若用随机变量 表示硬币正面出现的结果, 表示反面出现的结果,如果正面( )和反面( )出现的次数分别为 和 ,根据概率定义, 次抛硬币试验中正、反面出现的概率分别为
则抛硬币试验随机变量 的概率分布可表示为
从随机变量和概率分布的定义可以看出,随机变量 表示的是试验次数 充分大时,抛硬币试验结果中出现正面向上和反面向上的事件及概率分布。
根据随机变量定义, 和 是指 次抛硬币试验结果分别出现正、反面向上事件的可能性,因此,随机变量 是一个统计变量, 和 不能用来描述单次抛硬币(试验次数 )时的结果及概率分布。
由于随机变量定义及概念的抽象性和复杂性,《随机过程》教课书在定义随机游走时,出现了用随机变量 来表示每一次抛硬币试验结果的基本概念错误。
五、随机游走定义中的概念错误分析
连续抛投均匀硬币,记录结果:
设为独立同分布随机变量, ,定义
为简单对称随机游走。
从上述随机游走定义可以看出, , ,……, 是连续 次抛硬币后的 个样本值,虽然我们事前无法预测每个样本值 ( )究竟是 (正面)还是 (反面),但是根据概率定义,当次数 充分大时,这 个样本值中出现 和 事件的频率会趋于 (图2)。
图2 抛硬币试验结果及概率计算方法
随机变量 是一个统计量,其取值代表样本空间 上的一个事件。对于 次抛硬币试验,随机变量 描述的是 充分大时, 个样本值( , ,……, )出现 和 的事件及概率分布。
但是,随机游走定义却用随机变量 来描述连续抛硬币试验中每个样本值 ( )的取值及概率分布,混淆了随机变量与随机试验样本值的定义域和值域。
如果将抛硬币试验结果的每个样本值 ( )当作随机变量,并假设 ,则表示在连续抛硬币试验过程中,每次抛出硬币后,硬币都会一分为二,出现半个硬币正面向上和半个硬币反面向上的荒谬结果。
六、重新定义随机游走
连续抛投均匀硬币,记录结果:
, ,……,
若 , ,……, 中出现 和 事件的概率均为 ,则定义
为简单对称随机游走。
从新的随机游走定义可以看出,当抛硬币试验的次数 充分大时,试验结果会呈现出正面和反面各一半的统计分布规律,与《概率论》教科书中的概率和随机变量定义及基本概念完全相符。
七、结论
《随机过程》教科书中的随机游走定义不仅为随机过程学科提供了将质点位移假设为随机变量的错误研究方法,而且也为自然科学、工程技术和社会科学提供了错误的动态随机现象研究方法及理论,并导致数理金融学产生严重的范式危机。《随机过程》教科书中的随机游走理论完全建立在错误的随机变量假设基础之上,随机过程学科因此将面临重大范式变革并产生一系列新的重大发现,新的随机游走研究方法及理论将会推翻并替代现有《随机过程》教科书内容,从而把自然科学、工程技术和社会科学对动态随机现象的认识提高到一个崭新的水平,引发一场持久广泛的科学革命,为中国的随机过程学科进入世界一流前列提供了千载难逢的历史性发展机遇。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 09:47
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社