||
【英文原文地址:http://blog.sciencenet.cn/blog-1565-666599.html 】
前两篇博文讨论了有关基础之后,我们现在准备讨论随机过程真正实用的部分。
我们从随机序列(Random Sequence)开始。$...X_{1}, X_{2}, X_{3}, ...,X_{i},...,X_{t},X_{t+1},...$就是个随机序列,是由一系列随机变量构成的序列;每一个随机变量都编了号(indexed),如构成下标的整数 i= . . . , 1, 2, . . . ,t, t+1, . .. 所示。
如果我们主要考虑从第1个到第t个随机变量,我们用联合概率密度函数$p(x_{1}, x_{2}, x_{3}, ...x_{t})$来描述其概率分布;用一个t维期望矢量$[E(X_{i})]$来描述其期望;用t乘t协方差矩阵$[\sigma_{ij}]$来描述其协方差,其中 $\sigma_{ij}$表示$X_{i}$ 与$X_{j}$之间的协方差(i=j的时候,$\sigma_{ij}$就是$X_{i}$的方差了)。易知,$[\sigma_{ij}]$的第一行元素是$\sigma_{11},\sigma_{12},\sigma_{13},...,\sigma_{1t}$。
(如果以上内容看起来并不浅显,你需要倒回到教程(1)再读一下。)
然而,我们这里关于协方差部分将使用与传统有点不同的术语。我们将使用相关序列(Correlation Sequence)来描述随机变量之间的相关性,对于随机变量$X_{i}$,其相对应的相关序列标记为$x_{ij}$ , j=1,2, . . .t。使用这种标记的理由如下:
通常,随机变量$X_{i}$本身就是个矢量,而协方差被用来描述这个矢量的各个分量之间的相关性。因此,对于依时间先后顺序出现的各随机变量的相互关系,我们则用相关系数描述。为避免混淆,我们仅仅将“协方差”用于处于同一时刻的某个随机变量的各分量之间。但是,我们必须强调从数学上看,这两种二阶矩描述的性质并无差别。除了计算上的考虑,就概念而言,跟随机序列打交道所需要的知识,教程(1)已经完全包含了。
由于牵涉到针对时间的运算,我们往往要考虑成千上万个时刻。与一个1000乘1000的矩阵或者有1000个随机变量的概率密度函数打交道,最好也就是个郁闷,时常根本搞不掂。我们需要考虑一些可以简化问题的特殊情况。最狠的简化是独立随机序列,即
$ p(x_{1},... x_{t})=p(x_{1})p(x_{2})...p(x_{t})$ (1)
通俗点说,这种序列叫做白噪声(white noise)序列。进而言之,如果$p(x_{1})=p(x_{2})= . . . = p(x_{t})$,我们称之平稳白噪声(stationary white noise)序列(注1),也可以叫做独立同分布序列((independent and identically distributed Sequence,简记为 i.i.d. Sequence)。
通常来说,i.i.d这个假设太苛严了,实际应用中,大多数序列都达不到。因此,我们介绍更复杂点的马尔科夫假设 (Markov Assumption) –
武林外传中,佟湘玉说:"我从当初就不应该嫁过来,如果我不嫁过来,我的夫君也不会死,如果我的夫君不死,我就不会流落到这么一个伤心的地方.........",这种说法就体现了马尔科夫的假设:现在这一刻的状态决定于上一刻的状态,而下一刻则由现在这一刻决定。数学上,我们将马尔科夫的假设描述为
$p(x_{t+1}|x_{t},x_{t-1}...,x_{1})=p(x_{t+1}|x_{t})$ , 对所有t成立 (2)
类似方程(1), 有t个变量的函数$p(x_{1},,x_{t})$马上就可以简化为一系列有两个变量的函数的乘积,即
$p(x_{t},x_{t-1},...,x_{1})=p(x_{t}|x_{t-1})p(x_{t-1}|x_{t-2})...p(x_{2}|x_{1})p(x_{1})$ (3)
当然,我们可以觉得马尔科夫的假设不现实,因为为什么当前时刻的$X_{t}$只决定于刚刚过去的(t-1)时刻的$X_{t-1}$而不是更往前的时间点呢?比如,为什么不可以是$X_{t-2}$呢?理论上,这个困难极易克服,稍加思考,我们定义一个新的随机变量:
$Y_{t}=[X_{t},X_{t-1}]$ (4)
$Y_{t}$就成为了一个马尔科夫序列。而且,任何只依赖有限时间范围的“过去”的序列,都可以转成马尔科夫序列。这也说明为什么有大量的文献都是研究马尔科夫过程的。当然,从计算量而言,这样的分析只是转换了标记方法。计算的简化必须另外处理。特别指出,我们在下一篇文章将会看到,一个非常容易计算和分析的随机过程-高斯马尔科夫序列。在实际处理马尔科夫序列的问题上,这种序列有非常重要的地位。
同时,我们不厌其烦地强调:
(1)一个随机序列就仅是一系列编了号的随机变量的集合而已。(它们的性质,教程(1)都包含了)。
(2)马尔科夫序列很大程度上足以对付依赖有限久远的过去的随机现象。
(3)“高斯型”,“平稳”,“马尔科夫”,“独立同分布”等等,只是些修饰限定的说法,主要是用来限定一些随机过程,以便其好表示,好计算。
为了测一下你对这篇博文的理解,这里有个练习:“有一个系统,它的输出(也许是矢量)是一个非高斯的马尔科夫随机序列,其协方差矩阵有非零的非对角上的元素...—有感觉吗?”
读完这篇文章,我们就直接进入连续时间的随机过程了,除了需要教程(2)关于连续时间的说明,不需要更多的新概念。
注1. 我们将进一步区分“宽平稳的”和“严平稳的”。前者只依赖于对于i和j不同的随机变量的协方差$\sigma _{ij}$的性质,而后者则要依靠下标不同的随机变量之间所有的概率关系的性质。
教程链接:
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 16:46
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社