|||
【英语原文地址:http://blog.sciencenet.cn/blog-1565-671318.html 】
继续讨论卡曼滤波器,就有一个简单的公式要提及:贝叶斯准则(Bayes Rule)。这是由条件概率的定义可直接导出的公式。考虑两个随机变量x和y,从条件概率的定义出发,有:
$p(x|y)=\frac{p(x,y)}{p(y)}=\frac{p(y|x)}{p(y)} p(x)$ (1)
方程(1)中p(x)被称为先验概率(prior probability),是我们对随机变量X观察或者检测以前,根据以往经验就知道的,X的某个值x发生的概率;而另一方面,p(x|y)被称为后验概率(posterior probability),则是在观察了与X有关系的随机变量Y的某个值y以后,增加了对X随机变量的信息的了解,进而得到的X取某个值x的概率。因子$\frac{p(y|x)}{p(y)}$将先验概率p(x)化作了后验概率p(x|y)。因为可能牵涉一系列的函数运算,所以从计算化简角度而言,这个公式不算有用。因此,我们再次借助高斯密度函数。如果我们设$p(x)\sim N(\bar{X},M)$,$p(y|x)\sim N(hx,r)$,并且这里$\bar{X},M,h,r$都是已知值,则容易推知,$p(x|y)\sim N(\hat{X},P)$,其中,
$\hat{X}=\bar{X}+Phr^{-1}(y-h\bar{X})$ (2)
$P=M+Mh(hMh+r)^{-1}hM$ (3)
公式(2)和(3)可以看作是个一级卡曼滤波器(one stage Kalman filter)的作用的描述:通过将Y的检测值y代入方程,将关于X取x值的先验概率p(x)刷新为后验概率p(x|y),这个时候,$\hat{X}$就是对当前X的值x的估计,正好是方程(2)中计算出来的均值;而方程(3)中的方差P,正好是这个估计的可能偏差程度的衡量。我们说这里的高斯密度函数属于再生密度函数(reproducing density function)。其意思是说,先验概率的概率密度函数通过数学表达形式相同但参数不同的后验密度函数而“再生(reproducing)”了。
我们又可以将此处利用高斯密度函数进行贝叶斯估计而得的公式,当作一个线性系统来理解。(在教程(4)中,我们是将高斯马尔科夫过程当作线性系统来理解),即认为:
$Y=hX+V, V\sim N(0,r)$ (4)
此处,随机变量V代表了噪声,则Y就是通过一个线性系统(h是代表线性系统作用的一个参数),在有噪声V的情况下,对Y的观察,谓之"“y是对系统状态x的噪声下的观察”。矢量与矩阵的情况可以再任何一本标准教科书找到,此处不复述。读者可以参考我写的那本已有44年老的教科书,里面有推导;也可以看看我的博客blog.sciencenet.cnblog-1565-14253.html,介绍Kalman因其滤波器而获Draper奖的情况,这在工程学界,就是得Nobel 奖了。还可以参看blog.sciencenet.cnblog-1565-426323.html,是关于非线性滤波的简短课程,主要介绍从Kalman滤波器的直观解释,以及其向非线性滤波的延伸。
现在总结一下五篇博文的内容:
(1)概率论基础;
(2)测度论背后的理念以及仅仅运用概率的人需要知道的知识;
(3)从教程(1)出发,理解随机序列和随机过程;
(4)高斯马尔科夫线性系统;
(5)贝叶斯准则和卡曼估计。
请相信我46年教学经验,请参考这五篇博文,其中的知识支撑了我学术生涯最初的30年。最近25年我又考虑了将泊松分布和幂指数分布在线性离散事件中的应用。但是,这新的东西,怎么也达不到将高斯马尔科夫过程用于控制场合而达至的美与实用。休息一段时间,我再来谈谈这些新东西,再写些教程。
俗话说,“不经历风雨,怎么见彩虹?”你仍然要去认真攻读概率论和随机过程的正规教材,我这里只是给出个关于概率论和随机过程的整体直观的图像,帮助你学习而已。记住:天下没有免费的午餐!
教程链接:
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 16:25
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社