lovesvidon的个人博客分享 http://blog.sciencenet.cn/u/lovesvidon

博文

【ML系列】条件高斯分布(补充)

已有 8812 次阅读 2018-10-9 16:41 |系统分类:科研笔记

问题描述

已知两随机变量$X$和$Y$的联合高斯分布,求解在随机变量$X$的条件下,随机变量$Y$所服从的分布。假设该联合高斯分布为:

$$ \left[\begin{matrix} X\\ Y \end{matrix}\right] \sim \mathcal N \left(\left[ \begin{matrix} 0\\0 \end{matrix} \right], \left[ \begin{matrix} K_{XX} & K_{XY}\\ K_{YX} & K_{YY} \end{matrix} \right] \right) $$

求解$Y|X$所服从的分布


求解过程

我们可以用$\Sigma$表示协方差矩阵,将联合高斯分布写为向量概率密度函数一般形式,假设联合随机变量$S = \left[\begin{matrix} X & Y \end{matrix}\right]^T$,那么可以有:

$$ \begin{align} \mathcal N (S|\mu, \Sigma) & = v \exp \left( -\frac{1}{2} (S-\mu)^T\Sigma^{-1} (S-\mu) \right) \\ & = v \exp \left( -\frac{1}{2}( S^T \Sigma^{-1} S - S^T \Sigma^{-1} \mu - \mu^T \Sigma^{-1} S + \mu^T \Sigma^{-1} \mu) \right) \\ & = v \exp\left( -\frac{1}{2} S^T \Sigma^{-1} S + S^T\Sigma^{-1}\mu + C \right) \end{align} $$

在这个式子中,$C = \mu^T \Sigma^{-1} \mu$是一个常数。

依据条件概率的定义,我们有:

$$ P(Y|X) = \frac{P(X, Y)}{P(X)} $$

我们知道$P(X)$是独立与随机变量$Y$的,无论随机变量$Y$如何变化,只要随机变量$X$确定,那么$Y$将与联合分布一样同服从高斯分布,只不过该分布的均值和方差会随随机变量$X$的改变而改变。确定$Y|X$服从高斯分布后,可以将其写为:

$$ Y|X \sim \mathcal N (\mu_{Y|X}, K_{Y|X}) $$

同样地带入概率密度函数的一般形式,可以有:

$$ \begin{align} \mathcal N (Y|X; \mu, \Sigma) & = z \exp(-\frac{1}{2} Y^T \Sigma_{Y|X}^{-1} Y + Y^T \Sigma_{Y|X}^{-1} \mu_{Y|X} + C)\\ & = z \exp\left(-\frac{1}{2} \left[\begin{matrix}X \\ Y\end{matrix}\right]^T \left[ \begin{matrix} K_{XX} & K_{XY}\\ K_{YX} & K_{YY} \end{matrix} \right] ^{-1} \left[\begin{matrix}X\\ Y\end{matrix}\right] \right)\\ \end{align} $$

假设$\Lambda$矩阵为协方差矩阵的逆,可以表示为:

$$ \Lambda = \left[ \begin{matrix} K_{XX} & K_{XY}\\ K_{YX} & K_{YY} \end{matrix} \right] ^{-1} = \left[ \begin{matrix} \Lambda_{XX} & \Lambda_{XY}\\ \Lambda_{YX} & \Lambda_{YY} \end{matrix} \right] $$

将矩阵$\Lambda$带入到概率密度函数中,我们可以得到:

$$ \begin{align} \mathcal N (Y|X; \mu, \Sigma) & = z \exp(-\frac{1}{2} Y^T \Sigma_{Y|X}^{-1} Y + Y^T \Sigma_{Y|X}^{-1} \mu_{Y|X} + C)\\ & = z \exp\left(-\frac{1}{2} \left[\begin{matrix}X \\ Y\end{matrix}\right]^T \left[ \begin{matrix} \Lambda_{XX} & \Lambda_{XY}\\ \Lambda_{YX} & \Lambda_{YY} \end{matrix} \right] \left[\begin{matrix}X\\ Y\end{matrix}\right] \right)\\ & = z\exp\left( -\frac{1}{2} (Y^T \Lambda_{YY} Y + 2 Y^T \Lambda_{YX} X + X^T\Lambda_{XX} X) \right) \end{align} $$

依据该式可以得到如下的两个方程:

$$ \begin{align} & \Sigma_{Y|X}^{-1} = \Lambda_{YY}\\ & \Sigma_{Y|X}^{-1} \mu_{Y|X} = \Lambda_{YX} X\\ & C = X^T \Lambda_{XX} X \end{align}$$

再依据分块矩阵求逆公式[1],可以将$\Sigma_{Y|X}$与$\mu_{Y|X}$用已知量表示出来:

$$ \begin{align} & \Sigma_{Y|X} = K_{YY} - K_{YX}K_{XX}^{-1}K_{XY} \\ & \mu_{Y|X} = K_{YX} K_{XX}^{-1} X \end{align} $$


条件高斯分布在高斯过程中最重要的应用之一在于,如果已知协方差矩阵和历史数据X,那么就可以估计出Y的分布!


[1] Formula A.12 http://www.gaussianprocess.org/gpml/chapters/RWA.pdf

 



https://blog.sciencenet.cn/blog-3189881-1139867.html

上一篇:【ML系列】“非线性”二元分类
下一篇:【ML系列】从贝叶斯线性回归到高斯过程
收藏 IP: 210.45.251.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-24 00:35

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部