lijiankou的个人博客分享 http://blog.sciencenet.cn/u/lijiankou

博文

主成分分析和核函数

已有 4999 次阅读 2013-6-16 22:26 |个人分类:机器学习|系统分类:科研笔记| PCA

主成分分析和核函数

主成分分析(PCA)的主要作用是降低数据的维度,提取其主要特征,因为现实中很多数据都是很稀疏的,通过提取主要特征过滤噪音发现其潜在的规律;核函数表示了两个数据之间的相似性。那么这两者之间存在什么样的关系?直观上理解,PCA和核侧重的是两个相反的方向,下面给出解释。

考虑下面的高斯核,

$k(x,y) = exp(-\frac{1}{2}\sum_{j = 1}^{D}\frac{1}{\sigma^2_j}(x_j - y_j)^2)$ ,x,y代表了两个数据点,j 代表了数据的不同特征,D是特征数

此时协方差矩阵 $\sum$ 为对角矩阵,当 $\sum$ 不是对角矩阵的时候,可以通过相似变换到一个对角矩阵。

由以上可知,如果 $\sigma_j = \infty$ ,那么相应的维度等于0,从而可以忽略掉,因为加上一个0不会改变原来的值,我们更关心方差较小的那些特征。

另一方面,从PCA的角度考虑,如果 $\sigma_j = \infty$ ,说明数据在该特征上区分度大,该特征就是数据的主要特征,我们希望保留该特征,对于方差较小的特征,即区分度不大(数据基本相似)的特征可以忽略掉。

从以上分析可以看出,PCA关注的是区分度,差异性,而Kernel关注的是相似度,PCA最希望保留的特征恰恰是kernel可以忽略的,而kernel保留的,很可能被PCA忽略掉了。

需要注意的是,我们上面考虑的是一种极端的情况,方差是无穷大,真实数据方差不会是无穷大,我们降维以后,数据的相似性也不会是0,被忽略掉的特征的相似性也不完全相同。上面的极端例子只是为了说明PCA和核函数侧重的是数据的两个方面,一个侧重差异性,另一个侧重相似性。





https://blog.sciencenet.cn/blog-520608-700128.html

上一篇:信息熵
下一篇:极大似然估计和贝叶斯估计
收藏 IP: 124.16.137.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-23 19:53

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部