chinesehugh的个人博客分享 http://blog.sciencenet.cn/u/chinesehugh

博文

[转载]三文读懂PCA和PCoA

已有 5144 次阅读 2020-5-9 22:34 |系统分类:科研笔记|文章来源:转载

PCAPrincipal Components Analysis即主成分分析,也称主分量分析或主成分回归分析法,首先利用线性变换,将数据变换到一个新的坐标系统中然后再利用降维的思想,使得任何数据投影的第一大方差在第一个坐标称为第一主成分上,第二大方差在第二个坐标第二主成分上。这种降维的思想首先减少数据集的维数,同时还保持数据集的对方差贡献最大的特征,最终使数据直观呈现在二维坐标系。

PCoAPrincipal Co-ordinates Analysis即主坐标分析co-ordinate具有“统筹”的意思,即系统全面地筹划安排),可呈现研究数据相似性或差异性的可视化坐标,是一种非约束性的数据降维分析方法,可用来研究样本群落组成的相似性或相异性。它与PCA类似,通过一系列的特征值和特征向量进行排序后,选择主要排在前几位的特征值,找到距离矩阵中最主要的坐标,结果是数据矩阵的一个旋转,它没有改变样本点之间的相互位置关系,只是改变了坐标系统。两者的区别为PCA是基于样本的相似系数矩阵如欧式距离来寻找主成分,而PCoA是基于距离矩阵欧式距离以外的其他距离来寻找主坐标。

https://mp.weixin.qq.com/s?src=11&timestamp=1589034117&ver=2328&signature=ML24aOEUo8oFXJcdstGfDK3F6M6Zb7xJMD3QpRyJjdJ*AEDMwSNBUwg5fBmhArZWjL18istknySqcJ--06xVAOF2ziM5TvixzWTGKUpATXv62zCx5qUt-gFj8CM7IZU*&new=1

此链接为第三篇,最难懂的。通过此链接先看第一、二篇,比较好懂(也有一些地方不太好理解),或许写得也有一些小问题,不过是目前找到的最全面的讲解PCA和PCoA的文章。



https://blog.sciencenet.cn/blog-3431904-1232443.html

上一篇:[转载]全转录组数据挖掘思路及RNA测序十年发展历程
下一篇:[转载]新鲜核桃的青皮如何去除?
收藏 IP: 111.36.136.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-16 15:52

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部