博文

R语言：聚类分析hclust

已有 13540 次阅读 2018-12-8 21:06 |个人分类:R|系统分类:科研笔记

# 生成测试数据
# 产生0-1之间均匀分布Uniform Distribution的数值
x = runif(10)
y = runif(10)
# 得到2维的数组：按列合并
S = cbind(x,y)
# 赋予名称，便于识别分类：生成Name1-Name10的系列名赋予数组行名
rownames(S) = paste("Name",1:10,"")

# 数值计算距离
out.dist=dist(S,method="euclidean")
# 注释：在聚类中求两点的距离有：
# 1，绝对距离：manhattan
# 2，欧氏距离：euclidean 默认
# 3，闵科夫斯基距离：minkowski
# 4，切比雪夫距离：chebyshev
# 5，马氏距离：mahalanobis
# 6，蓝氏距离：canberra

# 根据距离聚类
out.hclust=hclust(out.dist,method="complete")
# 注释：聚类中集合之间的距离：
# 1，类平均法：average
# 2，重心法：centroid
# 3，中间距离法:median
# 4，最长距离法：complete 默认
# 5，最短距离法：single
# 6，离差平方和法：ward
# 7，密度估计法：density

# 聚类结果绘图
plclust(out.hclust)

plclust有的版本不认别，可用plot代替

# 添加聚类分类矩形，如分为3类
rect.hclust(out.hclust, k=3)

# 得到分为3类的数值
out.id = cutree(out.hclust, k=3)
out.id
# 以矩阵的方式分辨名称对应的类
table(out.id,paste("Name",1:10,""))

直接返回的样本对应分组列表，可用table转换为矩阵格式

写在后面

为鼓励读者交流、快速解决科研困难，我们建立了“宏基因组”专业讨论群，目前己有国内外2400+ 一线科研人员加入。参与讨论，获得专业解答，欢迎分享此文至朋友圈，并扫码加主编好友带你入群，务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助，首先阅读《如何优雅的提问》学习解决问题思路，仍末解决群内讨论，问题不私聊，帮助同行。

学习扩增子、宏基因组科研思路和分析实战，关注“宏基因组”

点击阅读原文，跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA

转载本文请联系原作者获取授权，同时请注明本文来自刘永鑫科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3334560-1150586.html

上一篇：Nature Method：DEMIC——使用宏基因组数据预测细菌的生长速率
下一篇：R语言：生成正态分布数据生成--rnorm,dnorm,pnorm,qnorm

收藏 IP: 210.75.224.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

刘永鑫

扫一扫，分享此博文

woodcorpse的个人博客分享 http://blog.sciencenet.cn/u/woodcorpse

博文

R语言：聚类分析hclust

猜你喜欢

写在后面

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

刘永鑫

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

woodcorpse的个人博客分享 http://blog.sciencenet.cn/u/woodcorpse

博文

R语言：聚类分析hclust

猜你喜欢

写在后面

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

刘永鑫

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

该博文允许注册用户评论请点击登录评论 (0 个评论)