woodcorpse的个人博客分享 http://blog.sciencenet.cn/u/woodcorpse

博文

R语言:聚类分析hclust

已有 90 次阅读 2018-12-8 21:06 |个人分类:R|系统分类:科研笔记

# 生成测试数据
# 产生0-1之间均匀分布Uniform Distribution的数值
x = runif(10)
y = runif(10)
# 得到2维的数组:按列合并
S = cbind(x,y)
# 赋予名称,便于识别分类:生成Name1-Name10的系列名赋予数组行名
rownames(S) = paste("Name",1:10,"")

# 数值计算距离
out.dist=dist(S,method="euclidean")
# 注释:在聚类中求两点的距离有:
# 1,绝对距离:manhattan
# 2,欧氏距离:euclidean 默认
# 3,闵科夫斯基距离:minkowski
# 4,切比雪夫距离:chebyshev
# 5,马氏距离:mahalanobis
# 6,蓝氏距离:canberra

# 根据距离聚类
out.hclust=hclust(out.dist,method="complete")
# 注释:聚类中集合之间的距离:
# 1,类平均法:average
# 2,重心法:centroid
# 3,中间距离法:median
# 4,最长距离法:complete 默认
# 5,最短距离法:single
# 6,离差平方和法:ward
# 7,密度估计法:density

# 聚类结果绘图
plclust(out.hclust)

plclust有的版本不认别,可用plot代替

image

# 添加聚类分类矩形,如分为3类
rect.hclust(out.hclust, k=3) 

image

# 得到分为3类的数值
out.id = cutree(out.hclust, k=3)
out.id
# 以矩阵的方式分辨名称对应的类
table(out.id,paste("Name",1:10,""))   

image
直接返回的样本对应分组列表,可用table转换为矩阵格式

猜你喜欢

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外2400+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
image

学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
image

image

点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA



http://blog.sciencenet.cn/blog-3334560-1150586.html

上一篇:Nature Method:DEMIC——使用宏基因组数据预测细菌的生长速率
下一篇:R语言:生成正态分布数据生成--rnorm,dnorm,pnorm,qnorm

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2018-12-19 17:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部