不积小流 , 无以成江海 !分享 http://blog.sciencenet.cn/u/xiongchaoliang

博文

R的clusterprofiler包做功能富集分析

已有 47649 次阅读 2016-4-19 19:45 |个人分类:【技术-软件】|系统分类:科研笔记

R真是生物信息数据分析的好帮手!这里我们学习一个用来做基因的GO和KEGG富集分析的R包。

clusterProfiler是Bioconductor的软件包,可以对基因集合或基因cluster进行功能聚类的统计分析和可视化。下载说明文档及安装包的地址为:

http://bioconductor.org/packages/release/bioc/html/clusterProfiler.html

clusterProfiler功能有以下几个方面:

功能富集分析

富集结果可视化


一、功能富集分析

1.GO富集分析

具体方法为:

enrichGO <- enrichGO(gene = gene, universe = names(geneList),organism = “human”, ont = “CC”, pvalueCutoff = 0.01, readable= TRUE)

该函数以geneList作为背景基因集,pvalue=0.01做为阈值,在GO 的CC分类上对基因集合进行富集分析。结果如下:


2.KEGG富集分析

所用函数为:

enrichKEGG <- enrichKEGG(gene = gene,organism = human, pvalueCutoff = 0.01, readable= TRUE)

该函数将基因集合以0.01为阈值进行KEGG的通路富集。结果如下:


另外,还可以对基因集合做DO(disease ontology)及Reactome pathway富集分析。具体函数可参加说明文档。

二、富集结果可视化

1 可以对KEGG的通路可视化以通路hsa04110为例,具体方法为:

require(pathview)

Hsa04110 <- pathview( gene.data = geneList, pathway.id = hsa04110, species=hsa, limit=list(gene = max(abs(geneList))),cpd=1)

可视化结果如下图:

2 对GO富集的结果可视化

具体方法为:

Barplot(ggo,drop=TRUE,showCategory = 12)

结果输出的是ggo富集记过中前12位的条目,如下图:


比较基因集合的生物学功能

利用compareCluster函数,可以自动计算每个基因集所富集的功能分类。具体方法为:

Compare <- compareCluster(geneCluster=geneset, fun=”enrichKEGG”)

Plot(Compare)


(转自:云生信)







https://blog.sciencenet.cn/blog-1509670-971259.html

上一篇:用R绘制饼图
下一篇:NPInter: Interaction between noncoding RNAs and biomolecular
收藏 IP: 159.226.43.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-27 06:06

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部