|
Kegg通路或者GO本体论富集分析是基因功能注释最常见的分析,结果可以以多种形式展示,最常用的包括:条形图/bar图,气泡图/dot图等,其中气泡图输入数据一般包括以下4个维度的信息:
名字,富集倍数(或者gene ratio),P值,基因count。
例如:
pathway | enrichment | pvalue | count |
RNA transport | 4.807258641 | 1.56E-05 | 15 |
Epstein-Barr virus infection | 4.569261748 | 2.70E-05 | 16 |
HTLV-I infection | 3.814616521 | 0.000153244 | 17 |
Tuberculosis | 3.454180941 | 0.000351414 | 13 |
MAPK signaling pathway | 3.378131581 | 0.000418667 | 16 |
Neurotrophin signaling pathway | 3.212102971 | 0.000613617 | 10 |
Long-term potentiation | 3.000035266 | 0.000999919 | 7 |
Dopaminergic synapse | 2.967026455 | 0.001078881 | 10 |
Endocytosis | 2.841316731 | 0.001441064 | 15 |
Herpes simplex infection | 2.775219173 | 0.001677957 | 12 |
4维分析结果
做出来的例图如下(微生信平台免费在线做气泡图)
富集气泡图
该图包含的4维信息有:
1, Y轴的通路名(pathway,结果表格的第一列)
2, X轴的富集倍数(enrichment,结果表格的第二列)
3, 点的颜色(P值,结果表格的第三列)
4, 点的大小(count,该通路中包含的基因与输入基因列表交集的基因数)。
其中基因的信息就丢失了,那么我们能否将基因的信息也加入到图中呢?答案是肯定的!
让我们先来看看5维的分析结果,以clusterProfiler结果为例:
Description | GeneRatio | pvalue | geneID | Count |
Circadian rhythm | 0.014085 | 0.010497623 | RORA/RORB | 2 |
NOD-like receptor signaling pathway | 0.028169 | 0.03303255 | CASP8/TRIP6/MAPK8/CASP1 | 4 |
PPAR signaling pathway | 0.028169 | 0.008761306 | CD36/AQP7/LPL/CYP4A11 | 4 |
Viral myocarditis | 0.028169 | 0.009484362 | CASP8/MYH7/SGCB/SGCD | 4 |
Hypertrophic cardiomyopathy (HCM) | 0.042254 | 0.014532337 | MYH7/MYL2/MYL3/SGCB/SGCD/SLC8A1 | 6 |
Dilated cardiomyopathy | 0.042254 | 0.020924238 | MYH7/MYL2/MYL3/SGCB/SGCD/SLC8A1 | 6 |
Osteoclast differentiation | 0.049296 | 0.034284302 | LILRB5/MAPK8/FHL2/FCGR1A/IFNGR2/FOS/LILRB3 | 7 |
Phagosome | 0.049296 | 0.018180176 | TUBA3D/THBS4/SFTPD/CD36/FCGR1A/TUBA3E/DYNC1I1 | 7 |
Huntington's disease | 0.056338 | 0.001736229 | TBPL1/CASP8/VDAC3/CREB5/PPID/CLTB/NDUFA12/GRIN2B | 8 |
5维分析结果
根据这里的基因,我们可以在气泡图的基础上,添加一个基因维度,列出基因名字。若下图所示(瞬间眼前一亮有没有)
升级版的5维富集气泡图
该图左侧为基因,右侧为常规的气泡图。
包含的5维信息有:
1. Y轴的通路名(pathway,结果表格的第一列)
2. X轴的基因ratio(gene ratio,结果表格的第二列)
3. 点的颜色(P值,结果表格的第三列)
4. 基因名字(结果表格的第四列,图中左侧的桑吉图,连线表示隶属关系)
5. 点的大小(count,结果表格的第五列)
秉承一贯简洁的作用,微生信平台支持直接输入数据,就可以做出来这张桑吉气泡图,尝鲜版,赶紧试试吧!
微生信云平台 注册用户40000 引用415
微生信云平台(http://www.bioinformatics.com.cn)以160多款在线作图、在线数据分析工具为基本方式,致力于0代码分析数据,0代码展示数据结果,帮助生命科学、医学等领域的40000多名科研工作者更便捷地分析数据,了解数据,挖掘数据背后的生物医学意义,助力发高分文章,促进知识传播。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-27 08:31
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社