|
导读
做完通路分析,拿到几十条富集通路后,我们经常会寻找与“某关键词”相关的通路。例如与癌症相关的通路,与免疫相关的通路,与代谢相关的通路等。单纯从名字来看,面对几十甚至上百个英文通路名,一时半会分不清。通过利用KEGG官网的pathway二级分类对富集结果进行汇总,可以帮助我们快速找到感兴趣的通路,例如癌症相关通路,免疫相关通路等。
汇总原理
KEGG官网页面上给出了所有pathway的名字及其隶属关系,分成三个级别。
一级分类:共7个,分别是Metabolism(代谢)、Genetic Information Processing(遗传信息处理)、Environmental Information Processing(环境信息处理)、Cellular Processes(细胞过程)、Organismal Systems(有机系统)、Human Diseases(人类疾病)和Drug Development(药物开发)。
二级分类:在一级分类下面的分类,例如一级分类4. Cellular Processes下面
包括5个二级分类:
4.1 Transport and catabolism(运输与分解代谢)
4.2 Cell growth and death(细胞生长与死亡)
4.3 Cellular community – eukaryotes(细胞群落-真核)
4.4 Cellular community – prokaryotes(细胞群落-真核)
4.5Cell motility(细胞运动性)
三级分类:二级分类下面的分类,例如二级分类4.5 Cell motility下面包括5个三级分类:
Bacterial chemotaxis - 细菌趋化性
Flagellar assembly - 鞭毛组装
Motor proteins - 运动蛋白
Cytoskeleton in muscle cells - 肌细胞的细胞骨架
Regulation of actin cytoskeleton - 肌动蛋白细胞骨架的调控
我们富集分析的结果一般都是三级分类,因此使用二级分类对三级分类进行汇总,可以快速找到相关的通路。
1, 打开绘图页面
http://www.bioinformatics.com.cn/plot_basic_pathway_enrichment_second_class_summary_bar_plot_206
2,示例数据
点击图片上方的示例数据,下载,并使用excel打开。
示例数据(仅供参考)包括两列:
第1列:富集的pathway通路名字;
第2列:映射到该通路的基因列表,以/分割
3,输入检查
Ctrl+A选中示例数据,Ctrl+C拷贝,Ctrl+V粘贴到输入框。
然后使用输入框下面的“输入检查”按钮先对输入数据进行检查。若检查不通过,请根据检查提示重复【修改-输入检查】步骤,直到检查通过(如下图所示),然后可以继续往下进行。
注:输入检查是新加功能,它会根据不同模块的输入要求,逐行逐列检查输入数据,并给出提示,确保数据符合模块要求。
4,参数选择
图片大小:图片宽度,图片高度
字体和位置:通路名字大小,bar上数字字体大小,二级分类字体大小等。X轴最大值,留空则后台自动设置
颜色:设置了前6类的颜色(一般不包括drug development分类)
字体:Times New Roman和Arial字体
5,提交出图
检查通过,并且参数选好后,点击“提交”按钮,约3s后,会在页面上呈现KEGG通路二级汇总图预览。我们提供了pdf,svg两种矢量图,png,tiff两种标量图供大家下载使用。其中矢量图可以使用acrobat illustrator进行编辑、组图等。同时提供了一级、二级、三级通路汇总表格,以及输入中与KEGG官网名字不一样的通路名列表。
图中:左侧黑色粗体为一级分类名,共6个(去掉了Drug Development),其余为二级分类名,同一个一级分类下的所有二级分类名使用相同颜色显示。右侧条形为映射到该二级分类的基因数(汇总,去重后的基因数)。
注1:由于不同富集软件使用的KEGG库不太一样,因此,会输出未分类的通路,请根据KEGG官网页面修改后,重新出图。
注2:若输入的通路未汇总到某一级分类中,则该一级分类不在图中展示
汇总表包括7列:
Class I:一级分类名
Class II:二级分类名
Class III:三级分类名
Class III genes:三级分类基因
Class III gene count:三级分类基因数
Class II genes:二级分类基因
Class II gene count:二级分类基因数
微生信助力高分文章,用户194000,谷歌学术3500
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-26 03:57
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社