|
做完通路富集分析,拿到几十条富集通路后,我们经常会寻找与“某关键词”相关的通路。例如与癌症相关的通路,与免疫相关的通路,与代谢相关的通路等等。单纯从名字来看,面对几十甚至上百个英文通路名,一时半会还真分不清。今天,给大家带来一款实用的KEGG Pathway通路汇总小工具。使用这款工具,我们可以快速找到感兴趣的通路,例如癌症相关通路,免疫相关通路等,并最终汇总成一张美图。
汇总原理
KEGG: Kyoto Encyclopedia of Genes and Genomes
KEGG官网页面上给出了所有pathway的名字及其隶属关系,分成三个级别。
一级分类:共7个,分别是Metabolism(代谢)、Genetic Information Processing(遗传信息处理)、Environmental Information Processing(环境信息处理)、Cellular Processes(细胞过程)、Organismal Systems(有机系统)、Human Diseases(人类疾病)和Drug Development(药物开发)。
图1. 一级分类
二级分类:在一级分类下面的分类,例如一级分类Cellular Processes下面包括5个二级分类:Transport and catabolism、Cell growth and death、Cellular community – eukaryotes、Cellular community – eukaryotes和Cell motility。
三级分类:二级分类下面的分类,例如二级分类Cell motility下面包括3个三级分类:Bacterial chemotaxis、Flagellar assembly和Regulation of actin cytoskeleton。
我们富集分析的结果一般都是三级分类,因此使用二级分类对三级分类进行汇总,可以快速找到相关的通路。例如Cell growth and death(细胞生长与死亡)相关通路。
图2. 一、二、三级分类
1, 打开绘图页面
首先,使用浏览器(推荐chrome或者edge)打开KEGG Pathway二级分类汇总绘制页面。左侧为常见作图导航,中间为数据输入框和可选参数,右侧为描述和结果示例。也可以在搜索框中搜索pathway,找到绘图页面。
http://www.bioinformatics.com.cn/plot_basic_pathway_enrichment_second_class_summary_bar_plot_206
图3.可视化绘图页面
2,示例数据
点击右侧“示例数据”链接下载excel格式的示例数据。
图4. 输入数据示例
示例数据(仅供参考)包括两列:
第一列是富集的pathway通路名字;
第二列是【该富集通路中包含的基因】与【做富集分析时所输入的基因】的交集基因个数。
3,粘贴示例数据
直接拷贝示例数据中的AB两列数据,然后粘贴到输入框。
注意:不是拷贝excel文件,是拷贝excel文件里边的数据。另外粘贴到输入框后,格式乱了没关系,只要在excel中是整齐的就行。同时数据矩阵中不能有空的单元格,中文字符等。
图5. 必需输入
4,修改参数,并提交
我们设置了图片尺寸、文字大小、颜色、字体等参数,基本能满足日常绘图使用。如需更高级的定制,请联系我们。
图6.颜色、字体等可调参数
5,提交出图
粘贴好输入数据,调整好参数(重点是X轴最大值的参数)后,点击提交按钮,几秒钟后,会在页面右侧出现预览图。我们提供了4种图片格式供下载使用,两种矢量图(pdf,svg)和两种标量图(600 dpi tiff和300 dpi png),及汇总表格。
图7.预览与下载
结果说明
1)图中左侧黑色粗体为一级分类名,共6个(去掉了Drug Development),其余为二级分类名,同一级别的名字用相同颜色显示。右侧条形为隶属于该分类的基因数之和,可以很方便地看出二级分类名字及基因数。
2)由于不同的富集工具使用的名字略有不同,因此若存在与KEGG官网不一致的名字,请根据提示,调整后重新提交作图。
3)我们还提供了带有一级、二级及三级分类的汇总结果表格供下载。表格形式见图8。
图8. 汇总结果表格
没有预览就是没有出图,这时请参考示例数据,检查输入数据的格式。
遇到文字截断,需要修改字体、调整字体大小等,请参考用inkscape编辑svg矢量图
微生信助力高分文章,用户55000+,引用700
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-21 22:23
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社