微生信分享 http://blog.sciencenet.cn/u/chinapubmed 0代码在线绘制160+科研图

博文

根据KEGG官网,将pathway分析结果进行二级分类汇总,轻松找到感兴趣通路

已有 234 次阅读 2024-7-15 10:58 |系统分类:科研笔记

导读

做完通路分析,拿到几十条富集通路后,我们经常会寻找与“某关键词”相关的通路。例如与癌症相关的通路,与免疫相关的通路,与代谢相关的通路等。单纯从名字来看,面对几十甚至上百个英文通路名,一时半会分不清。通过利用KEGG官网的pathway二级分类对富集结果进行汇总,可以帮助我们快速找到感兴趣的通路,例如癌症相关通路,免疫相关通路等。fig1.png

 

汇总原理汇总原理.png

KEGG官网页面上给出了所有pathway的名字及其隶属关系,分成三个级别。

一级分类:共7个,分别是Metabolism(代谢)、Genetic Information Processing(遗传信息处理)、Environmental Information Processing(环境信息处理)、Cellular Processes(细胞过程)、Organismal Systems(有机系统)、Human Diseases(人类疾病)和Drug Development(药物开发)。

 fig2.png

二级分类:在一级分类下面的分类,例如一级分类4. Cellular Processes下面

包括5个二级分类:

4.1 Transport and catabolism(运输与分解代谢)

4.2 Cell growth and death(细胞生长与死亡)

4.3 Cellular community – eukaryotes(细胞群落-真核)

4.4 Cellular community – prokaryotes(细胞群落-真核)

4.5Cell motility(细胞运动性)

三级分类:二级分类下面的分类,例如二级分类4.5 Cell motility下面包括5个三级分类:

Bacterial chemotaxis - 细菌趋化性

Flagellar assembly - 鞭毛组装

Motor proteins - 运动蛋白

Cytoskeleton in muscle cells - 肌细胞的细胞骨架

Regulation of actin cytoskeleton - 肌动蛋白细胞骨架的调控

我们富集分析的结果一般都是三级分类,因此使用二级分类对三级分类进行汇总,可以快速找到相关的通路。

 1,     打开绘图页面

http://www.bioinformatics.com.cn/plot_basic_pathway_enrichment_second_class_summary_bar_plot_206

fig3.png

2,示例数据

点击图片上方的示例数据,下载,并使用excel打开。

fig4.png

示例数据(仅供参考)包括两列:

第1列:富集的pathway通路名字;

第2列:映射到该通路的基因列表,以/分割

3,输入检查

Ctrl+A选中示例数据,Ctrl+C拷贝,Ctrl+V粘贴到输入框。

fig5.png

然后使用输入框下面的“输入检查”按钮先对输入数据进行检查。若检查不通过,请根据检查提示重复【修改-输入检查】步骤,直到检查通过(如下图所示),然后可以继续往下进行。

注:输入检查是新加功能,它会根据不同模块的输入要求,逐行逐列检查输入数据,并给出提示,确保数据符合模块要求

对错.png

4,参数选择

图片大小:图片宽度,图片高度

字体和位置:通路名字大小,bar上数字字体大小,二级分类字体大小等。X轴最大值,留空则后台自动设置

颜色:设置了前6类的颜色(一般不包括drug development分类)

字体:Times New Roman和Arial字体

fig6.png

5,提交出图

检查通过,并且参数选好后,点击“提交”按钮,约3s后,会在页面上呈现KEGG通路二级汇总图预览。我们提供了pdf,svg两种矢量图,png,tiff两种标量图供大家下载使用。其中矢量图可以使用acrobat illustrator进行编辑、组图等。同时提供了一级、二级、三级通路汇总表格,以及输入中与KEGG官网名字不一样的通路名列表。  

fig7.png

 

图中:左侧黑色粗体为一级分类名,共6个(去掉了Drug Development),其余为二级分类名,同一个一级分类下的所有二级分类名使用相同颜色显示。右侧条形为映射到该二级分类的基因数(汇总,去重后的基因数)。

注1:由于不同富集软件使用的KEGG库不太一样,因此,会输出未分类的通路,请根据KEGG官网页面修改后,重新出图。

注2:若输入的通路未汇总到某一级分类中,则该一级分类不在图中展示

fig8.png

汇总表包括7列:

Class I:一级分类名

Class II:二级分类名

Class III:三级分类名

Class III genes:三级分类基因

Class III gene count:三级分类基因数

Class II genes:二级分类基因

Class II gene count:二级分类基因数

 

微生信助力高分文章,用户194000,谷歌学术3500



https://blog.sciencenet.cn/blog-707141-1442319.html

上一篇:棒棒糖图展示GO本体论富集分析结果
收藏 IP: 116.233.28.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-16 13:37

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部