微生信分享 http://blog.sciencenet.cn/u/chinapubmed 0代码在线绘制160+科研图

博文

使用pathview在线渲染KEGG Pathway Map,给感兴趣的基因、化合物添加颜色

已有 517 次阅读 2024-11-3 11:52 |系统分类:科研笔记

导读:

通过将用户提供的基因表达定量数据,化合物定量数据映射并渲染到相关的KEGG通路图上,能够帮助我们直观且系统地研究基因、酶、化合物间的关系。

KEGG通路图简介

KEGG PATHWAY数据库是一系列手动绘制的图形图谱的集合,称为KEGG通路图,涵盖了代谢通路、信号通路、各种细胞过程和生物系统相关的通路,以及与人类疾病相关的扰动通路。通路图标识符为:物种缩写+5位的数字编号。例如hsa04064,表示“NF-kappa B signaling pathway - Homo sapiens (human)”,而mmu04064则表示“NF-kappa B signaling pathway - Mus musculus (house mouse)”。

                                            fig1.png 

 通路图上各个元素所代表的意义

 fig2.png 

1,打开作图URL

https://www.bioinformatics.com.cn/plot_basic_kegg_pathway_map_by_pathview_092

 fig3.png

2,示例数据

点击图片上方的示例数据,下载,并使用excel打开。

fig4.png

 输入数据包括两列:

第一列是该pathway中包含的基因/化合物ID。其中基因ID使用的是NCBI的entrez gene id,纯数字,例如3553为基因IL1B; interleukin 1 beta;化合物ID使用的是KEGG的compound ID,以C开头,例如C01245为“D-myo-肌醇 1,4,5-三磷酸盐”,药物ID使用的是KEGG的Drug ID,以D开头,例如D08877为“Briobacept (USAN)”。

第二列是每个基因/化合物对应的数值,可以是倍数变化(log2FC),或者其他任意有意义的数值。

其中首行首列为KEGG的Pathway ID,该ID可以在KEGG官网查询。例如这里的hsa04064为“NF-kappa B signaling pathway - Homo sapiens (human)”。必需指定物种,不能是map04064。

这些信息都可以在KEGG官网进行查询获得,例如https://www.genome.jp/dbget-bin/www_bget?pathway+hsa04064

 

fig5.png 

3,输入检查

示例数据:点击输入框下面的“示例”按钮,将载入示例数据。

真实数据:数据放在excel中,调整好后,Ctrl+A选中数据,Ctrl+C拷贝,Ctrl+V粘贴数据到输入框中。

fig6.png

然后使用输入框下面的“输入检查”按钮先对输入数据进行检查。若检查不通过,请根据检查提示重复【修改-输入检查】步骤,直到检查通过(如下图所示),然后可以继续选择参数。

fig7.png

注:输入检查是新加功能,它会根据不同模块的输入要求,逐行逐列检查输入数据,并给出提示,确保数据符合模块要求。

4,选择参数

fig8.png

 基因colorbar颜色:

提供了低颜色,中颜色和高颜色

基因colorbar数值范围

例如若基因的数值范围为[-2.5,3.5],若最小值和最大值都留空,则colorbar的范围就是[-4,4],即[负的绝对值最大的数向下取整,正的绝对值最大值向上取整]

若设定最小值和最大值,则根据所设定的值(默认取整)设置colorbar对应的数值范围。

化合物colorbar颜色

提供了低颜色,中颜色和高颜色

化合物colorbar数值范围

例如若化合物的数值范围为[-2.5,3.5],若最小值和最大值都留空,则colorbar的范围就是[-4,4],即[负的绝对值最大的数向下取整,正的绝对值最大值向上取整]

若设定最小值和最大值,则根据所设定的值(默认取整)设置colorbar对应的数值范围。

图例colorbar的位置

左上、左下、右上、右下

5,提交出图

检查通过,并且参数选好后,点击“提交”按钮,约15s后(后台需要从KEGG官网下载数据),会在页面上显示pathway map预览图。由于该图是在KEGG Pathway Map的基础上,对图片进行上色后获得的图,因此,仅提供了300 dpi png格式图片供下载。

fig9.png

在这张KEGG Pathway Map中,红色表示基因表达上调,绿色表示基因表达下调。黄色表示化合物/药物信号上调,蓝色表示化合物/药物信号下调。

当然,也可以只绘制表达数据(左图)或者只绘制化合物/代谢数据(右图)。

fig11.png

 pathview官方在线版(https://pathview.uncc.edu/),功能更多。

 pathview R包代码版

 fig12.png

微生信助力高分文章,用户220000+,谷歌学术4400+



https://blog.sciencenet.cn/blog-707141-1458304.html

上一篇:测序公司给的分析报告中为什么没有Ensembl GTF注释版本?
下一篇:生信入门第九课:PCA、相关性、热图和火山图及代码详解
收藏 IP: 114.86.41.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-13 09:02

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部