|
今天是六一儿童节,祝宝宝们节日快乐。
KEGG是一个整合了基因、化合物、酶和系统功能的数据库,它利用图形来表征代谢通路,以及各种通路间的关系,使得研究者能够在系统层面了解所关注的代谢通路(pathway)。
KEGG通路图因其形式美观、容易理解等优点,在论文中经常出现,特别是标注感兴趣的基因/化合物后,结果更加清晰。
以小鼠MAPK signaling pathway为例,该通路的id为mmu04010。要将感兴趣的基因或者化合物标注颜色,我们可以直接在KEGG网站进行操作。
1, 打开通路对应的pathway图链接
https://www.genome.jp/pathway/mmu04010
其中左侧是功能区,用来搜索,上色等。
右侧为pathway图,网页版时该图为交互式的,即鼠标放在某元素上,会弹出相应的信息。
2, 寻找感兴趣的基因或者化合物
一般我们获得的都是gene symbol。例如,我们对Mknk2、Gadd45b、Map2k2、Igf1、Ptprr这5个基因比较感兴趣(例如差异表达)。我们可以搜索这5个基因对应的geneid(或者化合物id)。这里我们在左上角Search下面的输入框中输入Mknk2,点击GO按钮。
然后会在输入框下面显示所查询基因对应的geneid 17347(黄色背景所示),同时会在绘图区展示出该基因所在的位置,鼠标悬停在查询结果的17347上时,右侧图对应位置会高亮。这里每次只能查询1个,所以我们需要查询5次,以确定我们待标注基因的geneid,以备后续给图标注颜色使用。
17347 Mknk2
17873 Gadd45b
26396 Map2k2
16000 Igf1
19279 Ptprr
注意:这里搜索策略是文本匹配,因此可能会出现1对多的结果,这时需要仔细找到精确匹配结果。
当然,若有geneid,也可以使用ID search
3, 设置颜色
获得对应的id后,我们可以在txt编辑器中编辑颜色,每行一个,包括id和颜色两列,空格分隔。例如:
4, 标注颜色
点击Color右侧的“+”,拷贝步骤3整理好的结果,粘贴到输入框中,然后点击“Exec”按钮执行上色。
5, 下载
点击“Exec”按钮后,即可获得上色后的图,点击图上面的“Image file”即可下载标注好颜色的通路图。
注意:由于一个元素可能包含多个基因,或者1个基因出现在多个元素中,因此待标注的基因数可能与最终结果的个数不一致。
我们也可以使用多种颜色,支持RGB颜色,例如 #FF0000表示red,#0000FF表示blue等。但是需要注意颜色不能与名字颜色一致,例如名字颜色是黑色,那么标注黑色就不妥。
当然,我们也可以使用pathview R包来标注颜色。其原理是:KEGG pathway图是用KGML(KEGG Markup Language)语言存储的。一个pathway图对应有一个KGML文件。图上的元素可以在其对应的KGML文件中找到。因此,找到KGML中对应元素的位置信息,例如矩形元素包括x,y坐标及高度和长度,根据这4个信息即可为相应矩形渲染颜色。
在线标注vs本地标注。在线标注所使用的数据是最新的,而本地程序可能不是最新的(针对那些自行下载的KGML和pathway图),或者会因为网络问题标注失败。
微生信云平台 注册用户41000+ 引用447
微生信云平台(http://www.bioinformatics.com.cn)以160多款在线作图、在线数据分析为基本方式,致力于0代码分析科研数据,0代码展示数据结果,帮助生命科学、医学等领域的科研工作者更便捷地分析数据,了解数据,挖掘数据背后的生物医学意义,辅助科研,促进知识传播。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-26 23:48
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社