ChengyangWang的个人博客分享 http://blog.sciencenet.cn/u/ChengyangWang

博文

史上最全物种转录因子、motif数据库footprintDB

已有 17114 次阅读 2018-1-25 17:39 |个人分类:数据库|系统分类:科普集锦| footprintDB

 本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome

作者:小丫  来源:嘉因

点鼠标就能找启动子区的motif》,给出了7种从一段DNA上找某个motif的方法。前提是找到这个转录因子的motif文件,如果在JASPAR里查不到,就去footprintDB试试,它可以跟TRANSFAC媲美。




2014年paper原文是这样描述footprintDB和TRANSFAC的:


A survey of the included data sources, organisms and TF families was performed together with proprietary database TRANSFAC, finding that footprintDB has a similar coverage of multicellular organisms, while also containing bacterial regulatory data.  


目前footprintDB收录了史上最全物种的转录因子和motif,每月更新。

http://floresta.eead.csic.es/footprintdb


包含8600个转录因子、12700个motif和27300个DNA binding sites。

包括所有物种,还单独列出了后生动物(果蝇、线虫等)和植物


这么多数据库,统统收录进来。





footprintDB能解决哪些实际科研问题呢?



问题一:找某个转录因子的motif


回到开头的问题,用《点鼠标就能找启动子区的motif》里的方法,从一段DNA上找某个motif,前提是先找到这个转录因子的motif文件。


http://floresta.eead.csic.es/footprintdb/index.php?search_entries


以p53为例检索


搜到21个转录因子和12个motif



12个motif都是人和拟南芥的。转录因子非常保守,即使您感兴趣的物种里没有它的motif,您也可以借用相近物种p53的motif。


蓝字都带链接,点开就是motif信息。下面列出的是一个未被JASPAR收录的motif,只比JASPAR收录的motif少了个JASPAR 2018的链接,需要转换motif格式。点击Download下载TRANSFAC格式的motif,用meme自带的转换工具变成meme格式的motif,然后就可以用《点鼠标就能找启动子区的motif》里的方法三找靶基因了。


问题二:我关心的蛋白质不一定是转录因子,它有可能结合哪个motif



INPUT: a protein sequence of a putative DNA-binding protein


OUTPUT: a list of possibly recognized DNA motifs



问题三:这个motif可能被哪些转录因子结合


INPUT: a DNA consensus motif or site


OUTPUT: a list of DNA-binding proteins (mainly TFs) predicted to bind a similar DNA motif

对后两个问题感兴趣的小伙伴,可自行前往footprintDB尝试。如果需要小丫写帖子讲解,请留言。




史上最全系列:






https://blog.sciencenet.cn/blog-3372875-1096783.html

上一篇:non-coding区的SNP影响了转录?HaploReg视频
下一篇:找到了motif,怎样展示结果?
收藏 IP: 124.77.56.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-26 01:22

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部