|||
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome
作者:小丫 来源:嘉因
《点鼠标就能找启动子区的motif》,给出了7种从一段DNA上找某个motif的方法。前提是找到这个转录因子的motif文件,如果在JASPAR里查不到,就去footprintDB试试,它可以跟TRANSFAC媲美。
2014年paper原文是这样描述footprintDB和TRANSFAC的:
A survey of the included data sources, organisms and TF families was performed together with proprietary database TRANSFAC, finding that footprintDB has a similar coverage of multicellular organisms, while also containing bacterial regulatory data.
目前footprintDB收录了史上最全物种的转录因子和motif,每月更新。
http://floresta.eead.csic.es/footprintdb
包含8600个转录因子、12700个motif和27300个DNA binding sites。
包括所有物种,还单独列出了后生动物(果蝇、线虫等)和植物;
这么多数据库,统统收录进来。
footprintDB能解决哪些实际科研问题呢?
问题一:找某个转录因子的motif
回到开头的问题,用《点鼠标就能找启动子区的motif》里的方法,从一段DNA上找某个motif,前提是先找到这个转录因子的motif文件。
http://floresta.eead.csic.es/footprintdb/index.php?search_entries
以p53为例检索
搜到21个转录因子和12个motif
12个motif都是人和拟南芥的。转录因子非常保守,即使您感兴趣的物种里没有它的motif,您也可以借用相近物种p53的motif。
蓝字都带链接,点开就是motif信息。下面列出的是一个未被JASPAR收录的motif,只比JASPAR收录的motif少了个JASPAR 2018的链接,需要转换motif格式。点击Download下载TRANSFAC格式的motif,用meme自带的转换工具变成meme格式的motif,然后就可以用《点鼠标就能找启动子区的motif》里的方法三找靶基因了。
问题二:我关心的蛋白质不一定是转录因子,它有可能结合哪个motif
?
INPUT: a protein sequence of a putative DNA-binding protein
OUTPUT: a list of possibly recognized DNA motifs
问题三:这个motif可能被哪些转录因子结合?
INPUT: a DNA consensus motif or site
OUTPUT: a list of DNA-binding proteins (mainly TFs) predicted to bind a similar DNA motif
对后两个问题感兴趣的小伙伴,可自行前往footprintDB尝试。如果需要小丫写帖子讲解,请留言。
史上最全系列:
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 13:05
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社