|||
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome
作者:小丫 来源:嘉因
《哪个蛋白质调控我感兴趣的基因?怎样筛选?基于分析或实验的可行方案V2.1》一文讲了找上游转录因子的策略:
Plan A:基于大量ChIP-seq公共数据挖掘
Plan B:motif分析预测
Plan C:ATAC-seq结合motif分析
motif系列答疑帖一步步帮你实现了Plan B
去哪找motif?
这段DNA上有我关心的motif吗?
motif scan结果怎样看?
motif结果怎样展示到文章里?
ChIP系列带你实现Plan A,下个系列解决Plan C。
原理
在线快速查看结果
局限性
速查表
从哪里下载数据
怎样批量处理数据
怎样展示结果
本文讲1234,下一篇讲567。
1. 原理
原理很简单,下图一目了然。做一个ChIP-seq实验能找到一个转录因子调控的靶基因,成百上千个ChIP-seq放在一起,就能找到任意一个基因被哪些转录因子调控。
2. 在线快速查看结果的两种方法
方法一
用Cistrome data browser: a data portal for ChIP-Seq and chromatin accessibility data in human and mouse. Nucleic Acids Res 2016; Oct 26.
感谢Dr. Mei 在本文撰写中提供的帮助。推荐另一个非常好用的工具,出自同一作者:去TCGA看表型,来CistromeCancer挖机制 | RNA-seq和ChIP-seq的完美结合
Cistrome Data Browser,http://cistrome.org/db,收集了GEO和ENCODE里人和小鼠的ChIP-seq和DNase/ATAC-seq数据,共38680套,每天还在跑新数据、上传。
如果您心中已经有了几个目标转录因子,想找ChIP-seq数据check一下;或者想挨个查看您关心的细胞类型里的转录因子,那就在线查看每个转录因子在你的基因附近的ChIP-seq信号。
具体查看方法:
例如搜索kidney,选择Homo sapions,列出人的各种factor的数据,点击Results条目查看详情。
点击右侧的WashU Browser或UCSC Browser就能查看结合信号
这是UCSC Browser的效果,黑色的瘦瘦高高的peak就代表这个转录因子在这个位置有结合信号。
如果想同时查看多个转录因子,就在条目左边的小方块里打个勾。点击页面最下方的WashU Browser或UCSC Browser,前者更快。
WashU Browser的展示效果更美,左侧是sample信息,每行信号下面对应显示peak的位置,不用肉眼再去判断。
方法二
ENCODE,https://www.encodeproject.org,产生了大量高质量的ChIP-seq数据。
新来的小伙伴儿可能要先看下面的视频了解ENCODE
4个物种ChIP-seq数量:
其中转录因子数量:
选择ChIP-seq、transcription factor,Homo sapiens,在右下角的results栏里,点击感兴趣的细胞系右侧的数字。
点击Visualize,选择hg38。
最多能添加100套数据到UCSC genome browser,查看某段DNA上的peak分布。鼠标移到感兴趣的track,出现sample信息。
3. 局限性
方法一的局限性:
用肉眼挨个看哪个track有peak,数据多了就要疯掉了。可以通过下篇介绍的456来解决。
只能看人和小鼠的数据;想看果蝇和线虫就用方法二;想看其他物种或ENCODE以外的果蝇、线虫数据,用下篇介绍的方法来解决。
Plan A本身的局限性:只能判断做过ChIP-seq的转录因子,如果关心的数据类型的ChIP-seq数据特别少,就很难遇到刚好调控你的基因的转录因子。如果没有阳性结果,就用本文开头提到的Plan B或Plan C解决。
方法二的局限性:
除了方法一的i和iii以外,最大的缺点就是不全,它只收录ENCODE相关项目的数据,其他ChIP-seq数据在这里看不到。它貌似是被拿来衬托方法一的。
4. 速查表:
您对哪种疾病感兴趣?哪个tissue?已经做了多少个ChIP-seq?
分别查看两个数据库里人tissue转录因子ChIP-seq数量,做个预判。
Cistrome(下面的数字仅作参考,更新到2016年1月,比目前总数少1万多):
956 | Blood |
847 | MammaryGland |
744 | None |
738 | Colon |
473 | Prostate |
409 | BoneMarrow |
373 | Embryo |
317 | Cervix |
253 | Lung |
189 | EmbryonicKidney |
161 | Liver |
87 | Brain |
86 | UmbilicalVein |
58 | Bone |
56 | Skin |
45 | Adipose |
35 | Foreskin |
31 | Endometrium |
27 | Cordblood |
19 | Kidney |
19 | FetalLiver |
18 | LymphNode |
15 | Breast |
12 | Cranial |
11 | Pancreas |
10 | ConnectiveTissue |
8 | Tonsil |
8 | SkeletalMuscle |
8 | EmbryonicLung |
7 | Muscle |
6 | Stomach |
6 | Heart |
6 | Coronaryarterysmoothmuscle |
6 | AdrenalGland |
5 | Esophagus |
4 | Ovary |
4 | ForearmSkinBiopsy |
3 | Headandneck |
3 | Bronchia |
3 | Artery |
2 | Uterus |
2 | UrinaryBladder |
2 | Thyroid |
2 | SpinalCord |
2 | PulmonaryArtery |
2 | PancreaticIslet |
2 | Gingiva |
2 | FetalSkin |
2 | FetalLung |
2 | Eye |
2 | Cerebellum |
1 | Testis |
1 | Spleen |
1 | Pancreaticductal |
1 | Epithelium |
ENCODE
792 | blood |
308 | liver |
236 | kidney |
236 | lung |
169 | mammary gland |
106 | uterus |
87 | embryo |
62 | large intestine |
60 | brain |
56 | epithelium |
41 | intestine |
39 | skin of body |
36 | connective tissue |
33 | musculature of body |
28 | stomach |
23 | limb |
22 | prostate gland |
22 | vasculature |
21 | blood vessel |
20 | esophagus |
20 | lymph node |
17 | pancreas |
14 | adipose tissue |
14 | vein |
12 | breast |
12 | spleen |
9 | gonad |
8 | vagina |
7 | bone element |
7 | heart |
7 | lymphoid tissue |
7 | nerve |
7 | testis |
6 | adrenal gland |
6 | penis |
5 | ovary |
5 | thyroid gland |
3 | artery |
3 | bodily fluid |
2 | bone marrow |
2 | eye |
1 | bronchus |
1 | extraembryonic component |
1 | mouth |
1 | placenta |
1 | spinal cord |
其他速查表:
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 13:09
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社