evangelion39的个人博客分享 http://blog.sciencenet.cn/u/evangelion39

博文

染色质开放性——敲开蛋白结合之门

已有 23164 次阅读 2017-10-3 11:10 |系统分类:科研笔记

染色质开放性(chromatin accessibility)是指真核生物染色质DNA在核小体或转录因子等蛋白与其结合后,对其他蛋白能否再结合的开放程度。这一特性反映了染色质转录活跃程度,结合其他DNA修饰(如甲基化)信息,特定条件下的染色质开放性变化可以提供大量的基因表达调控信息,为各种蛋白结合新位点的发现指明方向。更有趣的是,染色质开放性变化往往是各种应激反应(stimulus response)、抗逆反应(stress response)或者发育阶段过渡(transition)发生时非常早期的细胞学事件。在癌症早期诊断和治疗,农作物逆境胁迫的早期防治等方面,染色质结构研究可以提供非常上游的宝贵信息。

检测染色质开放性的手段主要是足迹法(footprinting),即利用外来蛋白(如核酸酶,修饰酶等)处理细胞核,再利用酶切,电泳,测序等手段衡量这些蛋白与DNA的结合程度,以此来体现染色质开放性。测序未普及之前,酶切与电泳是足迹法的经典不二选择。而今测序技术越来越成熟,价格越来越合理,利用核酸酶处理配合二代测序成为了足迹法的主流。ATAC-seq(Assay for Transposase Accessible Chromatin with sequencing)便是其中新近的具备高灵敏度的一种方法。

如前所述,用于足迹法的外来蛋白主要是核酸酶,过去很长一段时间里用的是比较粗暴的DNase I,价格低廉,但需要较大量的起始材料。DNase I 主要切割核小体未占据的DNA区域,生成的片段测序之后获得的是染色质开放的区域。之后出现了MNase I,同样粗暴,但MNase I为外切酶,消化了开放区域后,测序获得的是当前状态下核小体或转录因子等占据的封闭区域。因此二者互为补充。ATAC-seq使用了Tn5转座酶,在开放区域跳转,边切割边加上接头,利用PCR技术富集开放区域的片段,因此灵敏度更高,甚至可以做单细胞分析。这也是目前ATAC-seq作为明星技术的重要原因。

当然,故事到这里不会结束。所有以核酸酶为基础的DNA足迹法都有一个致命缺陷:核酸切割的偏好性(Bias)。有研究指出,DNase I切割无核小体和转录因子结合的“裸”DNA时展现出强烈的偏好性,之前许多DNase I印记分析反映的更多的是切割偏好,而不是真实的蛋白结合情况。此外,植物材料由于其细胞结构的特殊性(主要是细胞壁的存在以及丰富的纤维素和多糖),获取细胞核用于足迹法分析本身就是一个挑战。植物中第一篇ATAC-seq分析的文章来自Bob Schmitz Lab,他们分离细胞核之后还必须通过流式细胞仪进行分选,否则即使是拟南芥幼苗这样纤维和多糖干扰并不十分突出的材料,粗制的细胞核也不能被Tn5转座酶充分处理。

现在,我们的工作是要在足迹法技术上做新的改进。MAPit(methyltransferase accessibility protocol for individual templates)应运而生。利用外源DNA甲基转移酶处理细胞核,染色质开放区域中的特定“C”位点可被甲基化,封闭区域中的相应“C”位点则不被甲基化,之后愉快地进行甲基化测序(Bisulfite sequencing),从而精确显示染色质的开放程度。这个技术有三大优点:

1. 使用DNA甲基化组来显示染色质开放性,避免了核酸酶的偏好性问题,且结果同时提供了DNA甲基化组和染色质开放性的信息,配合转录组测序(RNA-seq),可一次性组合出特定状态下全基因组的甲基化修饰、蛋白结合以及基因表达调控的复杂网络,是功能强大的复合型分析。

2. 基于二代测序(NGS)的甲基化测序结果中,经过PCR扩增,不同reads的序列比例大致反映了一个细胞群体中特定位点甲基化与否的比例。而三代测序(如PacBio)中每一条reads直接代表了一个DNA单分子(single molecule)的序列。因此通过甲基化测序显示的染色质开放性,可以根据reads的序列信息估计出细胞群体中某一特定区域开放程度的百分比,即首次实现对染色质开放性进行量化。而在传统的基于核酸酶的足迹法中,仅能通过reads的多少来判断一个细胞群体总体的染色质开放程度。对于某些早期变化或弱反应中仅有少量细胞染色质结构改变的情况,MAPit具有灵敏而精确的探测能力。

3. 对于植物材料而言,甲基转移酶反应需要的起始材料比DNase I少,而又无需经过ATAC-seq所必须的流式细胞分选。在动物细胞中MAPit已实现了单细胞实验。植物中我们也已成功开发了成熟的反应体系。

这一技术目前自然也存在缺点:

1. 测序价格较贵。由于细胞本底甲基化的存在,每一样品都需要无甲基转移酶处理的对照(即背景甲基化组信息)来精确评估染色质开放性。因此测序样品数量会加倍。同时由于对reads亦即测序深度(sequencing depth)的要求,全基因组reads平均覆盖(coverage)往往需要达到60甚至100以上才能看到以往不能发现的较小比例细胞中出现的开放区域。在测序成本有限的情况下,不做全基因组而是特定区域的MAPit分析是不错的选择。

2. 受外源甲基转移酶的选择限制。由于特定的甲基转移酶有特定的目标位点(植物中天然存在的目标位点为CG, CHG, CHH,前者本底甲基化水平高,后两者很低),这一位点序列在基因组中出现的频率就决定了MAPit的分辨率(resolution)。因此选择多种具有不同目标位点的甲基转移酶进行搭配使用,可大大提高MAPit的分辨率。


最后说一说MAPit的前世今生。最早使用DNA甲基转移酶进行染色质研究的是已故的领域内大牛Bob T. Simpson(1998-1999年NAR以及Method Mol Biol的一系列文章)。Simpson Lab使用酵母材料对染色质和核小体进行了系统的研究,2004年他所在的宾州州立大学在悼文中对此评价道:“During the early 1990s, Simpson's laboratory used yeast genetics to further explore chromatin function, resulting in what has been called "the first and best evidence of the role of nucleosome-positioning in the regulation of gene transcription and DNA replication in vivo."”

这位大牛遭遇意外不幸离世,时年65岁,也是学界一大损失。Mol Cell杂志也为此发文悼念。他的生平详见http://science.psu.edu/news-and-events/2004-news/Simpson4-2004.htm

当时甲基化转移酶的工作主要由时任博士后的Michael Kadde和Mai Xu完成,由于技术条件限制,最初的实验并不能涉及单分子水平,因此被称为MAP(the methyltransferase accessibility protocol)。Mike在成为PI之后又结合当时迅速发展的测序技术对甲基转移酶介导的DNA足迹法进行了优化,发展出了MAPit(2006年Nat Struct Mol Biol等),并开发了配套的分析软件MethylVeiwer。至今他手握两项相关专利。但鉴于当时测序费用高昂,以及测序深度的限制,Mike起初并未将MAPi应用于哺乳动物全基因组,而是基于PCR将感兴趣的区域富集后测序,得到上千reads的覆盖度来获得染色质目标区域的详细信息。2012年Peter A. Jones将MAPit结合人类全基因组甲基化测序并开发了相应分析流程(pipeline)(2012年Genome Res)。他同时很强势地将这一技术重新命名为NOMe-seq(Nucleosome Occupancy and Methylome sequencing)。Mike则将MAPit应用于病毒全基因组(2013年NAR),同时也开发了MAPit-Patch技术,将目标区域片段化后加接头再用接头引物完成PCR,代替原本低效率的Bisulfite PCR,使目标区域的选择更加灵活自由(2013年Genome Res)。之后Sebastian Pott实现了人类单细胞MAPit(2017年eLife),但他沿用了NOMe-seq这一称呼。植物中我已建成了MAPit的成熟体系,结果预计明年见刊。

当前,MAPit的大规模使用依然受制于有限的经费,但随着测序技术的发展,人们将拥有更强的从全基因组层面大规模探测染色质开放性的能力,而更多的技术进步已经到来。



https://blog.sciencenet.cn/blog-3366000-1078925.html

上一篇:思念
下一篇:eLife的理想主义
收藏 IP: 128.227.50.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-1 10:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部