lisw05的个人博客分享 http://blog.sciencenet.cn/u/lisw05

博文

表观基因组学研究技术现状与展望 精选

已有 19169 次阅读 2016-6-1 16:34 |个人分类:人类基因组计划|系统分类:教学心得

表观基因组学研究技术现状与展望


李升伟/编译


真核基因组大多数由核小体组成,它们的结构是接近147bpDNA包绕在基本的组蛋白十聚体周围,然后异固缩成为染色质。包绕着DNA的核小体通过接近1万倍的固缩形成了中期染色体,这对有丝分裂时姐妹基因组的忠实分离至关重要。间期时,由于核小体占了染色质结构的近70%,它们必须在以下需要DNA的过程中解旋开来:复制、转录、修复和与调控蛋白的结合。核小体的分布、定位和构成,与组蛋白和DNA的化学修饰一起,构成了附加在基因组之上的复杂景观:表观基因组。与许多生物体的基因组序列现在本质上得到完全测序不同的是,对它们的表观基因组的探询还很不完整,这归因于个体表观基因组结构的复杂性和动力学。在原核生物中,序列特异性DNA结合蛋白质位于真核生物转录调控层级结构的最上层,而转录因子的分化表达导致了细胞类型特异性差异。许多其它关键的染色质元件在生物体的所有细胞中都得到了发现,作为转录因子结合的结果,动态性地改变了它们的分布。组蛋白变异本的合并和组蛋白尾巴的共价修饰有助于介导某种基因的表达状态的遗传,系通过调控对DNA的获得与否。另外,数百种染色质联会蛋白质――包括ATP依赖性染色质重构物类和组蛋白修饰酶类――与染色质相互作用来调整其结构。值得注意的是,核小体重构物类和染色质组蛋白成分的突变已经与人体发育性疾病和癌症取得了联系。因此,染色质结构和影响其的蛋白质的高分辨率基因组分析成为了生物学技术研发的主要焦点,用来研究基本细胞过程和人体疾病的发病机理。许多方法已经被用来探查表观基因组的各方面问题,但是到近期为止,表观基因组特征化的全基因组方法如ChIP-chipMeDIP的分辨率只达到了数百碱基对的数量级,使用的是基于杂交的读出技术和随机片断化基础上的染色质制备规程。但是,随着大规模并行短读出DNA测序方法的出现,以及其单碱基对分辨水平的潜能,人们已经恢复了对染色质特征化传统方法的兴趣,这些方法包括使用亚硫酸氢盐测序法于DNA甲基化的作图,和使用非特异性核酸酶如微球菌核酸酶(MNase)、脱氧核糖核酸酶IDNase I)和核酸外切酶。

碱基对分辨水平的表观基因组作图技术微球菌核酸酶消解配合平铺式微阵列分析(MNase-seq

使用MNase来消解染色质长久以来都被用于研究以一种低通量方式研究染色质结构,最近已经与平铺式微阵列分析(MNase-chip)和大规模并行DNA测序(MNase-seq)相结合,来研究核小体定位、分布、构成和全基因组修饰问题。MNase是一种单链特异性分泌性糖蛋白,被认为可以切断DNA的一条链从而解开螺旋,然后切断另一条链,从而产生一种双链断裂。MNase明显地“一口一口地咬断”暴露的DNA末端,直到其达到一种阻碍物如某个核小体。尽管MNase已经初步用于了核小体研究,其作用模式提示其将被任何阻碍物如DNA结合蛋白沿DNA进行了阻滞,从而可以确定被非组蛋白性蛋白质保护的基因组区域。通过将MNase消解与保护DNA的匹配端测序方法相结合来精确测定片断长度,特定大小的MNase保护颗粒可以得到恢复,不考虑提纯和作图亲和力的情况。事实上,在果蝇细胞中,我们已经使用匹配端MNase-seq 技术来对两种核小体分布进行作图并中止RNA聚合酶II的活性。Kent等人还应用匹配端MNase-seq技术于天然酵母染色质,来对两种核小体和序列特异性转录因子进行定位作图。Floer等人应用MNase消解法联合匹配端交联染色质免疫沉淀法即(X-ChIP)-seq,来鉴定RSC复合体(染色质结构重塑物)的结合位点,正在鉴定部分解旋的核小体。重要的是,这些研究证明了短至50bpDNA片断可以在MNase消解后得到恢复,提示MNase-seq技术不仅可以用于核小体分析还可以用于表观基因组作图。

作为MNase消解的读出结果和表观基因组学业基本方法,匹配端测序技术的基本局限性在于,标准短读出测序文库制备方法的最优化水平只达到了核小体大小(接近150bp)或更大一些的DNA片断,还涉及到DNA的大小选择问题,而由转录因子保护的DNA区域经常达到更小的数量级规模。为了解决这种局限性,我们引入了一种修正了的文库构建方法来加速DNA片断的匹配端测序,小到接近25bp。通过将调整MNase消解时间点与作图片断大小范围(从接近25bp到大于200bp)相结合,我们分析了核小体和非组蛋白性蛋白质的分布和动力学。值得注意的是,亚核小体颗粒和核小体颗粒可以分布于细胞群体内的同一基因组位点上,提示在核小体和其它染色质相关因子之间存在着高度动态性的相互作用。匹配端测序可以提供片断位置和长度数据,这两个参数可以显示为一种二维的“散点图”。每个点的X轴位置代表着片断中点到基因组特征如转录因子结合位点(TFBS)中心的距离,而Y轴位置则代表着片断的长度。得到的图形呈“V形图”,因为转录因子保护的最小DNA区域位于V形曲线的顶点,X轴值指示片断中点、Y轴值为其长度。基于对多于100个转录因子的V形图的计算,已知参与了核小体定位的转录因子的结合位点如Abf1Reb1,显示了定位良好的侧翼核小体,其上面布满了亚核小体颗粒。V形图还被用于ChIP数据,证明了接近125bp的功能着丝粒序列的三联体结构精确地对应于含Cse4着丝粒核小体的分布,由于Cbf1转录因子和着丝粒特异性Cbf3复合体的作用而立即分枝生长。MNase-seq方法组合匹配端测序方法为表观基因组学表达谱分析提供了几种优势。使用一种测序了的样品对不同大小的基因组片断进行作图,可以对核小体和大量非组蛋白性蛋白质的基因组分布进行评估,此方法的性价比非常优秀。该方法并不需要表位标签或抗体,因此很容易地适用于一系列细胞类型,尤其是那些没有亲和性试剂的细胞。对大至果蝇和小鼠的基因组上片断进行精确作图需要对每个片断末端进行少至25个循环的测序,而使用更少的循环可以减少测序的机时和成本。尽管MNase拥有一种众所周知的AT切割优先性,在实际应用中它会导致一种微小的作图偏倚,在有必要时可以减轻计算压力。用于对非核小体颗粒进行MNase-seq测序的基本缺陷是,这样的颗粒的身份鉴定在单独使用这种方法的情况下是无法正式建立的,因为许多蛋白质可能与相同序列相结合。但是,非核小体颗粒从可溶性天然染色质中的恢复提示这种材料适用于高分辨率ChIP-seq测序;事实上,它已经被成功地应用于对果蝇使用间断性RNA聚合酶II进行ChIP-seq作图。天然染色质ChIP-seq测序(N-ChIP)的应用还为与标准交联ChIP方法相关的问题提供了解决方案,这些问题包括由甲醛处理引起的蛋白质-蛋白质交联和表位掩蔽、和声波处理引起的ChIP方法的内在低分辨率。

脱氧核苷酸酶I消解配合高通量测序(DNase-seq

DNase I是一种非特异性核酸内切酶,基于它们对切割的过敏性,长期以来就被用于对“开放”染色质位点的作图。运用平铺式微阵列(DNase-chip)或高通量测序(DNase-seq)进行DNase I过敏性作图也被用来对表观基因组进行研究。DNase I优先地切割核小体缺失性基因组位点也就是调控元件如启动子、增强子、绝缘子和转录因子结合位点。DNase-seq以碱基对分辨率对DNase I消解位点进行鉴定,提供了一种与MNase-seq相逆向的方法,它推断了DNA咬合颗粒在过敏性位点之间的存在,而MNase也对这样的颗粒所保护的区域进行了作图。Hesselberth等人用酵母染色质的DNase-seq测序对染色质结构进行了作图,并计算预测了几种结合因子的结合位点。粗略DNase-seq测序数据的分析揭示了总体过敏性位点内DNase保护的微小区域,很可能可以指示出转录因子结合作用。但是,由于多种蛋白质可以与相同序列相结合,有必要整合DNase-seq测序数据和ChIP-seq测序数据来对引起特定DNase足迹的蛋白质进行定性鉴定。对这个问题,Boyle等人近期整合了DNase-seq数据和转录因子ChIP-seq数据来精确确定了人体细胞内几种转录因子的DNA结合作用。他们对粗略DNase-seq数据的分析揭示了更大过敏性位点内DNase耐受性的足迹,与Hesselberth等人的结果相似。据ENCODE联盟统计,DNase-seq测序法也是近期人类表观基因组鉴定的核心方法。在表观基因组学分析中,DNase-seq有几种与MNase-seq相似的优点。由于它不依赖于抗体或表位标签,DNase-seq可以用来在一次实验中分析大量蛋白质的基因组分布,可以适用于一系列细胞类型。但是,由于 多种蛋白质可以与相同的序列进行结合,有必要整合DNase-seq数据和ChIP-seq 数据来正常地鉴定引起特定DNase保护区域的蛋白质。运用DNase-seq测序对核小体定位进行作图也有些复杂,因为DNase I切割核小体DNA的分辨率有10bp

染色质免疫沉淀配合核酸外切酶消解和高通量测序(ChIP-exo

ChIP可以将蛋白质定位于基因组上特异性位点,已经成为了广泛应用于许多生物学研究领域的表观基因组作图技术。ChIP结合平铺式微阵列分析(ChIP-ChIP)或高通量测序(ChIP-seq)已经被大量用来研究数百种蛋白质的基因组分布。尽管通过ChIP-chip测序和ChIP-seq测序得到了许多重要的知识,但仍然有局限性。标准的ChIP方法应用声波处理将染色质片断化,产生了这些片断的异质性混合物。作为使用声波处理的ChIP-seq方法中的一个标准过程,文库制备期间对200400bp片断的大小选择更是使这个问题复杂化。最后,大多数ChIP-seq文库以单末端模式进行了测序,这种模式只有每个DNA片断的一个末端被测序,所得到的短序列读出被计算延伸至接近每个被测序片断的大小。总之,这些问题内在地局限了流行的全基因组ChIP方法的分辨率。为了改善ChIP-seq测序的分辨率,RheePugh引入了一种称为ChIP-exo的技术。ChIP-exo技术中,要在λ核酸外切酶处理后进行一种标准的X-ChIP测序。λλ核酸外切酶可以以一种5端到3端的方式降解DNA,从而达到沿着每条DNA链上结合蛋白的5端消解一定数量的碱基,其效果是在离核酸外切酶不可消解的蛋白质一定距离处产生了一种5屏障,使得屏障的3端序列保持完整。在进行了特异化测序文库制备和单末端高通量测序之后,在基因组中对所得到的读出序列的5端进行作图,高度精确地定界蛋白质-DNA交联所产生的5端屏障,其中,峰值对代表了蛋白质结合位置,结合蛋白质的每边都有一个峰值。通过对核酸外切酶切割边界的精确作图,ChIP-exo解决了单末端ChIP-seq测序法一般存在的分辨率有限的问题。ChIP-exo测序法的应用案例包括几种酵母转录因子和人体绝缘子结合蛋白质CTCF。对酵母转录因子Reb1ChIP-exoChIP-seq测序数据的比较发现,ChIP-exo峰值的标准差为0.3bp,而ChIP-seq峰值标准差为24bp,两者分辨率的改善度接近100倍。ChIP-exo方法分辨率的提高揭示了这些因子的基因组结合模式的新特征。例如,Reb1数据显示出有主要结合位点和次要结合位点。Reb1的次要结合位点少于100bp,大大地少于主要结合位点。值得注意的是,这些Reb1主次结合事件无法用标准的ChIP-chipChIP-seq测序来分析,提示ChIP-exo测序法可以实现在单个结合区域内分析多次交联事件。对其它因子的ChIP-exo分析还揭示了尚未鉴定的低分布结合位点,深度测序了与因子结合相关联的全套基序序列。例如,CTCF分布与单个一致性基序内多种序列模块的存在呈正相关。CTCF结合位点上的模块越多,结合分布率就越高,这与以前的研究结论相一致,证明了CTCF使用了其11个锌指的各种组合体与基序模块的不同组合体相结合。ChIP-exo法解决了常规ChIP-seq法的几种缺陷。核酸酶保护边界的精确作图实现了对蛋白质结合序列的碱基对分辨水平上的鉴定,而标准的ChIP方法只能得到结合序列的近似值。而且,未结合DNAChIP的污染增加了背景信号,其中,高富集污染序列导致了假阳性,而受研蛋白质对结合位点的结合不足则导致了假阴性。与MNaseDNase I一样,核酸外切酶处理去除了未结合DNA,大大降低了ChIP实验的背景,但是,ChIP-exo的信噪比可以高达3002800倍,ChIP-chip7倍,ChIP-seq80倍,它们都可以鉴定出低分布结合位点,实现对DNA序列与转录因子结合分布之间关系的深度分析。总之,ChIP-exo提供了一种碱基对分辨水平的方法来评估蛋白质结合分布,并进一步分析DNA序列与转录因子之间的复杂相互作用在基因组调控中的作用机理,并指导设计试剂用于测序系统之中。

与其它表观基因组学方法的综合实现单碱基对分辨水平作图

在对传统技术改进的基础上,MNase-seqDNase-seqChIP-exo等上述方法丰富了表观全基因组分析方法。而且,许多其它技术已经被用来对表观基因组进行作图。一种这样的技术是新的靶向化学切割方法,可以对核小体位置进行碱基对分辨率的作图。因此,我们不由得要问,其它目前的技术是否可以用来进行单碱基对分辨率的表观基因组作图?甲醛辅助性调控元件分离(FAIRE)和Sono-seq测序方法已经被常规地用来对“开放”染色质区域进行作图。这两种技术都依赖于这样的事实:当细胞被用甲醛处理后,核小体更易于与DNA而不是DNA结合蛋白交联。尽管FAIRESono-seq方法有一些差异,它们都基于相同的原理。用甲醛处理后的细胞与蛋白质-DNA相互作用相交联,并对细胞或分离的细胞核进行声波处理来剪切染色质。在声波处理后,样品被用酚-氯仿抽提。不与蛋白质(“开放”染色质)相交联的DNA在水相中得到恢复,而蛋白质-DNA复合体则存留在界面中。然后用微阵列杂交或高通量测序对水相中的DNA进行分析。但是,由于声波处理产生了片断的异质性混合物,并且只有非蛋白质关联DNA得到了恢复,这些技术还不能用来对这些颗粒进行精确定位从而对“开放”染色质区域进行定界。使用FAIRESono-seq染色质制备方法之一对DNA咬合颗粒的精确位置进行作图,那些正常情况下被废弃的包含在难溶成分内的蛋白质-DNA复合体就能够提纯并进行核酸外切酶消解,产生以统一的距离在蛋白质-DNA交联中终止的DNA分子,这就是ChIP-exo测序的大致过程。然后,核酸外切酶消解染色质的高通量测序就可以用来揭示DNA保护颗粒的精确定位,这种方法还可以与亲和力纯化联合使用来精确定位特异性因子。

未来发展方向

尽管单碱基对表观基因组测序技术的发展还处于发展早期,这些方法的应用已经取得了对染色质组织的重要认识。在获得了ChIP试剂的情况下,ChIP-exo方法被用来对系统内蛋白质的基因组结合进行了精确作图。MNase-seq可以对单个样品内的核小体和非组蛋白性蛋白质进行作图,同样地,DNase-seq很容易适应于任何系统来进行基因组测序。ChIP-seqMNase-seqDNase-seq方法的组合使用为蛋白质结合位点的碱基对测序提供了强有力的方法和工具。与表观基因组表达谱分析在单细胞系统内相对简便不同,它在多细胞生物体内的应用更为困难,因为不同的细胞类型在复杂组织中紧密地互相交织。事实上,ChIP-exoMNase-seqDNase-seq 测序已经常规地用于了单细胞性酵母或其它生物体的培养细胞,不必考虑该生物体的生物学条件。为了对细胞类型特异性表观基因组作碱基对分辨水平的表达谱分析,有必要将上述技术与从复杂环境中分离特定细胞类型的方法结合使用。一种这样的方法是荧光激活细胞分选(FACS),应用于荧光标记细胞或细胞核的提纯。FACS已经被用来从小鼠和人体大脑及小鼠胚胎中胚层中分离特定的细胞群体用于染色质分析。另一种标记于特定细胞类型的细胞核的分离技术(INTACT)已经被用来从拟南芥菜、美丽隐杆线虫和果蝇内的个体细胞类型中分离细胞核,进行表达和初步的染色质表达谱分析。将这些技术与上述各种碱基对分辨率表观基因组分析方法结合使用,将为认识造成特定细胞群体的调控网络提供值得关注的新战略。随着碱基对分辨率表观基因组技术进一步研发,测序成本持续下降,细胞类型特异性染色质的全基因组表达谱分析将变得日益成为常规。对转录因子、核小体特征(定位、分布、组成和修饰)和ATP依赖性染色质重构物的精确作图可以组成表观基因组计划,与基因组测序计划同样伟大,使得人们充分认识一种生物体内各种细胞类型的调控组织,也就是说,为什么同样的基因组会产生不同的细胞群体。

ChIP: 染色质免疫沉淀; ChIP-chip: 染色质免疫沉淀配合平铺式微阵列分析;ChIP-seq:染色质免疫沉淀配合高通量测序;ChIP-exo: 染色质免疫沉淀配合核酸外切酶消解和高通量测序;DNase I: 脱氧核苷酸酶IDNase-chip: 脱氧核苷酸酶I消解配合平铺式微阵列分析;DNase-seq: 脱氧核苷酸酶I消解配合高通量测序;FAIRE: 调控元件的甲醛辅助分离;MNase: 微球菌核酸酶;MNase-chip: 微球菌核酸酶消解配合平铺式微阵列分析;MNase-seq: 微球菌核酸酶消解配合高通量测序; Sono-seq: DNA声波处理和高通量测序;X-ChIP: 染色质免疫沉淀配合甲醛交联。

(原文遗失,待查。)


本文在此首次发表,欢迎转载和分享。




https://blog.sciencenet.cn/blog-2636671-981744.html

上一篇:表观基因组的诱惑:表观基因组学引论
下一篇:表观基因组学能为你做什么?
收藏 IP: 116.53.45.*| 热度|

3 许培扬 蔡小宁 王从彦

该博文允许注册用户评论 请点击登录 评论 (6 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-22 02:59

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部