||
2021年8月刊的Cell Research发表了美国德克萨斯大学休斯敦健康科学中心麦戈文医学院李文博研究组的论文——“RNA m6A modification orchestrates a LINE-1–host interaction that facilitates retrotransposition and contributes to long gene vulnerability”。
该论文发现了新的反转录转座子与宿主基因组的互相作用方式和作用机制。有趣的是,这个新的机制是建立在RNA m6A甲基化基础上的,从而提出了一个新的从RNA甲基化的角度来认识转座子的作用和调控。
人类基因组计划的完成使得我们辨识和了解了许多的人类基因。一个重大发现是,超过50% 的人类基因组是转座子序列 (1)。转座子(又称之为跳跃基因)是一类可以在基因组中自我复制和粘贴的DNA元件,早在20世纪50年代被美国遗传学家Babara McClintock在玉米中首次发现(2)。她本人也因此发现在1983年获得诺贝尔生理学奖。转座子主要可以分为两大类,DNA转座子和反转录转座子(retrotranspons)。其区别在于,反转录转座子会先转录生产RNA,再反转录成DNA来完成转座。LINE-1 (Long interspersed nuclear elements) 是人类基因组中已知丰度最高(碱基数目)的反转录转座子(约50万个拷贝),大约占到人基因组序列的17% 。LINE-1 也是人类基因组中目前已知的唯一一类可以自发转座的转座子。
但目前的研究表明,绝大多数的LINE-1已经发生突变或者片段丢失从而失去了转座的能力,据估计只有100-150个左右的LINE-1还具有活跃的转座能力(3)。在这篇论文中作者们既探讨了具备转座活性的LINE-1的调控和活跃转座(称为Retrotransposon-competent L1, 或RC-L1),也研究了大多数失去转座能力的LINE-1在内含子中的基因调节作用(图一)。
图一:示意图表示存在人类基因组中的LINE-1存在有极少数的具备转座活性的RC-L1和绝大多数哦失去转座活性的L1的区别。红色星号示意突变。
完整的LINE-1转座子的过度转座活性对于维持基因组的稳定性是不利的,在有些情况下会促进癌症或其他疾病的发生。为了抑制LINE-1的转座活化, 宿主细胞利用了DNA甲基化、异染色质形成等一系列的分子机制在转录和转录后各个层面去抵抗。即使这样,仍然有一些LINE-1能够逃逸抑制并且跳跃到新的位点,这些新的位点很大量的位于基因的内含子(intron)区域。这些新的LINE-1有些时候也能导致疾病的发生或发展 (3)。然而,宿主基因和转座子之间的相互关系和作用机制还亟待研究。
在哺乳动物中,m6A 是已知的一类最丰富的RNA甲基化修饰 (4)。近些年来如火如荼的RNA甲基化研究表明m6A修饰和其相关蛋白在很多生物学过程和疾病发生中起到重要作用(5)。得益于MeRIP-Seq等技术的发展,m6A在mRNA上面的分布可以得到很精确地解析。但是,对于m6A在新生RNA(nascent RNA)比如内含子RNA以及其它丰度较低的非编码RNA上的存在和功能我们知之甚少。为了解析m6A在此类RNA上面的分布,李文博课题组开发了一种新的m6A测序技术,作者们称为MINT-Seq (methylation inscribed Nascent Transcript Sequencing),能高效的富集和定量检测新生成的RNA (Nascent RNA)上m6A的分布。 通过该MINT-Seq,作者们鉴别出很多位于内含子上面的全新m6A位点。进一步分析发现这些大多存在于内含子中的LINE-1上。作者在血液癌K562细胞中发现了接近4000个m6A修饰的内含子 LINE-1 (m6A-marked intronic LINE-1),简称之为MIL(图二)。
图二:MINT-seq 发现了很多MIL(m6A-marked intronic LINE-1)(红色信号富集区)。
比较分析发现m6A的水平和 MIL RNA的稳定性呈明显的正相关,提示m6A可能能够促进这些LINE-1 RNA的表达或者功能。不仅如此,作者们发现这些MIL RNA序列在基因组上的方向通常是和包含这些序列的“宿主”基因(hosting gene)的方向是一致的,提示m6A在LINE-1上的写入机制依赖于RNA序列和转录过程,而非DNA序列。 对于MIL进一步的序列分析发现m6A水平高的MIL通常具有较高的m6A motif (RRACH) 密度,较长的长度,以及较少的突变。从LINE-1的亚家族方面看,进化上较为“年轻”的LINE-1 亚家族(比如LIHS,L1PA2)的m6A水平也整体高于更古老的LINE-1 亚家族。这说明一个可能性,即LINE-1在进化过程中逐渐累积了m6A, 和m6A对于LINE-1 可能是有益的论点一致。为了揭示m6A在MIL上的作用机制,作者通过分析ENCODE eCLIP 数据找到了一些富集于MIL的RNA结合蛋白,包括SAFB,SAFB2, HLTF和RBM15等。作者通过体外生化手段证实SAFB与MIL的结合主要通过m6A介导,提示SAFB可能参与MIL的调控。细胞生物学实验显示,敲低m6A转移酶复合物METTL3/14和RBM15会降低MIL的整体丰度而敲低SAFB会显著升高MIL的丰度。
为了进一步探究m6A和SAFB是否会影响LINE-1的转座活性,作者们构建了LINE-1转座报告系统,发现敲低METTL3/14显著降低LINE-1转座活性而敲低SAFB显著升高LINE-1转座活性。这进一步说明了m6A本身对于LINE-1的活动是起到促进作用的, 同时SAFB蛋白通过结合m6A标记的LINE-1 RNA来抑制LINE-1的活性。需要特别提出的是,作者构建了一个LINE-1 RNA突变体转座报告系统,针对性的破坏了序列中的部分RRACH motif,从而降低了RNA的m6A水平。与原始LINE-1序列相比该突变体的RNA稳定性和转座活性均显著降低。该实验证明了m6A的直接作用于LINE-1的功能,避免了很多敲低调节蛋白实验所常常遇到的直接还是间接作用(direct effect or secondary effect)的困扰。
上面的结果说明,对于LINE-1序列而言,m6A是一个进化上且在分子水平上都有一定“益处”的调节元素。但是从另一个角度来看,其实LINE-1就如同人基因中中的”寄生虫“需要争取跳跃到别的基因组区域来更多的“繁衍”,那么被m6A强化过的LINE-1是否对人类基因表达或者基因组功能有特殊影响呢?这个m6A的对LINE-1调节机制有何疾病相关性呢?
图三:示意图。有几个方向可以思考m6A对LINE-1 RNA 修饰导致的双向作用,即一方面影响LINE-1的跳跃活性,另一方面影响宿主(人)基因组的功能和基因表达。
作者分析发现MIL富集于DNA 损伤及修复相关基因中,也富集在超长人类基因中,提示这些MIL可能调控这些宿主基因的表达。通过进一步分析新生RNA在宿主基因上面的分布, 我们发现MIL下游的转录水平往往显著小于其上游,并且转录水平的降低通常在MIL的末端发生骤变 (图一)。这一现象广泛存在于不同的MIL区域,并且其降低的程度和MIL的m6A水平呈正相关。这提示我们MIL可能作为一个内含子里面的转录路障(roadblock) 控制了RNA聚合酶的转录延伸,从而达到调控其宿主基因表达的功能。作者选择了分别位于PSMA1 和ZRANB3的内含子中的两个具有非常高m6A水平的MIL,实验发现,通过CRISPR/Cas9 将MIL敲除或者反转都将明显降低转录路障(roadblock)的效果并且引发宿主基因的表达显著上升至2-3倍,直接证明了MIL是基因转录调控的重要元件。与此同时,敲除内含子中无m6A或者低m6A的LINE-1基本不影响宿主基因的转录或RNA水平,说明转录路障效果是直接依赖于m6A的。不仅如此,作者们发现敲低SAFB会进一步加强转录路障的效果(SAFB的作用是抑制MIL的RNA水平)。这些结果提示内含子LINE-1的转录路障现象也受到MIL及其RNA结合蛋白调控。
作者们观察到,包含MIL的宿主基因常常是非常长的人类基因,有些甚至达到几百kb或者超过1Mb。这么长的基因很可能格外会受到MIL的调节。作者们于是特别的查看了MIL对于超长基因的调节作用。尤其有意思的是,人类大脑是已知表达超长基因比较显著的器官,而LINE-1在人脑发育中也存在非常特别的活性跳跃。作者们于是使用已发表的人胎儿脑组织的RNA m6A 甲基化图谱发现了,并使用了人iPS分化的神经前体细胞验证了,很多重要的神经发育或者突触形成相关的基因含有MILs,比如 GPHN (Gephyrin), UBE3A,CTNND2 (delta2-catenin), DLG2 (编码 postsynaptic density protein-93), CNTNAP4 and CTNNA2,或者神经递质受体基因比如GABA receptor type-A γ3 (GABRG3) 和Glutamate Receptor AMPA Type-4 (GRIA4)。并且这些基因确实是受到MIL调节的,SAFB和SAFB2的敲低能够显著影响这些重要人脑功能相关基因的表达。生物信息分析显示这些含有MIL的超长基因和影响自闭症等人类神经发育疾病有显著相关性。
图四:总结图。此图全面总结了这篇论文发现的m6A在LINE-1 RNA 上的修饰导致的双向调控作用,即影响LINE-1的跳跃,也影响宿主(人)重要基因的功能和表达。
总结来说,这个工作主要揭示了:1) m6A在新生的RNA上尤其是LINE-1上的广泛存在并且促进LINE-1的RNA水平和转座活性;2)很多MIL存在于人类基因的内含子中,他们会通过形成转录路障(roadblock)从而抑制宿主基因的表达,尤其表现出对DNA修复蛋白和超长人类基因的偏好;3)宿主的RNA结合蛋白SAFB能够识别并抑制这些MIL从而缓解转录路障效应对于宿主基因组的影响。这些结果发现了m6A对于LINE-1 RNA调控的新机制,揭示了新的内含子序列导致的基因转录调控模式,同时加深了我们对于转座子和宿主间相互作用的理解。这个新的发现对于了解超长人类基因在疾病中(尤其是神经系统发育疾病)的病态表达也提供了新的思路。
在同一期的Cell Research上,来自法国国家科学研究中心CNRS和蔚蓝海岸大学的Victor Billon 和 Gael Cristofari撰写了很全面的对于这个论文发现的评论(图五) (6)。
图五:Gael Cristofari组对此论文的评论。MIL转录路障(roadblock)的示意图,来源于(6)。
博士后熊峰博士和研究生王若愚为共同第一作者。博士后李宙炯(韩国籍)在此工作中做了重要贡献。美国德克萨斯大学休斯敦健康科学中心Liu Ying组(目前搬迁到了佛罗里达国际大学)提供了重要神经前体细胞等材料和其他帮助。此工作也得到麦格文医学院的蔡光磊研究组和博后Shin-Fu Chen,德克萨斯Texas A&M 大学韩冷组的大力协助。
李文博老师组目前有两个博后职位空缺,欢迎有志于表观遗传调控(尤其是增强子,三维基因组和非编码RNA)的同学加盟。请直接联系李老师 wenbo.li@uth.tmc.edu。
相关论文信息:
https://doi.org/10.1038/s41422-021-00515-8
参考文献
1. Initial sequencing and analysis of the human genome. Nature. 409, 860–921 (2001). 2. B. McClintock, The origin and behavior of mutable loci in maize. Proc. Natl. Acad. Sci. U. S. A. 36, 344–355 (1950). 3. H. H. Kazazian Jr, J. V. Moran, Mobile DNA in Health and Disease. N. Engl. J. Med. 377, 361–370 (2017). 4. I. A. Roundtree, M. E. Evans, T. Pan, C. He, Dynamic RNA Modifications in Gene Expression Regulation. Cell. 169, 1187–1200 (2017). 5. I. Barbieri, T. Kouzarides, Role of RNA modifications in cancer. Nature Reviews Cancer. 20 (2020), pp. 303–322. 6. V. Billon, G. Cristofari, Nascent RNA mA modification at the heart of the gene-retrotransposon conflict. Cell Res. 31, 829–831 (2021).
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-4 18:39
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社