||
根据上一个科学问题基因组的规模,我们知道人类的基因组由30亿个核苷酸代码组成,这些核苷酸被紧密封装在23对线性染色体中(根据2022年3月公布的人类最完整的T2T-CHM13基因组数据,在人类所有22个常染色体和X染色体的端粒到端粒无间隙的基因代码里共包括3,054,815,472 bp的核DNA和16,569 bp的线粒体DNA)。人类和其他大多数哺乳动物相似都具有相同规模的基因组(比如小鼠有34.5亿个核苷酸,大鼠基因组有29亿个,奶牛的基因组有36.5亿个等等),其中用于编码蛋白质的基因数量大约为2.5万个,其代码大小只占DNA基因组大小的1% -1.5%, 再除去2%左右用于编码调控的调控基因, 剩余的95%以上的DNA序列都是没有任何编码功能的所谓的“垃圾DNA”(junk DNA,垃圾DNA概念由日本遗传学家大野乾Susumu Ohno1972年提出,是指DNA中非编码的DNA部分,该部分主要由随机分布在基因组中的重复DNA片段组成)。不仅人类如此,所有动物的基因组里都有大量的垃圾DNA,这些DNA不能编码用于构建身体和催化细胞内化学反应的蛋白质。那为什么它们会被认为是垃圾DNA呢?
图1 人类的染色体和基因组规模
我们知道基因组序列就好像是由四个字母A、G、C和T编排而成的合成手册,这些字母的某段序列组合构成基因,而基因才用来决定蛋白质的结构。所以蛋白质的合成并不是直接去阅读手册然后去制造蛋白质那么简单。在科学问题RNA多样性中我们已经讲过,蛋白质合成之前,DNA的编码首先要被转录成RNA,而RNA会被切割并重新组装成更小的基因片段,而在RNA切割过程中,有些DNA片段,即所谓的某些非编码部分会被切割而丢弃掉,这就意味着这些片段最终没有参与蛋白质的合成,这就是垃圾DNA的由来。然而奇特的是,基因组中垃圾DNA的数量非常巨大,为什么DNA序列中会保留这么多看似不太必要的大片垃圾片段呢?
图2 垃圾DNA的示意图
科学家们对基因组中这些没有明显功能的“垃圾DNA”片段的作用一直感到困惑,基因组中非编码的“垃圾DNA”一直以来也都被认为是无用的,它们似乎只是存在于DNA中而对生物体的生物功能没有实质的贡献。通常这些“垃圾DNA”片段是通过转位过程产生的,或者某些基因的DNA片段被转移到了基因组其他位置。因此,大多数垃圾DNA区域都包含转位子(transposons)的多个核苷酸序列的拷贝,这些转位子或者是从基因组的一部分中复制或剪切出来的序列,或者是入侵病毒需要表达的基因片段,然后它们将自己插入到DNA序列的其他位置。所以利用复制剪切机制在基因组中移动的序列片段无疑增加了遗传物质的数量。这种“剪切和粘贴”基因片段的过程在基因组演化过程中不仅缓慢而且及其复杂,它们和DNA的修复机制有重要联系。所以,如果转位行为频繁发生在生殖细胞中,那么这些基因片段就会被整合到种群的基因组中,从而增了加宿主基因组的演化规模和演化方向。
图3 病毒逆转录转位基因的插入过程及演变
2008年在《细胞分子生物学》上的一项研究中,科学家们从酵母基因组中清除了“垃圾DNA”,也就是对特定的基因去掉其内含子的部分,这部分是DNA转录过程中被切掉丢弃的部分。实验表明,去除内含子对细胞的生理功能没有显著影响,这项研究虽然不能支持“垃圾DNA”不发挥任何功能的观点,但至少说明并不是每一段“垃圾DNA”都是细胞生理功能所必须的。然而2019年《自然》杂志发表的另一项研究结果却给出了相反的结论:当环境食物匮乏的时候,研究人员发现这些看似无用序列而被去除的部分对酵母细胞的生存产生了至关重要的影响,研究认为这些内含子的功能可能取决于环境,它们显然不能当作DNA中的垃圾成分而随意丢弃。
然而很多年来“垃圾DNA”这个流行的概念极大地阻碍了主流研究人员对非编码DNA的研究热情,毕竟谁会愿意花费时间和精力去基因组里捡垃圾呢?值得庆幸的是,经过一些喜欢冒险去探索未知领域科学家们的努力,在20世纪90年代初,人们对“垃圾DNA”,尤其是对“垃圾DNA”中重复序列部分的看法开始发生重要改变。现在越来越多的生物学家将DNA中的重复序列视为研究基因组功能的宝藏,这些转位因子其实根本不是无用的垃圾DNA,相反,它们通过与其周围基因组的相互作用,成为基因代码重组的重要区域,它们能为基因表达的调节提供新的和重要的调控信息,从而增加生物体的进化能力。
图4 研究垃圾DNA的ENCODE项目
现在“垃圾DNA”成为一个非常有争议的概念,它虽然指出生物体基因组中携带的垃圾DNA对生物的适应性没有直接影响,但越来越多传统上被视为“垃圾DNA”的生化功能被重新确定。这些发现也从根本上改变了“垃圾DNA”的概念,先前的“垃圾”概念依赖于DNA的生物功能,没有考虑基因组结构的选择效应,然而基因元素的生物功能是随时间持续改变的,“垃圾DNA”可能在基因组中起源上被选择执行某种生物功能,但在进化中它可能逐渐被弱化或摈弃,但其在提取或转录过程中依然发挥着某种辅助的选择作用。
基因组本身就是一个不断进化发展的遗传物质,它的序列中必然包含着物种新功能产生和旧功能遗失的历史“记录”。随着环境的改变,功能DNA可以逐渐成为“垃圾DNA”,而“垃圾DNA”片段也可以进化成功能DNA。进化生物学家斯蒂芬·杰伊·古尔德和耶鲁大学古生物学家伊丽莎白·弗尔巴开始使用“扩展适应”(exaptation)来解释原来具有某种原始功能的基因组片段如何在新功能中开始扮演重要角色,即便它们最初认为是没有任何用途的“垃圾DNA”。所以,随着基因组序列信息的不断丰富,生物学家正在慢慢地发现非蛋白编码DNA的重要作用。
事实上,人类在基因组的“垃圾DNA”中不断发现新的基因组元素。发育生物学家在脊椎动物的进化过程中发现了一种新的逆转录子:一种从RNA反向转录的DNA片段,它能随意插入基因组的任何地方,该逆转录因子被认为具有增强基因转录信号的功能。另一方面,一种物种中的无功能序列可能在另一个生物体中成为外显子,从而最终转录成信使RNA发挥作用。宾夕法尼亚州立大学的科研团队也发现这种机制经常导致脊椎动物基因组中另一个有趣的特征,即重叠基因,即基因会共享一些核苷酸。无数的研究表明,重复序列也不是“垃圾”,而是真核生物基因组中重要而且有价值的修饰或定位部分。
人类基因组计划(Human Genome Project)让众多科学家对人类基因组中的“垃圾DNA”进行了重新评估,他们发现,虽然不到2%的基因组用于产生蛋白质,但大约80%的基因组的确具有某种生物功能。虽然DNA被转录成RNA后,某些片段会在随后的过程中被切碎,但那些被丢弃的序列是功能性的剪切,它们确实在基因表达中发挥着作用,包括调节DNA如何转录,如何产生某些非编码RNA进行辅助,以及从哪里翻译蛋白质等等。如果我们将蛋白质编码序列比喻成交响乐的音符,那么那些非编码序列就像是乐谱之外的指挥,它们影响着这首交响乐实际演出时的节奏和某一个乐章的重复演奏次数。
图5 垃圾DNA研究的发展历程图
过去十年对基因组研究的进展表明,“垃圾DNA”可能只是被误解的遗传物质。科学家们现在已经将各种非编码序列与各种生物过程甚至人类疾病联系起来。例如,研究表明,非编码DNA片段掌握着基因表达的强弱,能够影响癌症如乳腺癌和前列腺癌的发展,而且基因编码区域以外的突变还可能导致自闭症的产生。探索非编码序列的作用现在成为基因组研究的热点,越来越多的证据表明,那些非编码序列可能有助于癌症的治疗,专家们现在认为它们很可能成为癌症诊断的一种有前途的工具。总之,生物基因组中大量存在着的非编码DNA并非都是毫无用处的“垃圾DNA”,它们在基因组中的分布、演化、作用和功能正被科学家们的研究慢慢揭开。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 15:04
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社