从RNA走向DNA,基因组形成与发展史
1从第一个能自我复制的RNA遗传物质(基因)开始,至出现能自我复制独立生存的细胞,生物基因由一个数量从小到大、结构从简单到复杂的发展过程。
2 RNA分子是最初出现的遗传物质,并具有生物活性的功能,但因其结构特征无法形成稳定有序并数量庞大的基因组。
3 原始逆转录酶和转录酶是类RNA复制酶的核酶,使核酸序列由RNA向DNA转化,DNA分子结构稳定,可极度延长而保存转录的序列,基因因此连锁形成基因组。
4为基因组的稳定和有效功能表达,基因自稳和调控机制的发生。
5经历亿万年进化,基因组以逆转录方式的原始增长机制已终止,在复制过程中的基因重复复制和趋异特征成为基因组增长的唯一方式。
6庞大的基因组以染色体的形式存在,原核细胞基因组只有一个染色体、一个复制子;真核细胞含多个染色体和复制子,由核内的执照因子来控制,使细胞基因组在细胞分裂周期中只能复制一次。确保子代细胞基因组的完整性。
7原始遗传复合体中遗传物质从RNA走向DNA而连锁,从基因的竞争走向基因组的竞争,DNA之争就是基因组之争,囊泡世界由此走向细胞世界。
基因和基因组的发现为物种的进化提供了研究的物质基础,物种的进化本质是细胞基因组的进化,以此可以完美地阐明达尔文主义的进化论,但细胞基因组本身是如何发生与形成的,目前尚未阐明,甚至于有的自然科学家还认为生命最初是一堆有机分子偶然聚集在一起形成的。自然界一切物质分子的运动都是以内在动力为基础的,地球从物理世界、化学世界、有机世界、再入生化世界而生命世界,是分子运动的必然过程;在事实与理论上,生命的发生与发展不应夹杂丝毫偶然或上帝的因素,超自然力的意识会让人陷于不可知论。现代分子生物学和基因学的研究进展、特别是对RNA世界的研究,展示与阐明了具有遗传性能的生物大分子的发生、发展与进化的过程,以及这些分子如何逐步演化出特异而有序的生命运动。虽然我们无法重演生命诞生的最初,也不能确认进化过程中所有的细节,但还是可以从现有对这些分子结构与性能的认识,来演示与推测其运动与进化过程,以极大的可信度来支持这些生命起源的理论。
我们今天认识的细胞基因组是个DNA世界,但从对RNA世界的研究发现最初发生的遗传物质是RNA,RNA为什么要向DNA演化?如何向DNA演化?如果我们能普遍科学的语言合乎逻辑地阐明细胞基因组发生和演化过程,我们对生命本质的认识也将更深刻,也可以对自然界的病毒现象、转基因现象、“基因治疗”现象、以及物种的兴亡表现的更客观些。
RNA世界是萌生基因的源泉
有机世界中产生的囊泡是生命的摇篮(1),能自我复制RNA复制酶从随机自聚的RNA分子中脱颖而出的,生命的步伐就此开始(2),原始的RNA酶因复制的忠实性不高复制出有序列差异的RNA,效率和精确度高的复制酶因复制优势扩大,能形成最佳酶促反应的最佳序列胜出,成为一群不断扩增的克隆,这类功能性RNA就含有“种”的概念,也是生命起源中最早出现的基因。RNA复制酶不仅能复制自我序列,也能复制其它随机生成的RNA,酶促合成使随机自聚的RNA均成了一个个群体,丰富了最初的RNA世界;RNA的大量生成导致对能量与底物的竞争,因此在这个随机序列的RNA群体中,除了RNA复制酶,凡是能辅助RNA复制,有利于囊泡稳定和增长的,容易保留和发展;如有的RNA分子可参与囊泡膜结构,使囊泡膜对分子发生选择性滤过的功能而有利于囊泡的新陈代谢;有的RNA序列萌发出其它的核酶功能,如促使RNA氨酰化的氨酰化酶、以RNA为模板复制DNA的逆转录酶、以DNA为模板复制RNA的转录酶等;因为生命的最核心运动就是核酸的复制,这些功能性RNA出自于随机自聚的RNA,因有利于核酸的复制而被保留,有“存在优势”。而RNA复制酶的存在使这些功能性RNA扩增而延续是首要前提。RNA简单的序列变化可导致二级结构变化,很容易因新的分子构象导致功能变化,因此复制中发生更具生存优势的生物活性的序列会胜出,RNA分子均有自我进化的特征。在生存竞争中,无功能的RNA分子逐渐淡出,带功能的RNA分子组成了最原始的基因库,带有这些原始遗传物质的囊泡开始走向细胞进化的步伐。
囊泡结构虽然很小,随囊膜两性分子的组成和内容物的张力有大小之分,但对于各类有机分子或RNA分子来说是巨大的,一个细胞大小的囊泡有如一个居住上百万人的城市,容纳上百万核苷酸样的有机分子是不成问题的。随着囊泡运动,内容物的数量与种类的增加,在各种RNA分子与其它生物大分子不断发生碰撞的随机运动中,产生或诱导新的分子间反应或随之的产物,这些反应与产物凡是对囊泡的稳定和增长有利的,参与或催化的RNA分子就易被保留,如在衍生DNA和蛋白质的进化过程中发挥功能的RNA分子,形成原始的核酶群,组成囊泡基因库。在蛋白质编码的进化过程中,因随机自聚的核酸序列如能指导氨基酸序列产生功能性蛋白质多肽的RNA,更成为囊泡基因库的重要基因源。功能RNA的增加使的囊泡内生物分子的种类与运动形式不断复杂、多样化,囊泡的代谢效率与生存功能也不断增强。这些基因均出自于自聚的RNA世界,而不断复杂化的生命运动也促使从中筛选出更多的RNA基因来。原始的基因库在囊泡运动中积累。
囊泡的运动还有囊泡融合与吞噬的机制,这也会造成囊泡基因库的汇集和快速增加,囊泡可从中获得更强生存优势的机遇。在浩瀚的原始海洋中,可发生天文数字的囊泡,加上足够漫长的进化时间,逐步积累一个原始细胞必备的1500功能基因,应该是必然而容易理解的。从原始囊泡发生、RNA基因的出现,囊泡基因库不断扩大有一个漫长的发展史,决不可能是一个偶然的聚集事件。
RNA世界是个混沌的基因世界
RNA(基因)的功能可分成两大类,一类是因自身分子构型而具备生物活性,如各种核酶,另一大类是通过序列编码功能性蛋白质(酶功能与结构功能);还有一类近年来探知的具基因调节功能的非编码RNA。RNA可以作为遗传物质,原始囊泡也可以包容庞大的RNA基因库,但是RNA因分子特征不能集聚成过大的结构;从RNA病毒分析,RNA与脂类或多肽以复合状态可稳定存在,但不能聚集众多RNA基因作有序运动。因此除了某些病毒,自然界没有以RNA为遗传物质的物种;以RNA病毒为例,RNA最长为17kb,HIV是较为复杂的RNA病毒,长度仅为9.3-9.7kb,病毒基因组再大只能分段组成,如呼肠孤病毒基因组分为10个片段,流感病毒分为8个片段,紫花苜蓿花叶病毒由4条RNA组成等,为保证基因组的稳定性和完整性,RNA病毒与其结构蛋白的包装机制是十分独特与严密的,是细胞或囊泡所不具备的。由于RNA分子是独立并具备功能的,相互间有功能和底物的竞争,在优胜劣汰的生存环境中,RNA 竞争就是基因的竞争,囊泡或细胞内不存在“无用”的RNA。例如原来不清楚功能的细胞中大量存在的非编码RNA(SINE和LINE),现在正是RNA细胞生理研究的热点,研究结构显示其在基因调节中有重要的生理功能。
物种在繁衍中,其基因组成必须完整,因此基因必须以组形式存在,使细胞在分裂增殖时基因组行动同步,保证其正确复制和复制后的分配万无一失,以保证子代基因组的完整性。而原始囊泡中各类RNA分子游离状态难以有序组织,囊泡中可能发生和包含大量的具有基因意义的RNA分子,但这些基因并没有脱离原始囊泡的混沌状态,基因无法有序复制与分配,当子代囊泡一产生,父代囊泡的特征也就烟消云散了。包含RNA的囊泡们虽然形态与组分可以相似,但就其遗传物质和遗传特征来说是无定型的,也就不能产生物种的概念。因此RNA世界是个混沌的基因世界,当囊泡基因库中基因数量与种类大到一定程度,基因必须以有序的方式存在,这个有序方式就是与RNA同期发生的DNA,基因由RNA产生,却由DNA来保存,生命的遗传物质从RNA走向DNA,生命由原始逐步走向成熟。
由RNA世界衍生的DNA世界
DNA与RNA分子结构十分相象,仅核糖结构上一个氧元素之差,从分子特征与结构分析,DNA与RNA一样,可由脱氧核糖核苷随机自聚而成,但DNA分子本身几乎没有任何生物活性,因此在生命物质起源初期,自聚的DNA可能仅以一种惰性的有机分子存在。由于DNA与RNA分子结构十分相象,DNA与RNA之间同样存在核苷碱基配对关系。从RNA到DNA需要逆转录酶,逆转录酶与RNA复制酶一样,也是一种RNA酶;从RNA世界中自聚而萌生出以RNA为模板的RNA复制酶,那出现以RNA为模板的DNA复制酶的也就不难理解了,这两种酶在识别底物核苷酸的分子结构上仅一个氧基之差,因此也可能此酶就是从RNA复制酶差异复制中直接转化过来的。同样原理,以RNA核酶的发生机制分析,在RNA世界中,出现以DNA为模板的RNA转录酶和以DNA为模板的DNA复制酶也是可以理解的;因生存优势囊泡内功能性RNA基因的数量增加,以其序列为对应的DNA的合成几率也随之增加,并存在相互间的转录,可以推测在一个混沌的RNA世界发展过程中,同时也衍生出一个DNA世界。虽然DNA本身没有生物活性,但以RNA基因序列为模板的DNA记录下了基因序列,进而在DNA复制酶的酶促下合成互补的DNA链,互补的DNA能以双链螺旋形式稳定存在,DNA又能通过转录酶源源不断地提供功能RNA分子,这是基因能在自然界立足稳固存在的根本因素。如无外加因素,DNA的稳定性可维持亿万年,因此也是极度保守的,以至于自然界存在基因化石之物,和甚至于有的科学家希望借此复制古生物学。这个DNA世界是在RNA引导下产生的,加上也由RNA引导衍生的蛋白质多肽(见蛋白质编码一节),在RNA世界发展过程中,呈现的是以RNA遗传基因为起因,以RNA、DNA和蛋白质为基础的生命世界,这个状态延伸至今。
RNA走向DNA,基因连锁成基因组
在对逆转录病毒的研究中发现,以RNA为模板的逆转录酶可以在不同的模板间跳跃,因此在逆转录时,新合成的DNA链可从一条RNA模板转移到另一个RNA模板,实际上将两条RNA的序列信息连在一条DNA链上,这就是基因的连锁。DNA的重要特征是结构稳定,可极度延长,连锁现象可连续发生,连锁的基因不断增加,作为一个DNA分子统一运动,基因的连锁,意味着基因组的形成。DNA对基因的连锁是随机的,囊泡中可发生各种基因组合的DNA,因包含基因多少与功能的差异,在能量与底物有限状况下,DNA之间存在着竞争,最佳组合才易胜出,基因组大功能多也易胜出,导致DNA基因组不断增长,最后囊括了几乎囊泡内所有基因,成为一个基因组;这样的DNA分子在复制与分离过程中,可以保证父代序列与子代序列的一致性,囊泡中遗传物质如此传承,就具备细胞的特征了。基因组的竞争随着细胞特征的发生就成为细胞间竞争、即物种的竞争。
由于DNA因结构的稳定性极度地稳定延长,随着基因从RNA向DNA转化,囊泡内基因由无组织无序状态成为统一的超分子结构、染色体,一种DNA的超螺旋结构。游离的基因可因囊泡的分裂而随机丢失,囊泡中初始作为遗传物质的主体为DNA所取代。在父代囊泡繁殖分裂时,随染色体的复制与分离,进入子代的囊泡,保持了庞大基因组的稳定与完整性,这是基因必须从RNA向DNA转移的根本缘故。但DNA本身没有分子活性,仅仅是记录了遗传信息,基因功能的实施仍然需要通过RNA实施,由转录酶从DNA序列源源不断地生产各类功能性RNA和信息RNA,操纵整个生命世界的运转。
生命运动的经典法则是由DNA→RNA→蛋白质,而RNA是基因的起源物质,RNA向DNA逆转录遗传信息发生在生命起源的早期,近来研究发现,逆转录现象虽然是古老的,但仍在生命活动中留有痕迹,如在DNA复制的启动和染色体端粒与端粒酶的运动中。
囊泡世界中最终还是有一些未被整合入染色体的游离基因,游离的基因由于功能的单薄无法与基因组竞争,然而其不随基因组统一行动,成为自然界另一大类微生物、病毒的重要来源。
DNA基因的调控
DNA增长的早期,RNA分子向其逆转录的方式是随机的,功能性RNA因生存优势,容易获得机会被转录,一些原始的无功能或功能较差的RNA也有机会被转录而连锁,另有一些先期转录的基因被后来因性能更好的基因加入而显得多余,而DNA分子的运动中没有剔除某段序列的机制,结构稳定而保守,保留了发展过程中大量无效的、低效的、或在进化过程中过时的核酸序列,因此DNA的序列总信息量大大地超过了RNA信息量,含有完整的历史记忆而显得冗长,但DNA的延长因结构因素达到饱和时,通过逆转录基因连锁延长的机制自然被限制了。由于DNA的增长相当于一种随机的记录,造成功能序列仅占DNA总长度中一小部分的局面,如果没有一个基因管理系统,功能序列会被海量的核酸序列所淹默。因此随着DNA的逐步增长,一个(DNA)染色体的自稳与调控系统也随之进化,其功能之一是限制外来基因再加入;之二是抑制或封闭DNA序列中无用的、不用的或暂时不用的片段,如人类基因组为例,4万个基因只占用30亿对总核苷酸量的1%。绝大部分的DNA序列被沉默,以保证功能基因的转录,按时效源源不断地产生各类功能性的RNA。
作为遗传物质,DNA的序列极其保守而稳定;如人类细胞增殖分裂过程中,30亿对核苷酸如数复制,4万基因在染色体中的位点毫无变动,倍增过程庞大而精细,成百上千万的分子有序运动,决不混沌,体现了生命的伟大与神奇。沉默的序列卷曲而卧,4万基因因时因势依次活跃表现有序,在多细胞物种中因细胞功能专业分化,每个细胞只有少量的基因发挥作用,调控严密、经济而高效;功能序列松绑解旋后将信息传递给RNA,由功能RNA驱使后续的系列生命运动。庞大的DNA基因组稳定而凝重,外部的环境复杂而多变,由活跃而动态的RNA从中握旋;一切有序、高效和经济的生物大分之运动,都是围绕着细胞基因组的完整复制,生命的繁衍是基因组复制的表现形式。
从RNA复制酶的起步,生命运动的本质就是核酸的复制,复制更多的DNA;DNA(基因组)不但保守,而且自私,每个DNA(基因组)都只为复制自我,当能量与原料不足时,基因组之间为生存而竞争,基因组在竞争中进化。由于DNA结构因为稳定和保守,基因组之间不能发生交流,因此自然形成基因组(物种)的多样性,在竞争中基因组(物种)的兴亡也是自然的;人类因具有最优势的基因组,站在自然物种的顶端;人类通过农业与畜牧业发展其它物种(基因组),或保持物种的多样性,最终目的还是为自身基因组发展提供原料,DNA自私性的本质没有变化。也是由于稳定而保守,DNA没有将序列中无用、不用或暂时不用、甚至有害的序列剔除的功能,实验室的所谓基因剔除技术(knockout),是抑制功能性RNA,而非真正的从细胞基因组或DNA中剔除什么基因,目前基因工程技术还没有从细胞基因组中剔除一个基因或一段序列的手段。
目前对基因自稳与调控系统已有所了解,这个系统同样是随DNA发展过程中进化而来。已知DNA序列的开关是由核苷酸甲基化机制调节的;原始的甲基化与去甲基化酶归属于核酶,在RNA世界中自聚发生,因其功能而加入RNA基因库;此类核酶通过序列互补识别对DNA相应序列发挥效应,被甲基化的序列因此而沉默。这种沉默机制起始必然也是随机的,由于DNA序列中包含了众多功能差异或不同、性能强弱或有无的基因序列,随机地沉默部分序列,可提高另一部分序列的转录效率,产生未被沉默基因功能的随机组合,因此在基因组组成未发生任何改变的情况下,表现的综合功能却发生了差异,而能提高生存效率与机能的最佳沉默组合得以胜出,基因的随机沉默逐渐稳定进化为特异性沉默,这类沉默在人类染色体中占总量的99%。去甲基化酶又可使沉默的基因复苏,复苏同样有一个从随机至特异的进化过程,使DNA基因的调控发展成一个动态过程;核糖开关的基础研究也证实RNA核酶的基因调节机制,与甲基化机制相互相成,通过与特异平台配对识别,发挥转录终止和起始调节。DNA中有些序列或基因因过时无效而永不复用,成为基因化石。至于更上一级的调控机制目前尚不清楚,从受精卵胞浆有助于一个体细胞转化为胚胎干细胞的现象推测,更高一级的调节物质在细胞胞浆中,受细胞内外综合环境所影响。
从囊泡世界走向细胞世界
曾有人认为地球上的细胞生命是从一个细胞发展而来的,自然界的物种有一个共同的祖先,经历了亿万年的进化逐步分化成如今的万象世界,这个概念其实已经包含偶然论的超自然思维,如此庞大的原始海洋中、海量的原始生命分子中某一天某一刻突然涌现出一个细胞,这个细胞就是生命的共同祖先,这一天岂不会被人认为是上帝使然吗!实际上发展到一定时期包含有丰富遗传物质的囊泡的代谢运动规律与细胞已经没有本质上的差别,唯一的不同是囊泡的子代不能完全保留父代的基本特征与性能,不能形成物种。当囊泡中的基因有DNA连锁至90%以上,DNA的复制分离能保证生长分裂后子代细胞的基因组与父代一致,能维持父代的基本特征与性能,就是细胞的概念。以这样的认识观,可以想象海洋中海量的囊泡发展到相应时期,囊泡中的基因积累并连锁至一定程度,尽管它们之间的基因组组成自然存在着各种差异,然而它们却共同地从囊泡时期跨入了细胞时期,从这个意义上说细胞的形成不是个别的,是宏观的,是物质运动发展的必然规律,我们可以就此摆脱上帝或偶然的超自然思维束缚了。即使发展至今细胞生命已经经历了亿万年的进化,参与细胞生命周期运动的基因也不是100%的被连锁,仍然有少量基因处于细胞核或染色体外,游离于细胞基因组而独立运动,这些游离基因因不能与细胞基因组同步而不稳定。这些基因一定是细胞的非必需基因,可以丢失;或是普遍存在的、在分裂或繁殖中不会丢失的基因组分,如线粒体基因。
物种的基础基因有相似性也不能说明所有的物种是一个原始细胞进化而来的,因为生命物质的基本组成和基础运动均起源于原始海洋,生物大分子有着共同的运动规律,基因起源于自聚的RNA酶,因结构与功能的构效关系,起源不同的同功酶,向着最佳结构进化,最后会形成序列与结构的相似性;因此可以说生命基础基因的相似性是由异趋同、而非由同趋异的结果。
DNA在继续进化、生物钟在走
DNA的原始增长和基因组积累是由逆转录酶和逆转录机制驱使的,但经历亿万年的进化,这种混沌世界的现象早已不复存在,因此我们将逆转录现象和逆转录序列看作一种基因化石,用于研究生命的进化史。然而近年来在研究逆转录病毒时,一些专家表示逆转录病毒可以将病毒基因序列整合入细胞DNA序列,这种核酸运动的“复古”现象及其论点是需要置疑与进一步认证的;;例如有关乙型肝炎病毒序列和肝细胞DNA整合的研究结果,以及成为乙型肝炎病毒造成慢性感染的论点很需要认真反思的。乙型肝炎病毒DNA多聚酶中的逆转录酶片段功能是复制病毒DNA,病毒DNA多聚酶中并不含DNA内切酶和连接酶,何以将病毒DNA插入细胞DNA。在病毒学研究中,以往从未发现有病毒基因序列进出宿主基因组的机制或相应的临床现象。从上述DNA(基因组)发展史分析,离开RNA混沌世界后,自然界没有以插入基因的方式使物种基因组进化的机制,人工的也没有。基因工程技术能将外来基因插入或改造病毒基因组,(使病毒基因组扩大违背了病毒的进化规律。)尚无能力或工具将外源基因插入细胞基因组(染色体),一些现代基因工程实验室的整合研究结果是“工艺品”,而非自然。要改造细胞基因组、参与物种的进化、创造新物种人类还有待努力。
除了RNA病毒外,所有的物种的基因组都是DNA组成,基因线性排列,实质是一条长长的DNA双螺旋链,多重卷曲成为染色体。一条染色体可含成千以上功能基因,原核细胞只有一条染色体,而真核细胞含有多条染色体,一个主要差别就在于它们的复制,原核细胞只有一复制子,复制分离过程简单;真核细胞含有许多复制子,由执照因子控制每一个复制子在一次细胞周期中只能激活一次,复制后的染色体有丝来牵制分离(有丝分裂),确保倍增的染色体完整地分配到两个子细胞。
进化论与基因学研究显示,基因组在复制过程中基因重复复制和趋异成为DNA进化的动力和物质基础,重复复制可使基因组基因数量增加,概率为每百万年1%;而两个重复序列的基因因变异而趋异,最后分化为两个性能不同的基因,序列趋异是进化钟的基础,也为约每百万年1%。通过这个方式,一个基因组基因的倍增需要一亿年;从脊柱动物一万个基因进化到人类4万个基因,经历了5亿年时间,其中还包括了恐龙时期,悠悠生命史确实是漫长渐进的。
人类的文明史与生命进化史比较确实在过于短暂,除了从化石与生物比较学研究,我们是无以察觉生命进化的。自人类有文字记载以来,可看出数千年来人类的思维对象有了翻天复地的改变,但人类的思维能力和思维深度并没有多大的改变,表明控制人类智慧的基因没有明显的进化,所以我们可以欣赏与借鉴古人的文化,与今日文明沟通。但DNA的生物钟在走,基因组必定在进化,只是我们无法察觉,但我们从生命进化规律预测将来。基因组的竞争就是物种的竞争,因此物种的兴亡也是自然规律。自然不能逆转,远古时代以逆转录方式形成基因组的机制早已终止,物种(基因组)的进化只能遵循达尔文的渐变论,通过复制变异按生物钟缓慢发展。
基因组的恶化与优化,有性繁殖与育种(略)
(2010-8-31 陈国民)