Wildbull的个人博客分享 http://blog.sciencenet.cn/u/Wildbull

博文

如何寻觅失踪的蛋白质和核酸的“媒人”? 精选

已有 4964 次阅读 2020-8-23 14:54 |系统分类:科普集锦| ATP假说, 遗传密码的起源, 生命构件, 前生命“汤”, 共演化

在现代生命的生化系统中,蛋白质与核酸互为因果,不可分割,35亿多年前曾经使这两种大分子联姻的“媒人”早已消逝的无影无踪......要想知晓遗传密码从何而来,关键是如何去寻觅失踪的蛋白质和核酸的“媒人”......


1. 引言

遗传密码的起源是揭示地球上生命起源的钥匙,因为它是生命存在的前提条件。遗传信息是一种以三个核苷酸(称之为密码)的形式保存的化学记忆(RNADNA),但关于其起源的研究与争议持续了很长时间(如[1,2,3,4,5])。以一套密码创作出数以千万计的不同的物种可谓大自然的神奇,因为它几乎被从细菌到人类的所有物种所共有,仅有少数的错误例外,这表明标准密码是在一个非常短的时期内或非常接近被认为是地球生命起源的时期被一个所有生命的的共同祖先以现在的形式所使用[6]。因此,遗传密码是生命的通用语言。

自从遗传密码被发现以来已经过去了半个多世纪,但其起源仍然被视为生命科学最大的秘密之一。遗传密码真的不可知吗?遗传密码真的需要外部设计吗?我们离获得一个关于约35亿年前遗传密码是如何起源的清晰概念还相距遥远。或者说,我们并不清楚为何遗传密码在前生命世界起源从而开启了信息时代[7]Cavalier-Smith [8] 指出,“只有在比个体的自私基因更高的水平进行选择,才可能驱动导致遗传密码产生的大分子的协同演化”。我完全同意这一观点。因此,认为生命开始于裸基因复制的起源而细胞之后才进化的观点是错误的。原则上来说,只有细胞选择才能增加像遗传密码这样的复杂特性。

本文在脂质囊泡及随后的原细胞的生化反应演化的范畴中讨论遗传密码的起源问题,在那里ATP位于生物能量的中心,将太阳能转化为化学能,启动了一系列的链式反应,导致了记录遗传信息的三联体密码子的诞生。

1-1. 演化≠起源

大多数生物学家都悲观地认为,没人准确地知道遗传密码从何而来,因为准确重建密码子的起源过程是不大可能的[9]Smith Szathmáry [10] 指出:“遗传密码的起源代表了进化论中最令人困惑的问题;同时现有的翻译机器又是如此复杂、如此普遍以及如此如此必须,以致很难想象它是如何产生的,或者说没有它生命是如何能够存在的”。Yockey [11]甚至宣称, 密码子的起源是不可知的, 因为没有任何迹象表明存在通过特定序列或序列之间的密码来控制化学反应的物理或化学机制。他批评道, 许多冠以遗传密码起源之名的论文其内容仅仅是在论述它的演化而已。

1-2. 已有理论的致命缺陷

凝固事件假说认为在一个单一祖先中密码子分配到氨基酸完全是“机遇”,之后就保持不变[1]。立体化学假说认为,在很多情况下,在氨基酸和合适的tRNA上的相应密码子的碱基序列之间存在特殊的立体化学适合性[12, 13]。立体化学假说和凝固事件假说的观点似乎是对立的。也有人认为,遗传密码既不是偶然的,也不会完全凝固[8]。共进化假说认为遗传密码与氨基酸的生物合成是平行进化而来的[2]Knight[14]认为,遗传密码是选择、历史和化学的产物。在我看来,这些假说都没有描述遗传密码是怎样在原始生化系统中被创造出来的。之后几乎没有取得明显的进展,尽管文献中充满了试图解释遗传密码的变异或弹性以及氨基酸-密码子可能的分配规则[15, 16, 17, 18]

直白地说,这些假说存在几方面的缺陷。首先,所有假说都忽视了能量驱动力的重要性,其次,没有哪个理论能从生化系统的范畴来解释遗传密码的起源(部分和整体的关系)。特别是,所有假说也忽视了能量转换和信息化之间的神奇关系。以我之见,仅仅基于密码子自身是不可能理解密码子的起源的[15, 19],或者说,即使将视角扩展到密码子与氨基酸之间的可能关系[17]

1-3. 分子不可能在体外演化

以我之见,原细胞的演化必须从一个封闭的环境(如脂质囊泡)开始。事实上,我们长期以来被强烈主张大分子体外进化的艾根所提出的所谓分子拟种模型所困扰[20]。一个在环境中的分子拟种被想象为是一个在遗传上相关的RNA分子的种群,它们具有一定的形态相似性,但又不完全一样。他假设分子拟种遵循达尔文的自然选择过程。这个模型具有很大的影响力[9],在我看来,也误导了我们对遗传密码起源的理解。譬如,它错误地假设,在原始地球生命的自然历史中存在优势聚合物序列及相关功能特性的随机演替[21]。我们必须记住,所有现存的细胞都被一层由两亲性脂类组成的膜所包裹,这有利于一些像ATP这样的关键细胞化合物的生产。此外,两亲性脂类可以在水介质中自组装,为原始细胞的分裂提供了化学基础。众所周知,具有长疏水尾巴和亲水头部的两亲分子能在液态水存在时自发成膜[8]

1-4. 生物大分子的体内协同演化  

对于一个细胞来说,发明通过RNA合成蛋白质是一个伟大的创举,反之亦然。这就是所谓的蛋白质和核酸的“鸡与蛋” 悖论,这困扰分子生物学家已长达半个多世纪。这似乎是一个关于谁先出现(“代谢在先”vs“复制在先”)的循环逻辑争论。另一方面,任何假设也不可能逃脱这一悖论。

令人惊讶的是,大分子起源的线索已彻底丢失,因为生化途经的环化导致一些过渡状态或轨迹早就消失了。正如古希腊哲学家赫拉克利特所言,在圆周上, 起点和终点是重合的。

从逻辑上来说,这种复杂的协调一致的路径和相互交织的过程是不可能单独进化而来的。原始生化系统是通过以功能优化为目的的分子协作(即协同进化,一个用于达尔文选择的词汇)发展而来的。“共生”一词也被用来描述分子进化[8]

1-5. 失踪的“媒人”

这里我提出一个逻辑的推理,只有“A”能做两件事(“B”、“C”),它才有可能在“B”和“C”之间建立起联系(信息的前身)。但这同时还需满足另外的条件,即这种相互作用需发生在封闭的实体(如脂质囊泡)之中,还需有一定的选择压力能使原细胞进行结构和功能的优化。

对遗传密码来说,“B”和“C”分别是核酸和蛋白质。在这个情形,在生命演化的历史过程中,“A”彻底地消失了。因此,如果我们想知道遗传密码的起源,我们需要找出“A”。如上所述,生物大分子必定是在封闭的环境(如脂质囊泡)中演化而来的,这绝不可能发生在自由的溶液中。如果可以这样,大自然为何要在地球上创造出如此复杂的细胞呢?

不幸的是,在以往所有关于遗传密码起源的理论或假设都没有这样的逻辑推演,也没有关注这个“媒人”。其结果,仅仅聚焦于“B”和“C”之间的关系是不可能得到正确答案的。

 

2.  ATP假说

本论文提出了一个新的学说—ATP假说,以解释在一个原细胞中ATP是怎样在遗传密码(与原始生化系统协同演化)的起源中扮演了一个中心角色的(1)。ATP是打开这个黑匣子的钥匙。ATP是一个普遍存在于前生命“汤”中的生命构件,但现在被太阳光子驱动的化学反应不断更新以不至于枯竭。在原始密码的演化过程中,ATP既是能量的载体,也是信息化分子,因它能为氨基酸缩合成短肽链以及具有催化功能的多肽提供能量以及促进多核苷酸的形成,导致对核酸(RNADNA)中三联体密码子的热力学有利和/或或然的选择。最终,RNA成为信息的短暂携带者,而DNA成为遗传信息的最终以及永久的储存分子。为何这里说ATP是信息的携带者是因为它为通过简单分子合成其它核苷酸提供了能量,而AGCT/U构成遗传密码。

支持ATP作为遗传密码启动者的关键论点就是它并不需要额外的能量输入就能延长多核苷酸和多肽链,这使建立或固化多核苷酸中的核苷酸序列与多肽的氨基酸序列之间的关系成为可能,当然这还需要通过细胞的生存选择(一种生态力量或反馈机制)从这两类生物大分子之间的无数随机组合中进行固化。这是极为重要的一点。不然,我们无法在逻辑上解释为何信息能够产生。从技术上来说,光合作用,一种目的导向的过程,能使各种生命因子或反应(ATP、脂质囊泡、信息化、结构化、同质性个体、个性、生存,等等)整合进生化系统的遗传密码操作系统之中,即使生化系统刚开始时尚处于贫瘠而原始的状态。遗传密码最终采取了三联体的形式可能主要是由操控氨基酸的立体化学特性所决定,通过如沃森-克里克碱基配对作用,并且多核苷酸和多肽环化成了一个互为因果的反馈回路。ATP假说也可视为一个关于遗传密码起源的能量模型。

 

 Figure (Version 7).jpg

一个基于ATP假说的关于遗传密码子起源的简单概念模型。在原细胞中,蓝色虚线表示前细胞时期的演化过程,而红色实线表示现代的过程或关系,箭头表示影响或作用的方向。能量(如太阳能)、生命构件和半透性脂质囊泡(适合于细胞分裂)是生命起源的三个不可或缺的要素。这个故事是从前生命“汤”中的脂质囊泡开始的,那里足够数量的各种各样的生命构建(如吡咯、ATCGUNADPH、氨基酸、脂肪烃、泛醌、单糖等)共存在一起。ATP在多核苷酸和多肽之间架起了桥梁,推动了前细胞的信息化、记忆化和结构化/分区化过程。ATP的光化学生产(包括水的裂解、电子传递链、跨膜质子梯度等)受到了前细胞的选择,促进了遗传密码的起源,一个持续了数亿年的过程。之后,ATP通过介导生化创新(如循环,糖酵解,卡尔文循环循环,糖酵解,卡尔文循环)成为了能量中心。只有完成了将多核苷酸和多肽环化为一个互为因果的反馈循环以及遗传信息的保存从RNADNA的过渡(这与中心法则相反)才见到了细胞生命的曙光,只有这时,达尔文进化才开始登场。最先的细胞,具有可分裂和可复制的特性,发展出了一个精致的生化系统,通过光合作用将太阳能不停地转化为ATP,再通过各种代谢途径进一步支撑其它的细胞功能,这些过程被三联体密码字记载的遗传信息所指挥。

 

地球诞生于约45亿年前,持续到40亿年前后的“晚期重大撞击”事件可能阻止了生命的存活[22, 23]。这可能是前生命“汤”时期,那时虽然存在相对复杂的化合物但并无演化发生。随着地球的逐渐变冷,前生命的演化在脂质囊泡(原细胞的前身)中开启,在那里原始生化系统在ATP的能量驱动下不断发展。下一个时期就迎来了由三联体密码子指导的自我组装、自我复制和周期性分裂的生命演化(达尔文进化)的到来。毫无疑问,在现在的生化系统中,ATP驱动了一系列的动态过程,如,从小分子到大分子的构建(同化作用)和将大分子裂解为小分子(分解代谢),建造活机器的各个部件这也称之为新陈代谢[24]

生命及其遗传密码是如何于30多亿年前在地球上诞生的?这毫无疑问是一个重要但主要还是推测性的议题。但可以借助某种哲学的视角进行逻辑推测。古希腊哲学家亚里士多德曾说,“我们不知道一件事,除非我们弄清楚它的为什么,即原因”。因此,如果用亚里士多德哲学的说法,原因如下:“质料因”由各种生命构建(如核苷酸、氨基酸、糖、脂类等)所组成,“形式因”用质料构建特殊类型的事物(即拥有生化系统——包括遗传密码、生化循环等——的原细胞), “动力因”就是引起变化的通过光化学反应生产的ATP,“目的因”就是形式的目的,即细胞的个体性及其渴望为生存的斗争。

 

3. 为何ATP

3-1.“隐藏之手”还是自然力量?

我们不能否认密码子和氨基酸之间的立体化学联系[13]。否则,我们会陷入遗传密码是上帝创造或设计的宗教信仰之中。关键是遗传密码的诞生必须有驱动力。虽然随机性和选择常常被认为是这种驱动力,但我认为它们不是主要的驱动力。我倾向于认为驱动力应该是能量的,如在原始细胞中太阳光子驱动的化学合成生产的ATP。重要的是,只有ATP能在分子、有机体、物种和生物圈之间建立起能量联系。

毫无疑问, 作为一种化学语言的遗传密码的设计绝不会依赖于所谓的“上帝之手”的干预, 而我们也没有可信的化石证据, 因为数十亿年的时光已将生命演化早期的分子遗迹彻底埋葬[25]。但幸运的是, 我们依然能够从现在的生命回溯历史, 虽然我们的眼睛仅能感知早期生命历史的非常微小的一部分。

为了避免“上帝之手”, 在原始细胞中遗传密码发展的起步条件应该是在结构上具有简单性,在能量上具有持久性。有在此之后,蛋白质/核酸的相互作用和热动力过程才能变得越来越复杂,才能在选择压力下通过结构、路经及功能的优化建立起秩序。

3-2. 来自现有生化系统组织的启示

现在是过去的延续,因此,为了解决遗传密码起源的难题,了解现存的生化系统是如何组织的将是富有成效的。考虑这样的问题:生命是什么?我们可以说,生命不是静止的,是一个程序!我们也可以更详细地说,生命在组分上是物质、能量和信息的统一体,在动态上是物质循环、能量流动和信息交流的和谐互动。其中,能量是支撑生命系统的关键。在最近几十年,物理学家和化学家已经揭示了关于有机体是如何组织以及如何工作的许多细节。现已清楚,有机体就是分子机器,在那里发生着无数不可思议多的生化反应以获取、转化和利用能量。除了化能自养细菌,所有现存的自养生物(植物、藻类和一些细菌)的能量来源都是太阳光,它们通过一系列复杂的生理生化过程(称之为光合作用)将太阳能转化为化学能[26]。这样的生物能储存在硫酯键中(如在乙酰辅酶中),像在乙酰磷酸中的与碳连接的磷酸酯键中,或在三磷酸腺苷(ATP)分子中的磷酸键中[27]

从能量和信息的角度来说,在生化系统中, 没有什么比核苷酸ATP的角色更重要的了。ATP是光合作用的唯一能量产物,携带着从太阳能转化而来的化学能。它然后通过ATP/ADP/AMP 的转化为代谢提供能量,支撑在一个组织精巧的细胞中的各种生物分子之间的相互转化。换言之,主要的代谢通路(如卡尔文循环、糖酵解和三羧酸循环)都与ATP相偶联。从这种意义上来说,ATP是普适性的生物能量货币。当然,核苷酸的代谢产物——NAD(P)H也是必须的,因为它传递He-[通过NAD(P)H/NAD(P)+的转化]

在现存的生命中,ATP除了是遗传系统(DNARNA)不可或缺的构件之外,组成遗传密码的其它四个核苷酸都可从ATP和其它生命构件获得,因为ATP为这些转化提供了生化动力[28]。从这种意义上来说,ATP在生化上控制着信息交换,而信息划定了有生命和无生命的界限,因为生命世界似乎是唯一可以记录、加工或利用信息的地方[29]。因此,作为能量转化和信息化不可替代的分子,ATP在生化系统中扮演了能量中心的角色。

3-3. 生命是如何在地球上起源的?

遗传密码的起源是生命起源的一部分。生命和遗传密码的起源是两个紧密联系的问题,对其中一个的了解需要对另一个的了解。

  生命光化学起源的指示分子

ATP在遗传密码起源中的重要性可归结为其驱动了原始生命早期光合系统演化,像其它所有不可逆过程,生命的起源必定是为了耗散广义热力学势,主要是太阳光子势[30]。虽然存在争议,有迹象表明地球上的生命可能是从光化学合成开始的,因为光能毫无疑问是最普遍以及最恒定的能量来源,这对一个像生命起源这种需要数亿年的过程来说是特别重要的[31]

让我们看看来自一个有趣分子提供的可能证据。众所周知,叶绿素是光合作用的一个非常重要的分子。有趣的是,它似乎是镁卟啉环和来自原始细胞膜的长链脂肪酸的加合物。卟啉环和脂肪酸都是前生命“汤”中的生命构件。另一方面,细胞色素是一种以铁卟啉或血红素为辅基的电子传递蛋白,因此是生产ATP的原始光合系统的必须部分。血红素可能就是从光合色素——叶绿素衍生而来的,因为在现存生物中两者的生物合成途径亦十分相似[32],虽然你也可能提出相反的观点。以我之见,细胞色素刻有光合作用的印记。现在,细胞色素是一个普世的电子载体,甚至出现在化能自养细菌中[33]。考虑一个这样的问题:如果光合细菌不是现存生物的最后的共同祖先(LUCA),为何化能自养细菌要用一个像细胞色素这样印刻了光合作用的分子作为电子载体?

关于生命起源的热力学耗散理论认为,生命开始并持续到今天是作为吸收和耗散太古代海面上的太阳能的催化剂的[34]。这进一步被以下推理所强化,即许多基本的生命分子都是色素,它们的产生和演化是为了耗散太阳光谱[30]ATP假说更进一步细化了生命是如何从被光化学合成驱动的生化系统的演化开始的,其中ATP在从能量到信息的生化转化中扮演了关键的角色,并导致了遗传密码的诞生。

  各式各样的生命起源理论

迄今为止提出了许多关于生命起源的假说,如“原始汤”假说、黏土假说、脂质世界假说、多磷酸盐假说、辅酶世界假说、铁-硫世界假说、锌世界假说、多环芳烃世界假说、代谢在先模型、自催化假说、自组织和自复制假说、深部热液生物圈模型、深海喷口假说、热合成世界假说、放射性海滩假说、紫外线和温度辅助的复制模型、水泡假说和多起源假说等[31, 35]。但是,在生命起源研究群体中,关于最早的生命是光能自养、还是化能自养、或是异养的问题还未达成共识。

与这些假说不同,本文主张生命起源于光化学合成,即原始光合作用驱动了生命的起源,虽然现在关于生命起源最流行的理论认为是与海底碱性热喷口的化学过程有关。关于最早生命的能量来源存在激烈争论,提出的假说从pH、氧化还原梯度到热能和紫外线[35]。遗憾的是,光能,这个最普遍以及最持久的能源,被排斥在外,可能基于这样一种想法,即复杂系统演化自简单系统。但简单的事物不一定比复杂事物要老,因为演化既有复杂化也有简单化。因此,化能自养细胞未必就是最早的生命。

ATP假说强烈支持生命的光合起源。叶绿素生物合成基因的系统发育研究为祖先细菌为绿细菌提供了最好的解释,生命之树的根位于硫细菌和非硫绿细菌之间。据推测,遗传密码子可能源于与原细胞利用多聚磷酸盐作为能量来源有关,但其后来的扩展得益于原细胞氨基酸生物合成的演化,这也导致了光合作用的起源[8]。这是一个有趣的观点,虽然我只部分同意。

3-4. ATP作为遗传密码起始者作用顾虑的回应

可能有人会质疑,原始核苷酸的前生物起源并不依赖ATP,这些核苷酸(甚至其多聚体)的最早组分能够化学合成,这似乎比原始的光合系统要早的多[36, 37]。但是,核苷酸没有光合作用的帮助在原始汤中存在的事实并不能否定原始细胞中ATP的生产与光合作用的协同演化导致了现代细胞生化系统及其遗传密码成型的可能。AGCT/U或其它核苷酸可能都在原始汤中存在过,但仅有ATP被选择成为了为原始细胞光合作用的能量产物。这要么是随机的,或者是分子匹配的必然结果。最终,随着生化系统的发展,ATP开始通过提供能量来驱动利用简单分子(如氨基酸、谷氨酰胺、一碳单位、CO2等)合成其它核苷酸。

  还有人也许会质疑,原始光合系统是否能在完全没有蛋白质参与的情况下生产ATP?早期生命如何在没有DNA或甚至没有RNA的情况下使光合系统得已传播?事实上,各种生命构建物质(如氨基酸、嘌呤、嘧啶)被发现存在于陨石中 [38],表明核苷酸容易在前生命汤中存在或形成。原细胞发明了光化学反应或简单装置来生产ATP,这一过程之后在蛋白质和RNA/DNA的帮助下变得高效和常规化,即光合作用。这是一个共演化的结果,而不是一个序列过程!

 

4. 怎样ATP

4-1. 从能量转化到信息化之旅

在地球诞生的早期,绝不可能有任何信息,信息是细胞生命演化的产物。在这里假设,遗传密码系统是由原始细胞中与ATP生产密切关联的化学机制所产生的。

  ATP生产的跨膜H+梯度

从能量上来说,原始生命需要完成的第一个任务就是获得这个核苷酸充足的生产。在现在的光合生物中,ATP的合成需要跨膜质子梯度,而质子来源于在光系统中对水的裂解。因此,为了获得质子梯度,需要有相对封闭的实体或小空间对H+不通透。这个空间最有可能就是脂质囊泡,原细胞的前体。ATP的合成需要跨膜H+梯度表明,大分子是不可能如艾根设想的那样在体外演化的。

从化学上来说,在原始地球上脂肪酸能自动形成双层球状膜结构不是没有可能[39]。在现存的生命形式,由脂质(磷脂)双层组成的细胞膜对物质的进出具有选择性。它允许像CO2O2这样的小分子通过扩散进出,但阻止一些分子和离子(如H+)的通透,导致膜两侧不同的浓度。H+不能自由地穿过膜除非通过跨膜蛋白质通道。这意味着,原始细胞中ATP的形成逐渐变得依赖蛋白质通道,之后发展成ATP合成酶。此外,通过水的裂解形成H+也需要多肽的帮助。通过这种方式,膜通过操控细胞内外两侧的电化学梯度(特别是通过神奇的纳米马达ATP合成酶)开始对能量进行管理[40]

  大分子协同演化以促进ATP的生产

  有理由相信,只有当各种要素(阳光、脂质双层膜、多肽、水的裂解、跨膜H+梯度、电子载体等)组织成一种有序的状态,顺畅的ATP生产才有可能。可以推理,在原细胞中随机地发生了一系列的事件。譬如,跨膜质子梯度加上多肽通道导致了合成ATP装置(如ATP合成酶)的形成。ATP这样的核苷酸能通过自身缩合形成多核苷酸,一些核苷酸能携带氨基酸(tRNA的前身),而另一些构建合成多肽的平台(rRNA的前身),它们最终取代了通过ATP活化的氨基酸无规则和随机的多肽的形成过程。现在,RNAmRNAtRNArRNA 能实施蛋白质合成的关键反应。另一方面,多肽反过来不仅参与亲水分子/跨膜离子通道的构建,而且参与H2O的生物化学裂解和催化核苷酸的自缩合反应。其结果,许多连续的反应形成成各种链条,可能是线性、分枝或环形的。从根本上来说,这是一种创造/创新的过程,从无序中创造出有序,从随机性中创造出规律性。简言之,通过这些过程,随机存在的生命构件最终被组织成有秩序的细胞结构和功能。

  无组织的前生命“汤”和偶发的自组织

  在原始地球上的化学混合物(前生物“汤”)被认为含有大量的生命构件,例如氨基酸、吡咯、磷酸盐、金属离子、核苷酸(如ATGCU)、NADPH、多聚氨基酸、多聚核苷酸、脂肪烃、质体醌、泛醌和单糖[31]。这些生命构件被认为能形成随机序列的聚合物或超分子聚集体,具有不同的特性或功能,如自我复制或催化[21]。生命进化的第一步就是将各种各样的生命构件隔离在一个脂质囊泡中,其中各种产物(如多核苷酸、多肽)能积聚到一个很高的水平,不能自由的扩散出去。此外,封闭环境有助于保护不稳定化合物的生化反应。以我之见,在地球诞生的早期,分子的偶发性自组织(如多聚化、自我复制)可能早已存在,但原始生命的演化是从没有组织的物质开始的。

  细胞分裂是怎样开始的?

意外的封装不会形成细胞。首先,细胞分裂的发展是遗传密码子出现的前提条件。让我们首先考虑半透性的脂质囊泡(由具有极性和非极性结构域的两亲分子包围)包裹了足够的生命构件。太阳光能反复的随机性刺激,驱动了这种个性化结构中电子与质子的流动,拉开了元素重组的大幕。这包括各种有机化学反应,导致了一系列的前生命合成。由于这种膜结构对物质进出的非均衡性影响,容易导致大分子有机物质的积累,但伴随着像CO2这样的小分子的不停输入,因此,原始细胞在增大与破裂之间循环往复,导致了光化学合成(光合作用的前身,这里称之为拟光合作用)和细胞分裂的发展。

正是膜的连续生长和不连续分裂的能力使得有机体在物理上成为可能。譬如,在两亲分子是流体的温度下,膜可以通过插入环境中的额外的分子而自发生长,又由于自然的不稳定性或剪切力而自发地分裂,细胞只是利用、指挥或改变这些基本的物理力[8]。通过对脂质囊泡的自发进化研究表明,它们分裂、融合、内化并形成复杂的内部网络[41]

  走向信息化

一个信息时代来临了:在拟光合生长并伴随分裂的周期中,通过个体生存的选择,原始细胞建立了“内禀”的特性或功能,如在处理光化学合成产物时的规律性、可复制性和各种有机化学反应的节律性,其结果导致了复杂的生化循环网络和光合作用的产生(1)。因此,这种包裹了生命构件的“反胶团”很可能就是在光化学反应的驱动下生命和其遗传密码开始出现的地方。这也是一个创造生命原始“本质”的过程。

4-2. ATP到三联体密码子之旅

ATP是如何在两种大分子之间启动以三联体密码子形式进行编码的?我们如何才能描绘信息演化的途经?你可能会猜测,氨基酸和核苷酸形成巨大的团簇,也许这就是ATP所参与的地方,即可能它可以被吸收进氨基酸和/或核苷酸簇中去。虽然不能排除这种大分子簇的随机形成,但这并没有得到前生命选择的青睐。将一组遗传密码是如何成功地被选择下来用于记录、保存和传递信息的情景概述如下。

  多核苷酸和多肽的“媒人”

可以设想,在被原细胞包裹的有机“汤”中,能量物质ATP及其衍生物能随机的延长多核苷酸链和多肽链(因为ATP通过氨酰tRNA合成酶为tRNA的氨酰化提供生化能量,这是将氨基酸连接形成短的多肽链的关键前提条件),这使得建立或固化多核苷酸中的核苷酸序列和多肽中的氨基酸之间的化学关系成为可能,当然这是从它们之间无数的随机组合并通过了细胞生存的选择,一种生态力量或反馈机制。简单地说,ATP能为两件事的完成提供能量:延长核酸(RNADNA)和蛋白质,然后才能在这两个生物大分子之间建立其关联(即一种序列特异性的相互作用),这就是信息!信息通过特殊的多肽-多核苷酸配对所记录。通过这种方式,ATP介导了从能量转化到信息化的生化革新。这是地球上生命和遗传密码诞生的不可或缺的一步,这是在原始细胞中开始构建生化系统(包括遗传系统)的关键。需要指出的是,ATP并不是多核苷酸和多肽形成的唯一驱动者,因为这些多聚物也能在实验室合成,因此亦可能存在于前生物时期。但是,这并不能否认ATP在多核苷酸和多肽之间的桥梁作用,因为ATP可能大大地改善了这些过程。这个以ATP为中心的遗传/生化系统得到了不断改善,并通过前细胞的选择保存了下来。

  从信息化到结构化和功能分化

信息化不可避免地伴随着结构化(如结构细分和特化)和功能分化,这为三联体密码子系统的建立奠定了基础这是一个多功能结构(功能性生物大分子)的发展阶段。譬如,tRNA特化为携带特定的氨基酸,而多肽有助于tRNA的氨基酸臂与其反密码子的匹配,通过立体化学相互作用(例如,氢键、范德华力和芳香族堆积)的分子识别,逐渐发展出密码子-反密码子碱基配对规则,最后,迎来了一个合成蛋白质(根据mRNA模板合成多肽)的统一的平台——rRNA的诞生。通过这种方式,大分子进行功能分化,即多核苷酸负责信息的编码、保存和传输,而多肽(称之为酶)高效催化几乎所有生化反应,两者进一步环化为互为因果的系统。其结果,基于编码的信息化导致了各种原理或格局(如生化通路)的进化创新(1)。这种生化过程显著地增加了原始细胞的复杂性。一个可遗传的生物信息系统的建立标志着从前生命化学世界向原始生物世界的真正过渡,只有在此之后,才开启了达尔文进化的时代。对这些机制的逐步完善为原细胞提供了进一步的选择优势。

  为何是三联体密码子?

有理由认为三联体密码子不过是对氨基酸的一种合适的立体化学操控以及在选择压力下生化网络优化的结果。为了对约20种氨基酸进行管控,密码多了累赘,少了不够(43 =64还有相当大的编码冗余)。即三个核苷酸是满足氨基酸编码最低需求的密码子数。

  为何可遗传的同质性受到青睐?

原始生命的个性是由脂质囊泡的体积限制所决定的。这导致了受遗传密码指挥的同质性原始细胞的自组织、分裂和繁殖的发展。原始细胞必定花费了漫长的时间通过以前细胞生存为目的的正向表型选择去测试和修改遗传密码。然后,细胞获得了从一代到下一代传送记录在DNA中的蓝图的能力(可复制性),同时,自我构建成为了生命的核心特征。因此,原始细胞朝着第一个可遗传的细胞迈出了历史性的一步,即一个能够承载、处理和传递信息、繁殖同质性(虽然不是绝对的)个体、因此可以进行达尔文进化的真正的物种。似乎有这样的一个第一原理,即同质性个体的繁殖受到自然的青睐,这有点像一种向心的生理生态力量,不仅控制着各种生化事件的整合,而且确定了生存选择的方向。

据推测,只有那些能产生更多自身拷贝的在环境中起作用的大分子才有进化的希望[42]。从个体性(原细胞)的角度来说,这似乎是一个有道理的观点。

4-3. RNADNA之旅

核酸如何分化成DNARNA是一大谜团。一般认为,作为遗传物质载体的DNA优于RNA,主要因为DNA具有较大的化学稳定性,这样DNA就比RNA能形成更大的基因组[18],虽然两种生物大分子在结构上仅有细微的差别。

既然光合作用只生产ATP,那么,从ATP向其它几种核苷酸的转化就不会困难。因携带有高的活化能,三磷酸化核苷酸可以自动缩合成各式各样的mRNA及其它RNA,而既然可以聚合成mRNA,那再拼接出更长的核酸(DNA)亦是水到渠成之事。mRNA走向DNA是生化系统信息化逐渐完善的一个标志。DNA特化为准确记录和永久保存指挥细胞活动的所有遗传信息,而mRNA变为专门司职于遗传指令执行、存在短暂的信使。

RNA作为引物仍然参与现存生物体的DNA复制,这是从RNADNA进化过程中的一个惊人印记。

在信息的整合过程中, 终产物DNARNA在结构上出现了细微的差异。首先,在核糖的第二个碳原子处前者是-H后者是-OH。其次,碱基也变换了1, DNA中的胸腺嘧啶TRNA中被尿嘧啶U所取代, 当然两者的差别十分细微, 也就是T多了一个甲基。没人能回答为何碱基相异的是1个而不是4个。在结构上或许并无多大意义, 只是在于区别, 因为类似的例子亦不罕见(譬如NADPHNADH)。与DNA不同,RNA可以折叠成各种复杂的三级结构,类似于结构蛋白,催化广泛的化学转化[43]。目前尚不清楚RNA多样的三维结构是否只与核糖或碱基的如此微小的变化有关。在结构上来说,这只是一个意外吗?从功能上来说,遗传系统细分为RNADNA似乎是为了实现在一个非常小的细胞内对成百上千同时发生的生化反应进行有序的信息管控。其结果,生化系统达到了这样一种状态,即mRNA的使命完成之后,马上就被销毁掉,而DNA所记录的遗传信息则是要永久保存与传递的,这是种族延续的根本。

 

5. ATP为中心的RNA世界

Woese [44]提出了RNA世界学说(该词由Walter Gilbert1986年创造[45], 认为地球上早期的生命分子先以RNA出现, 之后才是DNA, 早期的RNA分子同时拥有如同DNA的遗传信息储存功能, 以及如蛋白质般的催化能力, 支持了早期的细胞或前细胞生命的运作。RNA世界学说被认为是解释生命如何起源的最被广泛接受的理论[46]。虽然可能绝没有基于RNA的有机体的直接物理证据,但有几个证据链被认为支持RNA世界假说:催化核酶的发现、自然RNA的催化功能、以及在体外选择条件下RNA催化功能增强的进化[21, 43, 47]

关于RNA进化的实验室实验证实了RNA在催化核苷酸合成、RNA聚合、tRNA的氨酰化和肽键形成中的作用[48, 49, 50, 51]。例如,与蛋白酶相似,核酶能催化特定的生化反应。体外进化的核酶利用ATP-γ-S ATP作为磷酸盐供体催化多核苷酸的5’-磷酸化,与未催化的反应相比,速率提高了~109[52, 53]

不难想象,核酶的催化作用,在它们被更有效的蛋白酶取代之前,可能在生物化学系统的早期发展中起着过渡性的作用。蛋白质在驱动化学反应的能力上更为强大,因为它们有各种各样的阳离子、阴离子和疏水基团。

有趣的是,核苷酸衍生的辅酶似乎是早期基于RNA的代谢的残余物,因为它们在大多数这些反应中仍然扮演着重要的角色[54]。我相信,这些因素确实证实了早期RNA(或更准确地说NTP聚合物)在构建复杂前生命系统的能力。但是,对于组织中心的存在,这几乎没有提供有说服力的证据,类似于现代核糖体,在那里各种核糖核酸和小分子通过非共价或瞬时共价相互作用相聚在一起[55]

尽管如此,笔者仍然怀疑这种RNA从随机中创造出生命世界的说法,虽然认同RNA早于DNA出现的观点(1)。有何证据说RNA具有信息储存功能和催化功能生命世界就一定起源于它?还有,该学说亦无法说明RNA分子为何要储存遗传信息以及为何要去支持前细胞生命的运作。

以笔者之见,RNA世界学说对生命和遗传密码起源的解释是有些牵强的[56, 57, 58],其缺乏演化动因和个体性是不幸的。即使事实证明原始地球上曾经存在过基于RNA的生命,这也不是最后的答案,因为人们还会问RNA是从哪里起源的[42]。虽然我们还无法准确地知道在RNA出现之前到底发生了什么以及为什么,有很多证据表明在现存细胞中RNAATP的依赖性,譬如,胸腺细胞核RNA的合成依赖于ATP[59]。因此,笔者提出一个替代的名称——太阳光子驱动的化学合成介导的ATP中心世界学说,即地球上的早期生命是与脂质囊泡中的光系统的发展协同演化而来的,这些囊泡构建了一个精致的生化系统利用太阳能合成ATP。支持这的证据来自现存生化系统的一系列结构和功能特征(例如:光合色素、电子传递链、利用跨膜H+梯度的ATP合成、与ATP偶联的代谢循环或通路,以及通过ATP及其衍生物的RNADNA的合成等)不过,如果大家不愿舍弃“RNA世界”一词的话,那始作俑者也应该是核苷酸ATP

 

6. 何去何从?

生命的起源可总结为“容器支撑的化学在先”或“”自我组装[60, 61]。可能有人会问,为何分子不能静静地呆在有机汤中而是要挣扎着从混沌走向秩序?我们可将此归结为在永不歇息的太阳能的照射下基于编码的自组织:如果没有这样的密码,原细胞就不可能保持生化系统的有序控制,化学世界就还会停留在难以理解的混沌状态之中。这是否是第一原理:可遗传的同质性个体得到了存在的青睐(存在即合理)?

一般认为,生命需要复杂的结构[62]。但从某种意义上来说,生命又是一个矛盾的统一体,它从同质性中获得共性,但从异质性中获得多样性。个性可追溯到生命开始之初的脂质囊泡。正是这一特性使生命实体之间存在差异。神奇的是,这种从原始细胞中的纯化学性发展而来的个体性产生出复杂的欲望(竞争与斗争)、习性、本能乃至高等动物的精神。个性的维持,作为一种生理生态力量,是否在重塑或固化原始细胞中生化反应的节律性或规律性中具有重要作用?达尔文进化可能是最终驱动高级生命形成的力量。原细胞系是何时以及如何逃脱死胡同的命运的?一个原细胞是何时以及如何开始被转移/复制到它的子原细胞的?一个可繁殖的最小的原细胞需要多少个过程?这些问题都还没有答案。

或许人们会抱怨这个“ATP假说”叠加了太多的推测。当然,关于生命或遗传密码起源的所有理论或假说都是猜测性的,因为自从它们在地球诞生以来几十亿年已经过去了。以我之见,一个好的理论或假说取决于它能否对现有生化系统进行广泛的解释。我们必须记住,生命的起源和遗传密码子的起源是不可分割的。虽然本文的模型有很多假设,但它旨在提供一个新的概念框架,聚焦于能量驱动力(ATP)以及遗传密码子和生化系统的协同演化,这与主流的理论(1)和其它假说(附表1)有根本的区别。虽然有些研究对遗传密码、蛋白合成和核酸复制的共进化进行了讨论,但没有关注能量驱动力[63]。提出可通过实验进行验证的模型确实十分困难,因为所有的假说或理论既不能被证实也不能被证伪。这是迄今为止的情形,可能还会持续一段时间。特别是,原始细胞中生化反应漫长的平行演化可能是导致这一困难局面的重要原因。但是,因为它关乎我们自身的秘密,在水落石出之前,人类不可能终结追寻。我们可从密码子与生化系统的内在关联之中窥视它们可能的协同演化机密——这虽不见得就是真理,但至少可能是一条通向真理之道。

 

1 关于遗传密码起源的主要理论的比较

名称

含义

证据或推理

文献

立体化学假说

在很多情况下,氨基酸与在合适的tRNA上相对应的密码子碱基序列之间存在特殊的立体化学适应性

1.     密码子之所以是普适性的,因为它的本质是立体化学的。

 

[13]

凝固事件假说

在单个祖先中密码子分配到氨基酸的过程完全是“机会”,然后就保持不变

1.        密码子之所以是普适性的,因为现在的任何变化都是致命的,或至少自然选择强烈地阻止变化,这解释了为何密码子不变化的事实;

2.        为了解释为何所有生物的密码子都是一样的,我们必须假设所有生命均起源于单个有机体;

[1]

共演化假说

密码子的分配平行于氨基酸的生物合成

1.        密码系统的结构主要是前生物时期氨基酸形成路径的印记,这在氨基酸生物合成的酶促途径中仍然可以识别;

2.        因此,基于生物合成时氨基酸之间的前体-产物关系可以阐明遗传密码的演化;

3.        大多数前体-产物氨基酸密码域应该是相邻的,即仅被单个碱基变化最小间隔所分离。

[2]

综合假说

遗传密码是选择、历史和化学的产物

1.        密码子的分配模式是一种适应以优化一些功能,如由突变或翻译错误引起的误差的最小化;

2.        遗传密码经过长时间累积了氨基酸,密码子的分配反映了这种模式的增量扩展;

3.        一定密码子的分配可能直接受到了特定氨基酸和短核苷酸链之间所偏好的化学相互作用的影响,而如果缺乏这样的相互作用,其它氨基酸就会从蛋白质中完全排斥掉。

[14]

ATP假说

遗传密码是脂质囊泡中ATP驱动的原始生化系统演化的产物,这种囊泡之后发展成原始细胞,在那里ATP驱动了生化系统从能量转化到信息化的生化革新,即ATP在能量上介导了多核苷酸和多肽的合成,导致三联体密码子的出现,且核酸和蛋白质环化为互为因果的关系。

1.        能量(太阳能)、生命构件和半透性脂质囊泡(适合于细胞分裂)是遗传密码子控制的细胞生命起源的三个必须要素;

2.        ATP是原始细胞的演化中生化系统的核心,它占据了将太阳能转化为化学能的光合作用的唯一能量产品的位置,也驱动了一系列生化革新(如三羧酸循环、糖酵解,卡尔文循环等)以满足细胞内能量转化的需求;

3.        ATP也是信息化分子,因为它同时能为核苷酸和氨基酸的缩合提供能量,因此才可能在这两个生物大分子之间搭建起桥梁,因此驱动了从能量转化到信息化的生化发展,这也是前生物化学的革命性飞跃;

4.        为了优化和记忆原始细胞中的生化反应,ATP驱动的信息化与结构化协同发展,导致了多核苷酸和多肽环化成一种互为因果的反馈循环,之后逐渐过渡到RNA上的遗传信息被永久地固定在了DNA上。用三个碱基编码一个氨基酸可能仅仅是由于氨基酸的立体化学处置(如通过沃森-克里克配对作用)的缘故;

5.        诞生的第一个细胞具有ATP-驱动的生化系统以将太阳能转化成化学能,亦能通过一系列酶促生物转化进行自我组装、自我复制和自我分裂。

The present study

 

有些不能自动进行的反应可在ATP的帮助下完成,因ATP具有一种独特的能力可推动大多数重要的生物聚合物(多肽、多核苷酸、多糖等)的生成[64]。事实上,ATP在生命起源中的能量作用也已经被注意到,如ATP被认为是一个普适性的能力来源[65],一个秩序化的机器[64]。有学者宣称,必定存在一种产生秩序的化学机制,这是在一定条件下物质演化的一种通常形式[64]。我敢说,这依赖于在原始细胞中的ATP驱动的生化系统的演化,在那里完成了从能量转化到信息化(因此产生了三联体密码子)的革新。这不可能是别的任何事情!

Crick [66] 指出,“我希望...当人们提出关于遗传密码子起源的详细理论时,如果可能的话,他们应该尝试提出可以用某种或其它方式进行验证的理论”。但是,验证提出的各种用于解释遗传密码起源的理论/假说的可靠性是一项充满挑战性的任务[67]ATP假说虽然是一个新的学说,但与已有的大多数理论并不矛盾,如立体化学假说、凝固事件假说、共进化假说、综合假说、模糊性降低[68]等假说均各自反映了这个故事的独特的一面。ATP假说将大大增进我们对遗传密码子(一个可测量的抽象实体[69])起源的认知。然而,收集证据来证实这一假设仍然面临挑战。

致谢

作者感谢Min S. Park 对英文的修改以及富有见地的讨论。感谢Gérard BattailVladimir MatveevAndrew MooreMartin B. SweatmanKatsuhiko ArigaMarcello BarbieriMassimo Di GiulioJoseph MoranAlison Liu 等学者提出的批评但有价值的评述和意见。该研究得到国家自然科学基金重大研究计划“水圈微生物驱动地球元素循环的机制”培育项目“湖泊生态系统中蓝细菌驱动S循环的机制机理及环境意义研究”( 91951110)和中国科学院战略性先导科技专项(B类)“大尺度区域生物多样性格局与生命策略”(XDB31000000)的资助。

 

参考文献

1.     Crick, F.H. The origin of the genetic code. J. Mol. Biol. 1968, 38, 367-379.

2.     Wong, J.T.F. A co-evolution theory of the genetic code. Proc Natl Acad Sci USA 1975, 72, 1909-1912.

3.     Frank, A.; Froes, T. The standard genetic code can evolve from a two-letter GC Code without information loss or costly reassignments. Orig. Life Evol. Biosph. 2018, 48, 259-272.

4.     Vitas, M.; Dobovisek, A. In the beginning was a mutualism - on the origin of translation. Orig. Life Evol. Biosph. 2018, 48, 223-243.

5.     Vitas, M.; Dobovisek, A. Towards a General Definition of Life. Orig. Life Evol. Biosph. 2019, 49, 77-88.

6.     Gonzalez, D. L. Chapter 6 The mathematical structure of the genetic code. In: Barbieri M. (ed.), The Codes of Life: The Rules of Macroevolution. Springer: Netherlands, 2008.

7.     Chatterjee, S.; Yadav, S. The Origin of Prebiotic Information System in the Peptide/RNA World: A Simulation Model of the Evolution of Translation and the Genetic Code. Life 2019, 9, 25; doi:10.3390/life9010025

8.     Cavalier-Smith, T. 2001. Obcells as proto-organisms: membrane heredity, lithophosphorylation, and the origins of the genetic code, the first cells, and photosynthesis. J. Mol. Evol. 2001, 53, 555-595.

9.     Rauchfuss, H. Chemical evolution and the origin of life. Springer-Verlag Berlin Heidelberg, 2008.

10.  Smith, J. M.; Szathmáry, E. The Major Transitions in Evolution. Oxford University Press: New York, NY, USA, 1995

11.  Yockey, H.P. Information theory, evolution, and the origin of life. Cambridge University Press: Cambridge, UK, 2005.

12.  Gamow, G. Possible relation between deoxyribonucleic acid and protein structures. Nature, 1954, 173: 318.

13.  Woese, C.R.; Dugre, D.H.; Dugre, S.A.; Kondo, M.; Saxinger, W.C. On the fundamental nature and evolution of the genetic code. Cold Spring Harbor Symp. Quant. Biol. 1966, 31, 723-736.

14.  Knight, R.D.; Freeland, S.J.; Landweber, L.F. Selection, history and chemistry: the three faces of the genetic code. Trends Biochem. Sci. 1999, 24, 241-247.

15.  Baranov, P.V.; Atkins, J.F.; Yordanova, M.M. Augmented genetic decoding: global, local and temporal alterations of decoding processes and codon meaning. Nature Rev. Genet. 2015, 16, 517-529.

16.  Koonin, E.V.; Novozhilov, A.S. Origin and evolution of the genetic code: the universal enigma. Cell Mol. Biol. 2009, 61, 99-111.

17.  Ohama, T.; Inagaki, Y.; Bessho, Y.; Osawa, S. Evolving genetic code. Proc. Jpn. Acad. Ser. B. 2008, 84, 58–74.

18.  Shah, P,; Gilchrist, M.A. Explaining complex codon usage patterns with selection for translational efficiency, mutation bias, and genetic drift. Proc. Natl. Acad. Sci. USA 2011, 108, 10231-10236.

19.  Sciarrino, A.; Sorba, P. Codon-anticodon interaction and the genetic code evolution. Biosystems 2013, 111, 175-180.

20.  Eigen, M. Selforganization of matter and the evolution of biological macromolecules. Naturwissenschaften 1971, 58, 465-523.

21.  Joyce, G.F. The antiquity of RNA-based evolution. Nature 2002, 418. 214-221.

22.  Nisbet, E.G.; Sleep, N.H. The habitat and nature of early life. Nature 2001, 409, 1083-1091.

23.  Bada, J.L. How life began on earth: a status report. Earth Planet. Sci. Lett. 2004, 226, 1-15.

24.  Danchin, A. From chemical metabolism to life: the origin of the genetic coding process. Beilstein J. Org. Chem. 2017, 13, 1119-1135.

25.  Leslie, M. On the origin of photosynthesis. Science 2009, 323, 1286-1287.

26.  Umena, Y.; Kawakami, K.; Shen, J.R.; Kamiya, N. Crystal structure of oxygen-evolving photosystem II at a resolution of 1.9 Å. Nature 2011, 473, 55-60.

27.  Sousa, F.L.; Thiergart, T.; Landan, G.; Nelson-Sathi, S.; Pereira, I.A.C.; Allen, J.F.; Lane, N.; Martin, W.F. Early bioenergetic evolution. Philos. Trans. R. Soc. Lond. B Biol. Sci. 2013, 368, 20130088.

28.  Nelson, D.L.; Cox, M.M. Lehninger Principles of Biochemistry (4th ed.). W.H. Freeman, 2004..

29.  Battail, G. Information and Life. Springer, 2014.

30.  Michaelian, K.; Simeonov, A. Fundamental molecules of life are pigments which arose and evolved to dissipate the solar spectrum. Biogeosciences Discuss. 2015,12, 2101-2160.

31.  Xie, P. The Aufhebung and Breakthrough of the Theories on the Origin and Evolution of Life. Science Press: Beijing, P.R. China, 2014.

32.  Taiz, L.; Zeiger, E. Plant Physiology (4th edition). Sinauer Associates, 2010.

33.  Madigan, M.T.; Martinko, J.M.; Stahl, D.A.; Clark, D.P. Brock Biology of Microorganisms (13th ed). Prentice Hall, 2012.

34.  Michaelian, K. Thermodynamic dissipation theory for the origin of life. Earth Syst. Dynam. 2011, 2, 37-51.

35.  Preiner, M.; Asche, S.; Becker, S. et al. The future of origin of life research: bridging decades-old divisions. Life 2020, 10, 20; doi:10.3390/life10030020

36.  Powner MW, Gerland B, Sutherland JD. Synthesis of activated pyrimidine ribonucleotides in prebiotically plausible conditions. Nature 2009, 459, 239-42.

37.  Patel BH, Percivalle C, Ritson DJ, Duffy CD, Sutherland JD. Common origins of RNA, protein and lipid precursors in a cyanosulfidic protometabolism. Nat Chem. 2015, 7, 301-307.

38.  Wong, Tze Fei JWong JT, Lazcano A. Prebiotic Evolution and Astrobiology. Landes Bioscience, Austin Texas, 2009.

39.  Wong, J.T.F.; Lazcano. A. (eds.) Prebiotic Evolution and Astrobiology. CRC Press, 2009.

40.  Iino, R.; Noji, H. Operation mechanism of FoF1-adenosine triphosphate synthase revealed by its structure and dynamics. IUBMB Life 2013, 65, 238–246.

41.  D’Aguanno, E.; Altamura, E.; Mavelli, F.; Fahr, A.; Stano, P.; Luisi, P. L. Physical routes to primitive cells: an experimental model based on the spontaneous entrapment of enzymes inside micrometer-sized liposomes. Life 2015, 5, 969-996.

42.  Orgel, L.E. Evolution of the genetic apparatus: a review. Cold Spring Harbor Symp. Quant. Biol. 1987, 52, 9-16.

43.  Doudna, J.A.; Cech, T.R. The chemical repertoire of natural ribozymes. Nature 2002, 418, 222-228.

44.  Woese, C.R. The Genetic Code: the Molecular Basis for Genetic Expression. Harper & Row, 1967.

45.  Gilbert, W. The RNA world. Nature 1986, 319, 618.

46.  Griffith, R.W. A specific scenario for the origin of life and the genetic code based on peptide/oligonucleotide interdependence. Orig. Life Evol. Biosph. 2009, 39, 517-531.

47.  Cech, T.R.; Zaug, A.J.; Grabowski, P,J, In vitro splicing of the ribosomal RNA precursor of Tetrahymena: Involvement of a guanosine nucleotide in the excision of the intervening sequence. Cell 1981, 27, 487-496.

48.  Zhang, B.; Cech, T.R. Peptide bond formation by in vitro selected ribozymes. Nature 1997, 390, 96-100.

49.  Unrau, P.J.; Bartel, D.P. RNA-catalysed nucleotide synthesis. Nature 1998, 395, 260-263.

50.  Lee, N.; Bessho, Y.; Wei, K.; Szostak, J. W.; Suga, H. Ribozyme-catalyzed tRNA aminoacylation. Nature Struct. Biol. 2000, 7, 28-33.

51.  Johnston, W.K.; Unrau, P.J.; Lawrence, M.S.; Glasner, M.E.; Bartel, D.P. RNA-catalyzed RNA polymerization: accurate and general RNA-templated primer extension. Science 2001, 292, 1319-1325.

52.  Lorsch, J.; Szostak, J.W. In vitro evolution of new ribozymes with polynucleotide kinase activity. Nature 1994, 371, 31-36.

53.  Huang, F.; Yarus, M. Versatile 5’ phosphoryl coupling of small and large molecules to an RNA. Proc. Natl Acad. Sci. USA 1997, 94, 8965-8969.

54.  White, H.B. Coenzymes as fossils of an earlier metabolic state. J. Mol. Evol. 1976, 7, 101-104.

55.  Gibson, T.J.; Lamond, A.I. Metabolic complexity in the RNA world and implications for the origin of protein synthesis. J. Mol. Evol. 1990, 30, 7-15.

56.  Atkins, J.F.; Gesteland, R.F.; Cech, T.R. (eds.) RNA worlds: From Life’s Origins to Diversity in Gene Regulation. Cold Spring Harbor Laboratory Press, 2011.

57.  Sengupta, S.; Higgs, P.G. Pathways of genetic code evolution in ancient and modern organisms. J. Mol. Evol. 2015, 80, 229–243.

58.  Zimmer, C. On the origin of life on earth. Science 2009, 323, 198-199.

59.  McEwen, B.S.; Allfrey, V.G; Mirsky, A.E. Dependence of RNA synthesis in isolated thymus nuclei on glycolysis, oxidative carbohydrate catabolism and a type of “oxidative phosphorylation”. Biochim Bioph Acta (BBA) 1964, 91, 23-28.

60.  Deamer, D. Assembling Life: How can Life Begin on Earth and other Habitable Planets? Oxford University Press: New York, NY, USA, 2019.

61.  Bains, W. Getting beyond the toy domain. Meditations on David Deamer’s “Assembling Life”. Life 2020, 10, 18; https://doi.org/10.3390/life10020018.

62.  Mayer, C. Life in the context of order and complexity. Life 2020, 10, 5, https://doi.org/10.3390/life10010005.

63.  Alberti S. Evolution of the genetic code, protein synthesis and nucleic acid replication. Cell. Mol. Life Sci. 1999, 56, 85-93.

64.  Galimov, E. M. Phenomenon of life: between equilibrium and non-linearity. Origin and principles of evolution. Geochem. Int. 2006, 44(Suppl. 1), S1-S59.

65.  de Duve, C. Life Evolving - Molecules, Mind, and Meaning. Oxford University Press: New York, NY, USA, 2002.

66.  Crick, F.H.C. The Genetic Code—Yesterday, Today, and Tomorrow. Cold Spring Harb. Symp. Quant. Biol. 1966, 31, 3-9.

67.  Di Giulio, M. A discriminative test among the different theories proposed to explain the origin of the genetic code: The coevolution theory finds additional support. BioSystems 2018, 169-170, 1-4.

68.  Barbieri, M. Evolution of the genetic code: the ambiguity-reduction theory. BioSystems 2019, 185, 104024.

69.  Battail, G. Error-correcting codes and information in biology. BioSystems 2019, 184, 103987.

 

附表1 关于遗传密码起源的其它假说

名称

含义

文献

物理化学假说

遗传密码起源的驱动力旨在减小在一个位置上编码氨基酸的不同密码子之间的物理化学距离

[13, 70]

模糊度减少假说

相关密码子组被分配到结构相似的的氨基酸,因此,遗传密码通过减少氨基酸组内或组间编码的模糊度形成了现在的结构

[71,72,73]

选择性区室化假说

一层浮油覆盖了原始海洋的表面,其组分在水--气界面形成缔合胶体或胶束。取决于介质的极性,这些聚集体具有亲水和疏水的内部,在那里可对氨基酸和核酸组分进行选择性摄取。胶束相的缩合和聚合得到增强,最终导致负载转接器环的形成,并拥有一个与目前有效密码子补充的反密码子。原始翻译机制只识别出两组氨基酸,亲水性和疏水性。

[74]

 “凝聚中的凝聚”假说

原始核酸分子中碱基的序列是每处都在发生的、在一定的化学起源水平上的有规律的渐进进化的结果,只要必须的化学和环境条件占主导。即使初级非生物源性蛋白质在没有核酸基质的情况下出现了,它们很可能具有常规的、非偶然的碱基,尽管它们毫无疑问远不如最近的生物源蛋白质那么稳定。正是这些“凝聚中的凝聚”通过它们的DNA分子的遗传密码的连续突变发生了进一步的进化。

[75]

二氧化三碳假说

在原始大气中形成的二氧化三碳(C3O2)聚合物可能在地球上产生了高浓度的有机化合物“汤”。在现在的遗传体系中发现了C3O2的各种各样的遗迹,这可能暗示,生命系统是由这种多聚物“汤”形成的。

[76]

核酸聚集几何学假说

与遗传密码进化起源相关的原始翻译复合物是一个有序的RNA聚合体,其稳定性不仅源自碱基配对、也源自已知的负责DNA的束聚集和凝聚的多价离子相互作用。三联体密码子是所提议的聚合物类别的结构几何学、信息编码能力和效率的逻辑结果。

[77]

五核苷酸与氨基酸相互作用假说

五核苷酸的一种特殊构象形成一种双面模板,“内面”能拥抱氨基酸,外面可作为在长链核酸上的三联体密码子的适配器。这可作为一个原始的解码系统,而这个解码系统可驱动一种动态的相互作用,籍此,氨基酸被并置在一起,促进肽键的形成。

[78]

二字母GC代码假设

遗传密码最初仅由2个碱基(GC)组成,然后通过另外一对碱基(AU)的引入扩展了可用的密码数量

[79, 80]

编码辅酶操纵假说

有用的编码在翻译之前。氨基酸被装载到早期的适配器——现代反密码子的祖先,作为在一个在代谢复杂的RNA世界中的核酶的辅酶。祖先的氨酰适配器合成酶可与今天的自剪接tRNA内含子相似。一个嵌入这些合成酶中的密码子-反密码子-鉴别者碱基复合物在氨基酸识别中可能扮演了重要角色。基因密码的扩展是通过利用独特氨基酸来接管无意密码而进行的,要么通过前体-产物关系或物理化学相似性,与已经编码的密码子相关联。

[81]

GNC-SNS假说

遗传密码起源于GNC密码,是通过获得在原始地球上前生命时期能容易合成并能大量累积的四种氨基酸[G,   A, D, V] 来实现的。在此之后,GNC密码成功地演化到GNSSNS密码。最终,通过成功地捕获AU起始的密码子而形成通用遗传密码。

[82]

演替假说

三个连续水平的化学特异性产生了遗传密码中的氨基酸的核苷酸分配规则。第一级源自氨基酸和短链寡核苷酸之间的疏水和立体专一性相互作用。第二、三级特异性取决于从所负载的寡核苷酸(氨基酸与寡核苷酸共价链接)到磷酸二酯键(二级特异性)和肽键(三级特异性)的形成的能量转化的条件,而这些反应由RNA模板所催化。简单的物理过程,在那里一定水平的特异性被整合进一个新出现的表达新特性的元结构中,产生了一个关于遗传密码子出现的简洁而现实的解释。

[83]

大气氧化状态假说

在时期I(前氧化),在原始地球的大气中,第一个氮基腺嘌呤(A)不含氧。在时期II(氧化),另外三个氮基出现在大气中,由三个时段组成,第一个是鸟嘌呤(G),第二个是胞嘧啶(C),第三个是尿嘧啶(U)。与上述时期相对应,自然界中密码子和氨基酸的形成可能以下列的方式进行:在时期I,第一个也是唯一的密码子AAA出现,赖氨酸(Lys)与之对应;在第二个时期,出现了19个密码子和8个新氨基酸(AsnGinSerAspThrAlaHisPro);在第三个时期,出现37个密码子和8个新氨基酸(TrpTyrCysIleMetVal,LeuPhe)。因此,在生化进化过程中,自然界中出现了20个氨基酸和64个密码子。

[84]

潮汐循环假说

潮汐驱动的浓缩和稀释循环产生、然后放大了原始核酸聚合物,也导致了模板导向的多肽组装的出现。这种循环也可能是细胞生命发展的基础。快速潮汐循环可建立PCR(潮汐连锁反应),类似于作用于核酸聚合物并允许它们自繁殖的PCR(聚合酶链式反应)。

[85, 86, 87]

减少误差假说

针对特定类型的遗传错误发展起来的密码子对氨基酸的进化分配的耐受量与该种类型的错误的流行成正比。各种遗传错误的相对比率应该在遗传密码的结构中留下了印记。由于热力学原因,嗜热菌的RNA具有较高的G+C含量。因为基因组中GC的频率没有升高,遗传密码是在不嗜热生物或非RNA世界中被固定的。

[88]

算术假说

遗传密码被证明是一种算术的句法结构,是一种至少在35亿年前就被一些原始算盘运算过的独特综合的结果。那个算术采用了带零概念的十进制数值系统。其结果是,零符号不仅作为十进制的一个组成部分控制着遗传密码,而且也直接作为一个演算符号。作为非物质抽象,所有的零,十进制语法和独特综合可以显示出一种人工性质的遗传密码。他们驳斥了遗传密码随机起源的传统观点。遗传密码中的新秩序几乎从未经历过化学进化,表面上,最初看起来像算术本身一样是纯粹的信息。

[89]

四列假说

密码中最早的氨基酸是那些最容易进行非生物合成的种类,即甘氨酸、丙氨酸、天冬氨酸、谷氨酸和缬氨酸。这些氨基酸被分配给以G为第一位的密码子。因此,第一个密码可能只使用了这些密码子。码很快发展成了四列密码子,其中同一列中的所有密码子编码相同的氨基酸:NUN = ValNCN = AlaNAN = Asp/ Glu、以及NGN = Gly。随后,通过一个密码子块的细分过程将氨基酸顺序加入到编码中,其中,一些早期氨基酸的密码子被重新分配给后来的氨基酸。后来的氨基酸被添加到原来由相似特性氨基酸占据的位置上,因为这可能对已经由较早密码子编码的蛋白质的干扰最小。其结果,在最终编码中氨基酸的性质保留了一个四列的模式,这是密码子演化早期阶段的遗物。这一过程的驱动力不是翻译错误的最小化,而是可以用一个更大的氨基酸字母表来对增加的蛋白质的多样性和功能的正选择。

[90]

分子互惠假说

复杂有机单体的合成及聚合反应发生在表面亲水层以及水汽界面。核酸的复制和肽的翻译始于疏水层和水层之间的乳化界面。原始生命的核心是一个含有精氨酸密码子和反密码子(它将这种氨基酸添加到预先形成的肽中)的短核酸家族。反过来,肽有助于核酸的存活和复制。富含精氨酸的肽起到隔离、传递磷酸盐键能的作用,并有黏结剂的功能,聚集核酸并保持在界面上。

[91]

率失真假说

遗传密码起源于这三种相互冲突的进化力量的相互作用:对多样的氨基酸的需求,容错性和资源的最低成本。Stickland发酵发生在RNA世界,成对的互补性原适配器被分配给Stickland氨基酸。

[92]

氨基酸发酵假说

.有证据显示,遗传密码在蛋白质存在之前就建立了,那时代谢是由核酶驱动的。此外,早期的原始生命必须依靠简单的厌氧生物产能过程。RNA世界中,氨基酸发酵驱动新陈代谢,这由原适配器(tRNAs的前身)所促进。

[93]

石板编码假说

该学说假设编码分子对直接接触,其中氨基酸侧链位于一种规则的晶体结构矿物的空心单元细胞中。每个细胞中编码含碱基的分子部分地相互屏蔽,剩余的自由空间确定填充侧链的立体化学性质。磷灰石族矿物被认为是这种类型编码的最好选择。矿物的岩浆性质、有机分子的非生物合成和多聚化事件是在所谓的“火山情景”框架内进行考虑的。

[94]

化学代谢假说

试图理解生命的起源应该以我们所知道的太阳系内外的现代化学为基础。在那里,氨基酸和非常小的化合物如二氧化碳、二氢或二氮及其直接衍生物非常普遍。使用这些基本化学物质的表面化学代谢可能是最早用于构建氨基酸、辅酶和磷酸盐基小碳分子等的。核苷酸(当然还有RNAs)的到来必定是很之后的事情了。

[24]

磷酯世界假说

在硫酯世界中,早期的新陈代谢产生了氨基酸和简单肽。这些早期简单肽的催化活性在从硫酯世界向磷酸盐世界转变中起到了重要作用。这种转变包括了糖磷酸盐、核苷酸和多核苷酸的出现。氨基酸和肽与核苷酸和多核苷酸的偶联导致了遗传密码的起源。

[95]

分子共生假说

在肽/RNA世界,脂质膜通过随机包裹来自前生命汤中的氨基酸、RNA和肽分子开启了原始细胞内的分子共生。这种内共生导致了翻译机器的几个必要部件的层次性出现:转移核糖核酸(tRNAs)、氨基酰tRNA合成酶(aaRS)、信使RNAmRNAs)、核糖体和各种酶。当按正确的顺序组装时,翻译机器就产生了蛋白质,一种基于从mRNA传递来的信息来组装氨基酸的过程。这是前生命信息时代的开始。遗传密码的形成分为这与翻译机的特点相一致的三个阶段:由前-tRNA/-aaRS/-mRNA机器发展而来的GNC代码,由tRNA/aaRS/mRNA机器编码的SNS代码,以及最后利用tRNA/aaRS/mRNA/核糖体机器获得的通用遗传密码。

[7, 8]

 

补充参考文献

70.    Sonneborn, T.M. Degeneracy of the genetic code, extant, nature, and genetic implications. In: Bryson, V.; Vogel, H.J. (eds.) Evolving Genes and Proteins. Academic Press, New York, pp. 377-397, 1965.

71.    Woese, C. R. On the origin of the genetic code. Proc. Natn. Acad. Sci. U.S.A. 1965, 54, 1546–1552.

72.    Fitch, W. M. The relation between frequencies of amino acids and ordered trinucleotides. J. Mol. Biol. 1966, 16, 1-8.

73.    Fitch, W. M., Upper, K. The phylogeny of tRNA sequences provides evidence for ambiguity reduction in the origin of the genetic code. Cold Spring Harbor Symp. Quant. Biol. 1987, 52, 759–767.

74.    Nagyvary, J; Fendler, J. Origin of the genetic code: a physical-chemical model of primitive codon assignments. Orig. Life 1974, 5, 357-362.

75.    Novak, V.; Liebl, V. On the question of the origin and evolution of the genetic system. Orig. Life 1975, 6, 269-271.

76.    Shimizu, M. Carbon suboxide and the genetic code. Astroph. Space Sci. 1979, 62, 509-513.

77.    Crothers, D.M. Nucleic acid aggregation geometry and the possible evolutionary origin of ribosomes and the genetic code. J. Mol. Biol. 1982, 162, 379-391.

78.    Balasubramanian, R. Origin of life: A hypothesis for the origin of adaptor-mediated ordered synthesis of proteins and an explanation for the choice of terminating codons in the genetic code. Biosystems, 1982, 15, 99-104.

79.    Hartman, H. Speculation of the evolution of the genetic cod III: the evolution of t-RNA. Orig. Life 1984, 14, 643 648.

80.    Frank, A., Froese, T. The standard genetic code can evolve from a two-letter GC code without information loss or costly reassignments. Orig. Life Evol. Biosph. 2018, 48, 259–272

81.    Szathmáry, E. Coding coenzyme handles: a hypothesis for the origin of the genetic code. Proc. Natl. Acad. Sci. USA 1993, 90, 9916-9920.

82.    Ikehara, K.; Omori, Y.; Arai, R.; Hirose, A. A novel theory on the origin of the genetic code: a GNC-SNS hypothesis. J. Mol. Evol. 2002, 54, 530–538.

83.    Seligmann, H; Amzallag, G.N. Chemical interactions between amino acid and RNA: multiplicity of the levels of specificity explains origin of the genetic code. Naturwissenschaften 2002, 89, 542–551.

84.    Shabalkin, I.P.; Shabalkin, P.I.; Yagubov, A.S. Evolution of genetic alphabet and of amino acid code. J. Evol. Biochem. Physiol. 2003, 39, 608-615.

85.    Lathe, R. Fast tidal cycling and the origin of life. Icarus 2004, 168:18-22. 

86.    Lathe, R. Tidal chain reaction and the origin of replicating biopolymers. Int. J. Astrobiol. 2005, 4, 19-31.

87.    Lathe, R. Tidal cycling and the origin of the genetic code: implications for cellular Life. J. Seckbach (ed.), Genesis - In The Beginning: Precursors of Life, Chemical Models and Early Biological Evolution. Cellular Origin, Life in Extreme Habitats and Astrobiology 2012, 22, 691-707.

88.    Gutfraind, A.; Kempf, A. Error-reducing structure of the genetic code indicates code origin in non-thermophile organisms. Orig. Life Evol. Biosph. 2008, 38, 75-85.

89.    shCherbak, V. Chapter 7 The arithmetical origin of the genetic code. In: Barbieri M. (ed.), The Codes of Life: The Rules of Macroevolution. Springer, 2008.

90.    Higgs, P.G. A four-column theory for the origin of the genetic code: tracing the evolutionary pathways that gave rise to an optimized code. Biol. Direct 2009, 4:16.

91.    Griffith, R.W. A specific scenario for the origin of life and the genetic code based on peptide/oligonucleotide interdependence. Orig. Life Evol. Biosph. 2009, 39, 517–531.

92.    Tlusty, T. A colorful origin for the genetic code: Information theory, statistical mechanics and the emergence of molecular codes. Phys. Life Rev. 2010, 7, 362-376.

93.    de Vladar, H.P. Amino acid fermentation at the origin of the genetic code. Biol. Direct 2012, 7:6.

94.    Skoblikow, N.E.; Zimin, A.A. Hypothesis of lithocoding: origin of the genetic code as a ‘‘Double Jigsaw Puzzle’’ of nucleobase-containing molecules and amino acids assembled by sequential filling of apatite mineral cellules. J. Mol. Evol. 2016, 82, 163–172.

95.    Hartman, H.; Smith, T.F. Origin of the genetic code is found at the transition between a Thioester World of Peptides and the Phosphoester World of Polynucleotides. Life, 2019, 9, 69; doi:10.3390/life9030069.


本文译自:Xie P. 2020. The ATP hypothesis discovers the missing “matchmaker” between proteins and nucleic acids. Preprints, 2020030419 (doi: 10.20944/preprints202003.0419.v7). 

英文原文下载地址:https://www.preprints.org/manuscript/202003.0419/v7/download

The ATP hypothesis (Version 7 中文翻译).pdf

preprints202003.0419.v7.pdf


本文摘要

迄今为止已提出了不少关于遗传密码起源理论,但都忽视了能量驱动力,及其与生化系统的关系,最重要的是忽视了失踪的蛋白质与核酸的“媒人”。这里提出一个新的假说:ATP是原始密码子起源的核心,通过驱动遗传密码和原始生化系统的协同演化来实现的。该假说旨在揭示遗传密码是如何通过原细胞的光化学反应而产生的,这种原细胞起源于包裹各种各样生命构建(如核苷酸、肽)的脂质囊泡。在现在的细胞中,ATP是光合作用的唯一能量产物,是生化系统的能量心脏。ATP能为多核苷酸和多肽链的形成和延长提供能量,因此扮演了这两类生物多聚物之间“媒人”的角色,最终介导了原细胞从能量转化到信息化的生化创新。虽然ATP不是唯一可以驱动多肽链形成的核苷酸,但它受到了前细胞选择的青睐。原细胞发明了光合系统来生产ATP,并在蛋白质和RNA/DNA的帮助下变得高效而有规律。遗传信息永久记录到DNA标志着可以进行达尔文进化的细胞生命的开端。ATP假说支持生命的光合起源学说,同时给迄今为止人们知之甚少的光合作用和生化系统的起源带来了启示。




http://blog.sciencenet.cn/blog-1475614-1247550.html

上一篇:视觉系统的演化之旅——视觉器官、光感受器及视觉分子
下一篇:我们能拯救长江中正在消逝的鲟鱼吗?

19 武夷山 杨正瓴 张蔚珍 张大文 陈亮 陈峰 柯志新 张佳 黄永义 黄仁勇 梁洪泽 王庆浩 张晓良 周健 张珑 王有基 丁凡 乔中东 王林波

该博文允许注册用户评论 请点击登录 评论 (9 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-4-18 11:55

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部