brianring的个人博客分享 http://blog.sciencenet.cn/u/brianring

博文

先读后写,基因学3R理论中的编写技能被提上议程! 精选

已有 5832 次阅读 2016-10-17 16:26 |系统分类:观点评述| 人类基因组计划, 基因编写



基因学上的3R分别指阅读(Reading)、编写(Writing)(即编辑)和计算Arithmetic。乍一看这三个词中好像只有一个词以R开头,但是因为基因学的计算部分通常会用到一种统计软件,这一软件恰巧被称为“R”,所以只有“编写”才是真正的例外。虽然名称拼写上有一点问题,但是编写也十分突出,引人注目。我们阅读了大量的基因序列(到目前为止,已经阅读了整个基因组中大约1.5万亿个碱基),为了弄清楚这1.5万亿个碱基有哪些作用,我们会进行大量的计算。虽然我们编写了遗传基因,但是我们至今还没有翻译出一个完整的动物基因组,也还没有掌握编写的技能。不过,这种局面很快就会被打破。

一般而言,先写然后才能读。即便是世界通用的经文也是如此,虽然有些人可能会认为经文是通过超自然的命令自发生成的,但其实它是人为写出来的。上帝用手指在石碑上写下了十诫(笔在石头上写得不顺畅,用蜡笔则会入手即化),摩西写了前五卷(可能得排除最后一点,因为他死了),吠陀在口头传诵,《古兰经》由默罕默德的门徒转录,整个星球大战前传系列也是即兴创作的。常规的写-读顺序最早出现在约翰的书里,其中他如此说道:“一切由词始”。

然而人类基因组是个例外,我们首先阅读了它(即人类基因组计划,于2003年4月完成),现在才开始讨论编写的问题。

准确地说,人类基因组早就被转录过很多次了。因为人体内的每一个细胞都存在基因组的一个拷贝(红细胞除外),而每个人拥有大概10万亿个细胞(不包括那些红细胞),据估计大概有1000亿人曾生活在地球之上,所以从整体上我们可以估计人类基因组已经被复制了一万亿次。但是从来没有人想过写点什么相关的东西,不管是基因、编辑,还是跟基因有关的奇幻故事。可能从遗传学的角度来看,编写并不是遗传学者必须要做的工作。

编写人类基因的故事需要大量的时间,而且其中涉及大量的复制和失误

人类基因组有一个起点,但并不是我们创造的。如果我们相信“上帝创造了亚当的基因组”的假说,那么现在流行的圣经就没有讲清楚创世故事中跟基因组有关的那部分,我们也就不太清楚一切是怎么开始的了。地球上的第一个生命始于大约40亿年前,时隔已久,所以我们肯定没法获得全面系统的了解。幸运地是,我们找到了一块完整的恐龙化石,其中保留了大量关于三十亿年前生活环境的化学证据,那个时候连雷龙都还没有出现呢。

我们现在所知道的是一个人的基因由父母双方的基因混合而成,其他人的基因也来自于他们的父母双方等诸如此类的信息。在由基因组追溯生命起源的过程中存在一条完整的路径,这就使得确定由谁(或者原始的动物)来承担基因中的失误或者缺陷很困难。关于基因组(和生命)的起源存在一个观点,即历史早期出现了一个可以自我复制的短RNA聚合物。RNA与组成基因组的DNA在化学性质方面非常相似,还具有一个独特的功能,即可以自我折叠成为一个复杂的形式,其中有一些被发现具备了酶的功能属性。一些催化RNA甚至可以复制其他的RNA。

第一个生命、第一个基因组有可能是同一个相对较短的、可以自我复制的RNA。

诚然,虽然这是一个至关重要的起点,但是一个短片段的RNA恰好能够自我复制,这并不足以解释人体的复杂性。而且人类如何将这一除了自我复制无其他功能的早期RNA链弄到自己身上,难道都靠日益复杂的生物链吗?通过数十亿年的转录错误、重复、自然抉择和干预,我们相信终究会轮到自己的,也会轮到地球上的所有其他生物的。复制中出现的一些错误可能影响很大,但是四十亿年的时间足以积聚大量的变化,而且编写时出错也是在所难免的

再次以圣经为例。许多人认为圣经是绝对正确的,他们声称圣经的确受到了神的启发,方方面面都是正确的。换句话说就是没有错误。但是也有许多教徒认为只有最初的版本才是完全正确的,现在的圣经经文里肯定存在人为的错误这种错误显然应该避免,不然就亵渎了圣经,会受到上帝的惩罚。

实际上,现代的希伯来语把元音和发音标准归功于努力减少圣经抄写员犯错误的举措。6-10世纪,有一群希伯来学者被称为马所拉学士,编辑了一个希伯来圣经的权威版本,后来不少基督教分支在翻译旧约全书的时候还把这个作为源头之作。一千多年的时间里,书面希伯来语都是没有元音的,主要通过字词中的辅音来推断意思。元音的缺失使得字词的意思模棱两可,特别是当其中的辅音意思也模糊不清时。添加元音可以减少复制中的错误,所以抄写员们发明了元音,其他的一些转录和编辑手段也确保了复制过程中尽可能少地犯错。然而,尽管有了这些举措,马所拉学士们还是犯了错误。

有一篇对犹大王约雅斤的简短注释就是非常好的例子。在《历代记·下》的第36章第9节中写道:

约雅斤登基的时候年方八岁,在耶路撒冷当了三个月又十天的王,而且他做了一些在上帝看来非常邪恶的事情。

但是《列王记·下》第24章第8节中说:

约雅斤登基的时候已年满十八,在耶路撒冷当了三个月的王。他母亲名叫尼护施,是耶路撒冷以利拿单的女儿。

在《列王记·下》中,约雅斤十八岁,而在《历代记·下》中 他只有八岁。

要么复制的时候出现了错误,一个版本中的“十”被遗漏了;要么约雅斤在八岁和十八岁的时候各登基了一次,每次为期三个月。还有,根据《历代记·下》中的描述,他八岁登基,“做了在上帝看来非常邪恶的事情。”作为一个父亲,我可以证明一个八岁的孩子绝对可以做出那种事情来。但是这种行为要想引起旧约中神的注意,估计那孩子还得等到十八岁。

这都是比较极端的情况,最可能的解释就出现了简单的复制错误。在其他情况下,距离或者其他解释都跟我们所知的实际情况不符,一个简单的转录错误似乎可以解释这种对比差异。

DNA中也会出现相似的错误,阳光是主要的罪魁祸首,因为紫外线辐射可以使DNA碱基发生化学变化,从而无法复制。这些受损的碱基会被细胞机制裁剪掉,虽然通常可以得到合适的修复,但是错误还是会发生,其他机制也会导致DNA出现不明显的替换和删除。虽然这些变化比较罕见,但是在数十亿年的时间里其产生的影响是可以相加的。

当然不仅仅是简单的替换和删除需要更为复杂详细的信息,因为它只是更改了信息,并不增加其数量。在这方面比较重要的是对基因组的补充。随着基因组的进化,主要采取重复DNA片段的方式,重复DNA片段相对来说是比较简单的。

回到圣经,我们在圣经中也可以发现复制的错误。《创世纪》的第一本书中包含了两种创造人类的描述,第一种在第一章,另一种在第二章。虽然主题是相似的,但是在关键性的细节上还是存在差异的,所以给那些坚持按照严格的语法来解释圣经中的事件的人造成了一些麻烦。与任性的约雅斤的情况不同,这两种创造人类的描述的差异肯定不是转录错误。相反,是因为每个故事的侧重点不同:第一个创世故事描述了地球是如何形成的,而第二个创世故事更关注我们与身处的世界还有上帝的联系。这两个相似的创世故事可能源于同一个故事,即美索不达米亚平原流传的创造世界的故事。然而,出于第一本圣经的叙事需要,早期的牧师对每种描述都进行了修改。换句话说,一个故事被复制了,然后修改了故事的所有副本,从而使得创世故事的叙事风格能够尽可能地复杂。当然这种方法并不只适用于圣经。莎士比亚大约一半的作品都不过是单一故事线的不同演变。“某人的身份被弄错了,然后悲喜随之而来”。他不过是在玩帽子戏法。

在我们的基因组中也存在类似的方式。单个基因只能有某些功能。然而如果一个基因被复制,每个副本都以不同的方式发展,具备不同的功能。这就产生了所谓的基因家族,一系列非常相似但角色不同的基因。例如,人体内(所有动物体内)有一个非常重要的基因家族,即Hox基因家族,在胚胎发展的早期对其施加控制。我们大概有40组不同的Hox基因,在发育的过程中各自扮演着不同的角色,但是都是在动物进化的早期由单个Hox基因演化而来的。

显然进化是强有力的,但是速度很慢。大多数生物技术公司的投资者都希望能在几年内获得收益,要是告诉他们大概要等一万年才能有成果,这样买卖就很难做了。因此现在正在努力进行基因组计划的第二阶段,从阅读过渡到编写。与依靠突变和选择相反,我们只是简单写下我们想要的基因组。

现在回头看最初的人类基因组计划是“HGP:阅读”。第二阶段可以是“HGP:编写”

这是本月初在哈佛医学院召开的一次会议上讨论的根本问题。最初的人类基因组计划跟阅读基因组有关。此次会议讨论的则是在该计划的基础上进行合乎逻辑的延伸。题为“HGP-编写:测试细胞中的大型合成基因组”,此次会议的目标在于讨论改写大部分基因组甚至从头制作整个基因组所需的概念和技术。这样的技术目前还不存在。然而,我们根据特定的序列来合成长片段DNA的能力发展迅速,而且这样做的成本也有所降低。所以可以合理推测我们很快就能够编写基因组了。

编写基因组的能力存在多种可能的应用。之前也讨论过,新的基因技术使我们能够相对轻松地对基因组做出小的修改,而现在讨论的是随心所欲、完全自由地编写基因组任何部分的能力。起点可能会包含基础科学,编写个基因组可能比探索基因组中的零散部分更为快捷。工业应用也很容易想象,因为可以通过对整个代谢过程进行再造从而实现一系列不同的化合物的制造。

当然,这也会涉及到几个伦理上的问题。首先,这项技术将强化我们克隆人的能力。目前克隆人的工作尚未完成,因为需要从被克隆的人身上提取细胞。有了编写基因组的能力之后,我们只需要知道那个人的基因编码,那些编码数量大概等于一个1GB的文档,然后我们就可以在其基础上进行重建了。

编写基因组与改写圣经中的部分内容相似吗?还是这更像是在网络上发布一篇哈利波特粉丝小说

在对基因组做出细微的修改时,我们不仅会面临伦理问题,同时还会面临编写整个染色体的可能性问题。对细胞代谢及其调控机制的理解意味着我们真的对于如何利用这种基因不够了解,但是这一点很快就会被改变。如果我们能够在孩子体内添加全新的生化路径,这将意味着什么?我们的基因组类似于一个绝对正确的神圣经文,容不得一丝一毫的修改吗?还是更像一个国家的宪法,需要在得到同意之后才能改写?还是我们会像人类基因组粉丝小说中所说的那样实现HGP:编写计划,每一个科学家或者每一位父母都可以编写他们觉得合适的东西?例如,在皮肤中添加叶绿体可以节省日常开支并且保证我们拥有健康自然的肤色,但是常年多云的城市房价可能因此下降。那么由谁来决定这是否可以作为人类多样性的一项补充呢?因此有人担心此次会议只对一百位与会者开放,而且不允许媒体报道会议所做的相关讨论。这可能不是因为对正在讨论的技术要绝对保密,会议上绝对不会讨论联合国资助克隆人军队这种事情。

与之相反,颁布这样的禁止令似乎是因为该会议的报道权限已经被授予了一家科学杂志公司,与会者默认了其对数据专卖权的要求。科学成果的产生往往得益于公共资金,现在却实际成为了科学出版商的有效财产,这就是个问题,但是这个问题需要单独讨论才可能解释清楚。不管怎样,会议不应该以这种方式来保密。

不管编写基因组的技术发展速度是快是慢,我们学习处理基因组所需基本技能的速度还是非常迅速的。阅读和计算在遗传学领域已经得到了很好的应用,而编写很快也会被纳入遗传学领域之中。至少有一点非常明确,我们不用担心因为使用何种字体而引发争论。在遗传学领域,没有无衬线字体或者新罗马字体,甚至连斜体或者加粗都没有。在可预见的未来里,我们在编写基因组的过程中只会使用A、C、G、T四个字符。


(本文为Dr.Brain Ring 原创,小编编译,点击http://charter-of-the-genome.org/2016/05/30/the-three-rs-of-genetics/即可阅读原文。如有转载需求,请联系yangqiao@idna.com.cn。)





https://blog.sciencenet.cn/blog-3213734-1009277.html

上一篇:科学界出现可重复性危机,不可重复未必就没有意义
下一篇:从体内的微生物重新认知自我,解答“我是谁”这一历史遗留难题
收藏 IP: 58.19.0.*| 热度|

4 黄永义 黄寿光 迟延崑 shenlu

该博文允许注册用户评论 请点击登录 评论 (6 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 18:29

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部