|
DNA, Plasmid to Replicon
连续几天阅读关于HCV的Papers,眼睛有些累了,反正她要加班,停下来写写关于环状DNA的小故事吧,我个人感觉她们很神奇:可以表达蛋白、可以转录RNA,可以修改DNA,甚至可以改造一种生命。质粒在丽丽的眼里就是“大圈”和“小圈”(表示质粒的大小),在凡凡的眼里就都是“鸡蛋”(只要是圆的),在我的眼里她们就是一条线串起来的不同元件。
Part I:DNA
我很想问:现实生活中在何种地方能听到双螺旋?或者说提到双螺旋时你的第一反应是什么?这种轴心对称、反向平行的结构是不是很美?你是否可以独立的设计出如此美妙的结构?如果你知道从有生命开始,是这种双螺旋延续了所有物种的生命,而这其中仅仅有四碱基,而且是互补配对的嘌呤和嘧啶(我甚至不知道他们的结构)?万千世界,尽在于此,怎么能不让人惊叹呢?
现在我们都知道DNA是什么,但估计很少人知道DNA是如何发现的,结构是如何得到的。昨晚在家静静的看着《The doublehelix》(By James Watson),作者风趣的言语中可以感觉到当时紧张的气氛。在不知道答案之前,1950s附近的几年是动荡的,原子弹的蘑菇云就在前几年,世界上弥漫着消沉、紧张的氛围,许多科学研究都在起步阶段。Linus Pauling发现的α螺旋结构竟然不是通过X-ray衍射计算出来的,而是通过他发现的化学键成键原理,是依靠量子力学的理论推算肽键应该在一个平面,用模型做出来的。当时研究DNA是某些课题组的“专利”,X-ray的技术也是少数人所擅长的,能够清晰的解释衍射图谱更是一件不容易的事情,当时还没有清晰的傅里叶转换。但人们知道能够结晶的物质一定有着规律性的结构,而DNA就是这种能结晶的物质。
如果你知道生物多样性,你也知道存在某种遗传物质,你还知道蛋白质是由二十余种氨基酸构成,而DNA仅有四个碱基,你会倾向于哪种物质是遗传物质?(所以说当时人们认为蛋白质是遗传物质也是可以理解的)记得是1946年Avery用肺炎双球菌证实了DNA是遗传物质,这个结果于1952年被研究噬菌体的小组证实了(The story of DNA (II))。这个时候已经有人想到用模型来分析DNA的结构了,也有些未发表、未公开的数据显示DNA是螺旋结构,但依旧很多人不愿意相信DNA是螺旋状的。也是那个时候,一位化学家(Erwin Chargaff)分析了DNA中A、T、G和C的比例,仅仅显示了A的含量和T的接近,G的含量和C的接近,也就是Chargaff's rules之一(估计再给他一点时间,他就知道A和T配对、G和C配对);当时人们对DNA的A型和B型的结构不清晰,烯醇式和酮式的结构还不明了,甚至DNA是酸还是中性的、氢键形成的位置也不清楚(那个时候距离Pauling发表《化学键的形成》没有几年),我很理解当时生物、物理和化学等领域的合作的重要性。不知他俩是如何在几天之内搭建了DNA的双螺旋结构,也不知当时等待金属原子模型的时候他们有多着急,也不知道他们怎样担心别人因知道DNA是双螺旋而占得先机。
很快,几天的时间,当时的大牛们看到这种完美结构的时候,就知道“DNA是如何复制、遗传,生物多样性是如何产生的,RNA是如何来的,蛋白质可能是如何翻译的”等等既基础又前沿的问题。之后的几年发现了密码子、DNA聚合酶、半保留复制等关键组分和机制。现在我终于理解为什么当时的人们知道自己的工作是否是诺奖级的,现在科技发展如此迅速,想预料一种工作是否属诺奖级别是不容易的。
Part II:Plasmid
本科三年级我首次走进实验室(周世宁教授和陆勇军教授的实验室)学习克隆的技术,当时我对质粒的了解仅仅停留在书本上,具体她们是什么我还不清楚。到四年级的时候我就很想知道为何质粒里面有不同的功能区?(其实其他同学早已经知道原因了)这些功能区到底有什么作用?如何设计一个新的质粒?到了本科毕业的时候,我还是没有搞清楚,当时特别希望能听一位老师给讲解一下。后来有幸考入南开大学的分子病毒学实验室,这里的老师和学生都精通于分子克隆、基因操作等技术,我很想在这里找到答案。几年下来也没有得到我想要的解释,只是不知不觉中自己对各个区域有了些了解。
简单说来,质粒原本就是共价、闭合、环状的DNA(现在理解这些概念好像不用靠记忆,貌似可以推导出来),无论是进入细菌还是真核细胞,首先她需要复制,这就涉及到原核、真核的复制圆点(ori)的问题(提前说明,接下来提到的元件全部来自基础研究,在此再次向科技工作者致敬!)。一小段的DNA序列,被不同的宿主细胞内的DNA聚合酶识别,开启DNA的复制;克隆时需要的筛选标记,原核中Amp, Kan等抗性基因,前后连着原核的启动子(Pbla)和原核的终止密码子,真核neo,puro,hygro等抗性基因,对应真核的转录启动子(Pcmv)和真核的终止密码子(SV40 pA)(曾经好奇为何Kan和neo总是在一起,有兴趣的同仁可以查阅一下,原来如此的感觉);再加上一组多克隆位点(MCS)就可以构建一个简单的质粒了:能复制、能携带、能筛选。
接着就会有人希望得到更好用的质粒,比如说拷贝数高、表达量高等特性,这个时候需要修改或增加质粒上于此相关的元件,比如替换成自巨噬细胞病毒的启动子(Pcmv);插入短肽作为蛋白的标签、或者多加入一个IRES,连带两个读码框;当人们对操纵子的了解加深以后,有人便思考加入可控的启动子,可以诱导表达;发现T7聚合酶后,人们知道可以再体外转录RNA,可以再体内诱导表达RNA;还有很多的种属特异的RNA启动子等等。现在回头看这些元件,她们就在那,拿过来用就好了。只是当时是谁第一眼想到她们可用?又是谁首次实现了应用?这都需要过程。以及后来许多LoxP/Cre的基因组编辑系统、Flip-In、T-Rex等等,所有的一切都是将一种特殊的基因(酶)、位点、元件插入到那条环状的DNA,她扮演着“火箭”(载体)的角色,将“卫星”(基因)送入细胞内。
更让人兴奋的是一个质粒竟然可以编辑宿主细胞的基因组!看到张峰博士发表的那篇文章后(Le C, et al., 2013, Science, (6121):819-823.),我的直觉告诉我,这个质粒过于强大,有时甚至可以称之为毒药:潜入细胞后,即可摧毁关键性的基因。若有一天她们整合入病毒基因组内,会怎样?是否会使病毒获得更强烈的破坏能力?若是在高等生物的真核细胞中发现了类似的机制,是否意味着获得性免疫又增加一个方式?还有Jennifer和Emmanuelle发表的文章,体外纯化的Cas9加上两段或是一段sgRNA,竟然可以再体外直接切割DNA,这是否意味着这套系统以后有可能替代限制性内切酶?做高难度的克隆将会更容易,不再受酶切位点的限制。
有时想了想,这仅仅是一个质粒啊,一个环状的DNA而已!
Part III:Replicon
可是,我更感兴趣的还是Viral Replicon。同样是质粒,所发挥的效果却是尽然不同的,因为这套质粒所能编辑的不是基因,而是操纵一种生命——病毒。
不接触HIV先关的材料有许多年了,已经不再关注的她的基因组有多长、读码框有几多、结构蛋白和调节蛋白的机制如何、流行病学情况怎样、抗AIDS的药物研发进展如何,统统的问题已经搁置很久了。可是有幸踏足病毒学,有机会看看微小病毒的故事还是值得回味的。
过去操作的质粒多为5 Kb~8 Kb大小,而一个HIV、HBV、HCV的基因组也不过10 Kb左右,曾经成功的将12 Kb的BFV基因组DNA连入3 Kb的载体,这样大小的质粒,经小师妹(张素珍同学)稍作改造之后,在宿主细胞内即可产生有感染性的病毒颗粒(这样的质粒也就是感染性克隆,也算一种Replicon)。如此而来,病毒颗粒不再用从病人体内直接分离,而是凭借replicon的转染即可获得。自1980s发现HIV以来,全世界有太多人专注于这个病毒,这也为病毒学、分子生物学等领域带来飞跃性的发展。
细看HIV颗粒:外层一层包膜,膜上插有糖蛋白,用于结合T细胞的受体,介导细胞的融合;膜内填充物(结构蛋白)支撑着病毒的颗粒形状,核心的核蛋白包裹着他们的遗传物质(RNA,少部分DNA。是不是发现此时DNA不再是遗传物质,而是RNA啊?太多的意外是从病毒的身上发现的,噬菌体也是一种病毒,是不是很神奇?如此微小的生命却给我们人类带来了太多惊喜),这套RNA进入宿主细胞内会被自身携带的反转录酶迅速伪装起来——反转录成DNA,此时就和宿主细胞内的DNA没有多少差别了,细胞内诸多组分也不再视之为外来物(其实宿主细胞液也无法完全的辨别HIV的RNA是不是敌人的武器),该转录的转录、该翻译的翻译。更有甚者,病毒的整合酶还帮助刚反转录出的DNA进入宿主细胞的核心,并顺利的将病毒的DNA整合入宿主细胞的基因组。如此一来算是成功的打入“中军大帐”,更为隐秘的隐藏起来,随着宿主细胞的复制而复制,并且还飞快的或是不间断的翻译出病毒的蛋白、转录出病毒的RNA、包装成病毒的颗粒,再靠着细胞内的微管等高速公路一批又一批的运输病毒的大军到细胞膜上,与在哪里等待已久的糖蛋白结合,顺利的将子代送出细胞外,启动下一轮的感染。
这些机制的发现同样凝聚了太多世界上科学家的心血,当然发现了病毒的各个蛋白和他们的功能之后,如何利用这套机制就容易理解了:套用VSV的糖蛋白做包装包膜,利用病毒自身的基质蛋白、反转录酶、蛋白酶、整合酶,包装需要的识别位点,整合用的LTR,反式转绿激活用的Tat蛋白,保护RNA基因组用的Rev蛋白,再加上携带目的基因的Peudo-genome,这就是一套简易的病毒包装系统。因为在此以前腺病毒的发现和病毒载体的应用已经广泛流传,利用反转录病毒可以将DNA整合入基因组的特性,便是筛选稳转细胞系的首选工具。病毒可以伪装,人们也可以将非病毒的组分伪装。将目的基因连入病毒的基因组序列中,利用她们的组分,将基因包裹入病毒的颗粒体内,再靠她们将基因运送入我们要整合的宿主细胞基因组内(彼此彼此罢了,傻瓜病毒)。保证实用性的同时要降低风险,必要时也需要BSL-2等硬件条件。
HCV的发现不算晚,仅仅比HIV迟到了八年而已,但是对这种(+)ssRNA病毒的操作确实坎坷些:估计是该类RNA病毒比较难于操作,适合她们繁殖的宿主细胞系也不多,多数为肝细胞,在体外建立培养的体系用去了四年的时间。后来人们发现了该病毒的3’端的一段保守序列,才得以通过测序获得她们的全基因组序列,直到1995年才获得了第一个感染性克隆。而且所能产生的病毒的量还是太少、感染性太低,无论是在体外转录出RNA还是在体内合成RNA,效果都不明显。
后来人们发现病毒经过几次传代培养之后,有发生突变的现象,有一些获得了更强的复制能力;有人将含有HCV基因组序列的DNA转染到肝细胞中,筛选整合有HCV基因组的克隆(另外的一种Replicon,靠细胞培养即可产生病毒或其组分);有人在这套基因组的前面加入了T7转录起始位点,或同时转入可诱导或组成型表达的T7聚合酶,提高了病毒的复制水平,也实现了可控;大概是十年前,有人发现病毒的复制主要和非结构蛋白里的两种酶有直接关系,他们使用一些报告基因、筛选标记替换了结构蛋白,这样便于筛选抑制HCV复制的药物。
多年下来人们对这类RNA的病毒比较了解了,发现了更多的毒株、亚型,在不同的国家中的流行毒株以及治病性也有所了解,只是RNA本身的突变率很高,容易产生耐药性的毒株(这要比细菌耐抗生素突变来的更快、更猛吧所以人类和病毒的斗争是永久性的),这位临床上行的治疗带来许多难处,十多年前全世界的感染HCV的人多达170 million。
除Replicon这种操纵病毒的技术以外,曾经听说有课题组希望能操纵真核生物的基因组(比如酵母),试图寻找到最小合成基因组,期待能够如操作质粒、病毒、细菌般操纵真核细胞。只要有人专注,这不是没有可能,需要的仅仅是时间和技术而已。想想胚胎的发育:精子仅仅是为了将DNA送入卵子细胞,是不是觉得卵子细胞更像是一个孵育的场所?如果二者的基因组可以改造,是否可以编辑高等生物的个体?如今有文章显示两个卵细胞也可以产生健康的子代小鼠,甚至有人发现精子中影响生命的两个关键基因,难道以后真的可以不需要雄性来繁殖后代?不得不说,高通量测序、基因组编辑、3D打印等技术如此盛行的今天,人们对新事物的认识和掌控的速度是惊人的,科学的发展值得我们持续关注。
后记
有些故事,了解过去会让人更容易了解现在。前不久还在TED中听到James Watson的演讲,从他们发现DNA结构到现在仅仅六十年。我能感觉到在其他领域里也一样有着类似惊人的故事,虽说科学不能解释很多现象,他同样能解释很多问题。有时我也有疑问:思考一定要凭借数据吗?如果没有数据,就不能决定下一步怎么走吗?科学的思维到底是怎样的?为何面对同一个现象,人们做出的决定是不同的?时而会有一种感觉:有时不能局限于眼前看到的现象、得到的数据,很多时候需要综合的考虑,包括一些猜想、直觉。有点像条条大路通罗马的感觉,规律可能是唯一的,研究科学方法并不是唯一的。
昨天看了一下《功夫熊猫3》,韩国导演执导,中国团队加盟控股,这次感觉里面的场景、语言很多有着中国的特色。能明显的感觉到这次有许多台词是从中文翻译到英文的,Po返回熊猫村,更像是电影转移到国内。最让我动心的是结尾的龙,这样的龙只有存在于中国,国外的文化让他们的龙身短小、翅膀宽大、口中喷的是火,这与龙图腾的汉族是不同的。看到影片在全球美国和中国同时上映,感觉很爽。虽说多年来我们都喜欢美剧大片,我们在学习、技术在更新、创意理念在改变,我们需要时间,更频繁的走上国际荧屏是早晚的事。
科学技术也是如此,和平和发展真的很重要,我们需要这样的一个环境。早上看到Editas终于上市了,与之一起的还有一家中国的药物企业(BeiGene,专注与抗癌药物的研发,有一个PD-1的单抗BGB-A317通过FDA的新药研究申请(IND)审评。前不久国务院总理强调在跻身重大科技前沿领域,中国科学学院院长也表示国内未来几年会成立跨学科的若干个创新中心,希望继续整合科研力量。太多突破性成果是被国外的科学家发现的,我们需要有自己的核心竞争力、知识产权、技术,需要我为日后在新领域中能“逐鹿全球”。有些时候,失去了一个领域,确实相当于失去了整个市场。
TJ Pharmaron
2016年2月4日星期四
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 14:21
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社