地球上所有细胞生物的遗传信息都储存在数字化的DNA序列中。今天,基因测序技术已经非常发达,DNA序列可以非常廉价迅速的确定。但测序只是读取数据,近年生物学最大的发现与发明之一是可编程的基因编辑技术:CRISPR-Cas9。这个技术类似于 WORD的搜索替换功能:用户输入一串字符串,程序找到匹配的字符串,然后进行删除或者替换。CRISPR-Cas9 的编辑技术里,搜索匹配字符串由实验人员通过一段 RNA表示,叫做导引 RNA -- gRNA,编辑由一个称为 Cas9 的蛋白根据 gRNA 定位完成。这个编辑系统的灵活性显而易见。Cas9 蛋白是固定的,你只需要改变导引就能在不同位置对DNA进行编辑 (注一)。
CRISPR-Cas9 技术的来源是细菌的自然免疫系统。某些细菌在遭到病毒入侵后,能够把病毒基因的一小段存储到自身的 DNA 里一个称为 CRISPR 的存储空间。当再次遇到病毒入侵时,细菌能够根据存写的片段识别病毒,将病毒的DNA切断而使之失效。有的细菌的CRISPR系统很复杂,涉及多种 Cas 蛋白 (Cas 的意思是 CRISPR-associated -- 与CRISPR相联的 )。经过多年的研究,生物学家们终于找到了一种简单的系统,只用到一种蛋白 -- Cas9。接下来,他们成功把这个细菌的系统进行改造用于动植物细胞的基因编辑。率先完成这一实际应用性开发的是张锋的研究小组。本文试图对相关技术与历史进行简单的介绍。
这里我把CRISPR之前漫长的研究历史一笔带过。简单而言,人们之前发现细菌免疫系统依靠一段很短的RNA进行识别,这段RNA称为 crRNA (CRISPR RNA)。可想而知,这段 crRNA 包含有入侵病毒的基因识别码。
CRISPR相关研究在2011年取得了重大突破。这一年,法国女科学家 Emmanuelle Charpentier 报告,通过基因分析与相关实验,发现一个只有四个组件的细菌免疫系统。除了 Csn1 蛋白(后来称为 Cas9)与 crRNA外,还发现一个他们称之为 trans -activating CRISPR RNA(简称 tracrRNA)的RNA。顾名思义,这个 tracrRNA 起到转写-启动的功能。第四个组件是一个作用于 RNA的生成, 称为 RNase III的蛋白。但这篇2011年的论文对各个组件的具体功能并没有完全确定。其论文中的下图显示 :蓝色是 Cas9 蛋白,红色的是 tracrRNA, 绿色+黑色线段是 crRNA (其中绿色部分对应需要识别的病毒编码),黄色是RNase III。
Charpentier 的论文发表后,美国加州大学的 DOUDNA (“道得娜”---有些中文文章音译成“多德娜” 属于错误读音)与她的研究小组隔洋合作,进行了进一步研究,于2012年6月发表了一篇重要论文。相关研究人员与主要结果如下图:
DOUDNA、 Charpentier 联合小组通过在细胞体外的试管实验发现了负责DNA切割的充分并且必要的三个部分:Cas9, crRNA 与tracrRNA (不需要 RNase III)。论文还确定了三个部分的作用:其中 Cas9 是切割机, crRNA 的主要作用是定位。而 tracrRNA 在与crRNA耦合后启动 Cas9 的切割功能(activate)。他们还成功把 crRNA 与tracrRNA 连起来成为一个分子,这样可以把 DNA 切割的组件由三个变成两个。如上图。左边是自然原核细菌中的机制,两个RNA分子。右边则是人工机制,把两个RNA给连起来了,成为一个带着一个配对圈的RNA分子。但 DOUDNA 等人的实验并没有在任何细胞内进行, 只是在细胞体外的试管里, 当然也没有在动植物等真核细胞内实验,也不知道能否可行( “it was not known whether such a bacterial system [the CRISPR-Cas9 system] would function in eukaryotic cells.”) 。在该论文发表后几个月 DOUDNA等人表示在真核细胞的实验中遇到了很多困扰("many frustrations")。
现在我们知道,Charpentier 2011年的论文出来后,美国东部 BROAD研究院的张锋小组也展开了研究。在Doudna/Charpentier 2012年6月论文发表前半年,张锋在2012年1月向NIH申请了一个项目:运用Cas9系统对真核细胞进行基因编辑。张锋的项目设计如下(从其项目申请截图):
上图是一个哺乳动物 CRISPR 基因编辑系统的设计。其代码进行表达后会生成四个部分:(1)带NLS的Cas9 蛋白,(2)tracrRNA , (3)多个 crRNA -- 注意不同颜色的线段 (图中称为 guide RNA array),(4) 带NLS的RNase III。真核细胞的特点是遗传物质在细胞核内,一般较大的蛋白是进不去的。其中 的 NLS 是为了使 Cas9 等 生成后能够被拖入细胞核内。可以这么说,张锋的思路是先不管具体机制是什么,直接在高等生物上进行基因编辑实验,而且多点编辑同时进行。
张锋小组的核心人物包括:张锋、丛乐、FEI RAN
张的小组在2013年1月发表论文,报告了他们的发现:(1)他们对四个组件进行了组合实验,发现基因编辑不需要 RNase III;(2)使用 Cas9 、crRNA 与 tracrRNA 组合,成功对真核细胞实现编辑,效率相当高( indel 达19%);(3)使用 DOUDNA 论文中的嵌合 RNA (chimera),发现长的那个(chimera A )编辑效率较双RNA系统低 (最高5.6%, 部分无法探测),短的那个 (chimera B) 不能编辑(注二)。如下图:
结论:
张锋首次将 CRISPR-Cas9 成功用于高等生物的基因编辑,其主要成果是基于2011年 Charpentier 的 tracrRNA 发现(注三)。
注一:Cas9 的工作机制是先找到 DNA上的一个特定的称为 PAM的序列,然后才是导引与DNA链的结合以及切割。所以,可行的DNA切割点不是任意的。PAM是一个限制。不同细菌的Cas9 蛋白的PAM序列不同,有的长些,有的只有三个字符,所以要找到可行的切割点也不是难事。
注二:后来的研究发现 组合 chimera RNA 加长后效率更高。
注三:张锋后来又发现一个 系统-- CRISPR/Cpf1,蛋白比 Cas9 小,只需要crRNA(不需要 tracrRNA), 切割位置离PAM远。
转载本文请联系原作者获取授权,同时请注明本文来自岳东晓科学网博客。 链接地址: https://blog.sciencenet.cn/blog-684007-1003348.html
上一篇:
英语听力测试答案揭晓 下一篇:
CRISPR基因编辑技术的显然性分析