||
2003年,当人类基因组计划接近完成的时候,生物学家在欢呼这一成就的同时,惊奇地发现人类基因数量比原先估计的少许多。人们本来认为,人类应该有10万个基因,测序结果发现只有大约2.5万到4万基因。奇怪的是,线虫有2万个基因,拟南芥基因数量比人类稍多,水稻基因数则是人类的2倍。随着研究的深入,人们再次发现,人类基因数比10年前估计的还要少,人类基因数量只有19000个左右,更重要的是,这些基因只占基因组序列的1-2%。比较复杂的是,这其它99%的非编码DNA具体发挥什么作用。这些序列被科学家形象地比喻为基因组的暗物质。美国人类基因组计划先后建立ENCODE和人类基因表观遗传学路线图计划,一个重要目标就是对基因组的暗物质功能进行探索,最近在新的基因编辑技术的支持下,科学家越来越多地发现这些基因暗物质确实发挥作用,并发现一些有意思的现象。
在2003年美国国家人类基因组研究所发起的“DNA元件百科全书” ENCODE计划等项目努力下,科学家逐渐了解,除了编码蛋白质的基因,基因组中还存在大量基因表达调节信息。科学家希望通过对这些调节信息的研究,帮助人们理解疾病的发生和寻找治疗方法。加州大学圣地亚哥分校拉荷亚基因组医学研究所细胞生物学家任兵说,是ENCODE计划使我们认识到人类基因组中非编码区域的重要性。任兵教授也是ENCODE成员之一,他也参与表观基因组学路线图项目,这两个项目都是由NIH赞助。这两个项目目的是预测基因组中存在的各种元件。这些元件包括大量非编码区域,调控基因在正确的时间和细胞表达的成分。科学家已经掌握了一些研究工具,例如检测DNA序列的生化探针、包绕DNA和RNA的转录调控蛋白、DNA和蛋白质的表观遗传标记等。
目前在人类基因组中发现成千上万控制基因表达的功能区域,这说明,人类基因组中控制基因表达的功能比基因本身占有更多空间。科学家们现在正试图对所有的功能区域进行研究,这是一个庞大的任务,但他们现在有了一个强大的新工具CRISPR-Cas9。
自从CRISPR-Cas9基因编辑技术进入科学领域,研究人员可以测试非编码区域功能元件的速度明显加大,但是这仍然是一项艰巨的任务。超过300万个基因表达调控区域,这里面可能包含1500万个转录因子结合位点,在某种特定细胞内大约15万个被激活(1%)。对这些非编码区功能的认识对理解人类疾病可能至关重要,大多数单核苷酸突变都发生在非编码区,某些非编码区调控基因表达功能和肿瘤发生密切相关,这些区域发生突变可以导致细胞功能和相关基因表达异常。使用CRISPR-Cas9,科学家们通过引入目标突变现在有机会测试非编码区的功能。
关于非编码区在调节基因表达方面的作用仍然存在争议,最重要的是多少比例的非编码区具有这种功能,科学家开始估计是80%的区域具有调控基因表达的功能,但是后来发现这个估计过高,现在比较统一的看法是只有10-20%的非编码区具有调节基因表达的功能。如果这些区域发生突变,可能会影响相关基因表达。
给研究这一现象的科学家带来巨大挑战的是,非编码区调控基因表达的方式种类繁多。如研究比较充分的斑点基因组中的启动子调控序列,这些序列可以与特定转录因子结合,促进附近目标基因的表达。对启动子研究比较困难一是因为数量庞大,估计基因组中有1500万个启动子,二是因为这些启动子物理位置上可能和调控基因之间有成千上万的碱基对。
ENCODE计划和表观基因组学路线图两个项目可以给这些序列提供线索,但是功能必须经过具体测试。研究基因功能的最基本方法是进行基因敲除,观察缺乏该基因对细胞和动物的影响。但是这种策略用于非编码序列就不那么容易,因为许多序列属于备份,只删除一个不会对基因表达产生明显影响。以色列特拉维夫大学遗传学家Ran Elkon说,研究基因组非编码区功能目前处于鉴别功能和非功能序列阶段,这是一个巨大的挑战。CRISPR-Cas9技术给科学家提供了比较高效的手段,使用基因组中不同目标区域RNA指导片段库能进行高通量目标序列分析。CRISPR-Cas9技术方法相对便捷,研究人员可以直接用人类细胞进行功能分析。
麻省理工学院张锋教授团队利用CRISPR-Cas9鉴别对肿瘤细胞生存发挥作用的基因,他们用人类黑色素瘤细胞模型一次可筛选约18000个基因,利用这些基因寻找抗黑色素瘤药物vemurafenib发挥作用的基础。2016年,该团队发布了一种研究抗药基因调节区域的筛选技术。负责这一工作的前博士后NevilleSanjana说,他们的发现证明了ENCODE计划预测的一些功能序列,也发现还存在新的功能序列。
ENCODE计划功能序列预测存在出入的证据也有其它CRISPR-Cas9筛选数据。波士顿哈佛医学院Richard Sherwood等创建了多路复用编辑调节分析技术。该技术可以对小鼠胚胎干细胞影响基因表达多个非编码区域进行功能分析。使用这种技术,他们获得基因表达调节的非编码区的定量信息。一些序列被ENCODE标记为增强子,但是用基因敲除技术提示没有功能。更重要的是,他们都发现存在一些没有被ENCODE标注的功能区。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 07:54
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社