|||
基于基因结构和序列变化的基因组学研究无疑必须转入到以生物学和医学核心命题为目标的研究。基因组学技术和规模化的特征将会延续并发扬,都在不断地催生新的科研思路和新的思维境界。
从“DNA 到RNA 再到蛋白质”和各类“组学”研究,最终将汇集在一个或者数个生物学命题下(如癌症、代谢疾病、脑发育与认知、生殖力的可塑性等),形成一种整合性、更高层次的“数据—信息—知识”消化和理解过程。
二十多年前胡德博士提出的“多系统生物学”开辟了新的思维和方法,但是他并没有将其研究内容具体化、思维框架化。尽管他思想的追随者们开发了很多高通量技术,产生了很多蛋白质-蛋白质相互作用的数据,基因表达关联数据,还开发了网络分析方法等,但是一个既宽容,又有序的思维框架还是呼之欲出,或隐或现。
首先,基因组学在新形势下已经完成了从基因组学(以DNA 序列为研究主体)到基因组生物学(以生物学命题为研究主体)再到基于谱系的基因组生物学(以生物谱系,如哺乳动物为研究主体)的“凤凰涅磐”。
未来会有诸多物种的基因组序列在名目繁多的理由下,将被不断测定,数据迅速积累成为必然。比如人类基因组在过去500 代(假设20 年为一代人)里积累的群体多态性会在未来的五年内全部找出来,这些多态性与人类疾病的关系也会在未来的十年里基本搞清楚,模型哺乳动物(如小鼠和大鼠)基因组的相关信息也会被逐渐全部获取。又比如,DNA 测序可以用来确定DNA 分子上的种种化学修饰,这些化学修饰可以用来评价基因表达调控机制;DNA 测序可以用来评估染色体的构象,而染色体构象与个体发育和细胞分化都密切相关;DNA 测序可以用来研究单个细胞的基因表达,而单细胞里单个基因的表达是基因功能调控的最基本信息;DNA 测序可以用来评价染色体的物理状态,如核小体的定位和组分(如组蛋白)蛋白质的化学修饰等,这些信息与基因在高层次的调控有关。可见,DNA 测序将不再停留在测定基因组本身的序列和多态性,也将会延伸到其他相关“组学”领域的研究。
其次,我们至少要界定生物学的基本系统,不是系统分类的系统,也不是类似于骨骼、肌肉等的生理系统,更不是基因型-表型相关联的遗传学系统,而是可以用来整理和分析分子和细胞层面信息和知识的新系统。这个系统的特点是并不摒弃原有的生物学系统,而是有机地将它们界定好,并且整合起来。
第一是“信息流”(Informational Track)系统,主要研究对象是DNA、RNA 和蛋白质序列信息,相关研究领域包括分子遗传学、分子进化和比较基因组学等。尽管基因型与表型的关系从传承来讲是遗传学的研究内容,但是越来越多的表型被分到可塑性的研究范畴,大样本量的研究也必然要与生态学结合在一起。简单地将基因变异(编码部分)与复杂的生物学现象相关联是不能够完全解决重要生物学问题的。例如,金-威尔森(King-Wilson)在1975 年提出的“两个调控水平”假说,简单地认为基因调控序列本身的不同决定了基因调控的不同,从而导致近缘物种间的种种表型不同,但是最近发现这些调控区的不同有的其实是组蛋白调控差异所引起的,并不是序列变异本身。信息流的研究素材主要是基因组DNA 序列、基因组群体多态性和详细的表型信息。
第二是“操作流”(Operational Track)系统,它的研究对象包括生理学、细胞生物学和分子生物学研究的主要实验内容和生物学命题。操作流是个比较复杂的体系,它包括了以DNA(Epigenomic,表观基因组学)、RNA(Ribogenomic,RNA 组学)、蛋白质(Proteomic,蛋白质组学)为主体的各种穿插交错的调控机制。
第三是“平衡流”(Homeostatic Track)系统,主要是药理学和生物化学等学科的研究精华。平衡流包括三个基本部分:物质(Material)流、能量(Energy)流和信导(Signaling)流。重要的物质流研究对象包括血红素(如血红素与生物节律的关系)、生物激素(如生长激素与发育的关系)、神经递质(如生物递质与神经发育的关系)等等。重要的能量流物质研究对象包括dNTP、NTP、多聚磷酸、各类单糖、各类多糖等。DNA、RNA 和蛋白质等作为主要细胞组分也会与能量流和物质流密切相关。例如,人类的生命周期(发育、更年、衰老等)和生殖周期的生理学就是这个“流”所要研究的部分基本内容。病理状态,比如人群中高发的代谢和神经退行性疾病等也在其中。信导流,也就是信号传导,显然已经是分子生物学家几十年来的研究对象。
第四是“分室流”(Compartmental Track)系统,它涵盖发育生物学、解剖学、生命起源等领域所涉及的核心科学问题。分室流将以单细胞和细胞群为研究对象,揭示细胞分化、个体发生和发育、组织形成等分子机制。由于生命起源是由简单到复杂,由单细胞到多细胞,所以分室流也将揭示生命起源和细胞器形成等分子机制。干细胞研究也是属于分室流研究的范畴,主要是在分子水平上解释胚胎、诱导干细胞、特定组织干细胞等的差别和如何解释干细胞的自然发生、诱导发生、定向分化和异常分化。同时,也要建立测定干细胞分化定向性和定向分化潜能的维持和诱导因素。
第五是“可塑流”(Plasticity Track)系统,主要是研究表型和行为的可塑性。前者囊括生态学与环境生物学的研究内容,后者包括神经生理和心理学等研究内容在分子水平的命题。举一个例子,就是生物节律之一的休眠,例如哺乳动物常见的冬眠(如棕熊和黑熊)和夏眠(如热带蝙蝠)。冬眠其实是一个由中枢神经系统参与的主动行为,也是一个复杂的生理过程,同时又受环境因素的严格制约。动物的迁徙和休眠行为在进化的框架下,既有趋同进化也有趋异进化,也具有相当强的表型和行为可塑性以及两者的交织和重叠。揭开表型和行为的可塑性之谜显然不是简单的遗传和遗传多态性的问题,是要集成生命科学各个领域的最新的概念和技术。
此外,这个“五流”是否涵盖了生命科学的全部呢?答案是肯定的不能!但是,知识在不断高速积累,科学要不断发展和提高,概念和理论必须不断更新,第一步一定要走出去。
最后,无论如何生命是一个整体,生命的最小单元——细胞也是一个整体,就连基因这一生命编码的最小功能单元也是由不同的序列和相互作用原件组成的。
因此,五流即各自可分,在分子水平研究基因与基因产物的功能;也可在细胞水平和整体(甚至群体)水平研究基因的相互作用和产生的结果。将不同的“流内”要素关联起来至少考虑一些基本参数,比如时、空、量、域等。“流间”要素也会有诸多的关联,有的可能会分不开,有的可能只是范围的界定。比如,通用内含子(universal introns)的大小和GC 含量的变化在人群多态性的水平上就很难分开,大部分的插入与高GC 含量呈现正相关。
生命科学研究的真正挑战在于如何将这些基于不同概念界定的,由不同技术和方法获取的,被不同领域科学家们所收集的,停留在各个不同理论和信息层面上的知识编织成一个有机的网络或系统。而这恰恰就是生命的特点,也可以说是揭示生命本质的终极途径。生物医学研究与临床医学实践的精准度也正是由这些研究学科前沿的进步来决定的。
本文由刘四旦摘编自美国科学院研究理事会编、于军等译《基因组科学的甲子“羽化”之路: 从人类基因组测序到精准医学》(北京:科学出版社, 2016.3)一书中,于军所撰“生物医学新征途:从人类基因组基本信息到精准医学”一文。
“人类基因组计划”是一项里程碑式的伟大科学计划,该计划的完成带动了生物医学的迅猛发展。精准医疗则是目前国际生物医学研究的热点,已经有包括美英在内的11 个国家启动精准医学计划,该计划的实施将实现个体水平的精准医疗。《基因组科学的甲子“羽化”之路: 从人类基因组测序到精准医学》分上下两篇,分别介绍两个伟大计划的路线图。上篇阐述了人类基因组计划的必要性和重要意义,涵盖了图谱定位、基因组测序的基础原理、技术发展和应用趋势,同时包括了信息和材料的收集、数据库的发布,以及该计划的实施与管理。下篇分析了精准医学的迫切需求和充分条件,描述了疾病知识网络和新型分类法,列举了实现目标的多个经典模型和研究实例,如百万人基因组计划、代谢组模式等,据此可以展望基因组学基础研究与医学的有效结合,实现个体健康状况的精准咨询、预防和诊疗。本书堪称基因组计划与精准医学的框架导航图,可供广大生命科学工作者和基础医学、检验医学工作者以及对精准医学感兴趣的研究人员参阅。
一起阅读科学!
科学出版社│微信ID:sciencepress-cspm
专业品质 学术价值
原创好读 科学品味
点击文中书名、作者、封面可购买本书
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-14 16:22
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社