||
所有的生物学都是计算生物学
翻译:山东农业大学皇甫柠
摘要:在此,我认为计算思维和技巧对于认知生命的探寻非常重要,以至于今天所有的生物学都是计算生物学。计算生物学,使我们对生命的认知条理化,使生物学概念具有缜密性和可测性,并且提供了一个综合不同见解的参考图。主流生物学实验中采取的数学方法、统计方法、计算方法,将会推动生物学中下一个现代综合方法的发展将生物学转变为一个定量的学科。
2008年在我获得目前工作的面试上,一位杰出的细胞生物学家向我提出了一个问题:“像你这样的人怎样取得论文通讯作者的呢?”暗示我永远也不会在研究项目中扮演一个重要的角色。我是学数学和机器学习的,但是现在在面试一个癌症研究所的计算生物学的职位。我的面试官并不是很确定我到底能为生物学做出什么样的贡献。是否学计算的人只是在为供应器服务?他们是否只是善于使用,却没有任何真正的科学想法?对于我独立进行生物学研究的能力,她很明显地表达了她的担忧。
她并不是最后一个担忧我的人。2012年,随着多篇论文通讯作者的署名都是我,我入围了欧洲分子生物学组织青年科学家奖,但最终并未获奖。根据面试小组提供的反馈,我的团队被称为“数学服务单位”,宣称我们“缺乏对生物学深入的了解”,并且谴责我们的团队“过于依赖合作者”。
去年,当新英格兰医学期刊的主编使用“研究寄生虫”一词来形容计算生物学家对已发表的数据所做的贡献时,我们终于意识到了在生物医学方面,生物学界对计算工作的评价有多低。
在过去的20年里,计算方法已经成为了生物学中得以确立的一部分,但是,以上的事例表明那些守旧派的生物学家和医生——在出版物、资金和职业上拿主意的人——始终对像我这样的人感到不安,我的专业是其他学科,追求的生物学问题与他们所追求的不同,使用的方法也是大多数生物专业所不包括的。如果连我那些从事生命科学的同事们也不能理解为什么计算研究如此重要,那么其他人又如何能够看到它的价值呢?
接下来,我将会论证计算思维和计算方法对于认知生命的探寻非常重要,以至于今天所有的生物学都是计算生物学。
计算生物学使我们对生命的认知条理化
Hallam Stevens 在《Life Out of Sequence》(序列之外的生命)提出“生物学使自己适应了计算机,而不是计算机适应了生物学”这本书中他从民族和历史的角度叙述了计算生物学的发展。他认为:“计算机不仅扩大了古生物学的研究范围,而且给它带来了全新的工具和问题,比如统计、仿真和数据管理,这些都彻底重塑了目前生物学研究的方法。”
论及计算机如何重塑生物学研究,一个关键的例子是数据库和本体论的使用。如今的生物学知识是被明确定义的、有序组织的,并且通过计算机存取的。如果瑞典植物学家分类学之父林奈生活在现代,他很可能也是一位计算生物学家。作为一名植物学家,他可能会在一些像transPLANT的项目中起主导作用,去组织一些我们所知道的关于农作物和模式植物的基因型和表现性的项目。或者他可能会与Gene Ontology Consortium合作去创造共同认可的词汇来统一关于生物体的生物学知识。就像林奈的自然分类一样,计算机这类的数据库对认知生命提供了重要的智力贡献。其他类型的任何一类生物学研究都是建立在这样的基础上的。
计算生物学使我们的视野更加开阔
计算机重塑生物学的另一种方式是通过引入了统计学方法和数据分析方法。一个很好的例子是探究明白突变过程是如何改变基因组的。突变过程——比如吸烟,光照或同源基因重组过程中出现的缺陷——在它们独立突变时是不可见的但在总体的模型中是可见的。C突变为T的频率是多高?这种频率是怎样随着邻近的突变而变化的?这种频率有多少是由基因组的其他特征引起的,比如复制时间。回答这些问题帮助我们明白活跃在细胞中的突变过程的基础特性,以及只有用数据统计方法才可能确定模型和相关性。
分析的各种类型都需要大量的数据收集,只有这样,计算生物学的成功才会和更大规模的成功紧密联系在一起,这份更大规模的成功是在将模型生物和人类的基因型和表现型聚集的努力下获得的。其中一个最早的例子在测定人类基因组时凸显了计算方法的力量,显示了计算的校准和搭支架方法能够高效地装配在鸟枪法测序中产生的DNA碎片,而且现代的下一代测序技术完全依赖于计算生物学的进展去分析大量的短序列读取。DNA测序一度被认为是一项有资格获诺选贝尔奖的发展项目。如今,计算生物学主要是在基础生物学和医学研究领域,引导着这种将自身转变得具有极易获得性和实用性的方法,如今这种方法彻底革新了我们对组织和单细胞所了解的内容。
计算生物学提供一幅生命地图
通过将大数据收集与数据库和统计学结合,计算生物学为生物学提供了一幅参考图——一幅汇集了所有个人见解的生命地图。这幅参考图没有达到像谷歌街景那样革命性的水平,而是像勇敢的探险家哥伦布、麦哲伦和瓦斯科·达伽马他们所用的地图一样具有探索性。这幅地图提供了一个大纲,但是许多地方是不完善的,并且一些重要的部分甚至可能被遗漏了正等待着被发掘。就像大家说的,这很危险。但是即使有这么多的缺点,计算生物学所提供的生命地图仍旧是一个不可或缺的向导:这幅由计算生物学提供的生命地图为计划、执行、和阐释所有聚焦于探索未知领域、推出生物学知识边界的小型实验提供了研究背景。
计算生物学将想法转变为假说
最后,计算机通过使模糊的概念具有严格性和可测性从而重塑了生物学。就拿我自己所做的实验为例:几十年以来,癌症研究者探讨了在同一肿瘤中,细胞间的遗传异质性将有助于使癌症对治疗产生抗性。这是一个简单的想法:细胞群体越多样,就越有可能有一群细胞对治疗产生抗性,并且在其他的细胞都被杀死后能够使肿瘤再生。
但是你测量的“遗传异质性”到底有多准确?它对抗性增长有多大影响?要回答这个问题,我们必须把这个想法转变为可试验的假说。我们使用基因组法去测量一个病人癌症基因组中不同位点的变化,然后确定异质性的定量测定,这样可以在治疗抗性上与临床信息进行数理上的比对。并且我们确实找到了证据来支持异质性决定了抗性这个原始想法。
对于将一个模糊的想法转变为一个可试验的假说需要一个定量的计算方法,这只是众多例子中的其中一个。在实验室中,计算生物学胜在了将大量复杂的数据转变为了可试验的东西,从而塑造和指导接下来进行的实验。
安歇吧,计算生物学
移液管生物学家,显微镜生物学家,细胞培养生物学家,你听说过这些工作头衔么?不,当然没有听说过。这些都是生物学家,因为关键在于你解决了什么问题,而不是你使用了什么工具,所以计算生物学家只是使用了不一样工具的生物学家。
主流生物学实验中采取的数学方法、统计方法、计算方法,将会推动生物学中下一个现代综合方法的发展。在物理学领域中,这类方法看上去更像是一种技能,它可以将教学实验技术与数学理论和数据分析结合。然后,即使是守旧派的生物学家也将会将计算生物学家视为他们其中一员。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-4 11:17
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社