葡萄皮的个人空间分享 http://blog.sciencenet.cn/u/Hadron74

博文

介绍国外几位生物信息学家(10)~~译后感

已有 11871 次阅读 2011-5-26 12:48 |个人分类:生物信息|系统分类:科研笔记| 生物信息学

    我化了一些时间翻译学习了Jones和Pevzner著的Introduction to Bioinformatics Algorithms一书中九位著名生物信息学家的介绍,收获很多,这里写下些心得体会,留下个记录,也希望给同道留些参考。

这本书是生物信息学算法导论,该书成于2004年,书中对那时生物信息学的常用算法进行了简介,是生物信息学算法入门非常好的教科书,书中除了算法介绍并配有习题。我在博士后的导师推荐作为研究生课程的教材之一,所以我也在这里想对有志于生物信息学研究的同道推荐这本书,已有的中文译本见我的博文系列(0)

    很自然的,这里选择的生物信息学家都偏重于算法设计,介绍的生物信息学家只是非常多的杰出的生物信息学家的代表,同时是为书中各个章节服务的(见下表)。这些科学家是生物信息初创时期做过重要贡献的科学家,有些已经不是活跃的生物信息学家,但这些文章对研究生物信息发展的历史很有帮助,对我等向前辈学人学习也有很多真知灼见。由于有些的介绍可能已时过境迁,这里给出这些科学家当前在网络上的主页,供大家参考。我在每篇博文的题头也做了链接。


    表一:本系列介绍的生物学家:

算法和复杂性        Richard Karp

                    http://www.cs.berkeley.edu/~karp/

分子生物学入门      Russel F. Doolittle                          

                    http://biology.ucsd.edu/faculty/doolittle.html 

全面查找            Gary Stormo 

                    http://ural.wustl.edu/index.html 

贪婪算法            David Sankoff      

                    http://albuquerque.bioinformatics.uottawa.ca/ 

动态规划算法        Michael Waterman                      

                    http://www.cmb.usc.edu/people/msw/Waterman.html                   

分治法              Web Miller

                    http://www.bx.psu.edu/miller_lab/

组合模式匹配        Gene Myers

                    http://research.janelia.org/myers/  

图算法,聚类和树    Ron Shamir

                    http://www.math.tau.ac.il/~rshamir/ 

隐马模型            David Haussler 

                    http://www.cbse.ucsc.edu/people/haussler

 

这一系列文章的写作也是很值得我学习的。在对每个科学家的生平介绍之后,作者选取了科学家最著名的贡献若干,以小见大,把他们的治学成绩和理念进行了介绍。文章行云流水,穿插了作者的语言和被介绍者的自我介绍,生动活泼地把一系列重大学术发现的背后的故事展现在读者面前。有很多名句值得我辈学习体味,如介绍Doolittle教授时的“这个发现花费了我们五年零二十分钟”,介绍Shamir教授时,“灵感只出现在法律图书馆的凌晨三点时”。


从这些前辈生物信息学家的成就中,我辈可以学习的很多,从科研基础,导师选取,科研兴趣,科研选题,概念创新,科学发现,科研协作,科研竞争,独立研究,课题申请,工作态度到科研与生活的关系等等。

这些前辈科学家都有坚实的科研基础。在涉足生物信息学之前,Karp和Shamir是著名的算法学家,Waterman和Sankoff是数学专家,Stormo是物理学士,Miller、Myers和Haussler是计算机科学专家, Doolittle是分子生物学专家。这正显示了Stormo的观点“跨学科间的策略在生物信息中特别有用”,成名的生物信息学家都是跨学科研究的高手。

对导师的选取,Haussler的例子给我辈以启迪。他发现Andrzej Ehrenfeucht是这个领域的领军人物,所以就选择了他作为自己的博士导师,当然我推断这个选择的成功也应该很大程度决定于Haussler在本科的时候的数学基础和在Science文章上的成功。

这些生物信息学家都有广泛的兴趣。如Stormo、Myers和Haussler正是通过Ehrenfeucht组织的兴趣广泛的讨论组,最终走向了生物信息学;Myers对科幻作品的着迷把他引向了科学研究;Doolittle在分子生物学研究的业余时间里学习计算机编程,使他做出了重要的工作;Shamir一直在几个领域的交叉进行工作等等。

对于科研选题,Haussler的观点给我不少启发。“主要的科学问题成熟于特定的时间。在这之前,它是不可及的,因为解决它们的基础还没有打好。而在这之后,它们就不再重要了,因为问题的核心已经被解决了。但是,认识一个科学问题是否成熟来解决是一种非常难的艺术。广泛的关注十分有帮助,还需要有很多的运气。

概念的创新在生物信息研究中,有很大的推进作用。如Stormo发明的位置加权矩阵(position weight matrices),比共有序列(concensus sequence)的方法更贴近基因调控位点的生物学描述,新的概念提出了序列谱寻找的新的生物信息学问题,引发推动了生物信息学算法和应用的深入研究。

在介绍Stormo的短文中,对科学发现有一个精辟的论述。“科学发现可以从多种途径得到,最重要的是要时时准备好。”在生物信息学中新问题、新方法、新数据、新结果是推动学科发展的动力,我辈的确需要时刻准备好的。

对于科研协作,在前辈科学家的研究经历中,笔笔皆是。Shamir在Simplex算法的平均复杂性的证明研究中称,与导师和Karp之间的合作是“极端令人兴奋的”;是新博士后Anders的加盟,使Haussler小组把隐马模型(HMM)引入了生物信息学界;Waterman和Smith的合作诞生了著名的动态规划算法;Sankoff提到CTAR计划中研究科学家的合作,称它为“家单位”(home department);是Lawler和Lander的介绍使Shamir从算法学转向了生物信息学。

对于科研竞争,有趣的例子是Haussler和Myers在人类基因组计划中的竞争。他们在博士生时都是Ehrenfeucht讨论组的成员,而后,一个(Myers)进入Celera公司用散弹法为私有公司测序,另一个(Haussler)对公开的测序结果进行了拼接,他们同时对人类基因组计划的完成做出了关键性的贡献。

对于独立科研,Sankoff对生物信息学创始初期的描述让我深省。 在我开始注意到联配问题时,它不是生物学家们和计算机学家们热门关注的事物,在十五年以前基因组重组也不是。令我非常高兴,虽然有时候也困惑的是:现在计算生物学家和生物信息学家的名符其实的大潮泛滥在这个领域,而在三十,甚至二十年前,只有非常少的单独研究者。”

对于课题申请,Myers对散弹法的工作的推广颇费周折。先是“开始对LanderWaterman定理关于散弹法真正所说的进行再思考”,而后和遗传学家Tim Weber申请“通过散弹法作为途径来加速人类基因组计划的进程的申请书”,但是“对于这个申请书的反馈意见是非常负面的,Weber和我基本上被判断为傻瓜。”,但Merys不灰心,“仍然和他的学生在模拟的层次进行工作”,直到最后Celera公司成立,对Myers来说这意味着有人决定化30亿美元来尝试我们的项目。

前辈的科学家工作的工作态度更是值得一表。从Doolittle和Shamir引用的话语中,可见他们对工作的痴迷和努力的程度;Myers对散弹法测序的有着出于常人的坚持和执着;Sankoff的循序渐进的科学研究方法;Shamir对待科研挫折时乐观的态度;Karp,Haussler等大科学家对生物奥秘探索的热情;所有的这些都给我留下了很深的印象。

科学家的生活点滴也让我体会出他们如何把科研和生活紧密结合的。Waterman的科研生涯的开始,只为“能够不做那些牧场运营和砍伐木头的工作”,最终他成为“生物信息学的创始之父之一”。Doolittle把科研工作和教育孩子结合到一起,与孩子一起做出了非常重要的工作。Shamir的生物学入门是他妻子Machal启蒙的。Myers进入Celera公司之前十年就认识了公司策划者Vender。这些细节或许是前辈学人成功不可或缺的条件之一。


从文中对生物信息学的贡献方式上,我这里试着把他们的贡献分为三种方式:理论生物信息学家,应用生物信息学家,整合生物信息学家。

理论生物信息学家的工作,如KarpShamir,他们往往是其它领域中著名科学家,把其他学科科学中成熟或新发展的方法引入生物信息学,解决生物问题,其研究范式多是“有解答后找生物问题。”,由于算法和其它数理方法的一般性和通用性,如果“理解要解决的生物问题”,往往能使生物信息学方法学有突破进展。

应用生物信息学家的工作,如Doolittle,他们往往是生物学方面的专家,只是从数理、信息学领域中成熟的方法引入生物信息学研究,其研究范式是“生物问题寻找答案”,也就是大家常说的“干实验”。特别在现代,生物信息学数据库、软件和网站帮助生物学家通过生物信息学的方法解决他们的问题,这样的生物信息学家在广大的生物实验室中有很大的需求。

整合生物信息学家的工作,如Haussler,他们把其他领域的方法和生物领域的问题整合起来,编制软件、数据库和网站为生物学家提供数据挖掘的数据源和平台,诸如Haussler“里程碑式的成功”的人类基因组浏览系统。现在生物信息学软件、数据库和服务大量涌现的时代,在软件整合和数据分析相结合的工作,更是现在许多生物信息学研究中所必须要做的事情。

当然上面的分类是非常粗粒度的,真正的生物信息研究多包括了理论探索,方法、数据和软件整合,应用于生物学实例,并最终由生物实验进行验证,如Miller在序列联配中用生物信息学推动生物发现的工作。特别要说是,在生物信息学相对成熟的今天,如果没有实验的验证工作,在当前的生物信息研究中很难发表很好的文章。

这里说生物信息学相对成熟,并不是说生物信息学不再需要理论研究了,非编码RNA,系统生物学,表观遗传学等等新的生物学生长点和高通量测序技术为生物信息学提供了很多新的机会。正像Haussler评价人类基因组计划成功的时候所说的那句“那一天来到了”,生物信息学研究现在正是仲夏时节

这段学习笔记是我对当前生物信息的发展的粗浅看法,抛砖引玉,欢迎博友和各位拍砖指导。




https://blog.sciencenet.cn/blog-565112-448151.html

上一篇:介绍国外几位生物信息学家(9)~~David Haussler
下一篇:Python for Bioinformatics 为生物信息学设计的Python教程
收藏 IP: 114.244.33.*| 热度|

5 陈飞 荣元华 孙广东 赵明 yonghuidong

该博文允许注册用户评论 请点击登录 评论 (6 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-17 21:17

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部