|||
随着生命科学科研领域的需要和测序技术的发展,生物信息这个交叉学科近年来愈来愈兴旺起来,从业者也越来越多。与传统的理论和实验学科不同,生物信息是一门数据科学,这就需要从业者具备一定数据收集、管理、处理和分析的能力。在海量的组学数据面前,使用别人开发的软件及图形界面操作往往不能解决工作中的问题,而简单的编程就可能解决问题,因而编程即成为一个生物信息工作者的必备技能。这本书就是为生物信息初学者设计的编程教程。
我从事生物信息工作以来,编程语言开始一直以PERL和C为主,从2007年开始使用Python,初时也因为块缩进的问题不习惯,但很快被其可读性和开放性所吸引,喜欢上了这门语言,并作为最主要的脚本语言使用至今。回国后,发现国内大部分的生物信息工作者还是以PERL作为主要的工作语言,就想为Python在这个领域的推广做些工作,有幸得到出版社马岚老师的推荐,见到本书,就与陈一情,李少娟合作进行了翻译。
正如书中所说,编程就像写菜谱做饭或者是按流程做生物实验一样,不是一件很难的事情。对于有过逻辑训练的生物研究者只要能熟悉了编程的思想,掌握这项技能是容易的。但是如何选择一个切门点和提高途径,真正把它运用到自己的工作中就是另外一件事情,为什么推荐这本Python书作为生物信息数据管理编程的入门书呢?
Python语言提供了从入门到高手的良好的学习曲线。Python语言是至今为止最接近自然语言的编程语言,学过其它一些编程语言的学员甚至不需要太多的训练就能读写其代码;模块化和面向对象的支持使得学员能不费力地从一个只能写几行代码的操作员变成一个管理千行代码的程序员,同时书写良好可读性代码的编程习惯也会令其受益终生;丰富的标准库和第三方包使得Python语言成为当前最好的“胶水语言”,把多方资源整合到一起来解决工作中的问题。
本书的风格非常适合对编程的初学者。它从生物数据管理分析实践出发,由浅入深地介绍编程的基础知识,特别是对错误处理和程序调试等初学者常见的问题做了精辟的阐述;本书在内容上对生物信息中的经常遇到的数据整理和做图分析有较重的篇幅,还包含了大量的Python第三方工具库接口充分地体现了Python开放性“胶水语言”的特点。该书采用章节的篇幅都不长,每每切中要点,便于读者围绕主题、消化概念,且后面的练习难度适中,所以很适合作为本科生或是研究生低年级的教材;书后的编程秘诀对于进入科研实践的研究者也有颇多的参考价值。
非常感谢我的博士导师陈润生院士能在百忙中为本书作序。感谢陈一情和李绍娟以及所有参与工作的同学,陈一情翻译本书的第一到十五章,李绍娟翻译了第十六到十八章,我翻译了其它的部分并校正了本书的译稿。感谢李大伟博士对蛋白质结构翻译部分的意见。非常荣幸能得到出版社马岚老师的支持,才得以出版此书。
希望这本书能对有志于生物信息的同道有所帮助。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-18 13:23
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社