葡萄皮的个人空间分享 http://blog.sciencenet.cn/u/Hadron74

博文

你所在的领域里,有哪些堪称开山之作的论文?

已有 3477 次阅读 2017-6-13 12:36 |个人分类:生物信息|系统分类:科研笔记| 论文, 生物信息, blast

我在@知乎回答了问题:“你所在的领域里,有哪些堪称开山之作的论文?” ,分享在这里:


作为生物信息的码农,生物信息领域的开山之作,个人觉得这篇BLAST(局域联配搜索基础工具)的论文是当之无愧的:

Basic local alignment search tool

SF Altschul, W Gish, W Miller, EW Myers… - Journal of molecular …, 1990 - Elsevier

生物信息是用计算机科学的方法研究生物学的领域。而生物学中信息的最主要载体DNA和蛋白质都是序列化的,生物的进化使得序列间存在大量的相似性,称为同源性。所以序列比对对于基因组研究至关重要。

在BLAST之前,计算机科学家已经有了一系列基于动态规划的算法进行序列比对,但单纯的动态规划算法所需的时间是与序列长度的平方成正比,虽然对计算机科学这已经很不错了,可对于成亿长度规模的基因组,上万条的序列同时进行分析,这个速度还是不能忍受的。

BLAST的出现改变这种情况,它采用了启发式的算法,基于文章通讯作者在1985年发明的FASTA算法。这个算法虽然不是严格的找最优解,但由于该方法抓住的生物序列的主要特征,在绝大多数情况下都能得到最优解。而在速度上,比前人的算法提高了50倍,别小看了这50倍,这使得序列对数据库的比对成为可能(BLAST一般的分析几分钟就能完成一条序列对大数据库的比对,想想这在以前的方法要几小时呀)。在此基础上,BLAST又革命性的引入了对数据库比对结果打分排序的统计方法,使结果分析更加清晰可靠。从此BLAST开启了序列比对应用的时代,也开启了生物信息学的时代。

BLAST由于其算法和软件的实用性,且得到了NCBI的大力推广,其文章得到了大量的引用。到2017年,Google Scholar上引用该文66,000多次,加上同一作者在1997年的加强版gapped-BLAST(62,000次引用),BLAST稳居生物信息领域第一牛文,也是人类历史上引用率最高的论文之一。



参考:

1,abc.cbi.pku.edu.cn/semi

2,What Are The Most Cited Research Papers Of All Time?





http://blog.sciencenet.cn/blog-565112-1060528.html

上一篇:【六一福利:转发赠书活动】
下一篇:与儿子的小实验:自来水对纯净水的比较

2 刘钢 强涛

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-4-13 10:47

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部