|||
我在@知乎回答了问题:“你所在的领域里,有哪些堪称开山之作的论文?” ,分享在这里:
作为生物信息的码农,生物信息领域的开山之作,个人觉得这篇BLAST(局域联配搜索基础工具)的论文是当之无愧的:
Basic local alignment search toolSF Altschul, W Gish, W Miller, EW Myers… - Journal of molecular …, 1990 - Elsevier
生物信息是用计算机科学的方法研究生物学的领域。而生物学中信息的最主要载体DNA和蛋白质都是序列化的,生物的进化使得序列间存在大量的相似性,称为同源性。所以序列比对对于基因组研究至关重要。
在BLAST之前,计算机科学家已经有了一系列基于动态规划的算法进行序列比对,但单纯的动态规划算法所需的时间是与序列长度的平方成正比,虽然对计算机科学这已经很不错了,可对于成亿长度规模的基因组,上万条的序列同时进行分析,这个速度还是不能忍受的。
BLAST的出现改变这种情况,它采用了启发式的算法,基于文章通讯作者在1985年发明的FASTA算法。这个算法虽然不是严格的找最优解,但由于该方法抓住的生物序列的主要特征,在绝大多数情况下都能得到最优解。而在速度上,比前人的算法提高了50倍,别小看了这50倍,这使得序列对数据库的比对成为可能(BLAST一般的分析几分钟就能完成一条序列对大数据库的比对,想想这在以前的方法要几小时呀)。在此基础上,BLAST又革命性的引入了对数据库比对结果打分排序的统计方法,使结果分析更加清晰可靠。从此BLAST开启了序列比对应用的时代,也开启了生物信息学的时代。
BLAST由于其算法和软件的实用性,且得到了NCBI的大力推广,其文章得到了大量的引用。到2017年,Google Scholar上引用该文66,000多次,加上同一作者在1997年的加强版gapped-BLAST(62,000次引用),BLAST稳居生物信息领域第一牛文,也是人类历史上引用率最高的论文之一。
参考:
1,http://abc.cbi.pku.edu.cn/seminar/caas13s2-02.pdf
2,What Are The Most Cited Research Papers Of All Time?
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 20:11
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社