李雷廷的个人博客分享 http://blog.sciencenet.cn/u/llt001

博文

needle和needleall

已有 6049 次阅读 2015-8-3 16:05 |系统分类:科研笔记

生物信息学历史上有两个里程碑式的序列比对算法,一个用于两条序列的全局比对——Needleman-Wunsch算法,一个用于两条序列的局部比对——Smith-Waterman。这两种算法目前还有广泛的应用。

EMBOSS软件包中有两个程序分别应用了这两种算法,一个名为needle做序列全局比对,一个名为water,做序列局部比对。两个程序都需要输入两个文件,包含一条序列的asequence和包含多条序列的bsequence,利用asequence中的一条序列分别比对bsequence中的所有序列。

而如果要多对多地做序列全局比对,就需要利用另外一个程序,名字为needleall。但是,如果要多对多地做序列局部比对,却没有一个程序叫做waterall。真是奇怪啊!而且,为什么一对多和多对多两种模式要分开呢,一个程序不可以解决吗?

EMBOSS知名度很高,似乎属于生物信息学“装机必备”,有一点令人挺不理解的,就是它编译好的可执行程序有262个之多!前面说的needle, needleall, water就是其中之三,为什么不弄一个整合的程序叫做emboss呢?^_^



参考资料:

https://en.wikipedia.org/wiki/Needleman–Wunsch_algorithm

https://en.wikipedia.org/wiki/Smith–Waterman_algorithm

http://emboss.sourceforge.net



https://blog.sciencenet.cn/blog-656335-910277.html

上一篇:使用datamash注意要对数据先排序
下一篇:在github中删除已经同步过的commit
收藏 IP: 218.2.227.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

全部作者的精选博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-20 00:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部