博文

Mothur软件的classify.seqs命令比blast快的分类手段

已有 6745 次阅读 2014-4-2 17:29 |系统分类:科研笔记| 分类, blast, Mothur

The classify.seqs command allows the user to use several different methods to assign their sequences tothe taxonomy outline of their choice. Current methods include using a k-nearestneighbor consensus and Wang approach.

Classify 用两种方法来计算分类：knn 和wang. 两者的区别是：knn快，不计算supportivevalue. Wang method 计算。

这里需要对比的序列和分类的文件：

http://www.mothur.org/wiki/Silva_reference_files 这个是常用的silva，还有greengene

mothur >classify.seqs(fasta=abrecovery.fasta, template=nogap.bacteria.fasta,taxonomy=silva.bacteria.silva.tax)

wang method的defaultmethod,，根据query sequences里面kmer比对taxonomy，default ksize是8，兼顾快速和准确度。同时迭代次数也可以设定，default为100 ，cutoff参数去除supportive value 小于设定的序列。

Knn method是基于dist 信息的，所以会产生一个dist文件，如果你想更快，numwanted可以从default 的10该到1,当然改到1的时候就是大致的看看了。同时knn method也像align.seqs一样，提供三种搜索序列的方式kmer,blast,suffix 还有一个distance. 用blast的时候需要有blast的程序，且让mothur 找到路径。不过一般的，我们都用default的kemr 方法，所以可以不理会。参考：http://www.mothur.org/wiki/Classify.seqs

转载本文请联系原作者获取授权，同时请注明本文来自周之超科学网博客。
链接地址：https://blog.sciencenet.cn/blog-491564-781467.html

上一篇：approximate Likelihood-Ratio Test 和 standard bootstrap区别
下一篇：盛世“危言”——“德无以安之则危，政无以和之则乱“的八点理解

收藏 IP: 147.8.76.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

博文发布时间已经超过87600小时，评论已关闭。

周之超

扫一扫，分享此博文

全部作者的其他最新博文

• 盛世“危言”——“德无以安之则危，政无以和之则乱“的八点理解

zczhou的个人博客分享 http://blog.sciencenet.cn/u/zczhou

博文

Mothur软件的classify.seqs命令比blast快的分类手段

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

周之超

全部作者的其他最新博文

全部精选博文导读

相关博文

zczhou的个人博客分享 http://blog.sciencenet.cn/u/zczhou

博文

Mothur软件的classify.seqs命令比blast快的分类手段

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

周之超

全部作者的其他最新博文

全部精选博文导读

相关博文

该博文允许注册用户评论请点击登录评论 (0 个评论)