zczhou的个人博客分享 http://blog.sciencenet.cn/u/zczhou

博文

Mothur软件的classify.seqs命令比blast快的分类手段

已有 6290 次阅读 2014-4-2 17:29 |系统分类:科研笔记| 分类, blast, Mothur

The classify.seqs command allows the user to use several different methods to assign their sequences tothe taxonomy outline of their choice. Current methods include using a k-nearestneighbor consensus and Wang approach.  

Classify 用两种方法来计算分类:knn wang. 两者的区别是:knn快,不计算supportivevalue. Wang method 计算。

这里需要对比的序列和分类的文件:

http://www.mothur.org/wiki/Silva_reference_files  这个是常用的silva,还有greengene

mothur >classify.seqs(fasta=abrecovery.fasta, template=nogap.bacteria.fasta,taxonomy=silva.bacteria.silva.tax)

wang methoddefaultmethod,根据query sequences里面kmer比对taxonomydefault ksize8,兼顾快速和准确度。同时迭代次数也可以设定,default100 cutoff参数去除supportive value 小于设定的序列。

 

Knn method是基于dist 信息的,所以会产生一个dist文件,如果你想更快,numwanted可以从default 10该到1,当然改到1的时候就是大致的看看了。同时knn method也像align.seqs一样,提供三种搜索序列的方式kmer,blast,suffix 还有一个distance. blast的时候需要有blast的程序,且让mothur 找到路径。不过一般的,我们都用defaultkemr 方法,所以可以不理会。  参考:http://www.mothur.org/wiki/Classify.seqs




https://blog.sciencenet.cn/blog-491564-781467.html

上一篇:approximate Likelihood-Ratio Test 和 standard bootstrap区别
下一篇:盛世“危言”——“德无以安之则危,政无以和之则乱“的八点理解
收藏 IP: 147.8.76.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 08:04

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部