||
The classify.seqs command allows the user to use several different methods to assign their sequences tothe taxonomy outline of their choice. Current methods include using a k-nearestneighbor consensus and Wang approach.
Classify 用两种方法来计算分类:knn 和wang. 两者的区别是:knn快,不计算supportivevalue. Wang method 计算。
这里需要对比的序列和分类的文件:
http://www.mothur.org/wiki/Silva_reference_files 这个是常用的silva,还有greengene
mothur >classify.seqs(fasta=abrecovery.fasta, template=nogap.bacteria.fasta,taxonomy=silva.bacteria.silva.tax)
wang method的defaultmethod,,根据query sequences里面kmer比对taxonomy,default ksize是8,兼顾快速和准确度。同时迭代次数也可以设定,default为100 ,cutoff参数去除supportive value 小于设定的序列。
Knn method是基于dist 信息的,所以会产生一个dist文件,如果你想更快,numwanted可以从default 的10该到1,当然改到1的时候就是大致的看看了。同时knn method也像align.seqs一样,提供三种搜索序列的方式kmer,blast,suffix 还有一个distance. 用blast的时候需要有blast的程序,且让mothur 找到路径。不过一般的,我们都用default的kemr 方法,所以可以不理会。 参考:http://www.mothur.org/wiki/Classify.seqs
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-16 01:12
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社