woodcorpse的个人博客分享 http://blog.sciencenet.cn/u/woodcorpse

博文

USEARCH11发布,新功能简介

已有 4234 次阅读 2018-8-1 20:39 |个人分类:软件|系统分类:科研笔记

image

USEARCH是继Mothur、QIIME后的第三大流行扩增子分析流程,目前引用7296次。由Robert Edgar大神独立编写。官方网址:http://www.drive5.com/usearch/

详细介绍,请参阅

软件优缺点

  • 优点

跨平台
体积小巧
易用

  • 缺点

软件64位版收费
代码不开源

v11新功能

就在2018年7月末,USEARCH(Ultra-fast sequence analysis)扩增子分析神器迎来了其第11个大版本,

具体有哪些新功能呢?

详见此页:

http://www.drive5.com/usearch/manual/whatsnewv11.html

主要新增了6大新功能,21个新命令,下面进行简介。

新特征

  • 机器学习:主要包括随机森林、多次交叉验证、OTU分类重要性,包括的命令有森林训练、森林分类和森林交叉验证

image

  • 改进嵌合体检测
  • 新增了两种Alpha多样性指数: Mirror estimator、 Singleton-free (FE) estimator
  • Octave plot(八度图)展示Alpha多样性,方便观察样本品中真实序列、测序错误和嵌合体数量

image

  • 样品组间多样性比较

image

  • 同一性交驻验证特征预测的准确率

image

新命令

  1. calc_lcr_probs: Calculate lowest common rank probabilities 计算序列物种分类各级概率
  2. cluster_tree: Construct clusters from tree using distance cutoff 基于树文件聚类
  3. distmx_split_identity: Split distance matrix into test/training pair for CVI 拆分距离矩阵为测试和训练集
  4. fastx_syncpairs: Sort forward and reverse reads into the same order 双端序列找成队并排序
  5. fastx_trim_primer: Remove primer-binding sequence from FASTx file 引物匹配并切除
  6. forest_classify: Classify data using random forest 随机森林分类预测
  7. forest_train: Train random forest classifier 随机森林分类器建立
  8. nbc_tax: Predict taxonomy using RDP Naive Bayesian Classifier algorithm 采用RDP算法预测分类学物种注释
  9. otutab_binary: Convert OTU table with counts to presence(1) / absence(0) 转换OTU表为二元(有、无)形式
  10. otutab_forest_classify: Classify samples using random forest 样品随机森林分类
  11. otutab_core: Identify core microbiome in OTU table 鉴定OTU表中核心微生物组
  12. otutab_forest_train: Train random forest classifier on OTU table 基于OTU表的随机森林训练
  13. otutab_otus: Extract OTU labels from OTU table 提取OTU表中的OTUs
  14. otutab_rare: Sub-sample OTU table to same number of reads per sample 抽样标准化OTU表
  15. otutab_samples: Extract sample labels from OTU table 提取OTUs表中样品名
  16. otutab_select: Identify OTUs which are informative (correlate with metadata) 鉴定更有信息的OTUs,,即组间差异OTUs
  17. otutab_xtalk: Identify cross-talk using improved algorithm (UNCROSS2) 改进算法鉴定嵌合
  18. search_pcr2: In-silico PCR, search for matches to primer pair 电子PCR,基于引物匹配扩增区
  19. subtree: Extracts subtree under given node 提取树中指定结点的子树
  20. tabbed2otutab: Convert read mapping file (read+OTU) to OTU table 单行表格转换为OTU表
  21. tree_subset: Extract subset of tree for given set of leaf labels 根据树叶标签提取子集

猜你喜欢

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外1800+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
image

学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
image

image

点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA



https://blog.sciencenet.cn/blog-3334560-1127082.html

上一篇:微生物组——扩增子分析专题研讨会-9月-北京!!!
下一篇:USEARCH11命令大全,200+命令中文简介,快速查找需要功能
收藏 IP: 101.64.179.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-26 10:49

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部