woodcorpse的个人博客分享 http://blog.sciencenet.cn/u/woodcorpse

博文

史上最详细的微生物扩增子数据库整理

已有 634 次阅读 2017-9-4 07:37 |个人分类:扩增子|系统分类:科研笔记

本网对Markdown排版支持较差,对格式不满意的用户请跳转至 或“宏基因组”公众号阅读;

声明:文章内所有链接内容均来自“生信控”公众号,已经获作者向屿授权。

本人对每个数据库的使用目的和经验配导读,需要使用的小伙伴读点击链接跳转原文学习。

“生信控”相关文章推荐

听说不用再在各种公众号+网页检索微生物扩增子数据库的资料了,惊不惊喜?

image

听说史上最详细的微生物扩增子数据库整理已经在生信控上更新完成了?
是的,是的,就在生信控!在生信控!生信控!【三遍洗脑模式…】

给个面子,此处需要大家配合一下略显浮夸的围观

image

哦对,今天我们编辑有事去了(不知道是不是约会),大家就勉为其难的接受下直男审美的编辑吧!哈哈~

所有数据库的链接和简介如下:

1简介

扩增子研究的基本背景知识,包括16S和ITS结构,扩增区域选择等。

2数据库概述

几个公共数据库有RDP, SILVA, GreenGene, UNITE的基本信息统计,如官网链接、更新周期、数据量和主要用途。

RDP

RDP数据库全称“RibosomalDatabase Project”,是由密歇根州立大学开发维护的在线工具,包括数据库和分析工具两部分。两者都很好,但都没有做到最好。分析工具最早是用于一代测序产生的16S数据分析,其后逐步拓展了在28S、ITS、功能基因的分析功能,并支持二代测序平台产生的数据,而数据库部分则提供高质量、已注释的细菌、古菌16S rRNA基因和真菌28S rRNA基因序列。目前其数据库最新版本为RDP Release 11.5,于2016年9月30日更新。文章《Ribosomal Database Project: data and tools for high throughput rRNA analysis>》被引829次。使用Mother分析的用户对它应该比较熟悉,更新也算比较频繁,推荐。Usearch之前推荐使用RDP数据库用于去嵌合,现在又推荐Sliva了。

NCBI taxdmp

研究中有时不只有细菌、真菌;比如18S/ITS可以扩增出所有真核生物,最全的数据库那当然还是NCBI。很可惜这么强大的需求下没有整理。想要注释最全的物种信息,大家只能按文中的说明,自己整理吧。注:NCBI数据无人把关,比较乱,假阳性率或错误比较多;但有信息总比没有强。
通常注释需要将序列blast到NCBI的NR的核酸或蛋白库中,获得最相拟序列,再结果相似序列的GI号转换Taxonomy,链接中有详细的教程。

SILVA

最大最全的数据库,全的缺点是假阳性率会更高。SILVA是一个rRNA基因序列的综合数据库,收录原核和真核微生物的小亚基rRNA基因序列(简称SSU,即16S和18SrRNA)和大亚基rRNA基因序列(简称LSU,即23S和28SrRNA)。细菌真菌都有,更新频繁,自己也在在线分析工具,SlivaNGS,使用详见SILVAngs: 扩增子16S/18S免费在线分析。唯一的问题是它的物种注释采用的是14级,且与常用的七级不同,不能转换和比较。

GreenGene

16S物种数据库里面可以说是大名鼎鼎了,即便是多年没有更新,但是使用该数据库进行物种注释依然是很多科研工作者不变的选择,而且16S功能分析工具PICRUSt也是基于该数据库的,可想而知其影响力。QIIME的默认数据也是它。主要是人工整理,比较准确。分类采用常用的七级界门纲目科属种,方便理解和阅读。

PR2

PR2数据库的2013年发表在Nucleic Acids Research上,是针对 18S测序分析比较好用的数据库

UNITE

16S(常选RDP或Greengene)和18S(常选SILVA或PR2)的几种常用数据库
ITS(全称ribosomal internal transcribed spacer,核糖体基因内转录间隔区)是最常用的真菌鉴定及多样性检测的marker基因,UNITE数据库是专门针对真菌ITS序列(包括ITS1和ITS2区)最全的数据库,不用考虑ITS注释数据库的选择,UNITE就是近乎唯一的存在!

FunGene

FungGene (http://fungene.cme.msu.edu/) 是RDP延伸的一个针对微生物功能基因序列的数据库。其按照功能分为抗生素抗性(Antibiotic resistances)、植物致病基因(Plant Pathogenicity)、生物地球化学循环(Biogeochemical cycles)、系统进化标志(Phylogenetic markers)、生物降解(Biodegradation)、金属循环(Metal Cycling)及其他(Other)等七类功能基因。每类都包含几到上百种功能基因,可被用于功能marker基因高通量测序后的比对及功能基因引物设计等。

喜欢上面数据库文章的小伙伴,推荐关注生信控,阅读更多相关文章!
image

跳转原文:http://mp.weixin.qq.com/s/yx1F97n_2xh0IrpolAzYVA



http://blog.sciencenet.cn/blog-3334560-1074113.html

上一篇:Nature:拟南芥微生物组功能研究1培养组学—高通量细菌分离培养
下一篇:Nature:拟南芥微生物组功能研究2细菌基因组测序和分析
收藏 分享 举报

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2017-10-23 06:54

Powered by ScienceNet.cn

Copyright © 2007-2017 中国科学报社

返回顶部