woodcorpse的个人博客分享 http://blog.sciencenet.cn/u/woodcorpse

博文

QIIME 2用户文档. 9数据导出Exporting data(2018.11)

已有 2314 次阅读 2019-1-3 12:28 |个人分类:QIIME2|系统分类:科研笔记

前情提要

QIIME 2用户文档. 9数据导出

https://docs.qiime2.org/2018.11/tutorials/exporting/

Exporting data

注:最好按本教程顺序学习,想直接学习本章,至少完成本系列1简介和安装

为了使用qiime 2,输入数据必须存储在qiime 2对象(即qza文件)中。这就是支持分布式和自动来源跟踪以及语义类型验证和数据格式之间的转换的需要(有关qiime 2对象的更多详细信息,请参阅核心概念页)。

有时,您需要从qiime 2对象中导出数据,例如使用不同的微生物组分析程序分析数据,或在R中进行统计分析。这可以通过使用qiime导出命令来实现,该命令以qiime 2对象(.qza)文件和输出目录作为输入。对象中的数据将根据特定对象导出一个或多个文件。

警告: 当从qiime 2对象导出数据时,将不再有与数据相关的来源。如果随后重新导入数据,则与新对象关联的源将从导入步骤开始,并且所有现有的来源信息都将丢失。因此,最好只在使用qiime 2完成所有可以实现的处理步骤后,再从对象中导出数据,以最大化每个对象来源的追溯。

以下部分提供了从qiime 2对象导出数据的示例。可以从任何qiime 2对象或可视化中导出数据;该过程与下面描述的过程相同。

详者注:为什么要导出文件?
QIIME2采用统一qza文件格式,是为了保证文件格式统一和分析流程可追溯。但不可能要求每个人都用此需系统,而且此系统的功能也不是万能的,需要导出其它软件兼容的格式,方便交流和其它用户更个性化的分析。

# Miniconda安装的请运行如下命令加载工作环境
source activate qiime2-2018.11

# 如果是docker安装的请运行如下命令,默认加载当前目录至/data目录
# docker run --rm -v $(pwd):/data --name=qiime -it  qiime2/core:2018.11

# 建立工作目录
mkdir -p qiime2-exporting-tutorial
cd qiime2-exporting-tutorial

导出特征表

Exporting a feature table

导出FeatureTable[Frequency]对象为BIOM v2.1格式

wget \
  -O "feature-table.qza" \
  "https://data.qiime2.org/2018.11/tutorials/exporting/feature-table.qza"

qiime tools export \
  --input-path feature-table.qza \
  --output-path exported-feature-table

导出的biom文件位于exported-feature-table文件夹中,名为feature-table.biom,可用biom程序对文件进行格式转换和分析

导出进化树

Exporting a phylogenetic tree

导出Phylogeny[Unrooted]对象为newick格式

wget \
  -O "unrooted-tree.qza" \
  "https://data.qiime2.org/2018.11/tutorials/exporting/unrooted-tree.qza"

qiime tools export \
  --input-path unrooted-tree.qza \
  --output-path exported-tree

导文件为exported-tree/tree.nwk,是标准树nwk文件

(((New.CleanUp.ReferenceOTU1480:0.11995,(New.CleanUp.ReferenceOTU202:0.04479,
New.CleanUp.ReferenceOTU432:0.0049)0.769:0.04661)1:0.26705,
((New.CleanUp.ReferenceOTU1150:0.00016,(New.CleanUp.ReferenceOTU782:0.04264,(New.CleanUp.ReferenceOTU643:0.10438,
(((New.CleanUp.ReferenceOTU1014:0.01521,New.CleanUp.ReferenceOTU270:0.02738)0.879:0.02315,(((New.CleanUp.ReferenceOTU1008:0.0378

导出与提取

Exporting versus extracting

提取包括所有的信息文件,如下例中的特征表文件,结果即包括特征表,又包括生成此文件的相关软件版本信息,还有生成此文件所有步骤的文件说明。

mkdir extracted-feature-table
qiime tools extract \
  --input-path feature-table.qza \
  --output-path extracted-feature-table

解压目录包括一个对象编号UUID的目录,里面有所有文件。

推荐使用 https://view.qiime2.org 在线查看结果,可以图形化展示分析流程的追溯。

Reference

Bolyen E, Rideout JR, Dillon MR, Bokulich NA, Abnet C, Al-Ghalith GA, Alexander H, Alm EJ, Arumugam M, Asnicar F, Bai Y, Bisanz JE, Bittinger K, Brejnrod A, Brislawn CJ, Brown CT, Callahan BJ, Caraballo-Rodríguez AM, Chase J, Cope E, Da Silva R, Dorrestein PC, Douglas GM, Durall DM, Duvallet C, Edwardson CF, Ernst M, Estaki M, Fouquier J, Gauglitz JM, Gibson DL, Gonzalez A, Gorlick K, Guo J, Hillmann B, Holmes S, Holste H, Huttenhower C, Huttley G, Janssen S, Jarmusch AK, Jiang L, Kaehler B, Kang KB, Keefe CR, Keim P, Kelley ST, Knights D, Koester I, Kosciolek T, Kreps J, Langille MG, Lee J, Ley R, Liu Y, Loftfield E, Lozupone C, Maher M, Marotz C, Martin BD, McDonald D, McIver LJ, Melnik AV, Metcalf JL, Morgan SC, Morton J, Naimey AT, Navas-Molina JA, Nothias LF, Orchanian SB, Pearson T, Peoples SL, Petras D, Preuss ML, Pruesse E, Rasmussen LB, Rivers A, Robeson, II MS, Rosenthal P, Segata N, Shaffer M, Shiffer A, Sinha R, Song SJ, Spear JR, Swafford AD, Thompson LR, Torres PJ, Trinh P, Tripathi A, Turnbaugh PJ, Ul-Hasan S, van der Hooft JJ, Vargas F, Vázquez-Baeza Y, Vogtmann E, von Hippel M, Walters W, Wan Y, Wang M, Warren J, Weber KC, Williamson CH, Willis AD, Xu ZZ, Zaneveld JR, Zhang Y, Zhu Q, Knight R, Caporaso JG. 2018. QIIME 2: Reproducible, interactive, scalable, and extensible microbiome data science. PeerJ Preprints 6:e27295v2 https://doi.org/10.7287/peerj.preprints.27295v2

译者简介

刘永鑫,博士。2008年毕业于东北农大微生物学专业。2014年中科院遗传发育所获生物信息学博士学位,2016年博士后出站留所工作,任宏基因组学实验室工程师,目前主要研究方向为宏基因组学、数据分析与可重复计算和植物微生物组、QIIME 2项目参与人。发于论文12篇,SCI收录9篇。2017年7月创办“宏基因组”公众号,目前分享宏基因组、扩增子原创文章400+篇,代表博文有《扩增子图表解读、分析流程和统计绘图三部曲》,关注人数3.2万+,累计阅读500万+。

猜你喜欢

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外3000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
image

学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
image

image

点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA



https://blog.sciencenet.cn/blog-3334560-1155090.html

上一篇:QIIME 2用户文档. 8数据导入Importing data(2018.11)
下一篇:QIIME 2用户文档. 11数据筛选Filtering data(2018.11)
收藏 IP: 210.75.224.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-22 17:23

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部