zd200572的个人博客分享 http://blog.sciencenet.cn/u/zd200572

博文

将QIIME2学习进行到底

已有 4502 次阅读 2019-2-13 15:44 |个人分类:biology|系统分类:科研笔记

qiime2-2019.1已经发布,程序稳定性越来越好,鉴于官方已经停止支持qiime1,有必要把qiime2的所有细节都理清,学好,这样才能对自己的数据进行实战分析,并将结果运用于实验和生产过程中。发现文档更新也相当快,感谢公众号宏基因组翻译的文档,让我在看许多专业术语方面扫清不少障碍,但是你介于翻译过来的命令却已经过时,还是对照着看最新版的,基本上很少改动,当然,专业英语好的除外。
发现需要学习的有几个内容,数据的过滤(嵌合体,非细菌序列,注释级别太少的等),还有就是训练一个适合自己的分类参考数据集,另外就是对于一个样本多个时间采样的结果的分析等,下面一个一个来学习。

1.数据的过滤

在分析过程中发现用自己的数据跑出来许多序列只能注释到细菌界,后面不能细分,像这种要过滤掉,刚好发现官方提供了相关的教程和命令,于是直接执行得到结果。教程里面是过滤后保留至少到门的结果,刚好是符合我的需要的,于是参数也不动了。

  #过滤没注释到门的序列
  qiime taxa filter-table \
  --i-table table.qza \
  --i-taxonomy taxonomy.qza \
  --p-include p__ \
  --o-filtered-table table-with-phyla.qza

2.训练一个适合自己的分类参考数据集

对于一般的科研项目,扩增使用的多是V3V4通用引物341F和806R,但是不少项目使用的是单独V4的引物515F和806R,而且,就是相同位置的引物,还有简并多少的区别,以及覆盖度的多少。因此,如果不是和官方同样的引物,就有必要训练一个适合项目的参考数据集。下面开始我的步骤:

1)下载并导入参考序列

#greengenes_13_8 wget -c ftp://greengenes.microbio.me/greengenes_release/gg_13_5/gg_13_8_otus.tar.gz
unzip gg_13_8_otus.tar.gz#或者SILVAwget -c https://www.arb-silva.de/fileadmin/silva_databases/qiime/Silva_132_release.zip
unzip Silva_132_release.zip #这个数据更新及时,我决定用它试试#导入参考序列qiime tools import \
   --type 'FeatureData[Sequence]' \
   --input-path ../SILVA_132_QIIME_release/rep_set/rep_set_16S_only/99/silva_132_99_16S.fna \
   --output-path silva_132_99_16S.qza

<h1>导入物种分类信息</h1>

qiime tools import \
   --type 'FeatureData[Taxonomy]' \
   --input-format HeaderlessTSVTaxonomyFormat \
   --input-path ../SILVA_132_QIIME_release/taxonomy/16S_only/99/taxonomy_7_levels.txt  \
   --output-path ref-taxonomy.qza#提取参考序列,由于数据较大,这步耗时相当长。这里把截取长度设置为126bp,因为我qiime feature-classifier extract-reads   --i-sequences silva_132_99_16S.qza   --p-f-primer GTGYCAGCMGCCGCGGTAA   --p-r-primer GGACTACNVGGGTWTCTAAT --p-trunc-len 126   --p-min-length 100   --p-max-length 400   --o-reads ref-seqs.qza#训练Naive Bayes分类器nohup time qiime feature-classifier fit-classifier-naive-bayes \
   --i-reference-reads ref-seqs.qza \
   --i-reference-taxonomy ref-taxonomy.qza \
   --o-classifier classifier.qza &
 ```
过程相当耗时耗资源,但是对于一台一般的服务器来说不是问题,峰值内存使用在25G+。

<h2>3.通过比对过滤非细菌序列</h2>
这个主要是过滤宿主基因,应该是宏基因组测序中用的较多。
```bash
qiime quality-control exclude-seqs \
  --i-query-sequences query-seqs.qza \
  --i-reference-sequences reference-seqs.qza \
  --p-method blast \
  --p-perc-identity 0.97 \
  --p-perc-query-aligned 0.97 \
  --o-sequence-hits hits.qza \
  --o-sequence-misses misses.qza
qiime feature-table filter-features \
  --i-table query-table.qza \
  --m-metadata-file hits.qza \
  --o-filtered-table no-hits-filtered-table.qza \
  --p-exclude-ids




https://blog.sciencenet.cn/blog-623545-1161989.html

上一篇:qiime2-2019.1更新学习笔记
下一篇:aspera在mac和win下的使用命令整理
收藏 IP: 114.221.37.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

IP: 61.185.190.*   闂傚倷鐒﹂幃鍫曞磿閹惰棄纾绘繛鎴旀嚍閸ヮ剚鏅搁柨鐕傛嫹 | 闂備浇宕垫慨宥咁吋閸℃浼� 闂備浇宕垫慨宥咁吋閸℃浼� +1 [7]闂傚倷绀侀幖顐λ囬娑辨闁告稑锕ュ▍鐘绘煏閸繃澶勯柟顖樺劦閺屻劑鎮ら崒娑橆伓   2018-6-22 12:13
闂傚倷鐒﹀鎸庣濠婂牜鏁勯柛鈩冦仛缂傛岸鏌i姀鈶跺湱鈧艾顦甸弻娑樷攽閸℃浠鹃梺缁樼缚閸婃洟婀佸┑鐘诧工閸燁垶骞嗛崼銏″枑闁哄鐏濈痪褏绱掗崒娑樻诞濠碉紕鍏橀弫鍐╂媴鐞涒剝鏅繝鐢靛仦閸ㄥ爼骞愰幘顔肩;闁圭偓鏋煎Σ鍫ユ煙閸喖鏆曠紒銊ㄥ吹閳ь剚顔栭崳顕€宕滃☉銏犵閻庯綆鍣弫濠囨煕韫囨洖甯堕柡瀣у亾闂傚倷鑳舵灙缂佺粯鍨块幃銏ゎ敆閸屾侗娼熼梺璺ㄥ櫐閹凤拷
IP: 106.39.42.*   闂傚倷鐒﹂幃鍫曞磿閹惰棄纾绘繛鎴旀嚍閸ヮ剚鏅搁柨鐕傛嫹 | 闂備浇宕垫慨宥咁吋閸℃浼� 闂備浇宕垫慨宥咁吋閸℃浼� +1 [6]闂傚倷鑳剁划顖滃垝瀹€鍕垫晞闁告稑鐡ㄩ崑鈺呮煏婵炵偓娅嗛柛銈呯焸閺屻劑鎮ら崒娑橆伓   2018-6-22 10:08
闂傚倷娴囬妴鈧柛瀣尰閵囧嫰寮介妸褉妲堥梺浼欏瘜閸犳牠鍩ユ径鎰妞ゆ牗鐭竟鏇熺節瀵伴攱婢橀埀顒侇殜椤㈡牠寮撮姀鐘靛姦濡炪倖甯掗敃銉р偓姘炬嫹
IP: 106.38.115.*   闂傚倷鐒﹂幃鍫曞磿閹惰棄纾绘繛鎴旀嚍閸ヮ剚鏅搁柨鐕傛嫹 | 闂備浇宕垫慨宥咁吋閸℃浼� 闂備浇宕垫慨宥咁吋閸℃浼� +1 [5]闂傚倷绀侀幉锟犳嚌妤e喚鏁嬫い鎾卞灩绾惧鏌ㄩ悤鍌涘   2018-6-22 09:37
闂備礁鎼ˇ顖炴偋閸愵喖鐤鹃柣鎰閺佸﹪鏌熸潏楣冩闁稿骸绉归弻娑㈠即閵娿儲鐏撶紓鍌氱墕椤兘骞冪涵鍜佹Ч闂佹悶鍔岄幖顐㈠祫闂佸憡绋戦敃锕傘€呴弻銉︾厱婵犻潧妫楅鈺呮煟韫囨梻鍙€闁哄矉绻濆畷鎺楀Χ閸涱厾顔掓繝鐢靛仜閻楀﹪宕归崹顔炬殾闁靛鐓堝顏嗙磽娴f垝鍚柡浣割煼瀵宕堕浣规珳闂佸壊鍋侀崹濠氼敊鎼淬劍鈷戦柣鐔告緲濡插鏌熼崘鍙夋崳缂傚倹鎹囬幃娆擃敆閸屻倖绁梻渚€鈧偛鑻晶顖滅磼鐎n亷韬€规洜鍘ч埥澶愬箳閹存粌顥氶梻浣芥硶閸o箓骞忛敓锟�
闂傚倷鐒﹂幃鍫曞磿閹惰棄纾绘繛鎴旀嚍閸ヮ剚鏅搁柨鐕傛嫹  闂傚倷鐒︾€笛囧礃婵犳艾绠柨鐕傛嫹 闂傚倷绀侀幖顐も偓姘卞厴瀹曞綊宕樺ù瀣亖闂佺鎻梽鍕疾椤掑嫭鍊堕柣鎰綑閸斻倝鏌h箛鎿冩Ц闂囧鏌e▎灞戒壕闂佸憡鎸婚悷銉ョ幓閸ф唯闁宠桨鑳堕ˇ銊╂煟鎼粹剝璐″┑顖e幖鐓ら柨婵嗘閸欏繘鏌i悢鍛婄凡闁逞屽墲椤骞堥妸鈺佺倞闁冲搫鍟伴悞楣冩⒑闂堟稈搴烽梻鍕缁辩偤鍩€椤掑嫭鈷戦梻鍫熺⊕椤ユ粓鏌涙繝浣虹煓妞ゃ垺鐟╅崺鈧い鎺戝閸婄敻鏌i悢鍛婄凡闁哄棙娲樼换婵囩節閸愩劎浠稿┑鐐靛帶缁绘﹢宕洪敓鐘茬闂傚牊绋掑▍蹇撯攽閻樼粯娑ч柛濠傜秺瀹曠懓鈹戦崼锝呅¢梺璺ㄥ枔婵敻寮查鍕€堕柣鎰綑閸斻倝鏌h箛鎿冩Ц闂囧鏌e▎灞戒壕闂佸憡鎸诲畝绋跨暦濡ゅ懎纾兼繝濠傛噽閿涙粌鈹戦悙鍙夘棡閻㈩垳鍋涢埢鎾绘焼瀹ュ棛鍘甸梺鑲┣归悘姘辩矆閸儲鐓忛柛顐g☉婵″灝霉濠婂啯鍟炴繛鐓庣箻閸╋繝宕橀鐐靛幀闂備浇宕垫慨鎾敄閸曨垱鍊块柨鏃囧Г閸欏繘鏌涢妷銏℃珖闁活厼鐗婇妵鍕敇閻旈顑傜紓浣插亾濠㈣泛艌閺€浠嬫煃閵夈儱鏆遍柍褜鍓欑紞濠囧箖濡绶為柟閭﹀墲琚濇俊鐐€栭崹鐓庘枖閺囥垺鍋℃繝闈涱儐閻撴瑩鏌涢幇顓炵祷闁逞屽墲椤曆冪幓閸ф鏁嶉柣鎰綑閸撶敻姊洪柅鐐茶嫰婢ь垳绱掗崒姘毙х€规洟浜堕、姗€鎮╁▓鎸幮ラ梻浣筋嚙濞寸兘骞婇幘璇茬柈闁宠桨璁查崼顏堟煙鐎电ǹ校闁哥喎鎼湁闁挎繂娲﹀▍鏇熴亜閿斿灝宓嗛柟顔肩秺楠炲洭宕滄担绋跨厒婵犵數濮崑鎾淬亜韫囨挾澧曠紒鐙€鍣i弻锟犲炊閳轰絿鐐烘煕鐎n亞效闁哄矉缍佹俊鎼佸Ψ閵夘喕鐥繝纰夌磿閸嬫盯宕愰崹顔炬殾闁归偊鍏橀弸搴ㄧ叓閸ャ劍灏紓鍌涙崌濮婄粯鎷呮禒瀣懙闁汇埄鍨遍〃濠傜暦閻熸壋鍫柛鏇ㄥ弾濞村嫬顪冮妶鍡楃瑨闁挎洩濡囩划鍫熷緞婵炵偓顫嶉梺鐟扮仢閸燁偄顕i鈧弻宥堫檨闁告挻宀稿鏄忣槾缂侇噮鍘藉鍕箛椤掑偆妲遍梻浣虹《閸撴繈鏁嬮梺鎰佷簽閺佸寮婚悢鍛婂闁告劑鍔庨崝鐑芥⒑闁偛鑻晶顕€鏌涙繝鍐╁€愰柕鍡楁嚀椤﹀湱鈧鍠氭灙妤楊亙鍗冲畷鐔碱敃閵堝嫬鍤辨繝鐢靛仜椤曨厽鍒婇銏犵婵炴垶顭勮瀵板嫬鐣濋埀顒備焊閻㈠憡鍋eù锝呮憸閿涘秵銇勯幘瀛樸仢婵﹤顭峰畷鎺戔槈濞嗘垹鈻忛梻浣筋嚃閸ㄩ亶鎮у⿰鍫濈鐟滄棃寮婚妸褉鍋撻敐搴′喊婵¢箖鏀辩换娑氣偓娑欋缚閻﹥淇婇銏╁殶婵″弶鍔曢埞鎴﹀醇濮橆兛澹曢梺鑽ゅ枑濠㈡﹢寮抽弴鐔虹瘈濠电姴鍟悘鈺呮煙閼碱剙顣奸柟宄版嚇閹儳鐣濇繝鍐冄囨⒑閼姐倕校闁告枮鍛筏闁兼亽鍎查崕鐔哥節婵犲倻澧曠紒鐙呯秮閺岀喓鈧稒岣块惌瀣磼椤曞棛鐣甸柡灞剧☉椤繃顫戦弽銊︻唶缂傚倷鐒﹂崬濠氬箯閿燂拷
2018-6-22 09:491 濠电姴鐥夐弶搴撳亾濡ゅ懎违閻庯綆鍓氶~鏇熺箾閸℃ɑ灏柣鎰躬閺岋綁骞囬浣叉灆濠德ゅ皺缁垱绌辨繝鍥у璺侯儜缁辩敻鏌f惔銊︽锭闁活厼鍊垮顐㈩吋婢跺娅㈤梺璺ㄥ櫐閹凤拷 闂備浇宕垫慨宥咁吋閸℃浼� 闂備浇宕垫慨宥咁吋閸℃浼� +1 | 闂傚倷鐒﹂幃鍫曞磿閹惰棄纾绘繛鎴旀嚍閸ヮ剚鏅搁柨鐕傛嫹
IP: 114.243.229.*   闂傚倷鐒﹂幃鍫曞磿閹惰棄纾绘繛鎴旀嚍閸ヮ剚鏅搁柨鐕傛嫹 | 闂備浇宕垫慨宥咁吋閸℃浼� 闂備浇宕垫慨宥咁吋閸℃浼� +1 [4]闂傚倷绀侀幉锛勬暜濡ゅ懏鏅濋柕蹇嬪€曠紒鈺呮煥閻曞倹瀚�   2018-6-22 00:23
闂備礁鎼ˇ顐﹀疾濠婂牊鍋¢柕鍫濐槹閻撳倹绻濇繝鍌氼伀闁崇懓绉归弻宥夊煛娴e憡娈ㄧ紓浣介哺閻楃娀寮婚敓鐘查唶妞ゆ劑鍨归埛澶愭⒒閸屾鍫ュ疾閻樺樊鍤曢柛顭戝亜缁剁偛鈹戦悩鎻掝仼鐟滄澘鍊圭换婵嬪閿濆懐鍘梺娲诲弾閸犳氨鍒掗鐔风窞閻忕偞鍎抽崢鐟邦渻閵堝棙顥嗛柛瀣姍瀵櫕瀵肩€涙ḿ鍘遍梺闈涳紡閸愬啨鍎崇槐鎺楀焵椤掆偓閻f繈宕熼浣圭彨闂佽绻掗崑鐔煎磻閹惧墎涓嶉柟鐑樺焾閻斿棝鏌涢幘鑼跺墾鐟滅増甯掓闂佹悶鍎洪崜娆忣渻娴犲鍊堕柣鎰硾娴滃湱鐥崜褍甯堕柍钘夘樀楠炴ḿ澹曠€n亶妫熺紓鍌欒兌婵绮旈悷鎵殾闁靛⿵濡囩弧鈧梺鍛婃处閸撴盯寮抽悩缁樼厽閹兼番鍨兼竟姗€鏌i鈧妶绋款嚕閹间焦鏅搁柨鐕傛嫹
IP: 110.152.216.*   闂傚倷鐒﹂幃鍫曞磿閹惰棄纾绘繛鎴旀嚍閸ヮ剚鏅搁柨鐕傛嫹 | 闂備浇宕垫慨宥咁吋閸℃浼� 闂備浇宕垫慨宥咁吋閸℃浼� +1 [3]闂佽瀛╅鏍窗濮橆厽鍙忛柟缁㈠櫘閺佸棝鏌i弮鍌氬付婵☆偅锕㈤弻銊╂偆閸屾稑顏�   2018-6-21 21:31
"闂傚倸鍊风欢锟犲磻閸曨垁鍥敋閳ь剟寮荤仦瑙e牚闁割偅绻傞悵姗€姊洪崨濠勭畵閻庢凹鍙冮幃鐢稿Χ閸氥倗鎳撻オ浼村礃閳哄倸鍓电紓鍌氬€哥粔鎾敄婢舵劗宓侀柍褜鍓熼弻銈嗘叏閹邦兘鍋撳Δ鍛槬闁绘ḿ绮悡銉︾箾閹达絾鐝悗姘炬嫹"
IP: 202.113.11.*   闂傚倷鐒﹂幃鍫曞磿閹惰棄纾绘繛鎴旀嚍閸ヮ剚鏅搁柨鐕傛嫹 | 闂備浇宕垫慨宥咁吋閸℃浼� 闂備浇宕垫慨宥咁吋閸℃浼� +1 [2]闂傚倷绀侀幖顐λ囬銏犵鐎广儱顦介弫鍡樼節婵犲倻澧涢柛瀣ㄥ€濋弻銊╂偆閸屾稑顏�   2018-6-21 18:05
缂傚倸鍊烽悞锕傚箯濠靛洣绻嗛柛銉墮闁卞洭鏌ㄩ悤鍌涘•闂備胶鎳撻崥瀣箰閹跺壙澶愬箻鐠囪尙顔掓繝闈涘€搁幉锟犲磿瀹ュ鐓曢柡鍥ュ妼楠炴牠鏌i幘杈捐€块柡灞诲妼閳藉鎼归銏╀紦
婵犵數濞€濞佳囧磹閽樺)娑㈠礋椤栨氨锛熷┑顔矫ぐ澶愭倿婵犲洤绾ч柛顐g☉婵$晫绮幋鐐电闁瑰鍋為幆鍕瑰⿰鍛槐鐎殿噮鍋婇獮妯肩磼濡桨缃曢梻浣稿暱閹碱偊宕愰崷顓″С婵ǹ鍩栭悡鏇㈡煥濠靛棗鏆欏┑锛勫劋閹便劑鎮烽柇锔解枅婵犵鍓濋幐鎶藉极閹剧粯鏅搁柨鐕傛嫹
https://wapbaike.baidu.com/item/%E5%BA%B7%E7%BA%B3/80659
IP: 202.113.11.*   闂傚倷鐒﹂幃鍫曞磿閹惰棄纾绘繛鎴旀嚍閸ヮ剚鏅搁柨鐕傛嫹 | 闂備浇宕垫慨宥咁吋閸℃浼� 闂備浇宕垫慨宥咁吋閸℃浼� +1 [1]闂傚倷绀侀幖顐λ囬銏犵鐎广儱顦介弫鍡樼節婵犲倻澧涢柛瀣ㄥ€濋弻銊╂偆閸屾稑顏�   2018-6-21 18:02
闂傚倸鍊风欢锟犲磻閸曨垁鍥敋閳ь剟寮荤仦瑙e牚闁割偅绻傞悵姗€姊洪崨濠勭畵閻庢凹鍙冮幃鐢稿Χ閸氥倗鎳撻オ浼村礃閳哄倸鍓电紓鍌氬€哥粔鎾敄婢舵劗宓侀柍褜鍓熼弻銈嗘叏閹邦兘鍋撳Δ鍛槬闁绘ḿ绮悡銉︾箾閹达絾鐝悗姘炬嫹

1/1 | 闂傚倷娴囬鏍礈濮橆儵锝夊箳濡ゅ﹥鏅i梺璺ㄥ櫐閹凤拷:7 | 婵犵妲呴崑鎾跺緤妤e啯鍋嬮柣妯款嚙杩濋梺璺ㄥ櫐閹凤拷 | 婵犵數鍋為崹鍫曞箰閹间焦鏅濋柨婵嗘川閸楁岸鎮楀☉娅辨粍绂嶅⿰鍫熺叆闁绘洖鍊圭€氾拷 | 婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛鏇ㄥ幘閸楁岸鎮楀☉娅辨粍绂嶅⿰鍫熺叆闁绘洖鍊圭€氾拷 | 闂傚倷绀侀幖顐︽偋濠婂牆纾诲┑鐘叉搐杩濋梺璺ㄥ櫐閹凤拷 | 闂備浇宕垫慨鎾箹椤愶附鍋柛銉亹瑜版帗鏅搁柨鐕傛嫹

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-3-16 19:02

Powered by ScienceNet.cn

Copyright © 2007-2025 中国科学报社

返回顶部