|
命令:
cat taxid.list | taxonkit lineage | taxonkit reformat -f "{k}\t{p}\t{c}\t{o}\t{f}\t{g}\t{s}" -F -P | csvtk cut -I -t -f -2 | csvtk add-header -t -n taxid,kindom,phylum,class,order,family,genus,species > taxon.tsv |
解释:
taxid.list taxid文件,每行一个taxid |
taxonkit lineage | taxonkit reformat -f "{k}\t{p}\t{c}\t{o}\t{f}\t{g}\t{s}" -F -P | 解释: -f "{k}\t{p}\t{c}\t{o}\t{f}\t{g}\t{s}" 格式,也可在最后增加strain "{k}\t{p}\t{c}\t{o}\t{f}\t{g}\t{s}\t{t}" ----------------------------------------------------- -F 用更高等级的血统信息填充缺失的等级 例如:k__Bacteria p__unclassified Bacteria phylum c__unclassified Bacteria class ----------------------------------------------------- -P 使用前缀(k__,p__,...) |
csvtk cut -I -t -f -2 | 解释: -I(大写i) 忽略非法行(有时没有分类结果,会报错终止。该参数可以防止报错终止) -t tab分割 -f -2 只剔除第2列,其他列保留(如果是2,则表示只提取第2列。-表示剔除。) |
csvtk add-header -t -n taxid,kindom,phylum,class,order,family,genus,species 解释: -t tab分割 -n 增加的列名,并且是CSV格式。(taxid,kindom界,phylum门,class纲,order目,family科,genus属,species种,strain株) |
【参考】
1. shenwei356 (Wei Shen) (github.com)(https://github.com/shenwei356)
作者:Wei Shen 沈伟(生信专家),已开发多个爆款生物信息学软件,并在业界被广泛使用。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-27 20:20
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社