|||
在推断进化树的过程中,我们有时候希望phylip格式的文件能够将序列名称完整保留下来。这里就需要用relaxed phylip格式。
不过,通常情况下,如果序列名超过10字符,ClustalX和MUSCLE等软件给出的phylip文件会将名称截取到十个字符,也就是遵循传统的PHYLIP格式。
为了将比对好的FASTA文件直接转换为 relaxed phylip格式的文件, 这里提供了R的源代码。供有兴趣的同仁参考。
请参考最新版本的 phylotools 程序包
library(devtools) install_github("helixcn/phylotools") library(phylotools) dat <- read.fasta("aligned_fasta.fasta") dat2phylip(dat, outfile = "out.phy")
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-27 07:12
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社