||
构建进化树的时候,常需要批量下载序列,尤其是重现文献上进化树时。为此,利用python语言写了2个小程序,能够实现从NCBI的GenBank和Ensembl批量下载核酸序列和蛋白序列。
分为2个版本:一个能够从ncbi批量下载,另一个能够从ensembl批量下载。
小程序存贮在百度网盘:
链接:https://pan.baidu.com/s/1x8wGvbi14GjNm-nkBotL6A
提取码:gk1l
使用说明: 1. 将此exe文件放在任一文件夹中,双击后根据提示操作即可。
2. 序列号需要存储在txt文件中,每个序列号单独一行。
3. 每一行除序列号外,不要有的其它符号。
4. 如果从ncbi中下载,核酸序列号和蛋白序列号不能混合在一个txt文件中。
5. 如果从ensembl中下载,不区分核酸序列号和蛋白序列号,可以放在同一个txt文件中。
6. ensembl序列号和ncbi的序列号不能混合在同一个txt文件中。
注意事项:
1. 本程序仅适用于win10操作系统。
2. 结果以fasta格式形式存储在同一个文件夹的txt文件中,请根据提示查看。
致谢:
1. python 社区(https://www.python.org/)。
2. Biopython、colorama软件包的开发者、维护团队及资助者。
P.S. 如果有网友知道如何通过序列号判断蛋白和核酸序列,还望告知,以方便改进程序。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-20 07:58
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社