zbzhang的个人博客分享 http://blog.sciencenet.cn/u/zbzhang

博文

小程序:用序列号实现从NCBI或Ensembl 批量下载序列

已有 6023 次阅读 2021-11-9 09:18 |个人分类:生物信息|系统分类:科研笔记

    构建进化树的时候,常需要批量下载序列,尤其是重现文献上进化树时。为此,利用python语言写了2个小程序,能够实现从NCBI的GenBank和Ensembl批量下载核酸序列和蛋白序列。

     分为2个版本:一个能够从ncbi批量下载,另一个能够从ensembl批量下载。

           

            小程序存贮在百度网盘:               

                      链接:https://pan.baidu.com/s/1x8wGvbi14GjNm-nkBotL6A 

                      提取码:gk1l

使用说明: 1. 将此exe文件放在任一文件夹中,双击后根据提示操作即可。

                  2. 序列号需要存储在txt文件中,每个序列号单独一行。

                  3. 每一行除序列号外,不要有的其它符号。

                  4. 如果从ncbi中下载,核酸序列号和蛋白序列号不能混合在一个txt文件中。

                  5. 如果从ensembl中下载,不区分核酸序列号和蛋白序列号,可以放在同一个txt文件中。

                  6. ensembl序列号和ncbi的序列号不能混合在同一个txt文件中。

               

     

注意事项:

                1. 本程序仅适用于win10操作系统。

                2. 结果以fasta格式形式存储在同一个文件夹的txt文件中,请根据提示查看。

致谢:

        1. python 社区(https://www.python.org/)。

        2. Biopython、colorama软件包的开发者、维护团队及资助者。


P.S. 如果有网友知道如何通过序列号判断蛋白和核酸序列,还望告知,以方便改进程序。




https://blog.sciencenet.cn/blog-3446543-1311603.html

上一篇:生物信息小软件:本地BLAST
下一篇:本地blast结果一键提取比对序列信息
收藏 IP: 218.26.34.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (4 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-1 05:35

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部