|||
如何用Batch Entrez从Genbank批量下载序列
熊荣川
六盘水师范学院生物信息学实验室
http://blog.sciencenet.cn/u/Bearjazz
学习常常是从模仿开始的。从事系统发育或是生物信息学研究工作的的常常需要通过阅读别人的文章来学习一些经典的分析方法。然后我们可能都有一个共同的体会,文献读几百遍比不上用原文的数据,按照其方法一步一步的进行模仿分析,将自己得到的结果和文章的结果进行比较之后才会豁然开朗。
好在,通常文章都会有个表格列示了分析所用到的序列在Genbank中的索取号。我们只要全部下载到本地计算机就可以进行模拟分析了。然而问题来了,一条一条的下载毕竟是个苦差事。有没有什么简便的方法能够一次性把该表格中的序列全部下载下载下来呢?
呵呵,当然,这就是NCBI提供的工具“Batch Entrez”
Batch Entrez网址:http://www.ncbi.nlm.nih.gov/sites/batchentrez
用这个工具,要求你有一个文件,里面是一个列表,可以是Accession Number,Gi Number,或是NCBI里其它数据库的各种标识符。
文件的格式看例子:Bear.txt
下面我们就来逐步图解这个过程。
为了图文并茂请下载pdf文件观看
首先当然是在你的文献中,找到这个列示有所有序列Genbank索取号的表格
如下图
第三列正是我所需要的信息,这样,我们将这一列单独复制到记事本中,保存为文件bear.txt
打开,Batch Entrez网址:http://www.ncbi.nlm.nih.gov/sites/batchentrez
在有“浏览”字样的地方上传bear.txt, 点击Retrieve开始搜索。正常情况下,会出现下面的界面
点击“Retrieve records for 28 UID(s)”进入搜索结果界面
因为我们需要全部的序列,直接下载全部序列。
就这么简单,祝您科研愉快!
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-6-5 16:42
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社