|||
【图解】一次性下载已知线粒体基因组中13个蛋白质编码基因序列
熊荣川
在系统发育的相关研究中,常常会使用线粒体基因组序列。使用其中13个蛋白质编码基因构建系统发育树几乎已经成为线粒体基因组研究的惯用手段。那么在已经公布的线粒体基因组中如何又快又准确的下载到13个蛋白质编码基因呢?下面是图解详细的操作步骤:
由于排版问题,请下载PDF格式观看
首先打开
首先打开NCBI首页(http://www.ncbi.nlm.nih.gov/)
· 然后在search下来菜单中选择“Nucleotide”,并在其搜索栏中输入序列号“AP011544”。进入结果页面
在结果页面的左上角有“send”链接,点击之后,选择“coding sequences”
在文件格式中选择“FASTA Nucleotide”,则下载的是核苷酸序列
如果选择“FASTA Protein”,则下载的是氨基酸序列
一般都保存为文本格式,使用记事本打开之后另存为fasta格式即可。另外,保存的文件,每条序列的名字太长,使用相关软件(如mega4.0)打开时,序列存在一定的问题,很多名字部分的字母都被读成了序列去了,需要在文本状态下对相应的序列名称做适当的修改,这个可以根据研究的需要,再次不作赘述。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-19 21:54
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社