||
胖丫今天跟我说:“师兄,再来给我调调网络呗?公共BLAST服务器太慢了,半天刷新不出来!”我说:“我们这是百兆宽带到桌面,刷新慢不是网络的问题,是你离人家的服务器太远了!L”胖丫一脸委屈的说:“要不我去人家有服务器的实验室申请个博士读读?”“……”
不知道大家平时用公共BLAST服务器时有没有遇到刷新慢的问题?或者想比对一些公共数据库中没有的个性化数据?今天,我们这里写一个简单教程,来教大家搭建一个网页版(图形界面)BLAST服务器,用来解决上述问题(当然,也可以解决胖丫读博士的问题)。在搭建BLAST服务器之前,你应该先准备一个Ubuntu(Linux)系统。至于Ubuntu系统的安装,网上有很多教程,大家可以自行搜索,比如https://jingyan.baidu.com/article/3c48dd348bc005e10be358eb.html。当然,你也可以将Ubuntu系统安装到自己电脑的虚拟机里。如果只是用来做BLAST服务器的话,对电脑硬件的要求着实不高,平时实验室用的台式机就好。
系统安装好之后,我们就可以开始安装BLAST服务器了,这类软件有wwwblast、viroBLAST和Sequenceserver(http://www.sequenceserver.com)。前面我们我们已经介绍过viroBLAST的安装及使用,今天介绍Sequenceserver。Sequenceserver相当于NCBI-BLAST(ncbi-blast+)的前端图形交互界面,是用Ruby语言写的,因此在安装之前应该先安装Ruby、Ruby编译环境(ruby-dev)以及Rbuy的软件包管理系统(rubygems-integration)。大家可以在bash里面输入下面的命令(命令输入完毕后要按回车执行 #开头的行是命令说明):
#安装依赖软件包
sudo apt install ncbi-blast+ ruby ruby-dev rubygems-integration
#安装sequenceserver软件
sudo gem install sequenceserver
这样软件就安装好了!接下来我们需要准备序列文件,也就是你要检索的数据库。一般来说,我们可以从公共的数据库比如EnsemblPlants(http://plants.ensembl.org/index.html)、NCBI、EBI等,下载fasta格式(压缩后为fa.gz格式)的文件,这里我们以水稻的第10号染色体为例,简单演示一下数据库的准备:
#利用wget命令从EnsemblPlants网站下载水稻10号染色体序列
wget -c ftp://ftp.ensemblgenomes.org/pub/plants/release-32/fasta/oryza_sativa/dna/Oryza_sativa.IRGSP-1.0.dna.chromosome.10.fa.gz
#解压缩,就是将fa.gz文件加压为fa文件
gunzip Oryza_sativa.IRGSP-1.0.dna.chromosome.10.fa.gz
#利用sequenceserver格式化数据库, “./”代表序列文件存储在当前目录,要注意命令中的空格
sequenceserver -d ./-m
输入 sequenceserver-d./-m
命令后,屏幕会出现类似下面的信息(汉字是操作说明)
数据库准备完毕之后就可以运行Sequenceserver了,命令也非常简单:
sequenceserver -d ./#运行sequenceserver,比格式化数据库少了一个 –m 参数
最后一步就是用网页浏览器,比如chrome、firefox等打开网页版服务器了:
在浏览器地址栏里输入 127.0.0.1:4567
#本机访问本机可以用这个地址,如果局域网内的其它机器访问的话需要先查出服务器的IP地址,命令为 ifconfig
,然后将127.0.0.1替换为相应的IP地址。下图中eth0的IP地址为 192.168.0.104
,在浏览器中输入 192.168.0.104:4567
即可(lo为回环网卡,请忽略:))。
接下来就和普通的NCBI-blast类似了。
有关blast话题的我们说过不少,还请参见以前的一些推送。有问题可以留言和进群讨论。
欢迎关注“小麦研究联盟”,了解小麦新进展
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-26 23:12
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社