mashengwei的个人博客分享 http://blog.sciencenet.cn/u/mashengwei

博文

如何搭建一个网页版的BLAST服务器

已有 6316 次阅读 2017-12-20 16:57 |系统分类:科研笔记| 小麦, 在线, blast, 本地

如何搭建一个网页版的BLAST服务器

胖丫今天跟我说:“师兄,再来给我调调网络呗?公共BLAST服务器太慢了,半天刷新不出来!”我说:“我们这是百兆宽带到桌面,刷新慢不是网络的问题,是你离人家的服务器太远了!L”胖丫一脸委屈的说:“要不我去人家有服务器的实验室申请个博士读读?”“……”

不知道大家平时用公共BLAST服务器时有没有遇到刷新慢的问题?或者想比对一些公共数据库中没有的个性化数据?今天,我们这里写一个简单教程,来教大家搭建一个网页版(图形界面)BLAST服务器,用来解决上述问题(当然,也可以解决胖丫读博士的问题)。在搭建BLAST服务器之前,你应该先准备一个Ubuntu(Linux)系统。至于Ubuntu系统的安装,网上有很多教程,大家可以自行搜索,比如https://jingyan.baidu.com/article/3c48dd348bc005e10be358eb.html。当然,你也可以将Ubuntu系统安装到自己电脑的虚拟机里。如果只是用来做BLAST服务器的话,对电脑硬件的要求着实不高,平时实验室用的台式机就好。

系统安装好之后,我们就可以开始安装BLAST服务器了,这类软件有wwwblast、viroBLAST和Sequenceserver(http://www.sequenceserver.com)。前面我们我们已经介绍过viroBLAST的安装及使用,今天介绍Sequenceserver。Sequenceserver相当于NCBI-BLAST(ncbi-blast+)的前端图形交互界面,是用Ruby语言写的,因此在安装之前应该先安装Ruby、Ruby编译环境(ruby-dev)以及Rbuy的软件包管理系统(rubygems-integration)。大家可以在bash里面输入下面的命令(命令输入完毕后要按回车执行 #开头的行是命令说明):

  1. #安装依赖软件包

  2. sudo apt install ncbi-blast+ ruby ruby-dev rubygems-integration

  3. #安装sequenceserver软件

  4. sudo gem install sequenceserver

这样软件就安装好了!接下来我们需要准备序列文件,也就是你要检索的数据库。一般来说,我们可以从公共的数据库比如EnsemblPlants(http://plants.ensembl.org/index.html)、NCBI、EBI等,下载fasta格式(压缩后为fa.gz格式)的文件,这里我们以水稻的第10号染色体为例,简单演示一下数据库的准备:

  1. #利用wget命令从EnsemblPlants网站下载水稻10号染色体序列

  2. wget -c ftp://ftp.ensemblgenomes.org/pub/plants/release-32/fasta/oryza_sativa/dna/Oryza_sativa.IRGSP-1.0.dna.chromosome.10.fa.gz

  3. #解压缩,就是将fa.gz文件加压为fa文件

  4. gunzip Oryza_sativa.IRGSP-1.0.dna.chromosome.10.fa.gz

  5. #利用sequenceserver格式化数据库, “./”代表序列文件存储在当前目录,要注意命令中的空格

  6. sequenceserver -d ./-m

输入 sequenceserver-d./-m命令后,屏幕会出现类似下面的信息(汉字是操作说明)

数据库准备完毕之后就可以运行Sequenceserver了,命令也非常简单:

  1. sequenceserver -d ./#运行sequenceserver,比格式化数据库少了一个 –m 参数

最后一步就是用网页浏览器,比如chrome、firefox等打开网页版服务器了:

在浏览器地址栏里输入 127.0.0.1:4567 #本机访问本机可以用这个地址,如果局域网内的其它机器访问的话需要先查出服务器的IP地址,命令为 ifconfig,然后将127.0.0.1替换为相应的IP地址。下图中eth0的IP地址为 192.168.0.104,在浏览器中输入 192.168.0.104:4567 即可(lo为回环网卡,请忽略:))。

接下来就和普通的NCBI-blast类似了。

有关blast话题的我们说过不少,还请参见以前的一些推送。有问题可以留言和进群讨论。

SRA数据的下载以及在线blast--或许与你了解的不一样

在NCBI上blast野生二粒小麦基因组序列

get blast新技能

加速蛋白比对

节节麦基因组数据使用和下载


欢迎关注“小麦研究联盟,了解小麦新进展




https://blog.sciencenet.cn/blog-1094241-1090678.html

上一篇:ATAC-seq这么火?
下一篇:利用近等基因系进行RNA-Seq定位目标QTL——论材料的重要性
收藏 IP: 58.213.93.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-13 09:23

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部