mashengwei的个人博客分享 http://blog.sciencenet.cn/u/mashengwei

博文

小麦族多组学数据网站——设计基因组特异引物

已有 11957 次阅读 2018-5-4 12:06 |系统分类:科研笔记| 小麦, 引物设计, 特异引物检测

小麦族多组学数据网站——设计基因组特异引物

昨天我们介绍了序列调取,今天我来说一说设计基因组特异引物。不过在这之前呢,还是简单的说一说我们的blast。

如下图所示可以进入,也可以直接输入网址进入http://202.194.139.32/blast/viroblast.php。这个网页的blast不是我们从头写的前端代码,而是来自全球最大的同性交友网站GitHub(https://github.com/MullinsLab/ViroblastStandalone)。实际上IWGSC也是借鉴了这个。这里有很多公开的源代码,是块学习的风水宝地。

关于blast要说的一点是:可以同时提交多条fasta格式的序列。以前我们也简单的说过fasta格式,其实就是如下图这样提交序列就可以。

另外一点要说的是blast结果的展示形式。我们常见的是是类似NCBI那种图形化的界面,实际上blast结果还支持其他形式的格式。我们有时候要成千上万条序列进行blast,同时还要对结果进行批量筛选。此时选择tabular格式就会很方便。下图中的参数大家可以多试试,学会了可以花式做blast。

关于blast的数据库和昨天获取序列的数据库是一致的。

第二部分我们要说一说设计引物

普通小麦是异源六倍体,而且重复序列居多,设计出特异好用的PCR引物就比较费时费力了。关于PCR今天我们介绍两款在线的网站,第一个是PrimerServer,可以按照下图展示的方式进入,也可以输入这个http://202.194.139.32/PrimerServer/。当然这个也是来自GitHub,相关的文章已经在bioRxiv预发表。引物设计部分还是使用的primer3,而使用blast进行引物特异性检测,进而筛选特异性引物。另外一个网站是BatchPrimer3(http://batchprimer3.bioinformatics.ucdavis.edu/cgi-bin/batchprimer3/batchprimer3.cgi),从域名上我们也知道来自UC Davis,这个网页版的接口是Frank M You写的,相关的文章已经于2008年发表在BMC Bioinformatics上。原本我们也可以放到我们网站上,但是不知道啥原因特别慢。所以我们暂时加了链接到UC Davis。这个网站可以设计多种类型的引物,有能力的小伙伴先学习使用,后面我们有机会再介绍,关于引物设计这一块,欢迎有经验的小伙伴给我们传授经验。插句题外话,很多时候,遇到一个问题,一定要养成首先查资料的习惯。很多时候你碰到的问题别人也会碰到,说不定有人就会将解决方法分享出来。这也许就是站在巨人的肩膀上吧。人类社会的发展离不开一代又一代的物质和文化(科学、技术?)的积累。

说的有点远了,我们继续回来介绍如何设计特异的PCR引物。还是要回到PrimerServer(http://202.194.139.32/PrimerServer/)。这个工具和我们常用的引物设计工具差异有点大。我也是仔细研究了使用说明才搞明白。建议可以点击下图所示的问号,了解具体的用法。

我们要设计引物,一首先得有序列。这里呢需要你指定序列在基因组的位置或者基因上的那一段,当然也可以自定义。下面我们分别来举例说明。

假设中国春基因组上在染色体1A上的这一个区间chr1A:61355084..61355117有一个SSR,我们想要特异引物来检测它。

如下图,这里需要输入3个数据即染色体名字,SSR在染色体上的位置,以及SSR的长度。这里SSR区间可以换成任意其他你想设计引物检测的目标区间。这里也可以一次设计多个目标区间的引物,另起一行输入3个数据即可。

上图还要注意右侧的设置,其中Region Type有三种类型,今天这个例子需要选择Target Region,这里强调的是PCR产物必须包括这段区间。如果你想要在在某个区间内设计引物,这里设计出的引物是随机分布在区间里的,这里强调的是引物只能指定的区间里设计。而For 3' End 则是指定引物的3'末端。另外扩增产物的大小也需要设置成合适的大小。这里因为是检测SSR,不宜过大。还要注意选择上方的数据库,如下图,这里选择中国春。

接下里需要设置引物设计的其他参数,如下图。这里和普通的基于primer3设计引物的参数是一致的,不再详细说明。一般默认就好,如果设计不出来引物,可以试着调整下。

在下面就需要设置blast以及筛选特异引物的参数,如下图。注意下图中的蓝色圆点,如果你要筛选特异的引物就选择Yes,否则就选择No。

最后一步是选择blast的数据库。这里选择中国春。选择之后就可以提交了。

提交之后,是引物的多少,时间不会太久。如下图所示,这里一共设计出82对引物(我们刚才提交了2个位点),需要对这82blast基因组序列,以便筛选出特异的引物。

首先看看下图展示的结果,图中顶部列出了目标位点的信息,这里一共设计出20对特异的引物。接下来就是一个示意图,红框圈出了目标区间,下面红色字体就是特异的引物。

下面这个就展示了引物1的详细信息。因为我们设计的是特异引物,所以底部的Possible Amplicons只有一个位点。

上图中注意有一个指向右边的手指,点开之后就是一张PCR产物在琼脂糖胶上的示意图,如下图。

拉到页面底部,就可以下载引物信息了,如下图。

下载文件的格式如下图所示。这里可以看到,我们刚才提交的第二位点并没有设计出特异的引物。

这样我们就可以合成引物了。其实根据基因设计引物和上面也是一样的,只不过需要将染色体的名字换成基因的名字。对应的区间也需要换成你想检测的区间。这里也支持自己提交序列,则需要输入你提交的序列的名字,以及开始位置和长度。

最后再强调一点,有时候设计出的特异引物的3'端只有一个碱基差异,可能不足以区分同源序列,可以考虑隔2-3个碱基引入一个错配,引入错配会导致扩增效率降低,可以适当提高循环数。

工具已经介绍给大家了,至于效果如何就要看大家自己的熟悉程度了。刀还是那把刀,有的人可以拿来宰牛,有的人连鸡怕都搞不定。今天先介绍到这里吧,后面根据反馈再介绍。

wheatomics2.jpg



https://blog.sciencenet.cn/blog-1094241-1112287.html

上一篇:the plant journal:一个新的与大麦耐旱相关的microRNA
下一篇:2018年第17周小麦文献汇总(5.6)
收藏 IP: 58.213.93.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 03:36

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部