mashengwei的个人博客分享 http://blog.sciencenet.cn/u/mashengwei

博文

小麦族多组学数据网站——序列获取

已有 11895 次阅读 2018-5-2 08:29 |系统分类:科研笔记| 小麦, 基因组, 网站, 序列获取

小麦族多组学数据网站——序列获取

上周我们公布了我们刚刚上线的小麦族多组学数据网站(http://202.194.139.32/),近一周来已有437次访问。目前网站上线的功能不多,数据也不多,但是很多地方小细节还是我们独有的。在接下来的一段时间我们会一一介绍。未来我们也希望能够和更多的老师合作,能够让小麦组学数据更容易使用。同时也有很多小伙伴反应网站是英文的,后面有机会我们一定会推出中文版的,相信未来我们一定会有中国人自己的小麦族数据中心。

废话说了这么多,胖丫看不下去了,非得让我删去。胖丫说,漂亮话谁都会说,关键是要干出来,撸起袖子加油干才是正事。我哈哈一笑,附和着说:丫丫,你这话说的漂亮。胖丫稍微一愣,用右手中指往上推了推眼镜,转身插枪头去了。

好了,我们言归正传。自从中国春1.0基因组公布,blastn之后序列的调取有点不方便了。本来几秒钟搞定的事,现在要好几步才能搞定。所以能我们首先上线的就是序列获取功能,当然了经典的blast功能也同时在线了。点击下图中的get sequence就可以到达序列获取的页面(http://202.194.139.32/getfasta/)。

进来之后的页面如下:

首先说说支持哪些序列的调取。如下图所示,目前支持中国春1.0基因组序列、1.0基因和蛋白序列,野生二粒小麦的基因组序列、基因和蛋白序列,节节麦基因组序列、基因和蛋白序列,大麦基因组、基因和蛋白序列。除了这些,还有4个普通小麦(Cadenza, Claire, Paragon和Robigus)和一个四倍体材料(Kronos)。序列获取这一块后面会支持更多的内容,比如乌拉尔图的序列,重复序列,标记序列等。大家还需要什么样的数据还请告诉我们,暂时大家也可以提供自己的数据。

接下来我们举例说明。首先要说一说染色体序列的获取,染色体序列目前我们支持获取的区间序列长度不大于5Mb。这里要注意不同基因组间染色体编号的差异,中国春的染色体编号我们比较熟悉了,野生二粒和中国春是一致的,节节麦的七条染色体用1-7表示,大麦的7条染色体是数字后面加了H,比如1号染色体就是chr1H,对应中国春的第一部分同源群。比方说我想要获取中国春7A染色体上500Mb至501Mb的序列,则需要输入,chr7A:500000000-501000000。其中:和-都是英文状态下的输入。输入好之后需要选择数据库,因为我们想获取中国春的序列,所以就选择上图中的第一个(wheat genome 那个)。选好之后点击提交(Submit)即可。

对于基因和蛋白序列的获取,直接输入名字或ID就好。中国春基因的编号类似这个,TraesCS6A01G032200.1。其中Traes表示普通小麦,也即六倍体小麦;CS表示中国春,也即品种的名字;6A是染色体的名字;01G应该算是版本号;后面小数点之前的数字032200表示基因在染色体上的编号,这个编号一般是以10为单位变化,比如与这个基因挨着的两个基因是TraesCS6A01G032210.1,TraesCS6A01G032190.1;点后面的数字表示转录本的编号,如下图该基因有两个转化本,对应的编号是 .1和.2。另外还有中国春里还有一种基因编号里有LC两个字母,如 TraesCS6A01G039400LC.1,这里的LC是 low confidence的缩写,表示注释出的这个基因可信度比较低。这里的低是相对的说法,多数时候基因还是正确的。大家接触多了就会明白了。同样的对于其他基因组的基因编号也是类似的,大家应该可以明白的。

比方说我想要获取编号为TraesCS6A01G032200.1的基因序列和蛋白序列。如下图所以输入基因名字和选择相应的数据库即可。

蛋白序列

要特别强调一点,这里支持同时获取多条序列,每行一个基因名字或染色体区间即可。今天的序列获取就介绍到这里,下周我们会继续介绍如何进行blast。写完了才发现,貌似先介绍blast再介绍序列获取比较好。

最后还要说两件我们很久没说的事情,一件事关于我们我们举办摄影比赛的事情,大家可以通过邮箱13148474750@163.com投稿。另外一件事是,我们前面成立了一个小麦教师群。欢迎从事小麦研究和育种的老师加入,也欢迎博后加入。长按下方的二维码添加我们的主编王萌,确认身份之后会拉进群。




https://blog.sciencenet.cn/blog-1094241-1111899.html

上一篇:2018年第16周小麦文献推荐(4.29)
下一篇:the plant journal:一个新的与大麦耐旱相关的microRNA
收藏 IP: 58.213.93.*| 热度|

1 赵旭

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 01:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部