植物分子育种分享 http://blog.sciencenet.cn/u/bioysy 欢迎对分子育种有兴趣的朋友们!

博文

520个水稻品种的全基因组数据

已有 5980 次阅读 2010-11-9 20:33 |个人分类:关联作图|系统分类:科研笔记

   数据来源:Huang, X., X. Wei, et al. "Genome-wide association studies of 14 agronomic traits in rice landraces." Nat Genet 42(11): 961-967.(http://www.nature.com/ng/journal/v42/n11/abs/ng.695.html?lang=en)

   GenBANK序列号:ERP000106,ERP000235,ERP000236.这个序列号是NCBI上SRA(Sequence Read Archive)数据库的号(也就是在NCBI网站search时要在下拉拦里选择SRA).在每个序列号(比如ERP00235下有520个Items ).每个items表示一个水稻品种的序列(我的理解),
  如在这个items下Items的ERX003153 ,其中有这项

Sample: Oryza sativa China landrace HP23 (ERS006234),这应该是描述材料的项,其中的关键词是HP23,HP23是什么?在文章的附件中,在这里

landrace

  品种为:Baizhandao

      也就是说在ERS003153这个号下面是Baizhandao的高通量测序的全序列.点击进入ERX003153,当然出来的不是序列(如果这个号是一般的GenBANK好到这里应该有序列出来了).点击RUN底下的ERR009937,会有序列出来,当然出来的不是一个序列,是多个序列.这里的每个序列为高通量测序的一个read,每个read都很短,全序列,要靠软件,把所有这些read拼接起来.当然这可能也不是一般的计算机能干的事情.

依次进入每个items就是每个品种的,全基因组序列

      现在我比较关心一个问题,能不能用一段序列来blast这个数据库,这样我可能发现一个基因的多个等位基因,答案是肯定的,不过得在这来blasthttp://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE=Nucleotides&PROGRAM=blastn&BLAST_SPEC=TraceArchive&BLAST_PROGRAMS=megaBlast&PAGE_TYPE=BlastSearch当然得选择特定的数据库.

 

     这个号下存的应该是高通量测序的原始结果,对高通量测序,我只有一知半解,但不用去管它背后复杂的机理,我可能更关心最后的结果.在这个数据库的基础上,应该还会有比较多的二级数据库,二级数据库可能更好用些,会把这些read直接定位到参考基因组上



https://blog.sciencenet.cn/blog-479743-382076.html

上一篇:用高通量测序的方法鉴定转座子插入位点
下一篇:用多个RIL群体进行QTL作图
收藏 IP: .*| 热度|

0

发表评论 评论 (3 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 00:52

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部