李雷廷的个人博客分享 http://blog.sciencenet.cn/u/llt001

博文

上传测序数据到NCBI SRA数据库

已有 30388 次阅读 2015-7-25 13:59 |系统分类:科研笔记

目前,测序类的论文,一般需要将原始测序reads数据上传到某个公开的数据库,然后在文章末尾标明数据存储位置和登录号。NCBI的SRA (Sequence Read Archive) 数据库(http://www.ncbi.nlm.nih.gov/sra/) 是最常用的存储测序数据的数据库。然而要上传自己的数据到 NCBI SRA 对很多人而言,并不是一件容易的事。

要学会怎么上传数据到NCBI SRA,最直接的方式就是仔细阅读NCBI给的说明文档。这个链接(http://www.ncbi.nlm.nih.gov/books/NBK47529/)的文档给出了详细步骤。仔细阅读,按照上面的步骤,结合具体操作时的网页上各处的说明,一般都可以顺利完成任务。

现实是,许多人遇到的主要困难是:不看说明文档或说明文档看不懂;测序数据相关的一些概念不懂,导致不知道该怎样填表格,比如不明白SE和PE的区别,insert size和read length分别是什么意思,MD5的意思,以及怎样获得一个文件的MD5值。

一般上传数据到NCBI SRA的过程需要6步:

  1. Create a BioProject for this research

  2. Create a BioSample submission for your biological sample(s)

  3. Gather Sequence Data Files

  4. Enter Metadata on SRA website

    1. Create SRA submission

    2. Create Experiment(s) and link to BioProject and BioSample

    3. Create Run(s)

  5. Transfer Data files to SRA

  6. Update Submission with PubMed links, Release Date, or Metadata Changes

需要注意的一点是,上传的过程中很多地方一旦保存或提交就不可以修改,尤其是各处的Alias。但是,可以联系NCBI的工作人员修改内容。NCBI的工作效率是很高的,一般不超过48小时,就可以得到确认,并拿到登录号。



https://blog.sciencenet.cn/blog-656335-908140.html

上一篇:BLAST软件比对结果格式的转换
下一篇:一款强大的MacBook改键软件Karabiner
收藏 IP: 218.2.227.*| 热度|

1 bing6884

该博文允许注册用户评论 请点击登录 评论 (4 个评论)

数据加载中...
扫一扫,分享此博文

全部作者的精选博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 14:36

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部