|
目前,测序类的论文,一般需要将原始测序reads数据上传到某个公开的数据库,然后在文章末尾标明数据存储位置和登录号。NCBI的SRA (Sequence Read Archive) 数据库(http://www.ncbi.nlm.nih.gov/sra/) 是最常用的存储测序数据的数据库。然而要上传自己的数据到 NCBI SRA 对很多人而言,并不是一件容易的事。
要学会怎么上传数据到NCBI SRA,最直接的方式就是仔细阅读NCBI给的说明文档。这个链接(http://www.ncbi.nlm.nih.gov/books/NBK47529/)的文档给出了详细步骤。仔细阅读,按照上面的步骤,结合具体操作时的网页上各处的说明,一般都可以顺利完成任务。
现实是,许多人遇到的主要困难是:不看说明文档或说明文档看不懂;测序数据相关的一些概念不懂,导致不知道该怎样填表格,比如不明白SE和PE的区别,insert size和read length分别是什么意思,MD5的意思,以及怎样获得一个文件的MD5值。
一般上传数据到NCBI SRA的过程需要6步:
Create a BioProject for this research
Create a BioSample submission for your biological sample(s)
Gather Sequence Data Files
Enter Metadata on SRA website
Create SRA submission
Create Experiment(s) and link to BioProject and BioSample
Create Run(s)
Transfer Data files to SRA
Update Submission with PubMed links, Release Date, or Metadata Changes
需要注意的一点是,上传的过程中很多地方一旦保存或提交就不可以修改,尤其是各处的Alias。但是,可以联系NCBI的工作人员修改内容。NCBI的工作效率是很高的,一般不超过48小时,就可以得到确认,并拿到登录号。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-18 18:13
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社