||
以下信息都是基于个人最近一年的经验。GEO网站可能会更新,具体信息可以登录GEO官网查看。
上传数据官网:https://www.ncbi.nlm.nih.gov/geo/info/submission.html
1 注册账号
https://www.ncbi.nlm.nih.gov/account/register/?back_url=/geo/submitter/
2 文件准备:上传的文件包含三部分(一个Excel表格,处理的数据文件,原始数据)
详情请根据以下网站https://www.ncbi.nlm.nih.gov/geo/info/seq.html
第一部分是一个Excel表格(a metadata spreadsheet)里面有本次课题的基本信息,所有文件信息。按要求填好。metadata spreadsheet的模板可以从以下链接下载:https://www.ncbi.nlm.nih.gov/geo/info/examples/seq_template_v2.1.xls
第二个部分是processed data files. 包含完整的表达谱(行基因,列样本,值可以是标准化后的也可以是原始的read count),peak信息文件(bed, txt),可视化文件(bigwig, WIG, bedGraph)等. 我一般会准备一个表达谱(RNA-seq)或者bigwig和peak文件(ChIP-Seq)
第三部分是原始数据,对于NGS数据而言就是原始的fastq文件。但是这里GEO强烈建议上传压缩的文件。我一般都是压缩为.gz文件
将准备好的三部分文件全部放到以你账号名相同的文件夹中。例如你的账号名为“zhangsan”,你就需要创建一个文件夹名字为“zhangsan”, 然后将所有文件放到这个文件夹中。
3 上传文件(这里仅以FTP为例)
https://www.ncbi.nlm.nih.gov/geo/info/submissionftp.html#creds
我用FileZilla登录GEO (host, ftp-private.ncbi.nlm.nih.gov; username, geo; password, ******)。具体账号信息网页上会有。
登录上GEO后直接将上面的文件拖拽到GEO,如下图所示
4 通知GEO你已经上传完文件。
https://submit.ncbi.nlm.nih.gov/geo/submission/
我每次都是通过两种方式通知GEO。第一种方式是通过以上链接,第二种方式是通过email (geo@ncbi.nlm.nih.gov).
Email 内容如下: