Chen Lab @ HZAU分享 http://blog.sciencenet.cn/u/chenzhenxia119

博文

【生信技能】SRA Database的数据下载

已有 4538 次阅读 2018-7-17 17:17 |个人分类:学习经验|系统分类:科研笔记

作者:涂懿璇

首先发表于本实验室微信公众号:EvoDevo好好玩


大家好,我是佩奇。


在生物信息学课上,陈老师给大家介绍了各种常用的数据库,今天我就给大家介绍一下SRA数据库。


NCBI的SRA数据库是存储高通量数据的主要数据库,一般会将这些数据传到SRA数据库里。SRA以实验为储存单位,包括了实验项目、实验设计、样本信息以及测序信息和数据等。


SRA的四个层级

(其中字母开头代表数据来源,S、E、D分别代表SRA、EBI、DDBJ) 
1.Study——前缀SRP、ERP、DRP 
2.Sample——前缀SRS、ERS、DRS 
3.Experiment——前缀SRX、ERX、DRX 
4.Runs(存储的序列)——前缀SRR、ERR、DRR

SRA的基本用法

1.用文章提供的四个层级中的number直接到NCBI的SRA中搜索,如SRP063027,蓝头濑鱼的转录组研究,这些items包含的是实验SRX,或者直接用Biosample搜索物种信息。 

点进去看,有实验设计、提交单位、以及样品信息 

想要更方便的选择下载想要的数据或全部数据,可以返回上一个界面点击send results to selector 

选择自己想要的序号,点击Accession List 得到一个包含序列号的文本文件 

2.用XShell下载和好sratoolkit


3.用./prefetch 下载数据

prefetch 可以自动生成一个ncbi/public/sra的文件夹,所有从SRA上下载的数据都会存储在sra下,非常方便,而之前我经常使用的wget,虽然同样可以下载,但是下载的文件常常不完整,建议多使用prefetch。

结果

想批量处理的可以将所有的SRR号放在一个txt文件里,注意格式,另外狒狒之前介绍过linux的循环小技巧,点击原文即可获得,大家可以试一下。




所有数据来自我看的一篇文献 
https://bsd.biomedcentral.com/articles/10.1186/s13293-015-0044-8

Large-scale transcriptome sequencing reveals novel expression patterns for key sex-related genes in a sex-changing fish 
想把这些数据的分析流程过一遍,这篇文章很有特点,是无参转录组,经过 
Sample collection——RNA extraction——RNA extraction——Read pre-processing——_De novo transcriptome assembly——Quality checking——Annotation——Read mapping and differential expression analysis——Gene ontology and pathway analysis 
Background: 
1.鱼类性别的可塑性 
2.急性社会控制会造成female-to-male 
3.研究对象:双带锦鱼 
Methods: 
1.进行RNA测序以表征转录组特征并鉴定在大脑(前脑和中脑)和双带锦鱼性腺中表现出性偏爱表达的基因。 
2.对性腺中具有性别偏好的基因进行功能注释和富集分析,以检测male和female之间基因产物和遗传途径的全部差异。 
Results: 
1.第一次进行原生鱼类的转录组分析 
2.揭示了male和female性腺中性别偏爱性表达基因较多,大脑中的较少 
3.功能注释和富集分析表明,卵巢主要富集代谢过程,而睾丸主要和信号转导有关,尤其是神经递质受体和类固醇激素受体, 
4.相对于其他物种,双带锦鱼和性腺表达有关的雄性性别决定基因更具有保守性;一些雌性通路基因( eg:rspo1 and wnt4b)表现出意想不到的表达模式。 
5.在大脑中,基因表达模式表明局部神经甾体的产生和信号传导可能导致观察到的性别差异 。
Concision: 
关键性别相关基因表达模式表明,鱼类性别决定基因在演化上是保守的,但标准性别决定调控网络中的微妙变异可能有助于这些鱼的性可塑性。



https://blog.sciencenet.cn/blog-355779-1124534.html

上一篇:拯救bug思维导图
下一篇:【生信技能】SRA Database的数据下载升级款
收藏 IP: 220.249.99.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-24 01:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部