不积小流 , 无以成江海 !分享 http://blog.sciencenet.cn/u/xiongchaoliang

博文

LncRNA功能研究神器----TANRIC数据库

已有 21542 次阅读 2016-9-2 22:18 |个人分类:【转录组-lncRNA分析】|系统分类:科研笔记

     长链非编码 RNA ( Long non-coding RNA, lncRNA ) 是长度大于200个核苷酸的非编码RNA,其在剂量补偿效应、表观遗传调控、细胞周期调控和细胞分化调控等众多生命活动中发挥重要作用。作为遗传学研究的热点受到了越来越多的关注,最直观的就是每年国自然相关课题的中标情况,可以说呈现一种井喷的状态。

    TCGA 数据库里面大部分都是RNA测序的数据,这部分数据在 TCGA 基础分析里面只是做了编码基因的表达定量分析,但是这些数据还包括了大量长非编码 RNA 的信息,所以MD Anderson 肿瘤中心的一群生物信息分析专家就把 TCGA 原始测序数据全部下载下来,然后对这些数据进行了深入的挖掘,并且做成了 The Atlas of  Noncoding RNAs in Cancer ( TANRIC ,http://ibl.mdanderson.org/tanric/_design/basic/index.html)数据库供大家使用。

TANRIC 除了包括TCGA的数据外,还对 Cancer Cell Line Encyclopedia(CCLE)里各种细胞系的数据进行了深度的分析和整合。下面就以 HOTAIR 这个经典的长非编码RNA在肝细胞的研究为例,给大家介绍一下这个数据库的用法吧。

(一)查询界面

    TANRIC 打开的界面如下,Summary 和 Download 模块主要是介绍数据整体情况和下载数据。   My lncRNA 和 LncRNA in cell lines 是我们今天主要介绍的重点,分别是查询和分析 lncRNA 在 TCGA 和CCLE的表达情况及功能预测,由于 CCLE 仅是细胞系的数据,没有临床预后等相关信息,所以我们一般优先研究 lncRNA 在 TCGA 的表达情况。


    我们点击进去分别选择肿瘤类型、输入关注的 lncRNA 名字、要研究的样品类型和关联分析的数据情况,然后提交查询即可。对于很多新的lncRNA没被NCBI等数据库收录的,这时候如果按照基因名是无法查询的,对此TANRIC也提供了基于lncRNA上外显子位置信息进行查询的方式,以 HOTAIR 为例,另外一种查询方式是:chr12: 54356092-54357908 ; 54359748- 54359867 ; 54360060-54360161 ; 54362401-54362698(分别是HOTAIR 上 4 个外显子的区域信息),这种方式查询的效果和直接查询 HOTAIR 是一样的。最后点击提交,我们只需静静的等待最终的结果即可。

(二)查询结果展示

    在 LncRNA expr 那一列会提供每个样品的表达量信息,包括正常的组织和癌组织。需要注意的是这里的表达水平都是 log2 之后的值,也就是如果要做差异表达分析需要先转化过来才能比较,后续就可以计算 fold change 和做组间差异显著性检验了。

 在 Diff subtype 那一列会计算 lncRNA 表达量与哪些临床指标相关,例如 TNM 分期等。在 Survival 那一列会计算 overall survival 与表达水平的相关性,以便于寻找具有临床意义的 biomarker 。

 lncRNA 可以通过不同的作用机制影响下游基因的表达,在这里 TANRIC 通过计算候选lncRNA 和每个编码基因之间的相关系数,以此推断候选 lncRNA 直接作用的下游基因,并且以散点图的方式进行展示。

    随着RNA调控机制研究的深入,有人提出了 ceRNA(competing endogenous RNAs)假说,该假说认为 microRNA 可以通过结合 mRNA 导致基因沉默,而 ceRNA 可以通过竞争性地结合 microRNA 来调节基因表达,越来越多的文章证明 lncRNA 也是可以发挥 ceRNA 功能的。对此,TANRIC 也是通过计算候选 lncRNA 和每个 microRNA 之间的相关系数,以此推断候选 lncRNA 直接作用的 microRNA 情况。

 以上就是 TANRIC 数据库的最主要功能了,细胞系查询功能和前面介绍的基本一致,此外 TANRIC 还提供不同肿瘤表达水平的 Heatmap 图展示功能,在这里就不逐一介绍了,大家有兴趣可以到 TANRIC 的网站研究一下。可以说,对于前期标本量偏少后续又无法在大样本队列进行验证的项目,TANRIC 数据库就是独立验证候选 lncRNA 的又一神器。

(本文引自:永诺生物)



https://blog.sciencenet.cn/blog-1509670-1000471.html

上一篇:环状RNA(circRNA)干货大全,珍藏!
下一篇:肿瘤基因组学数据库终结者:cBioPortal
收藏 IP: 218.241.213.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-25 10:33

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部