||
circExp:人类癌症circRNA基因表达在线转录组平台
基因表达是将DNA编码的信息转化为功能性产物的过程。环状RNA (circRNA)是一类非编码RNA,它既与内源性microRNA竞争,又调节RNA结合蛋白,因此在转录和转录后水平上是重要的调节因子。环状RNA形成共价连接的连续环,在真核细胞的细胞质中大量存在,与同源线性形式相比,环状RNA相对稳定。circRNA通常与许多常见疾病相关,包括人类癌症。
由于癌症基因组的复杂性和人类癌症中大量的遗传异质性,鉴定用于各种癌症诊断和预后的分子特征是困难的。总的来说,与相应正常组织中的circRNA相比,癌症相关的circRNA通常是下调的,并参与肿瘤的发展、侵袭、转移和抗癌抵抗。这些独特的特征使circRNA成为诊断和评估复杂癌症预后的理想标记物。随着全基因组微阵列和高通量RNA测序(RNA-seq)技术的发展,转录组分析现在可以系统地表征环状RNA的表达变化。这些数据集存储在公共基因表达数据库中,没有任何跨数据集验证。因此,当前主要目标是开发一种生物信息学工具来分析circRNA数据以识别潜在的特征。
考虑到环状RNA的生物学意义,整合来自不同技术平台的转录组可能会在各种情况下提供交叉验证的高质量表达事件。为了实现这一目标,我们首先必须标准化和注释在各种平台上编译的circRNA。然后,为了帮助确定假定的circRNA相关的上调和下调事件,Zhao等人开发了第一个免费和开放的数据库circExp (http://soft.bioinfo-minzhao.org/circexp/,图1),该数据库能够表征人类癌症中的circRNA表达。
图1 circExp数据库的Web接口。(A)在探针标注页面,用户可以通过突出显示的四个功能进行数据过滤、下载和分页。还可以通过单击列号对数据表中的每一列进行排序。列过滤功能通过为列输入关键字来工作。过滤后的结果可以以Excel、CSV和PDF格式下载。用户可以通过点击屏幕右上方的按钮切换到热图。(B)在热图页面上,用户可以找到数据集的总体设计,并可以链接回公共数据库中的原始记录
为了提供人类癌症中集成和标准化的circRNA表达谱的来源,作者们进行了广泛的数据管理,并在多个技术平台上提供一致的注释,并开发了circExp。circExp数据库中的格式化数据包含(i) 48个精心策划的数据集,其中包含来自各种癌症类型的全基因组表达谱的表型信息,(ii) 189,193个预先计算的差异表达事件和(iii)跨多个技术平台的860,751个表达记录。circExp的web界面允许用户执行文本查询并根据其亲本基因和癌症类型浏览circRNA。为了进行高级生物信息学分析,提供了所有circRNA的132个可批量下载文件,包括1个数据集汇总表,48个带注释的探针数据表,49个表达矩阵文件(GSE93522有两个矩阵文件)和34个差异表达比较结果。此外,对29个数据集中的52个共享的差异表达基因进行了综合分析,使circExp数据库成为探索circRNA调控机制的有用工具。
参考文献
[1] Zhao M, Liu Y, Qu H. circExp database: an online transcriptome platform for human circRNA expressions in cancers. Database (Oxford). 2021 Jul 23;2021:baab045. doi: 10.1093/database/baab045.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 05:38
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社