||
HCCDB--打造一站式检索的肝癌基因表达图谱
1、大规模肝细胞癌(HCC)基因表达图谱发布,包含近四千例临床样本基因表达数据。
2、克服可重复性难题,建立HCC一致差异表达图谱。分析表明,在HCC中发生一致下调的基因集中在代谢通路、脂肪酸降解等通路,一致高表达的集中在细胞周期相关的通路。
3、整合TCGA和GTEx数据构建全新4D指标,全面描述基因在HCC中的表达模式。分析该指标发现,肝癌常用标志物AFP、GPC3表现突出,另外两个表现突出的基因SPINK1和AKR1B10也具有潜在的标志物价值。
数据库网址:http://lifeome.net/database/hccdb
———————————————————————————————————————
肝细胞癌是一种常见且死亡率很高的癌症。高通量生物技术的发展使得人们可以从不同的分子水平对HCC进行描述。目前,表达谱数据已经大量积累并广泛应用于分子分型和肿瘤标志物的研究中。然而,对于HCC这样一种高度异质的疾病,只从一个样本量有限的表达谱数据集中做出的推断,很容易出现可重复性差和假阳性高的问题。为了找到一致的HCC异常表达模式、全面注释HCC中的基因表达情况,我们收集了15个公共的表达谱数据集,总共近四千个临床样本,并开发了数据库HCCDB,提供用户友好的一站式在线检索服务。
HCCDB有以下功能与特点:
>>> 15个数据集、近四千个临床样本,保证HCC差异表达模式的一致性和可重复性
>>> 建立了HCC一致差异表达基因图谱
>>> 单基因搜索功能--全面注释单基因在HCC中的表达谱:
>>> 多数据集中的差异情况
>>> 提出基因表达4D指标,系统刻画其在肝中的特异性、在HCC中的异常程度、肿瘤特异性以及HCC特异性
>>> 在正常组织(GTEx)和多种癌症(TCGA)中的表达情况
>>> 预后性能
>>> 共表达
>>> 药靶、蛋白等外部链接
>>> 文献挖掘
>>> 多基因搜索功能--总结多基因在HCC中的表达情况
>>> 采用“总结性的描述指标 + 具体结果展示”的形式,便于用户快速掌握基因在HCC中的表达模式
>>> 便捷、美观的图形界面,所有中间计算结果和原始数据都可下载,提供详细的网站使用教程
数据库的整体设计和主要页面之间的跳转关系如下图所示。通过综合分析12个有癌旁的数据集得到一致差异基因,并映射到染色体上,得到如图2A所示的一致差异图谱。
通过分析4D指标的前两维(肝特异性logFC1和HCC中的异常程度logFC2)之间的关系,如图2B所示。结果显示,整个图中明显游离在外的三个基因都与HCC息息相关。其中,GPC3已被证实可通过激活Wnt和其他信号通路来促进HCC生长和转移;SPINK1被发现在分化良好的HCC和高度发育不良结节中差异表达;有研究表明AKR1B10可能在肝癌发生中有着关键作用。
以GPC3为例,来展示单基因搜索的结果,具体如图3所示。返回的结果中,总结性描述包括:是否为一致差异表达基因、预后性能、4D指标雷达图、基因基本信息等;外部链接包括HPA、TTD、NCBI、GeneCards,以及文献挖掘的结果。在基因的表达模式版块,HCC中的表达模式采用“表格 + 散点图/直方图”两种形式互为补充;多种癌症和正常组织中的表达模式采用“散点图/直方图”的形式进行展示。此外,还有生存期分析和HCC/癌旁/正常肝中的共表达结果展示。
此项工作主要由清华大学古槿课题组与上海东方肝胆医院陈磊课题组联合完成,数据库论文已被Genomics, Proteomics & Bioinformatics (GPB)杂志接收(2018年影响因子6.615),清华大学博士生连秋宇、硕士生王事成是论文主要作者。
HCCDB: a database of hepatocellular carcinoma expression atlas.
Genomics, Proteomics & Bioinformatics 2018, Accepted. [Database]
Qiuyu Lian*, Shicheng Wang*, Guchao Zhang, Dongfang Wang, Guijuan Luo, Jing Tang, Lei Chen#, Jin Gu#.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 09:52
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社