||
随着芯片和高通量测序技术的广泛应用,在肿瘤研究领域积累了越来越多的基因组学数据,特别是像The Cancer Genome Atlas(TCGA)、International Cancer Genome Consortium(ICGC)等大型肿瘤基因组测序计划的启动和完成,积累了大量的基因组学数据,这些数据至今为止已经占据了NCBI等公共数据库的半壁江山,同时也产生了各种各样的数据库以满足不同的研究需求。
对数据库的灵活运用已经成为科研工作者所必须掌握的基本技能,否则出去交流的时候都不好意思开口说不知道了。对于这些数据库,小编随口都能讲出十几个,例如***(此处省略一百字),然而,这么多数据库对于有选择困难症的人来说简直就是噩梦,很多人都在问有木有一个数据库能一次能满足我多个愿望呀?为此,小编对十几个数据库进行综合评估之后,给大家隆重推荐肿瘤基因组学数据库的终结者:cBioPortal网站(http://www.cbioportal.org/)。
cBioPortal网站整合了126个肿瘤基因组研究的数据,包括TCGA和ICGC等大型的肿瘤研究项目,涵盖了两万八千例标本的数据,此外部分样品还包括了临床预后等表型的信息。cBioPortal无需注册就能直接使用,而且提供一些小工具方便用户生成文章级别的图表,非常贴近用户的需求,下面小编就以EGFR基因在非小细胞肺腺癌的研究为例,带领各位小伙伴一步步玩坏cBioPortal数据库吧。
(一)EGFR在非小细胞肺腺癌的变异情况
首先,在cancer study选择要研究的肿瘤类型,如果想看候选基因在所有肿瘤的变异情况,就把所有肿瘤类型选上即可。在这里,我们可以看到对于肺癌有好几个研究项目的数据,一般我们选择样品量最多信息量最大的研究项目,所以我们选择了TCGA非小细胞肺癌项目(包括了522例样品)。然后,在genomic profiles选择要研究的组学数据类型,是研究突变还是拷贝数变化,还是多个组学的数据都考虑,在这类我们为了全面了解EGFR的变异情况,就把全部组学数据都选上了。最后,在gene set填上你所关注的基因,一个或者多个基因都可以,或者在user-defined list选择对特定肿瘤具有明确意义的基因。
选择好上面的参数点击提交,之后只需静静等候即可得到详细的突变结果。在Oncoprint标签页里面,不同的图例代表不同的突变类型,此外,还能把变异比对到具体的蛋白结构域,并且配有蛋白三维结构的图(Mutations标签页)。关键是可以调整显示的方式和图形的大小,最终还能导出不同格式的图,满足各位发表文章的需要。
(四)EGFR调控网络和药物反应
对于调控网络cBioPortal通过基因互作数据库,例如PID、PANTHER、Reactome等数据库寻找与候选基因相关联的基因,然后通过互作强弱分析构建调控网络。此外,利用DrugBank、KEGG Drugs和Cancer Cell Line Encylopedia等药物反应数据库,针对相关的药物靶向的基因进行标注,从调控网络的角度指导分子互作和药物反应实验。
(转自:永诺生物)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 08:16
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社