zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

GeneFEAST:基因功能富集分析总结和可视化工具

已有 474 次阅读 2025-3-26 13:44 |个人分类:科普|系统分类:科普集锦

GeneFEAST:基因功能富集分析总结和可视化工具 

在高通量“组学”实验时代,功能富集分析(Functional Enrichment AnalysisFEA)在我们解释这些研究所产生的生物数据的能力中起着至关重要的作用。在典型的工作流程中,一个实验产生大量的基因(即感兴趣的基因)以供进一步分析。RNA-Seq实验可用于鉴定在实验条件和对照条件之间差异表达的基因组。然后,基于某些术语数据库将生物相关标签分配给基因、通路或标记,例如GOKEGG 

l  在过代表性分析(ORAFEA中,超几何检验用于比较由注释条目的感兴趣的基因数量与在基础实验中测定的背景基因组中该注释条目的基因数量。

l  在基因集富集分析(GSEAFEA中,该过程略有不同,因为FEA本身有助于鉴定感兴趣的基因。特别地,所有测定的基因最初被认为是推定的感兴趣基因,并根据实验结果进行排名。例如,在RNA-Seq实验中,基因可以在病例与对照中从最过度表达到最低表达进行排序。然后,为每个条目计算富集分数(ES),其反映该条目的基因集合位于排序列表的顶部或底部的频率。最后,通过排列测试获得ESp值,并报告对条目的ES有贡献的核心基因的前沿子集,然后具有显著ES的条目的所有前沿基因的超集是最终的感兴趣基因。 

当使用FEA方法时,在FEA工作流程的最后一步,总结所有条目结果并生成报告。这最后一步对于研究人员从FEA中获得生物学见解至关重要,但它往往因信息量庞大而复杂化,这些信息可能是多维的,也包含冗余信息。 

重要的是,FEA通常是更广泛过程的一部分,有助于以基因为中心的假设生成和下游验证实验。因此,除了总结丰富的条目外,全面的总结工具必须能够系统地探索条目之间的联系、其相关的刚兴趣基因这些基因的定量数据。这种数据的常见例子是RNADNA-Seq实验中的倍数变化或拷贝数变化,这样的工具应该突出显示驱动多重富集的定量数据中的基因集和模式。此外,它应该能够系统地比较在多个研究中发现的富集。目前,没有FEA汇总工具提供所有这些功能。为了填补这一空白,Taylor等人最近提出了PythonGeneFEAST(图1https://github.com/avigailtaylor/GeneFEAST),用于总结和可视化由条目的任何标准组学数据库和上游FEA流水线产生的FEA结果。 

image.png 

1 输出HTML/CSS/JavaScript报告的结构和内容。总结单个FEA的报告具有社区概述首页(灰色插图),其中提供了Meta社区、社区和条目的列表(灰色插图中的绿色框架)、社区的轮廓图(i)和社区检测参数的图形网格搜索(ii)。社区概述主页具有锚链接(黑色实线箭头)进入完整报告:每个Meta社区都有链接(红色框架),其中每个成员社区的单独链接(蓝色框架,左下角),指向未形成较大Meta社区一部分的丰富条目社区的链接(孤立的蓝色框,右),以及不属于丰富条目社区的条目链接(黄色框架)。带有社区概述”和“完整报告”菜单的顶部导航栏固定在报告的顶部,并且始终可见,随时提供对报告每个部分的直接访问。总结多个FEA的报告以首页开始,该首页显示在每个输入FEA中被识别为丰富的条目集的翻转图(左上绿色框)。将在两个或更多个FEA中找到的每个条目集称为“FEA条目集交集。此首页顶部的导航栏提供了一个报告菜单,用户可以从中导航到总结每个FEA术语中的条目的单独报告-集合交集。每个单独的报告都具有总结单个FEA的报告的结构。在GeneFEAST报告中,每个Meta社区和术语都有一个信息框架,以HTMLCSS实现,可以缩放以适应用户的显示器。在每个框架中,JavaScript可以切换内容。Meta社区框架包含:圆圈和翻转图显示成员社区的基因集重叠、分割热图,其中条目注释被顶部热图中的基因社区成员资格替换,并对每个基因进行文献检索。Meta社区框架具有指向成员社区的链接(黑色,虚线箭头)。在适用的情况下,社区框架具有返回到其Meta社区以及其Meta社区中的兄弟社区的链接(黑色虚线箭头);另外,也有一个链接列表,链接到共享一些基因集重叠的条目。条目框架包含社区框架内容的子集,并具有指向弱连接社区的链接(黑色虚线箭头) 

GeneFEAST需要Python 3.12才能运行,可以从https://pypi.org/project/genefeastPython包索引pip安装。查看HTML输出报告需要支持HTML 5JavaScript 1.6Web浏览器。访问http://avigailtaylor.github.io/GeneFEAST获得GeneFEAST完整的安装说明和用户指南。 

参考文献

[1] Taylor A, Macaulay VM, Miossec MJ, Maurya AK, Buffa FM. GeneFEAST: the pivotal, gene-centric step in functional enrichment analysis interpretation. Bioinformatics. 2025 Mar 3:btaf100. doi: 10.1093/bioinformatics/btaf100. 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

image.png

 



https://blog.sciencenet.cn/blog-571917-1479373.html

上一篇:MRF-IMD:一种用于鲁棒生物标志物发现的集成多组学随机森林框架
下一篇:单细胞 RNA 测序在癌症中的新兴临床应用
收藏 IP: 112.116.155.*| 热度|

1 许培扬

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

IP: 223.72.65.*   回复 | 赞 +1 [1]许培扬   2025-3-26 14:40
物种与ID匹配:确保输入的基因ID类型与工具支持的标识符一致(如ENSEMBL、Entrez)916。

多重检验校正:推荐使用FDR或Benjamini-Hochberg法校正P值314。

结果解读:关注生物学意义而非单纯统计显著性,结合实验背景筛选通路114。

通过以上工具和方法,研究者可以系统解析高通量数据中的功能模块,并通过可视化增强结果的解释力。具体工具的操作教程可参考对应文献或博客(如CSDN、简书)2710。

1/1 | 总计:1 | 首页 | 上一页 | 下一页 | 末页 | 跳转

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-4-7 20:38

Powered by ScienceNet.cn

Copyright © 2007-2025 中国科学报社

返回顶部