||
RegRegSEA:表观基因组数据调控区域集富集分析网页服务器
高通量表观基因组分析技术,包括全基因组亚硫酸氢盐测序(WGBS)和转座酶可及染色质测序(ATAC-seq),已成为在全基因组范围内绘制 DNA 甲基化和染色质可及性的标准方法。将这些方法应用于临床或实验队列,可以生成包含数十万个可测试区域的基因组数据集。批量人类 ATAC-seq 实验通常在每个样本中产生约 50,000–300,000 个可及染色质区域的共识峰集,而基于 WGBS 的差异甲基化分析则聚该测试在数千万个单独的CpG位点中,对候选差异甲基化区域(DMR)进行检测,每个研究通常有数十万到数百万个。在这些研究中,一个核心分析挑战是从单个差异区域的目录编制转向识别那些活动与观察到的表观基因组表型一致相关的转录因子(TF)和调控程序。
当前用于这项任务的计算方法可分为两大类。基于区域重叠的工具,如 LOLA(位点重叠分析),用于检测注释基因组特征在用户定义的前景区域集中的统计过度代表情况。虽然对于少数高置信度区域非常有效,但这种方法依赖于用于定义前景的显式显著性阈值。这意味着在分析开始前,生物学上有意义但统计上中等强度的信号会被丢弃,因此结果的敏感性会随着所选的截断值而变化。以基因为中心的通路富集工具,如 ebGSEA,通过结合排序信号来解决这个问题,但它们首先将表观基因组信号映射到最近的基因。在基于邻近关系错误分配远端调控元件的情况下,这一映射步骤会引入解释性偏差。为了应对这些挑战,Wolff等人实现了一个工具,该工具允许对表观基因组数据进行无阈值、坐标原生的上游转录因子活性分析。
这里,Wolff等人介绍了 RegRegSEA(调控区域集富集分析,图1,https://web.ccb.uni-saarland.de/regregsea/),一个可免费使用的网络服务器,它将基因集富集分析(GSEA)框架应用于表观基因组学领域。RegRegSEA 不是选择一部分显著区域,而是使用完整的差异分析表,并通过基于效应大小和统计证据的符号统计量对所有测试的基因组区间进行排序。然后,它计算针对已整备的转录因子结合位点和管理调控特征的运行和富集分数。这种基于排序、坐标本地的分析方法能够检测到其结合位点显示出协调、全局表观基因组变化的转录因子和染色质调节因子。通过两个案例研究展示了 RegRegSEA 的实用性:对 Down 综合征(DS)大脑已发表的 WGBS 数据的重新分析,以及对多模态衰老肝脏数据集中 ATAC-seq 成分的分析。

图1 RegRegSEA 的交互式结果界面。用户可以通过不同 FDR 阈值下绝对 NES 生成最富集区域集的排序条形图,可选择过滤每个转录因子关联的最富集区域集以减少冗余。通过从结果表中选择区域集可生成感兴趣区域集的运行富集分数。用户选择的分析参数概览,可选择在多数据库任务中切换区域集数据库。富集结果和领先区域可通过下方按钮下载。用户可搜索感兴趣的区域集或转录因子,并按 FDR 或 NES 对表格排序以检查结果
参考文献
[1] Tobias Wolff, Friederike Grandke, Misbah Sayeeda, Pascal Hirsch, Matthias Flotho, Andreas Keller, RegRegSEA: a web server for regulatory region set enrichment analysis of epigenomic data, Nucleic Acids Research, 2026;, gkag454, https://doi.org/10.1093/nar/gkag454
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库
42. CircTarget:多种细胞类型circRNA调控综合数据库
43. GreenCells:植物lncRNA单细胞分析资源
44. RM2Target 2.0:RNA修饰的写入者、擦除者和读取者靶基因数据库

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-5-30 17:58
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社