||
单细胞多组学时代的基因调控网络推理
细胞调节基因转录以协调细胞对细胞内和细胞外信号的反应。转录在很大程度上受转录因子(TF)的调节,转录因子是一种与DNA的特定序列(DNA结合位点)结合的蛋白质,可以对靶基因的转录率产生积极或消极的影响。基因组DNA与结构蛋白紧密堆积在核小体复合物中,核小体是染色质的基本单元,使大多数基因无法进入转录机制。为了实现转录,基因转录起始位点附近的区域,即启动子,需要通过置换紧密堆积的核小体来暴露。DNA可及性的变化可以由所谓的先驱转录因子的结合触发。其他转录因子可以与DNA的末端顺式调节元件(CRE)结合,并与辅因子和其他蛋白质一起,协同实现从基因体DNA合成mRNA的RNA聚合酶-蛋白质复合物的募集和稳定(图1a)。
图1 基因调控网络原理。a、 基因调控及其关键要素。转录因子(TF)与启动子区和顺式调节元件(CRE)结合,取代核小体并使转录起始位点可接近。转录因子、辅因子和其他蛋白质之间的合作允许RNA聚合酶-蛋白质复合物的募集和稳定,该复合物从基因体DNA合成mRNA。b、 基因调控网络(GRN)可以从测量的组学数据中推断出来,并通过对TF结合预测或染色质可及性等额外信息的建模,可以进行细化,以更好地类似于真正的潜在GRN。GRN的节点是转录因子及其调控基因,节点之间的边缘表示调控模式(激活或抑制)。 c、 由单细胞组学数据生成的GRN可以理解细胞类型和状态特异性,解释动态轨迹的进展,并识别两者之间的差异
基因调控网络(GRNs)是以网络形式的基因表达调控的可解释计算模型,在数学上也被定义为图。基因调控的多种成分,如转录因子、剪接因子、长非编码RNA、微小RNA和代谢产物,可以被纳入GRN中。在这里,我们关注它们最简单的表示,它只捕捉转录因子和靶基因之间的相互作用,其中GRN的节点由基因组成,其中一些是转录因子,而GRN的边缘代表基因之间的调节相互作用(图1b)。揭示GRN的拓扑结构和动力学对于理解细胞身份是如何建立和维持至关重要,这对工程化细胞命运和疾病预防具有重要意义。
理解GRNs是生物学中一项长期的探索,正如20世纪60年代表征细菌乳糖(lac)操作的开创性工作所表明的那样。利用各种高通量实验方法和计算算法,重建大规模GRN成为系统生物学的主要焦点。从历史上看,GRN通常是从数据库中汇编的实验验证的调控事件中组装的,或从大量转录组学数据中的基因共表达中从头推断的。如果有足够的转录组学数据可用,可以推断GRN比从数据库中提取的GRN更适合当前的生物学问题,后者往往是广义的。然而,转录组学数据并没有直接捕捉到许多潜在的调控机制,如TF蛋白丰度和DNA结合事件、TF和辅因子的合作、替代转录物剪接、翻译后蛋白修饰事件以及基因组的可及性和结构。基因调控的这些其他方面的包含和测量有可能产生更好地代表体内基因调控的GRN(图1b)。例如,纳入染色质可访问性数据可以通过考虑基因是否开放以及将CRE纳入GRN的推断来微调TF-基因连接。
此外,批量分析提供了组织样本中不同细胞类型的混合测量,因此无法理清特定细胞类型或细胞状态的调控程序。单细胞技术的使用克服了这一限制,允许推断不同细胞类型、分化轨迹和条件下的GRN(图1c)。因此,随着多模态分析技术的引入,最近新出现的GRN推理方法激增。
本次介绍的这篇综述《Gene regulatory network inference in the era of single-cell multi-omics》中,作者们概述了GRN推理的一般原理及其潜在的局限性。此外,描述了如何利用多模式数据推断更准确的GRN,并对为此任务开发的几种新工具进行了分类和简要描述。此外,强调了可能的下游GRN分析以及如何通过实验评估获得结果。最后,讨论了该领域当前的挑战和未来的方向。
基因调控网络并不陌生,但是在单细胞多组学背景下开展基因调控网络推理仍然有很大的发展空间。详细内容见参考文献[1]。
参考文献
[1] Badia-I-Mompel P, Wessels L, Müller-Dott S, Trimbour R, Ramirez Flores RO, Argelaguet R, Saez-Rodriguez J. Gene regulatory network inference in the era of single-cell multi-omics. Nat Rev Genet. 2023 Jun 26. doi: 10.1038/s41576-023-00618-5.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-9 23:11
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社