zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

SCORPION:基因调控网络群体水平比较

已有 696 次阅读 2024-5-8 11:09 |个人分类:科普|系统分类:科普集锦

SCORPION:基因调控网络群体水平比较

在真核生物中,基因表达受到转录因子的严格调控,转录因子是一种在决定细胞身份和控制细胞状态方面起关键作用的蛋白质。它们通过激活或抑制特定目标基因的表达来实现这一目标。这种调控依赖于转录因子的丰度、它们与染色质(DNA -蛋白复合物)结合的能力以及它们经历的各种翻译后修饰。众所周知,调控相互作用的改变可能导致异常表达谱和病变表型。通常,构建并比较基因调控网络,以确定导致这些异常表型的转录因子与其靶基因之间关系的机制改变。转录组学数据可以通过检查基因的共表达模式来推断基因调控网络,这些基因是相同调控程序的一部分。根据基因调控网络重建中包含的转录组学数据的细胞或样本,网络可以代表组织内特定细胞类型的调控程序,也可以捕获定义样本取自的整个组织的平均机制。

利用来自单个细胞/细胞核的RNA测序(RNA-seq)数据中发现的基因表达变异性,可以推断单个样本中每种细胞类型或细胞状态的基因调控网络。然而,当有多个样本时,来自不同样本的转录组通常在进行组水平比较之前由实验组折叠。在差异网络分析的背景下,通常通过组合所有细胞的转录组来构建在每个实验组中的聚合网络。然后,这个网络代表了每个实验组的特征,这些聚合网络模型可以用于比较分析。为了更多地了解支持感兴趣表型的转录因子-靶基因相互作用,该网络被仔细检查或与其他网络进行比较。尽管总体网络模型很有用,但其设计并不是为了评估样本之间的调控异质性。

在差异基因表达分析中经常计算伪bulk谱,以考虑样品之间的生物学差异。然而,为了确定导致群体内样本间表型变化的一致机制模式,转录因子及其靶基因相互作用之间的生物学变异性应该理想地跨多个样本进行建模。这需要开发高效的技术,从单细胞/细胞核RNA-seq数据构建高度精确和可比较的基因调控网络。

使用来自单个细胞或细胞核的高通量RNA-seq数据来创建可比较的基因调控网络是一项艰巨的任务。这种类型的数据是高度稀疏的,并且经常包含基于单个实验中多个细胞状态的信息,这使得样本比较具有挑战性。此外,在文库准备过程中,非生物学因素经常影响数据,降低了我们检测生物学上准确相关结构的能力。例如,单细胞RNA-seq数据的高度稀疏性限制了最初设计用于使用大量RNA-seq数据构建基因调控网络的方法的应用,这些方法使用样本间的相关性来估计网络相互作用。这包括仅使用稀疏矩阵上的相关度量来模拟调控相互作用的方法,如加权相关网络分析(WGCNA),以及结合基因调控的先验信息来估计调控相互作用的方法,如PANDA(在网络之间传递属性以进行数据同化)

为了解决在单细胞数据上差异基因调控网络分析中的这些挑战,Osorio等人提出了SCORPION (single-cell Oriented Reconstruction of PANDA individual Optimized gene regulatory Networks,图1),这是一个使用单细胞/细胞核RNA-seq数据粗粒度来降低稀疏性并提高检测这些数据中相关结构能力的工具。然后使用调节网络重建算法(PANDA)将生成的粗粒度数据用于重建基因调节网络。PANDA采用消息传递方法整合多种信息来源,如蛋白质相互作用、基因表达和序列基序数据,以预测调控关系。由于对每个聚合的超细胞或者元细胞使用粗粒度和相同的基线先验,SCORPION可以重建可比较的、完全连接的、加权的和定向的转录组基因调控网络,适用于利用每个实验组多个样本的统计分析,也称为种群水平研究

image.png

1 SCORPION概述和基准。 a, SCORPION使用PANDA信息传递算法整合来自多个来源的数据,包括蛋白质-蛋白质相互作用、单细胞基因表达和序列基序数据,以预测准确的调控关系。在五个迭代的步骤中,SCORPION从单细胞转录组数据中生成可比较的、完全连接的、加权的和定向的转录组基因调控网络,适用于群体水平的研究。b、使用BEELINE和相同的精选合成数据集评估13种单细胞基因调控网络构建方法的性能。方法的排名基于它们在七个不同指标中的平均表现。如果度量是不可量化的,则显示灰色方块。每个指标的表现都用颜色从红色(最好)到蓝色(最差)进行编码。算法根据七个不同指标的平均表现进行排名:AUROCAUPRC、计算时间、表达水平造成的水平偏差、反馈回路(FBL;其中一部分(或全部)调控反应被用作未来基因调控的输入),前馈回路(FFL;由两个输入转录因子组成的三基因模式,其中一个调节另一个,两者共同调节靶基因)和相互迭代(MI;同样加权相互作用之间的调节和目标,反之亦然)基序结构识别。每个基因的平均基因表达量与其在网络中对应程度的相关性绝对值用于计算表达水平引起的水平偏差

通过BEELINE测试了SCORPION粗粒度输入数据的网络建模性能,BEELINE是一种系统评估从单细胞转录数据推断基因调控网络工具。作者们发现,用SCORPION对数据进行简化建模的网络在7个指标上优于其他12种基因调控网络重建技术。此外,通过监督实验,发现SCORPION可以精确识别野生型细胞和携带转录因子扰动的细胞之间调控网络的生物学差异。此外,通过将SCORPION应用于使用公开数据构建的单细胞RNA-seq图谱,证明了它在群体水平分析中的可扩展性,该图谱包括来自47名患者的200,436个细胞,并涵盖结直肠肿瘤和健康邻近组织的三个不同区域。SCORPION探测到肿瘤内和肿瘤间区域的差异,与对大多数结肠癌的基础——染色体不稳定性途径(CIN)的疾病进展的理解是一致的。研究结果在左侧和右侧肿瘤患者来源的异种移植物的独立队列中得到证实,并提供了与表型相关的调控因子及其存活率差异的见解。SCORPION工具包可以从https://cran.r-project.org/package=SCORPION获取。

参考文献

[1] Osorio D, Capasso A, Eckhardt SG, Giri U, Somma A, Pitts TM, Lieu CH, Messersmith WA, Bagby SM, Singh H, Das J, Sahni N, Yi SS, Kuijjer ML. Population-level comparisons of gene regulatory networks modeled on high-throughput single-cell transcriptomics data. Nat Comput Sci. 2024 Mar;4(3):237-250. doi: 10.1038/s43588-024-00597-5.

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

 

image.png

 



https://blog.sciencenet.cn/blog-571917-1433156.html

上一篇:单细胞图谱能够绘制成人乳腺的稳态细胞位移
下一篇:SCancerRNA:肿瘤ncRNA生物标志物的单细胞表达与相互作用资源
收藏 IP: 39.129.48.*| 热度|

1 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-19 09:17

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部