zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

scMTNI:从单细胞组数据集推断细胞谱系上的细胞类型特异性基因调控网络

已有 1988 次阅读 2023-8-18 08:46 |个人分类:科普|系统分类:科普集锦

scMTNI:从单细胞组数据集推断细胞谱系上的细胞类型特异性基因调控网络 

转录基因调控网络(GRNs)指定调控蛋白和靶基因之间的联系,并决定基因的空间和时间表达模式。这些网络在动态过程(如发育或疾病进展)中重新配置,以指定细胞类型特异性表达水平。单细胞组学技术的最新进展,如单细胞RNA测序(scRNA-seq)和使用测序的转座可及染色质的单细胞测定(scATAC-seq),能够收集发育系统的高分辨率分子表型,并为发现细胞类型特异性调控网络及其动力学提供了前所未有的机会。然而,系统地利用这些数据集来识别驱动细胞类型特异性表达模式的调节网络的计算方法是有限的。 

现有的从单细胞组学数据进行网络推断的方法主要使用转录组学测量,并且实验验证的相互作用的回收率较低。少数方法试图整合scRNA-seqscATAC-seq数据集来识别基因调控,然而,其中许多方法侧重于定义细胞簇,并且网络完全基于可访问的序列特异性基元匹配来定义。这将可纳入调控网络的调控因子类别限制为具有已知基元的调控因子。此外,现有方法为整个数据集推断单个GRN,或者不对细胞群体结构建模,这对于辨别推断的网络中的细胞类型特异性的动力学和转变很重要。为了克服现有方法的局限性,Zhang等人开发了单细胞多任务网络推理(scMTNI,图1),这是一种整合细胞谱系结构、scRNA-seqscATAC-seq测量以实现细胞类型特异性GRN联合推断的多任务学习框架。scMTNI将每种细胞类型的细胞谱系树、scRNA-seq数据和基于scATAC-seq的先验网络作为输入。scMTNI在网络推断期间使用概率先验来合并谱系结构,并输出细胞谱系上每个细胞类型的GRN。在模拟数据上对包括scMTNI在内的多任务学习方法进行了全面的基准研究,并表明将多任务学习和树结构相结合有利于GRN推理。 

image.png

1 scMTNI框架概述。scMTNI将细胞谱系树和细胞类型特异性scRNA-seq数据以及源自scATAC-seq数据集的细胞类型特异的先验网络作为输入。如果scATAC-seq数据不可用,则可以将基于批量或序列用于该细胞类型的先验网络。scMTNI的输出是细胞谱系树上每种细胞类型的一组细胞类型特异性基因调控网络。b使用两种动态网络分析方法分析scMTNI的输出网络:基于边缘的k-means聚类和基于潜在狄利克雷分配(LDA)的主题模型,以识别与特定细胞簇或分支上的一组簇相关联的关键调节因子和子网络。cscMTNI一起使用的数据集。模拟数据包括三种细胞类型的线性轨迹,而三个真实的数据集来自重编程时间序列过程、人类成年造血分化过程中鉴定的免疫表型细胞类型和人类胎儿造血过程中的免疫表型血细胞。MEF小鼠胚胎成纤维细胞、iPSCs诱导的多能干细胞、HSC造血干细胞、CMP普通髓系祖细胞、GMP粒细胞-巨噬细胞祖细胞、单核细胞、HSC-MPP造血干细胞和多能祖细胞、LMP淋巴细胞-髓细胞祖细胞、结合循环MEMPMEMP MK红系肥大祖细胞、GP粒细胞祖细胞、pDC浆细胞样树突状细胞。 

作者们将scMTNI应用于先前未发表的用于小鼠细胞重编程的scRNA-seqscATAC-seq数据集,以及两个已发表的用于人类造血分化的scRNA-seqscATAC-seq细胞类型特异性数据集。作者们证明了scMTNI框架集成scATAC-seqscRNA-seq数据集,用于推断线性和分支谱系拓扑结构的细胞类型特异性GRN的优势。作者们还研究了推断的网络如何沿着轨迹变化,并确定了谱系树不同部分特有的调节因子和网络组件。这些预测包括已知和先前未表征的细胞群向不同谱系路径过渡的调节因子,为深入了解与重编程效率和造血规范相关的调节机制提供了依据。 

参考文献

[1] Zhang S, Pyne S, Pietrzak S, Halberg S, McCalla SG, Siahpirani AF, Sridharan R, Roy S. Inference of cell type-specific gene regulatory networks on cell lineages from single cell omic datasets. Nat Commun. 2023 May 27;14(1):3064. doi: 10.1038/s41467-023-38637-9.  

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

 

image.png




https://blog.sciencenet.cn/blog-571917-1399441.html

上一篇:MultiVI:多模态数据集成的深度生成模型
下一篇:bmediatR:介导分析的贝叶斯模型选择方法
收藏 IP: 39.128.54.*| 热度|

1 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 18:12

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部