||
局部细胞特异性网络识别方法LocCSN
单细胞RNA测序(scRNA-seq)为单个细胞提供了高通量RNA表达,揭示了细胞群的异质性。基于单细胞测序数据,计算方法让细胞类型分类、新型细胞类型识别和轨迹分析成为可能。然而,在这些方法中,很少有人关注基因-基因相关关系和转录网络(揭示许多重要的生物学过程)。众所周知,基因表达受到转录因子网络的严格调控,在细胞水平上理解这些网络可以识别正常和病变组织中细胞内部运作的差异。
到目前为止,从scRNA-seq中估计共表达网络的努力仍然很有限。原因包括技术挑战,如非零计数的稀疏性和高水平的噪声、传统测量方法不容易捕获的非线性关系以及细胞间共表达模式的异质性。已有许多方法旨在估计所有细胞类型的单一共表达网络,但是,为了获得细胞水平上基因共表达的细微差异,我们需要估计每种细胞类型的基因网络。此外,即使目的是估计细胞类型特定的网络,传统方法估计的是该类型细胞的整个样本的单个共表达关系。使用这种方法,可以消除单个细胞间共表达的异质性,但这一知识可以为下游分析提供有价值的见解。
为了揭示单个细胞内的共表达网络,我们的目标是从scRNAseq数据构建细胞特异性网络。关于细胞特异性网络识别,在前几次已经发表了几篇公众文章。例如细胞特异性因果调控网络识别(参见细胞特异性因果调控网络识别)、细胞特异性基因调控网络识别方法CeSpGRN(参见细胞特异性基因调控网络识别方法CeSpGRN)、构建条件单细胞基因调控网络(参见构建条件单细胞基因调控网络)。本次介绍一个局部细胞特异性网络识别方法LocCSN(图1,https://github.com/xuranw/locCSN)。
图1 LocCSN方法流程
如果说LocCSN预测局部细胞特异性网络,那么原始方法CSN(https://github.com/wys8c764/CSN )和c-CSN(https://github.com/LinLi-0909/c-CSN)则是识别全局细胞特异性网络。与原始CSN和c-CSN方法比较,LocCSN在以下三个方面做了改进。首先,给定scRNA-seq数据,LocCSN要将所有细胞进行聚类(按照细胞类型、细胞周期等),针对每一个聚类(可以视为scRNA-seq子数据)识别每个细胞的特异性网络。因此,方法的名字叫局部细胞特异性网络。其次,在选择窗口大小(window size)时候,LocCSN为每一个scRNA-seq子数据通过迭代方法灵活选择,而不是对所有scRNA-seq子数据选择固定窗口大小(例如0.1)。第三,为了降低计算复杂度和缓解单细胞测序数据噪声,LocCSN使用metacell(元细胞)整合相同细胞类型的多个细胞,该元细胞就代表这些细胞。
可以说,在处理数据方面,LocCSN在单细胞和多细胞精度水平之间,做了一个折中处理。详细分析和比较结果可以参考文献[1]。
参考文献
[1] Wang X, Choi D, Roeder K. Constructing local cell-specific networks from single-cell data. Proc Natl Acad Sci U S A. 2021;118(51):e2113178118. doi:10.1073/pnas.2113178118
以往推荐如下:
2. 因果推理综述推荐一篇
5. 你想了解因果推理吗?
6. 因果学习工具:Causal Explorer和Causal Learner
7. 小样本学习
8. 样本异质性定量化
9. 生物标志物定义及其应用
13. miRNA靶基因预测工具:“我们到了哪里,又该往哪去?”
14. 人类细胞互作数据库:CITEdb
16. EMT标记物数据库:EMTome
17. EMT基因数据库:dbEMT
19. RNA与疾病关系数据库:RNADisease v4.0
20. 细胞互作网络识别方法:CINS
23. 发育、稳态和癌症中的细胞竞争
24. 单细胞组学测序在脑疾病中的应用
25. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-17 08:19
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社