||
P-CSN:偏细胞特异性网络分析单细胞测序数据
单细胞转录组测序(scRNA-seq)产生了大量的单细胞转录组数据,为我们在单个细胞水平上分析基因转录谱提供了机会。已经提出了许多用于分析scRNA-seq数据的计算方法,如降维方法、聚类方法和伪时间重建方法。基于这些方法,可以在复杂组织中发现新的或罕见的细胞类型,研究细胞分化过程。然而,这些方法主要集中于“不稳定”的基因表达水平,应考虑更多“稳定”的基因-基因关联。
推断基因调控网络是研究单细胞转录组数据的关键问题之一,目前已经发展出多种方法。然而,这些方法是细胞类型特异性的,需要我们首先将细胞分类,然后构建网络。这些网络揭示了类别的基因-基因关联,并隐藏了单个细胞的异质性。最近,提出了一种细胞特异性网络方法(cell-specific network method, CSN),该方法建立了单个细胞的网络,并建议使用“稳定”网络度矩阵(NDM)代替“不稳定”基因表达矩阵(GEM)进行下游分析。CSN基于统计独立性度量基因之间的非线性关联。然而,由于其他基因的存在,该方法估计的基因-基因关联包括直接关联和间接关联。为了克服这一问题,提出了条件细胞特异性网络方法(conditional cell-specific network method, c-CSN),该方法通过评估基因之间的条件独立性来过滤掉间接关联,极大地提高了基因-基因关联的可靠性。然而,当估计的基因对与条件基因强连锁时,知道条件基因就等于知道了它的强连锁基因,这就意味着条件独立性总是成立的,即无论估计的基因对是否连通,我们都假定它不连通。这样就产生了低估和假阴性问题。偏独立性是为了解决估计不足问题而提出的一个新的统计概念。Zhao等人不仅提供了理论证明,还在模拟和真实数据集上进行了验证。验证结果均显示了偏独立性对强连接网络中非线性直接关联量化的优势。
针对c-CSN方法的不足,Wang等人提出了一种偏细胞特异性网络方法(p-CSN)(图1)。该方法从scRNA-seq数据中为单个细胞构建网络,而无需首先对细胞进行分类。p-CSN的输入是一个“不稳定”GEM,输出是基因-基因关联矩阵。为了验证所提出方法的有效性,作者们在模拟和真实数据集上进行了验证。在模拟数据集上,作者们发现p-CSN可以缓解强连接网络中c-CSN的低估问题,从而减少网络构建的假阴性问题。在实际数据集上,p-CSN的偏网络度矩阵(PNDM)具有更好的聚类和可视化效果条件网络度矩阵(CNDM)的性能优于条件细胞特异性网络(CCSNs)。然后,作者们使用p-CSN分析细胞分化过程中基因调控网络的拓扑结构。结果支持剪接体通路在胚胎早期发育中的重要作用。此外,提出了一种基于p-CSN的单细胞网络熵(scNEntropy)方法来量化细胞状态并重建伪时间。在两个胚胎发育数据集上的结果表明,scNEntropy在不同细胞类型间存在显著差异,且scNEntropy重构的伪时间优于其他两种经典算法。最后,将p-CSN方法应用于肺腺癌数据集(LUAD)时,作者们发现与正常样本相比,肿瘤样本中细胞周期通路基因的GEM和PNDM发生了改变。此外,还发现GEM和PNDM联合使用比单独使用GEM或PNDM预测更多的生存结果。
图1 p-CSN方法的工作流程。(A)利用给定条件基因z的基因表达数据构建每个细胞(如细胞k)的p-CSN。(B)条件基因zg(g = 1,2,3…G )时,单元格k的p-CSNs可以集成为一个p-CSN。PNDM可以通过每个单元的p-CSN进一步计算。 一方面,PNDM可以应用于聚类分析。另一方面,PNDM可用于计算细胞的scNEntropy,并根据scNEntropy获得细胞的伪时间。p-CSN:偏细胞特异性网络,PNDM:偏网络度矩阵,t-SNE:t分布随机邻居嵌入,scNEntropy:单细胞网络熵
p-CSN方法的详细信息和结果见文献[1]。
参考文献
[1] Wang Y, Xuan C, Wu H, Zhang B, Ding T, Gao J. P-CSN: single-cell RNA sequencing data analysis by partial cell-specific network. Brief Bioinform. 2023 May 19;24(3):bbad180. doi: 10.1093/bib/bbad180.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 23:09
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社