zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

P-CSN:偏细胞特异性网络分析单细胞测序数据

已有 1489 次阅读 2023-10-11 13:42 |个人分类:科普|系统分类:科普集锦

P-CSN:偏细胞特异性网络分析单细胞测序数据 

单细胞转录组测序(scRNA-seq)产生了大量的单细胞转录组数据,为我们在单个细胞水平上分析基因转录谱提供了机会。已经提出了许多用于分析scRNA-seq数据的计算方法,如降维方法、聚类方法和伪时间重建方法。基于这些方法,可以在复杂组织中发现新的或罕见的细胞类型,研究细胞分化过程。然而,这些方法主要集中于不稳定的基因表达水平,应考虑更多稳定的基因-基因关联。 

推断基因调控网络是研究单细胞转录组数据的关键问题之一,目前已经发展出多种方法。然而,这些方法是细胞类型特异性的,需要我们首先将细胞分类,然后构建网络。这些网络揭示了类别的基因-基因关联,并隐藏了单个细胞的异质性。最近,提出了一种细胞特异性网络方法(cell-specific network method, CSN),该方法建立了单个细胞的网络,并建议使用稳定网络度矩阵(NDM)代替不稳定基因表达矩阵(GEM)进行下游分析。CSN基于统计独立性度量基因之间的非线性关联。然而,由于其他基因的存在,该方法估计的基因-基因关联包括直接关联和间接关联。为了克服这一问题,提出了条件细胞特异性网络方法(conditional cell-specific network method, c-CSN),该方法通过评估基因之间的条件独立性来过滤掉间接关联,极大地提高了基因-基因关联的可靠性。然而,当估计的基因对与条件基因强连锁时,知道条件基因就等于知道了它的强连锁基因,这就意味着条件独立性总是成立的,即无论估计的基因对是否连通,我们都假定它不连通。这样就产生了低估和假阴性问题。偏独立性是为了解决估计不足问题而提出的一个新的统计概念。Zhao等人不仅提供了理论证明,还在模拟和真实数据集上进行了验证。验证结果均显示了偏独立性对强连接网络中非线性直接关联量化的优势。 

针对c-CSN方法的不足,Wang等人提出了一种偏细胞特异性网络方法(p-CSN)(图1)。该方法从scRNA-seq数据中为单个细胞构建网络,而无需首先对细胞进行分类。p-CSN的输入是一个不稳定”GEM,输出是基因-基因关联矩阵。为了验证所提出方法的有效性,作者们在模拟和真实数据集上进行了验证。在模拟数据集上,作者们发现p-CSN可以缓解强连接网络中c-CSN的低估问题,从而减少网络构建的假阴性问题。在实际数据集上,p-CSN的偏网络度矩阵(PNDM)具有更好的聚类和可视化效果条件网络度矩阵(CNDM)的性能优于条件细胞特异性网络(CCSNs)。然后,作者们使用p-CSN分析细胞分化过程中基因调控网络的拓扑结构。结果支持剪接体通路在胚胎早期发育中的重要作用。此外,提出了一种基于p-CSN的单细胞网络熵(scNEntropy)方法来量化细胞状态并重建伪时间。在两个胚胎发育数据集上的结果表明,scNEntropy在不同细胞类型间存在显著差异,且scNEntropy重构的伪时间优于其他两种经典算法。最后,将p-CSN方法应用于肺腺癌数据集(LUAD)时,作者们发现与正常样本相比,肿瘤样本中细胞周期通路基因的GEMPNDM发生了改变。此外,还发现GEMPNDM联合使用比单独使用GEMPNDM预测更多的生存结果。 

image.png

1 p-CSN方法的工作流程。(A)利用给定条件基因z的基因表达数据构建每个细胞(如细胞k)p-CSN(B)条件基因zgg = 1,2,3…G )时,单元格kp-CSNs可以集成为一个p-CSNPNDM可以通过每个单元的p-CSN进一步计算。 一方面,PNDM可以应用于聚类分析。另一方面,PNDM可用于计算细胞的scNEntropy,并根据scNEntropy获得细胞的伪时间。p-CSN:偏细胞特异性网络,PNDM:偏网络度矩阵,t-SNEt分布随机邻居嵌入,scNEntropy:单细胞网络熵 

p-CSN方法的详细信息和结果见文献[1] 

参考文献

[1] Wang Y, Xuan C, Wu H, Zhang B, Ding T, Gao J. P-CSN: single-cell RNA sequencing data analysis by partial cell-specific network. Brief Bioinform. 2023 May 19;24(3):bbad180. doi: 10.1093/bib/bbad180.   

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

 

image.png




https://blog.sciencenet.cn/blog-571917-1405542.html

上一篇:NetRank:基于网络的生物标志物发现方法
下一篇:网络生物学的当前和未来方向
收藏 IP: 39.129.48.*| 热度|

2 宁利中 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 23:09

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部