||
SWEET:用于破译疾病个体特征的单样本网络推理方法
在大多数情况下,特别是对于复杂疾病,表型变化被认为是难以通过单一分子(如基因和蛋白质)或途径完全阐明的。相反,复杂网络经常被用来表征生物过程中的扰动,因为网络结构会随着表型变化而改变。然而,目前作为背景的生物网络仍然不完整,并且属于各种细胞类型和状态实验得出的聚合网络,这意味着很难直接使用这些网络来研究结构变化如何反映特定疾病(或细胞类型/状态)的表型改变。为了估计特定表型的生物网络,先前的研究已经提出,可以通过多个样本中测序数据(例如基因表达)中分子对之间的相关系数来评估共表达或基因调控网络。尽管这些数据代表了一系列的表型,但推断这些类型的方法网络需要考虑多个样本,因此被视为跨样本总体共享的聚合网络,而不是单样本网络(single-sample networks,SINs)。实现个性化医疗的一种方法是通过研究细胞组分之间相互作用的模式,以及这些网络结构的变化如何有助于反映不同细胞、多个组织和不同表型之间的同源/异质性,从而揭示每个个体的疾病分子机制。然而,准确地构建SINs以捕捉疾病的个体特征和复杂性仍然是一个关键的挑战。
为了支持这一追求,已经开发了几种基于SINs推理来探索样本水平特征的方法,例如线性插值来获得单个样本的网络估计(LIONESS),样本特异性网络(SSN)和细胞特异性网络(CSN)。SSN方法使用一个案例样本对一组控制样本的统计扰动分析来构建每个案例样本的SIN。虽然对照样本可以用来过滤估计的共表达网络中的噪声,但这一要求也限制了它们的应用,例如基于细胞系和单细胞的分析。为了弥补这一局限性,CSN方法基于统计依赖的新理论模型设计,将数据从“不稳定”的基因表达转换为“稳定”的基因关联。然而,这些方法依赖于对底层表达数据的差异分析,因此可能会错过人群中共享的任何信息。为了避免依赖差分分析,Kuijjer等人提出了LIONESS方法,在案例样本总体中重构聚合网络,并通过线性插值进一步估计每个案例样本的SINs;换句话说,它是一种从聚合网络逆向工程SINs的方法。长期以来,人们已经知道,常见疾病实际上由许多亚群或内型(即内在亚群)组成,其特征在于表现出的表型不同,并且往往存在不同的潜在机制。例如,在一组患者中存在不同的癌症亚型。然而,在SSN方法的统计扰动模型中、在CSN方法的统计依赖模型中以及在LIONESS方法的从聚合网络中删除单个样本的模型中,样本量差异可能会导致网络大小偏差。
为了解决这些问题,Chen等人提出了样本特定加权相关网络(sample-specific- weighted correlation network,SWEET,图1)方法,该方法可以通过考虑(i)在没有先验知识的情况下亚种群之间的内在个体/异质性(即全基因组样本权重)和(ii)对每个案例样本的扰动网络对一组案例样本的总体网络进行统计扰动分析来估计SINs。利用TCGA中收集的16种癌症类型的RNA测序(RNA-seq)数据进行仿真分析,结果表明全基因组样本权重可以有效减少由于内在亚群大小不平衡而导致的网络边数偏差(即网络变异)。与其他SIN推断方法相比,SWEET 识别的SIN更可能符合无标度特征,与人类蛋白质-蛋白质相互作用(PPI)网络有更高的重叠,在16种癌症中识别癌症驱动基因、癌症基因和预后基因具有更好的性能。对来自TCGA的7177例患者样本和来自CCLE项目的1101个细胞系的RNA-seq数据的分析进一步验证了SWEET方法在表征体细胞突变基因SMGs)、多驱动基因(MDGs)和必需基因等个体特征方面的有效性。SWEET方法结合网络接近性的使用有助于鉴定可重复使用的药物。此外,通过应用SINs的网络度矩阵,SWEET方法不仅可以有效区分不同的癌症类型(或细胞系类型),还可以识别出两种具有不同临床特征的肺腺癌(LUAD)潜在亚型。总之,SWEET方法提供了一种从RNAseq数据中为单个样本构建SINs的方法,解决了当前SIN推断方法的几个局限性,并提出了生物网络系统的观点,以弥补当前组学数据的分析。
图1 SWEET结构示意图。(A)通过全基因组表达谱量化样本权重,以调整内在种群之间的样本量差异。(B)构建一组病例样本的聚合网络和基于基因共表达的每个病例样本的扰动网络。(C)建立SINs的统计模型,通过全基因组样本权重的整合来评估聚合网络和扰动网络之间的差异。
SWEET与其他方法的详细比较结果见文献[1],相关代码见https://github.com/SysMednet/SWEET。
参考文献
[1] Chen HH, Hsueh CW, Lee CH, Hao TY, Tu TY, Chang LY, Lee JC, Lin CY. SWEET: a single-sample network inference method for deciphering individual features in disease. Brief Bioinform. 2023 Mar 19;24(2):bbad032. doi: 10.1093/bib/bbad032.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 04:54
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社