zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

空间转录组学的整合分析方法

已有 1628 次阅读 2023-5-10 09:33 |个人分类:科普|系统分类:科普集锦

空间转录组学的整合分析方法 

多细胞生物是由组成它们的细胞以及这些细胞之间的关系来定义的,这些细胞部分被细胞的空间组织所捕获。尽管单细胞转录组测序(scRNA-seq)在将细胞表征为独立元素方面产生了变革性的影响,但这种技术失去了细胞关系的许多方面,包括空间分布。新开发的工具专注于检测组织中细胞的空间组织,但在空间分辨率和RNA转录本之间往往存在权衡。因此,有必要将空间分辨的转录组数据与scRNA-seq/或组织学数据相结合,以弥合这些权衡,并更好地理解组织的空间组织。 

尽管重点关注分析过程的不同部分,但两种方法SpaGCNTangram分别是数据集成的计算方法,以改进空间表达的解释(图1)。SpaGCN专注于结合现有的组织学来识别空间结构域,并随后识别空间簇之间差异表达的基因。尽管Tangram也包含了这些步骤的各个方面,但其主要重点是提供与scRNA-seq数据的跨模态数据集成。在这种整合之后,可以使用Tangram完成许多分析任务,例如在非转录组范围的空间数据中输入额外的基因,或者将非细胞分辨率的空间数据去卷积为细胞类型比例。TangramSpaGCN完成的不同形式的分析在很大程度上是互补的。 

image.png

1 空间分辨转录组学的SpaGCNTangram分析方法的示意图比较。a. SpaGCN将组织学信息、用户定义的感兴趣区域(ROI)和空间转录组学集成到图卷积网络(GCN)中,并对图表示进行无监督聚类,以获得一组空间域。b. Tangram将单细胞数据与空间分辨数据对齐,以获得具有单细胞样质量的估算和去卷积空间域。 

SpaGCNTangram是空间转录组学计算方法发展的一部分。这一发展是由空间分辨率数据和生成数据的技术所驱动的。SpaGCN在这一群体中是不寻常的,因为它结合了解析空间域和计算差分表达式的方法(而不仅仅是其中之一)。与SpaGCN一样,Tangram使用组织学数据,但其重点是将任何类型的单细胞(或单核)RNA-seq与用各种方法工具包装的空间数据进行比对。Tangram作为单细胞和空间整合工具的使用将有助于满足人们对从scRNA-seq获得的原位簇可视化的普遍需求。尽管一些早期的工具是特定于一种类型或类别的空间实验的,但SpaGCNTangram都可以应用于实验分析,并且是空间领域的通用工具。 

随着实验技术的不断改进,高空间分辨率和所测定转录组百分比之间的差距继续缩小。然而,在新技术有望以亚细胞分辨率覆盖整个转录组之前,计算数据集成是弥合这一差距所必需的。尽管最近的方法是针对空间数据定制的,但基本模型通常更通用。本质上,信息以结构化的方式在数据集中的细胞之间共享,以最大限度地减少噪声,然后在数据集中对齐细胞。如果空间元数据可用于这些细胞集合中的一个,或者细胞之间共享信息的方式由已知位置定义,则这些数据集成方法成为空间数据集成方法。 

一个突出的讨论点是数据集成方法的前景,通过创建大型集成数据集(如人类细胞图谱),使我们更接近于对生物学的真正多模态理解。由于蜂窝定位是最基本的元数据类型之一,因此空间数据的集成对于将大规模数据集成到公共框架中非常重要。这将允许对基础数据和方法进行评估,这是该领域目前面临的一个重大挑战。随着方法的改进和参考数据的出现,揭示了导致疾病或其他表型的变异的新驱动因素差异也应该成为可能。尽管一些表型差异反映了细胞的自主变异性,但很大一部分可能是由细胞之间的关系产生的。揭示这些细胞-细胞关系如何促进组织功能的逻辑是这些综合方法及其背后数据开辟的一条重要途径。 

分析方法技术改进的一个重要事实为目前的评估在性质上是定性的。尽管这并没有直接限制方法的有效性,但它确实限制了我们对如何最好地应用或改进方法的理解。例如,空间聚类方法或细胞类型的空间分布的识别通常用显微镜图像进行可视化,并且当这些计算定义的特征与组织的细胞结构和形态相匹配时,被认为是良好的表示。有一些流行的统计度量,例如用于确定空间自相关的度量,但这些度量并不能反映所有类别的空间分析任务的性能。除了以TangramSpaGCN为代表的空间分析的进步之外,其他空间工具也很有用。与任何新领域一样,为了更好地理解许多空间分析工具的优缺点,需要在空间分辨转录组学分析工具之间建立独立、严格和定量的基准。 

展望未来,SpaGCNTangram等工具将在建立直接源自基因表达数据的空间区域方面发挥重要作用,而不是根据传统商定的解剖边界来定义。尽管基因表达不一定是全部和最终的,但它提供了一个统一的定量框架,将细胞和组织水平的活性联系起来。由空间表达定义的边界将连接器官形成中的细胞-细胞通讯、细胞迁移和形态发生等过程。空间分辨转录组学的分析工具通常采用数据优先的方法来理解生物学,有时被描述为无偏见,但与现有的生物学知识相结合来理解因果机制最终需要可测试的假设与高质量的数据相结合。 

对于未来的研究来说,特别重要的是与进化和发展及其相互作用有关的问题,因为空间领域的模块化扩展以创建新的功能是两者的重复主题。进化和发展为收集数据提供了广阔的空间,需要考虑一类新的集成,SpaGCNTangram等系统工具将是必不可少的。尽管这些工具可以捕捉大脑中的形态模式等生物现象,但聚类很难区分进化的副产物和作为选择直接产物的表型特征。跨发育的空间表达应该为分子机制提供有价值的见解,而跨物种的空间表达有助于捕捉选择和保护。 

空间基因组学、谱系追踪和克隆鉴定中可用的分子工具的快速并行开发,以及SpaGCNTangram等计算方法,将开启实验设计和发现的新时代。空间分辨转录组学有可能成为这十年的革命,就像前十年的单细胞技术一样。这些分析工具将有助于实现这一潜力。

 

参考文献

[1] Lu S, Fürth D, Gillis J. Integrative analysis methods for spatial transcriptomics. Nat Methods. 2021 Nov;18(11):1282-1283. doi: 10.1038/s41592-021-01272-7.

[2] Biancalani T, Scalia G, Buffoni L, Avasthi R, Lu Z, Sanger A, Tokcan N, Vanderburg CR, Segerstolpe Å, Zhang M, Avraham-Davidi I, Vickovic S, Nitzan M, Ma S, Subramanian A, Lipinski M, Buenrostro J, Brown NB, Fanelli D, Zhuang X, Macosko EZ, Regev A. Deep learning and alignment of spatially resolved single-cell transcriptomes with Tangram. Nat Methods. 2021 Nov;18(11):1352-1362. doi: 10.1038/s41592-021-01264-7.

[3] Hu J, Li X, Coleman K, Schroeder A, Ma N, Irwin DJ, Lee EB, Shinohara RT, Li M. SpaGCN: Integrating gene expression, spatial location and histology to identify spatial domains and spatially variable genes by graph convolutional network. Nat Methods. 2021 Nov;18(11):1342-1351. doi: 10.1038/s41592-021-01255-8.

 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

 

image.png




https://blog.sciencenet.cn/blog-571917-1387449.html

上一篇:自我监督学习食谱
下一篇:通过深度学习识别空间转录组学中的空间域:DeepST
收藏 IP: 202.203.17.*| 热度|

3 宁利中 许培扬 李升伟

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-28 20:28

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部