||
空间转录组学技术、数据资源和分析方法指南
包括人类在内的多细胞生物是由组织和器官组成的,这些组织和器官都专门从事单一的生物过程,由大量的细胞组成。尽管构成多细胞生物的数百种细胞都共享相同的基因组,但它们的基因表达模式却截然不同。这种差异不仅是由内部基因调控引起的,而且是由来自外部组织微环境的信号引起的。从批量RNA测序到单细胞RNA测序(scRNA-seq)转录组学技术的发展将细胞基因表达的知识推进到单细胞水平。这些转录组测序技术积累了丰富的细胞类型特异性基因调控信息,但不可避免地破坏了原有的组织结构。因此,悬浮液中的单细胞失去了组织的空间位置信息,导致一些单细胞在酶解过程中或离开特定微环境后基因表达谱发生变化。此外,某些形态特殊的细胞,如大脑中结构复杂的神经元和神经胶质细胞,很难通过组织酶解获得。单个细胞之间的连接仍然被破坏,这很难恢复真实的样品状态,并且导致对细胞与外部环境之间相互作用的理解有限。因此,一系列空间转录组学技术被开发出来,可以更全面、更直观地描绘组织中基因的表达,被Nature Methods选为2020年最有价值的年度方法。
空间转录组学技术用于在空间水平上解析RNA-seq数据,可以同时获得细胞的空间背景和转录模式,从而提高我们对组织结构的理解。细胞作为生物体的基本单位,在特定的空间位置与微环境相互作用,发挥其特定的生物学功能,因此空间位置信息对于研究和理解细胞生物学、肿瘤生物学、发育生物学等学科的发生机制尤为重要。显微技术(包括超分辨率和单分子成像)、多重荧光原位杂交等技术的发展加深了我们对细胞和组织结构和功能的认识。测序技术使我们能够对未知细胞或组织中的基因表达进行定量和定性分析。空间转录组可以结合显微成像和测序技术获取基因表达数据,同时最大程度地保留样本的空间位置信息,使研究人员能够发现更有价值的结果。揭示空间组织结构的功能和异质性是生物学研究的基础。这一需求推动了许多空间转录组学技术的发展。
由于测序成本的降低、显微镜和成像技术的改进以及计算能力的提高,空间转录组正在迅速发展和完善。基于不同方法的空间转录组学技术得到了发展和完善,生成和积累了大量包含空间信息和基因表达信息的非结构化数据。同时,大量分析空间转录组数据的计算方法也应运而生。然而,空间转录组学技术、数据资源和分析方法的多样性和复杂性都使不熟悉该领域的研究人员感到头晕目眩,无法快速入门。因此,Yue等人致力于编制一个简单的空间转录组学图谱,为研究人员提供空间转录组学技术、数据资源和分析方法的指导。具体而言,他们首先将22种不同的空间转录组学技术(图1)根据其技术基础分为四类,并对每一类技术进行了详细介绍,以帮助研究人员从目标上选择最适合的技术。其次,他们人工收集了479篇文章中的791个空间转录组数据集(图2),并对这些可用数据进行了整合,以方便数据采集可访问性和后续分析。第三,他们将70种用于分析空间转录组数据的计算方法(图3)组合在一起,并精心安排它们用于各种研究目的,如降维、聚类和细胞-细胞相互作用。第四,讨论了空间转录组学在分子生物学背景下的重要意义和空间多模态组学的发展趋势,并描述了空间多模态组学在肿瘤组织中的未来应用价值。最后,对空间转录组学技术、数据资源和分析方法进行了总结和展望,以指导当前和未来的空间转录组学研究。
图1 空间转录组学图谱及相关技术发展。标记的日期是指论文的接受日期,而预印本文章是指在线出版日期。Visium可参考10X geoonomics官方网站上的新闻稿。所选择的十种技术代表了空间转录组技术的发展,并与文本中的解释一起,提供了空间转录组进化的准确图景
图2 空间转录组数据集的统计。a 数据库中文件在各国间分布的差异。b 两种技术线的文章数量趋势图。数据截止到2022年12月31日。c空间转录组实验中使用的实验材料类别。d用于成像技术的人类和小鼠器官或组织的百分比。e在基于测序的技术中使用的人类和小鼠器官或组织的百分比
图3 数据分析工作流程。a、基于成像技术的预处理过程。b、基于NGS数据的预处理流程,以Visium数据为例。c、预处理后得到基因定位矩阵和基因表达矩阵。d、不同数据源组合及批次效果校正。e、数据的维度降低,以减少需要分析的度量标准的数量,同时保留尽可能多的信息。然后对具有相似表达模式的斑点进行聚类,并通过非线性降维(t-SNE或UMAP)将聚类结果可视化。f,结合空间转录组学数据和来自同一样本的单细胞测序数据预测细胞类型。g,结合带注释的同源单细胞数据,通过反卷积或整合从空间转录组数据中预测细胞类型。h,利用空间维度信息计算空间变量基因。i、对基因表达信息进行共表达分析,挖掘不同基因表达的相关模式。j、通过结合基因表达模式和细胞类型注释来定义空间区域和识别可能的组织亚区域。k,通过空间转录组数据的空间维度信息分析细胞间相互作用。l、利用基因表达的空间信息分析基因相互作用。m,随着时间的推移重塑细胞在空间中的轨迹,并利用空间维度信息推断细胞之间的进化和分化过程。n、利用序列或配对切片中基因表达相似性和位点之间的空间距离对空间转录组数据进行对齐和整合,并可视化3D模型
参考文献
[1] Yue L, Liu F, Hu J, Yang P, Wang Y, Dong J, Shu W, Huang X, Wang S. A guidebook of spatial transcriptomic technologies, data resources and analysis approaches. Comput Struct Biotechnol J. 2023 Jan 16;21:940-955. doi: 10.1016/j.csbj.2023.01.016.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 13:36
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社