zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

通过深度学习识别空间转录组学中的空间域:DeepST

已有 2824 次阅读 2023-5-14 19:13 |个人分类:科普|系统分类:科普集锦

通过深度学习识别空间转录组学中的空间域:DeepST 

组织由不同的细胞组成,其空间组织对发挥其生物功能具有重要意义。空间转录组(ST)的最新进展,如10×Visiumhttps://www.10xgenomics.com/)、SlideeqStereoseq,使得通过原位测序在转录组水平上理解组织功能和细胞结构成为可能。 

识别空间结构域(即在基因表达和组织学上空间一致的区域)是空间转录组学中最重要的课题之一。目前,识别空间域的方法主要可分为两类,非空间聚类方法和空间聚类方法。传统的非空间聚类算法,如K-meansLouvain,以基因表达数据为输入,导致聚类与组织切片几乎不对应。另一方面,已经开发了将基因表达、空间位置和形态学相结合的空间聚类方法,以解释基因表达的空间依赖性,从而更好地匹配空间位置。BayesSpace采用完全贝叶斯统计方法,使用空间先验将附近位置归属于同一集群。stLearn是一种组织内标准化技术,该技术基于从形态学图像和空间位置收集的特征,使用形态学距离来标准化基因表达。 SpaGCN结合基因表达、空间位置和形态学数据,通过生成捕获数据的空间依赖性的无向加权图来识别空间域。SEDR采用深度自动编码器网络和图形自动编码器来嵌入空间信息。尽管这些算法可以将斑点或细胞识别为不同的域,但它们主要依赖于线性主成分分析来提取高度基因表达的可变特征,涉及线性转换,因此它们无法对复杂的非线性相互作用进行建模。即使现有的方法也可以提供一些有用的信息,但这些工具往往不能充分利用空间信息,并且在预测组织结构方面受到限制。此外,大多数用于分析大量ST数据的空间方法无法正确校正批量效应,并且它们无法处理其他空间组学数据,这使得它们的通用性较差。总体而言,从ST数据中准确识别空间域仍然具有挑战性。 

在此,Xu等人提出了一种可定制的ST深度学习框架:DeepST(图1),以准确识别空间域。DeepST使用预先训练的深度神经网络模型从形态图像中提取特征向量,然后将提取的特征与基因表达和空间位置数据相结合,以表征空间相邻斑点的相关性,并创建空间增强基因表达矩阵。DeepST使用图神经网络(GNN)自动编码器和去噪自动编码器来联合生成增强ST数据的潜在表示,而领域对抗性神经网络(DAN)用于集成来自多个批次或不同技术的ST数据。对不同平台(例如,10×VisiumSlideqV2Stereoseq)生成的ST数据作为基准进行了广泛的测试,并与现有算法进行了比较。DeepST还可以处理基于成像的分子数据(例如MERFISH4iMIBI-TOF),特别是在MERFISH数据上提取三维(3D)表达结构域。通过对乳腺癌症ST数据集的进一步测试,DeepST识别出了在传统肿瘤内结果中未检测到的可视均质肿瘤区域内的异质亚区域。总之,DeepST在准确识别空间域方面具有强大的能力,在处理额外的空间组学数据方面也具有可扩展性。 

image.png

1 DeepST算法的工作流程。(ADeepST工作流程从ST数据开始,以H&E染色(可选)、空间坐标和空间基因表达作为输入。(BDeepST最初使用H&E染色来收集组织形态学信息,然后使用预先训练的深度学习模型,基于与相邻斑点的相似性来标准化每个斑点的基因表达。通过该矩阵计算相邻斑点之间的形态相似性,并合并基因表达和空间位置的权重,为斑点内的每个基因重新分配增强的表达值。(CDeepST生成三个网络框架,其中去噪自动编码器网络和变分图自动编码器用于提取最终的潜在嵌入,域鉴别器用于融合来自各种分布的空间数据(红点框,仅用于集成任务)。 

对空间转录组学数据分析感兴趣的,可以参考文献[1]DeepST 相关代码可参见:https://github.com/JiangBioLab/DeepST 

参考文献

[1] Xu C, Jin X, Wei S, Wang P, Luo M, Xu Z, Yang W, Cai Y, Xiao L, Lin X, Liu H, Cheng R, Pang F, Chen R, Su X, Hu Y, Wang G, Jiang Q. DeepST: identifying spatial domains in spatial transcriptomics by deep learning. Nucleic Acids Res. 2022 Dec 9;50(22):e131. doi: 10.1093/nar/gkac901. 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

 

image.png




https://blog.sciencenet.cn/blog-571917-1387960.html

上一篇:空间转录组学的整合分析方法
下一篇:癌症研究的下一个重大科学问题
收藏 IP: 39.128.54.*| 热度|

3 农绍庄 许培扬 李升伟

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-5 05:50

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部