||
单细胞RNA测序数据可视化工具比较
在短短十余年时间里,由于测序协议的出现,每个单细胞测序实验中表征的细胞数量从约1000个细胞增加到数百万个细胞。同时,许多计算方法也被开发出来用于分析和量化单细胞测序数据。典型的单细胞测序分析管道从原始读取开始,对其进行处理以创建一个表达矩阵,其中包含每个细胞中每个基因的表达值。进一步进行细胞聚类和簇特异性标记基因鉴定,并且注释细胞类型。然后使用非线性嵌入方法对结果进行可视化,例如tSNE或UMAP。可视化通常在二维(2D)空间中,每个细胞获得一对X-Y坐标以定义其在可视化图上的位置。最后,通过突出显示细胞元数据(给定实验中关于细胞的信息,例如批量、供体等)或跨细胞类型的特定基因表达,用于评估获得的细胞类型。这种评估只能以交互的方式进行。然而,当结果以报告形式共享或以论文格式(静态2D图像)发布时,只能看到与单个基因和单个细胞元数据相对应的分析快照。最近,以交互方式分析和可视化数据的能力吸引了很多人的注意。网络技术的进步导致了多种工具的发展,通过网络界面共享分析结果。
本次介绍的文献《Comparison of visualization tools for single-cell RNAseq data》试图概述一些目前可用的工具,以帮助研究人员选择数据可视化的方法。在单细胞测序可视化的广阔领域中,首先考虑了13个流行的交互式分析和可视化工具,并概述了它们的特性。然后,选择能够提供网络共享功能的工具,并通过它们在不同大小数据集(从5000到200万个细胞)上的性能来相互基准。另外,作者们还评估了这些工具的用户体验特性。最后,由于所有工具都有不同的输入要求,作者们开发了一个R包sceasy(https://github.com/cellgeni/sceasy),用于灵活地将一种数据格式转换为另一种格式(这也是这个工具包的重要特性)。
13种流行的单细胞测序分析和可视化工具有ASAP、BioTuring Single Cell Browser (Bbrowser)、cellxgene、Granatum、iSEE、loom-viewer、Loupe Cell Browser、SCope、scSVA、scVI、Single Cell Explorer、SPRING和UCSC Cell Browser。图1从云和web支持、容器化、支持的输入格式和开发人员活动方面比较了这些可视化工具。
图1 可视化工具及其功能概述
单细胞测序数据的大小和容量在过去十年中呈指数级增长,这为科学发现和理解开辟了新的途径。科学家们需要将他们的数据传达给合作者和同事,以便快速和容易地进行探索。理想情况下,应该从数据接收者那里消除计算资源和生物信息学技能的负担。
单细胞交互分析和可视化工具已被研究界广泛采用。它们使数据导入、公共数据访问和分析对用户来说更加容易,并加速了科学的发展。此外, 由于最近网络技术的进步,现在有一些工具(图1中那些具有Web共享功能的工具)允许用户在网络上托管和共享他们的单细胞测序数据可视化。这使得以用户友好的方式与他人共享分析结果成为可能,从而实现更快的科学开发。单细胞测序数据的高复杂性和维数只能通过全面的、交互式的和用户友好的工具来显示,这些工具可以通过网络提供可共享的可视化。
单细胞测序技术仍在快速发展中,预计数据集大小(每个数据集的细胞数量)在未来几年将进一步增长。相对于细胞计数,工具必须适合线性或次线性内存使用量的这种增长。为了保持竞争力,其他工具将不得不进行调整和优化。优化的一种方法是添加与HDF5格式的集成。一种更简单的方法是以随机方式选择一小部分细胞,对数据进行低采样。大多数工具都支持此功能。当进行低采样时,重要的是要确保稀有细胞群没有被移除。其中一种方法是几何素描—一种在保留罕见细胞状态的同时对大量单细胞测序数据集进行子采样的方法。
此外,通过使用3D图而不是2D或使用虚拟现实来丰富可视化。三维可以分辨二维中看不到的细胞类型。虚拟现实可以在同一个VR空间中支持多个嵌入,从而可以直接进行比较。
文献《Comparison of visualization tools for single-cell RNAseq data》代表了一个快速发展领域的快照,工具将会赶上或退出竞争,新的工具也将会出现。设计人员和开发人员不仅需要考虑可视化的效率和可伸缩性,还需要考虑可以丰富数据可视化并提供更科学见解的附加功能。一个例子是将数据集与公共单细胞测序数据进行用户友好的集成。这已经在商业产品中发生了,例如,Bbrowser为选定的细胞群提供了基于公开可用数据的细胞类型建议。它还提供了从与所选细胞相似的公共数据中搜索特定细胞的能力。值得注意的是,命令行工具具有完全相同或类似的功能。然而,将这一功能放在一个交互式的用户友好界面中,可以在整个研究界共享和探索结果,进而促进科学进步。
参考文献
[1] Cakir B, Prete M, Huang N, van Dongen S, Pir P, Kiselev VY. Comparison of visualization tools for single-cell RNAseq data. NAR Genom Bioinform. 2020;2(3):lqaa052. doi: 10.1093/nargab/lqaa052.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-18 07:18
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社