||
单细胞转录组数据细胞类型自动识别方法
单细胞测序技术已在多个研究领域发挥重要作用,因为它能够刻画不同组织和细胞群体的异质性和复杂细胞类型。传统的单细胞转录组数据细胞类型识别方法耗时、先验知识依赖来进行人工注释。相比较而言,单细胞转录组数据细胞类型自动识别方法具有快速、精准、更加用户友好的优势。鉴于此,本次介绍一篇单细胞转录组数据细胞类型自动识别方法综述论文(图1)。在预测精度、F1值、非标识率和运行时间四个方面,该篇综述系统讨论和评估了32种已发表的单细胞转录组数据细胞类型自动识别方法。此外,还介绍了这些方法的优势和劣势,并且取决于已有信息为用户推荐合适的细胞类型自动识别方法。同时,也对这些细胞类型自动识别方法的未来挑战和应用进行了讨论。最后,为方便使用这些细胞类型自动识别方法,作者们也开发了一个免费R工具包AutomaticCellTypeIdentification(https://github.com/xiebb123456/AutomaticCellTypeIdentification)。
图1单细胞转录组数据细胞类型自动识别方法综述论文
目前,细胞类型识别方法主要分为传统和自动。传统识别方法输入数据为测试数据集,自动识别方法按照输入数据类型又分为三种:积极学习(eager learning)、消极学习(lazy learning’)和标志物学习(marker learning)。积极学习和消极学习的输入数据为训练数据和测试数据,标志物学习输入数据为生物标志物数据和测试数据。从方法角度,传统识别方法采用非监督聚类方法,自动识别方法则采用分类器、最临近细胞和打分函数方式。详细比较见图2所示。
图2 传统和自动细胞类型识别方法在输入、方法和输出方面的概述
按照方法类型、方法特点、分类器、是否提供先验知识、是否能预测新的细胞类型、编程语言和输入数据格式条目划分,32种细胞类型自动识别方法的基本情况如表1所示。
表1 32种细胞类型自动识别方法汇总
详细的比较结果就不罗列了,最终发现:三种各不同类别的细胞类型自动识别最优方法在六种(准确率、F1值、非标识率、特异性、敏感性、运行时间)评价指标下表现相似。积极学习方法中,clustifyr,scHPL和scPred在所有指标中表现最优,SingleCellNet,SciBet和Seurat在准确率、F1值和运行时间方面表现良好。消极学习方法中,CellFishiing.jl方法表现最优。标志物学习方法中,SCSA, SCINA,scTyper和CellAssign方法表现最优。给定数据集,如果在组织或器官的数据集已经预先注释,那么更倾向于选择积极和学习方法,因为它们在准确率和运行时间方面表现更优。如果训练数据中的标识信息没有或者训练数据缺失,则推荐标志物学习方法。最后,先验信息对于任何一种细胞类型识别方法而言,都有助于提高它们的细胞类型识别准确率。
参考文献
[1] Xie B, Jiang Q, Mora A, Li X. Automatic cell type identification methods for single-cell RNA sequencing. Comput Struct Biotechnol J. 2021 Oct 20;19:5874-5887. doi: 10.1016/j.csbj.2021.10.027.
以往推荐如下:
2. Any RNA
3. 癌症内RNA
4. 一对搭档:计算与生物
5. miRNA组学
7. 细胞通讯推理框架
10. 环状RNAs与衰老
11. 生物网络的关系推断
12. 网络模块识别已20年
13. miRspongeR 2.0版本来了
14. 单细胞测序技术进展
16. 细胞特异性因果调控网络识别
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 21:22
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社