||
单细胞RNA-seq在生物医学研究和临床应用中的数据分析指南
复杂组织由多种细胞类型组成,这些细胞类型以各种各样的混合物和状态出现。每个细胞中包含的功能基因组信息往往与邻近的细胞群甚至同一类型的细胞有很大的不同。这意味着对大块组织中细胞群的分子分析本质上是不可靠和不敏感的。通过在单细胞分辨率下定量分子改变,可以获得令人难以置信的灵敏度和特异性,这为揭示疾病发病和进展的分子机制提供了前所未有的机会。自诞生以来,单细胞RNA测序(scRNA-seq)已被证明是分析单个细胞中基因表达的有力工具,在生理发生和发病机制中都是如此。例如,利用scRNA-seq在癌症生物学中,研究人员已经能够确定各种肿瘤类型中癌细胞的起源。此外,从治疗和预后方面,还发现了具有临床显著特征的恶性细胞亚群,如鼻咽癌中具有上皮-免疫双重特征的预后不良。同样,在转移性乳腺癌细胞中也观察到强烈的上皮到间充质转化(EMT)和干细胞特征。在scRNA-seq的帮助下,类器官系统的质量和有效性也可以得到准确的评估和系统的评价。患者来源的类器官模型目前正被应用于疾病病理解剖和促进药物筛选以进行个性化治疗。此外,通过联合应用患者源性类器官和scRNA-seq,发现了肿瘤进展过程中不同的细胞状态,并鉴定了耐药细胞亚群。在冠状病毒(COVID-19)大流行中,scRNA-seq加速了表征严重急性呼吸综合征冠状病毒2 (SARS-CoV-2)分子基础的研究,从而了解其病理。多种基于scRNA-seq的研究揭示了SARS-CoV-2靶向的细胞亚型,描绘了感染后免疫细胞的基因表达变化,量化了不同细胞类型间相互作用的改变,为开发潜在的COVID-19治疗方法提供了重要资源。
自商业单细胞平台出现以来,包括10×基因组和Singleron提供的平台,研究机构或第三方公司的核心设施提供的scRNA-seq服务使该技术更容易获得、负担得起,并在某些情况下成为生物医学研究人员和临床医生的常规技术。虽然这些服务提供商通常执行数据质量控制和执行数据处理的基本管道,但通常无法提供特定研究目标和科学问题所需的高级数据分析。因此,大多数生物医学研究人员需要通过确定最合适的计算工具来分析他们的数据,从而掌握scRNA-seq数据分析的全部范围。
为了克服scRNA-seq数据分析的障碍,特别是在生物医学研究中,Su等人旨在:1)总结分析生物医学scRNA-seq数据中每个分析任务的算法开发和基准测试结果的最新进展;2)介绍一个由更适合生物医学应用的推荐软件工具组成的工作流。 工作流程(图1)包括基本的scRNA-seq数据处理、质量控制(QC)、特征选择、降维、细胞聚类和注释、轨迹推断、细胞-细胞通讯(CCC)、转录因子(TF)活性预测和代谢分析。除了推荐的工作流程外,还提供了示例计算脚本以及软件环境设置,方便研究人员在本地进行数据分析。计算代码可在https://github.com/WXlab-NJMU/scrna-recom获取。为了适应即将到来的高级方法和更多的应用场景,作者们将保持计算脚本的更新。
图1 工作流程
参考文献
[1] Su M, Pan T, Chen QZ, Zhou WW, Gong Y, Xu G, Yan HY, Li S, Shi QZ, Zhang Y, He X, Jiang CJ, Fan SC, Li X, Cairns MJ, Wang X, Li YS. Data analysis guidelines for single-cell RNA-seq in biomedical studies and clinical applications. Mil Med Res. 2022 Dec 2;9(1):68. doi: 10.1186/s40779-022-00434-8.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 19:36
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社