||
ScRNAPip:单细胞RNA数据分析管道
单细胞测序技术是指在单细胞水平上对基因组、转录组和表观基因组进行高通量测序分析的新技术。它可以揭示单个细胞的基因结构和基因表达状态,反映细胞间的异质性。单细胞组学技术由于其高通用性,在癌症、微生物学和神经科学等领域发挥着重要作用。通过单细胞RNA测序(scRNA-seq)获得的大量新信息可能会重塑我们对疾病中基因调控和细胞异质性的理解。
目前,已有超过1500种工具被开发用于scRNA-seq数据分析,涉及30多个类别(https://www.scrna-tools.org/)。这可能是一个巨大的挑战,为研究人员选择合适的工具进行数据分析。在这项研究中,ScRNAPip的目标是建立一个系统的、动态的、可重复的工作流程,并指导用户完成scRNA-seq分析的关键步骤,包括数据过滤、均质化、降维分析、差异分析、伪时间分析、单细胞浏览器、circos图、拷贝数变异(CNV)和基因组不稳定性。这种可重复的分析管道也可以是一个易于修改的配置文件,以合并不同的数据源,并将作为模板来分析和可视化其他疾病模型中的单细胞数据集。此外,考虑到程序运行了很长时间后出现意外崩溃的可能性,在进程中设置了一个可重新启动的断点。
一些单细胞分析工作流程已经开发出来,如scAmpi (https://github.com/ ETH-NEXUS/scAmpi_single_cell_RNA和scTyper (https://github.com/omicsCore/scTyper)。与这些工作流相比,ScRNAPip的工作流包含了更多的分析模块。对于scTyper,(1)它不包括伪时间分析、细胞通讯和功能分析;(2)不具备批量校正功能;(3)可视化效果较少。对于scAmpi,(1)它不包括肿瘤细胞鉴定、细胞通讯和伪时间分析。ScRNAPip的缺点是:(1)局部分析只支持使用一个软件进行分析;(2)对人、鼠以外物种的适用性较弱。
ScRNAPip工作流基于R和Python,并使用fastp (V0.23.2) , CellRanger (V7.1.0) , Seurat (V4.3.0), Monocle2 (V2.26.0)等软件。ScRNAPip不支持质量控制,从其他平台读取数据映射。但是,如果有可用的表达式矩阵,则可以输入它(按照10X表达式矩阵的格式)以用于其他分析点。
ScRNAPip管道(图1)目前既支持人类也支持小鼠。如果要分析其他物种,可按照步骤进行操作,在配置文件中的位置中选择一个物种,然后在配置文件中选择一个物种。(1)从NCBI或Ensembl下载参考基因组的fa和gtf文件。请注意,从NCBI下载的注释文件通常是gff格式,需要使用gffread将其转换为gtf格式。(2)在CellRanger中使用mkref命令构建参考基因组。命令为“CellRanger mkref –genome = genomename –fasta = genome.fa –genes = genome.gtf.”。以上构建的参考基因组可用于CellRanger分析以生成表达矩阵。在随后的高级分析中,可以直接运行细胞相互作用的步骤1-6和步骤8,而无需进行任何更改。步骤7用于拷贝数分析,步骤9用于基因组不稳定性分析,步骤10用于伪时间分析,仅支持人类和小鼠。富集分析的第11步需要更改数据库。
图1 ScRNAPip流程
ScRNAPip可以从https://github.com/OpenGene/scrnapip中获取。
参考文献
[1] Xu, Limin, Zhang, Jing, He, Yiqian, Yang, Qianqian, Mu, Tianhao, Guo, Qiushi, Li, Yingqiang, Tong, Tian, Chen, Shifu, and Ye, Richard D.. 2023. “ ScRNAPip: A Systematic and Dynamic Pipeline for Single-Cell RNA Sequencing Analysis.” iMeta e132. https://doi.org/10.1002/imt2.132
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 23:25
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社