||
单细胞测序技术的广泛应用使得我们能够从单细胞精度水平来研究基因。近几年,大量人力物力的投入产生了丰富的单细胞测序数据。基于这些单细胞测序数据,一系列数据驱动生物信息学方法被开发出来。从2001开始,Bioconductor计划就致力于汇集高通量生物学数据分析的开源R软件包,其计划发展与高通量测序技术密不可分。例如,基因测序技术(已经经历了三代)迅速发展,Bioconductor计划就有专门版块开展基因组分析(图1)。
图1 基因组分析Bioconductor论文
5年后,单细胞测序技术发展迅速,Bioconductor计划对单细胞数据也有专门的版块开展单细胞分析(图2)。另外,Bioconductor计划还为单细胞分析专门撰写了一本在线电子书,获取链接:https://github.com/OSCA-source/OSCA。
图2 单细胞分析Bioconductor论文
2009-2019年以来,Bioconductor收集的开源R软件包呈现上升趋势(图3),这篇单细胞分析论文就是策划如何有序的使用这些开源R软件包,也是对在线电子书(https://github.com/OSCA-source/OSCA)的一个提炼。
图3 测序数据分析R/Bioconductor软件包个数趋势图
整篇论文的工作流程(图4)包括:研究计划(实验设计为导向)、数据预处理、导入R、数据处理、下游统计分析和交互式分析。为了统一单细胞数据分析,Bioconductor构建了一个输入数据的标准格式(即SingleCellExperiment类)。这里就不多说了,想使用R/Bioconductor做单细胞分析的可以阅读原文。
图4 分析单细胞数据的Bioconductor工作流程
后话
Bioconductor计划大大方便了高通量生物学数据分析,如果有共享的R代码,可以尝试转化为R/Bioconductor开源软件包,这样也可以督促不断完善实现的功能。如果你开发了一个R/Bioconductor开源软件包,也不要忘记写上“We are grateful to the Bioconductor Project, for the valuable comments on the codes to greatly improve the package.”。
参考文献与链接:
[1] Huber W, Carey VJ, Gentleman R, et al. Orchestrating high-throughput genomic analysis with Bioconductor. Nat Methods. 2015;12(2):115-121. doi:10.1038/nmeth.3252
[2] Amezquita RA, Lun ATL, Becht E, et al. Orchestrating single-cell analysis with Bioconductor. Nat Methods. 2020;17(2):137-145. doi:10.1038/s41592-019-0654-x
[3] https://github.com/OSCA-source/OSCA
以往推荐如下:
1. 因果推理综述推荐一篇
2. 生物学家的机器学习指南
3. 基础模型的机遇与风险
4. 一份单细胞数据分析教程
8. 国外知乎:Quora
11. 预印本知多少?
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-24 03:17
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社