zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

基于液滴的单细胞多组学概念和进展

已有 288 次阅读 2024-8-26 20:23 |个人分类:科普|系统分类:科普集锦

基于液滴的单细胞多组学概念和进展

单细胞测序技术由于其简单、灵活和商业可用性,已成为细胞分子谱分析的固定设备。特别是,通过微流体反应将单个细胞分配到油滴内,可以同时对数千个细胞进行转录组学或多组学测量。与基因组学分析的众多生物学发现相补充,过去十年来,从分析基线带来了新的能力,使人们能够更深入地了解单细胞多组学的复杂数据。在这里,ChowLareau重点介绍了四项创新,这些创新提高了液滴微流控分析的可靠性和理解。他们强调进一步确定技术发展原则的新进展,以及设计、基准测试和实施基于液滴的新方法指导方针。

从基于液滴的单细胞基因组学中获得的经验教训

2009年首次展示单细胞测序以来,单细胞基因组学分析已成为分子生物学工具包中广泛使用的主食,对复杂组织中细胞的分子异质性有了新的认识。多种方法可以实现单个细胞的分割和条形码,包括微孔、分裂池组合索引和液滴乳剂。尽管这些方法在当代工作流程中都可以产生大规模、高质量的数据,但最广泛使用的单细胞方法利用了微滴微流体,微流体仪器被用来制造油乳液,用于在数千个平行反应中对细胞核酸进行条形码。因此,ChowLareau将重点放在基于液滴的技术的概念和发展上。除了比先前基于平板的方法高100倍的通量外,基于液滴的单细胞基因组学为多组学提供了一个技术平台,包括转录组、可及性染色质、蛋白质丰度、微扰以及它们的许多组合。例如,通过测序对转录组和表位进行细胞标引(CITE-seq),可以量化表面蛋白表达和基因表达,从而确定抗体与寡核苷酸的结合。此外,DOGMA-seqTEA-seqNEAT-seq涵盖了中心法则(DNARNA和蛋白质)的所有测量。

最早描述基于液滴的单细胞RNA测序(scRNA-seq)的方法inDropDrop-seq建立了这一关键技术能力,改变了单细胞基因组学。这两种方法都引入了单细胞的大规模平行条形码,使用含有寡核苷酸的油乳剂液滴,这些寡核苷酸包括细胞条形码(14-16个碱基)和唯一分子标识符(UMI)(8-12个碱基),选择长度以确保分子多样性,而不会产生繁重的测序负担。虽然整体概念和设计是相似的,但这些分析在细节上存在差异,这些差异影响了这些单细胞分析的使用和扩展。例如,Drop-seq使用的是受泊松载荷限制的硬树脂珠,而inDrop使用的是软水凝胶珠,实现了亚泊松载荷,使每滴珠的分布更接近一个,从而提高了细胞分析的吞吐量效率。值得注意的是,使用软水凝胶珠也同样被10xGenomics商业化并使用,这是最广泛使用的单细胞测序商业试剂盒。珠子的选择是近年来单细胞基因组学中出现和发展的许多概念之一,包括检测多个细胞或液滴中的珠子策略。

在对基于液滴的单细胞测序的细微差别不断发展的理解的推动下,ChowLareau回顾了四项实验和计算创新,这些创新提高了单细胞基因组学技术的准确性或扩大了其范围。特别地,他们反映了迭代方法开发改进了最先进分析的小插曲。回顾了新方法如何扩展到分析基线之外,这促进了新的计算和实验方法的发展。这些创新产生了单细胞分析,大大提高了信噪比、准确的细胞产量和复杂的多组测量。此外,虽然关注的是基于细胞的测量,但注意到许多类似的进展已经被类似地描述为分析细胞核。在未来的几年里,设想持续的创新源于对基于液滴的单细胞技术发展的技术原理。

创新1:验证和扩展单细胞测量

基线:最多一个细胞必须装入一个液滴中以进行准确的单细胞分析。

新进展:计算和实验策略可以识别具有多个细胞的液滴并去除双峰,增加每次实验的细胞通量。

经验教训:单细胞技术的应用必须考虑有效推断的细胞双重体的频率和比例。通常,新的分析以物种混合实验为基准,以量化双重体率,并假设这些测量对其他情况具有普遍性。新兴的超载液滴方法利用不同的方法来增加细胞吞吐量,同时控制双重体速率。

创新2:利用环境(非细胞)测量

基线:在一个液滴内条形码的所有核酸被聚集并分配到一个特定的细胞。

新进展:统计模型可以利用没有细胞的液滴来估计周围的分子,这可以用来消除潜在的污染。

经验教训:并不是所有的核酸条形码都来自于一个液滴中的一个细胞,在不同的实验中,周围核酸的比率可能会有所不同。对空液滴的分析可以识别周围的分子,这些分子可以从细胞特征矩阵中回归出来,或者在更复杂的模型中加以利用。新的测定方法和计算方法考虑了在条形码中识别为细胞的测量值,可以提高单细胞测量的灵敏度和特异性。

创新3:仅对一个细胞的内容进行一次条形码(除非您不想这样做)

基线:对于单细胞条形码,每个液滴最多应存在一个寡核苷酸偶联的头。

新进展:检测条形码多胞胎的计算方法可以提高现有分析的数据质量,并且放松一个细胞一个条形码的假设可以使分析发展。

经验教训:大多数单细胞分析假设每个细胞的所有核酸都被一个独特的条形码标记。这个假设可能被偶然(影响感知到的细胞数量)或为试验开发而故意违反(例如,用许多微流体装置超载)。利用单细胞基因组学数据的这种技术细微差别可以使新的维度分析发展或解释现有的数据。

创新4:同时测量一个细胞的多个面

基线:单组学测量(例如RNA或染色质)每次测定。

新进展:采用滴内化学的策略可以测量额外的模式,但在测量预期分析物的条形码替代物时需要仔细考虑。

经验教训:新的多组学技术可以将正交测量(包括蛋白质丰度或扰动)与标准测量配对。当检测到这些模式时,条形码和直接定量序列(例如编码gRNA的结合物或原间隔物的CDR3DNA测序)是定量多组特征的最可靠方法。未来的分析必须尽量减少或严格基准使用替代条形码,以避免错误的解释。

总结与未来展望

随着近十年前基于液滴的scRNA-seq的首次演示,这些技术的局限性已经通过新的生物技术工具和生物信息学分析被重新定义。特别是,随着单细胞领域的发展,这些原始发展的基线已经被重新想象。ChowLareau强调了这些创新的四个实例,并共同提出了两个主题,这些主题可能会在未来几十年促进单细胞技术的持续创新。

首先,当评估新的单细胞技术时,明确定义和测试分析假设可以验证并使未来的方法进步成为可能。除了关于装载到液滴中的物质的实验假设外,即单个细胞(1)、无环境分子(2)和单个头(3),还重新审视了广泛持有的假设,即测定基线可以增强对单细胞基因组学数据的解释。检测条形码多胞胎的实验和计算创新的相互作用突出了这一思想(3)。在这种情况下,一种可以检测条形码多胞胎的算法允许将小珠超载成液滴,最终提高了dscATAC-seq检测中的细胞捕获效率。另一个例子是,scATAC-seq分析中典型的预处理步骤需要对降维上游的细胞-峰矩阵进行二值化。最近,两项研究重新审视了这一假设,而不是发现细胞-峰矩阵包含一个动态范围的值,提高了下游分析的性能,例如细胞聚类。因此,在开发新技术时,新的湿实验室协议或计算方法可以推动方法创新。

image.png

1 验证和优化单细胞测量的方法。(A)在基于液滴的测定中,混合实验中潜在的细胞双重体的表现,包括同型和异型双重体。(B)验证单细胞测量值的物种混合实验示意图。(C)典型混合实验的例子,突出了高置信度的人、小鼠和混合的双重细胞。(D)在推荐情况下、过载情况下以及在检测和去除双重分子后的细胞产量和双重分子率估计(紫色)。速率是根据先前的物种混合估计和六层哈希实验的Cell哈希推断估算的。(E)基于寡核苷酸的双重检测方法示意图,包括MULTI-seqCell哈希。(F)低维嵌入基于寡聚散列方法的数据,以识别真实散列实验中的细胞双重体。(G)来自细胞状态测量的单细胞数据的低维嵌入示例(例如,单细胞RNA或转座酶可及染色质的单细胞测定(scATAC-seq)),用于通过模拟双偶和邻居图分析推断潜在的异型双偶。(H)(G)中描述的计算过程的结果,其中预测的异型重态在高维空间中被分类。双重体调用(通过scrublet)和聚类是从真实的scRNA-seq数据中生成的。(1)将细胞超载成液滴并通过供体基因型识别双体的一般方法。(J)染色质可及、RNA和蛋白质的组合预标方法示意图

image.png

2 定量和减轻单细胞分析的噪声。(A)在液滴微流体反应中捕获的RNA分子示意图,包括在液滴微流体和单细胞基因组学之前,组织的细胞/细胞核解离可能产生的环境RNA分子。(B)在低或高环境信号下比较单细胞样本的样例数据膝状图。没有细胞的液滴在灰色框中突出显示。(C)单细胞原始数据的LYZ表达总结()与通过SoupX计算环境RNA的表达比较。(D)环境信号建模前()和建模后()的蛋白质基因组信号,经过背景(dsb)去噪和缩放,突出显示CD4mid髓系细胞(紫色)

image.png

3 单细胞检测中条形码多联体的检测及其影响。(A)假设将单个细胞或细胞核装载到液滴中,可能产生的头部/条形码结果示意图,突出显示了可能产生条形码多胞胎的两个实例。(B)条形码多重组的示例,其中九个有效的单细胞条形码(均通过膝盖截止)标记同一细胞(顶部)。基于对底层条形码序列的分析(下图),该多重片段起源于一个与单个细胞相关的具有许多不同寡核苷酸条形码的头部。(C)条形码多联体对转座酶可及染色质测序(scATAC-seq)实验中选择的单细胞试验中细胞计数的影响(相同的数据集)CellRanger-ATAC v1.1版本不考虑条形码多组,而v1.2版本保留了读取计数最高的条形码,丢弃了其他条形码。(D) scATACseq()和单细胞RNA测序()的关键核酸条形码步骤示意图,注意到两种方法的分子多样性是不同的。(E)在泊松假设下每个液滴平均条形码的分布(λ定义)。在λ = 1处突出显示了具有一个珠的百分比液滴的理论最佳值。(F)计算头寡核苷酸合并后每个细胞的头丰度总结,包括具有两个或多个头寡核苷酸的细胞

其次,由于在单细胞基因组学技术中测量的可能分析物的范围不断扩大,有原则的设计可以提高分析性能和可靠性。物种混合实验(1)仍然是验证单细胞捕获的金标准。考虑到新的检测方法对来自同一细胞的多个测量进行耦合,作者们强调了多组学设计的成功应用(4),它催化了异质分析物的检测和定量。尽管存在许多潜在的解决方案,但简约的方法允许更大的互操作性和未来的开发。例如,ASAP-seq中的桥接寡核苷酸允许重复使用现有的CITE-seq试剂,尽管凝胶珠上的捕获顺序在不同的测定之间发生变化。这种经济的设计实现了快速扩展,包括scCUT&Tag-pro,它可以绘制组蛋白修饰,并通过共同的表面蛋白质组量化将不同的测量结果联系起来。同样,在CROP-seq中的捕获策略,直接将细胞条形码与原间隔器相关联,与原始Perturb-seq实现中的相关条形码相比,可以更可靠地检测gRNA,最终减轻了慢病毒包装过程中可能发生的条形码交换问题。因此,建立尽可能接近分子来源的实验系统可以增强单细胞分析中新分析物的实用性和可解释性。从这个意义上说,作者们强调了新的测序化学的变革潜力,包括长读技术和生物信息学工作流程(例如scNanoGPSBlaze),它们可以从源分子的直接测量中提供更深入的见解。

image.png

4 单细胞多组学分析的概念和机会。(A)单细胞多组学测量总结。相同的细胞在降维空间中表示。通过转座酶可及染色质测序(ATAC)和选择抗原测序(ASAP-seq)对骨髓单核细胞进行分析,并嵌入细胞类型(来自染色质可及性)、细胞表面蛋白和线粒体(mt)DNA突变的克隆性的补充测量。(B)慢病毒包装过程中发生的条形码交换总结,这是原始Perturb-seq设计中已知的混杂因素。(C)蛋白质基因组学工作流程的试剂示意图,包括用于测序转录组和表位的细胞索引(CITE-seq)和在PHAGE-ATAC中显示纳米体的M13噬菌体等检测的寡聚偶联抗体。(D) PHAGE-ATAC方法综述,该方法直接扩增编码蛋白结合物的单链DNA(E)示意图表明噬菌体-ATAC试剂是可再生的,是单细胞试验中的一个关键和新颖的特征

总之,单细胞基因组学技术的广泛生物效用已经建立了这些检测作为分子生物学工具包的关键工作流程。通过反思过去几年的这些创新,本文提供了一个新的视角,可能会加快未来的方法开发。

参考文献

[1] Chow A, Lareau CA. Concepts and new developments in droplet-based single cell multi-omics. Trends Biotechnol. 2024, doi: 10.1016/j.tibtech.2024.07.006.

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

image.png

 



https://blog.sciencenet.cn/blog-571917-1448292.html

上一篇:SBM:使用随机块模型重新评估基因共表达网络的模块化
收藏 IP: 202.203.17.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-8-27 00:13

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部