||
CHARM:通过单细胞四组学测序解析基因调控图谱
细胞核基因组在基因调控中起着核心作用,并编码多层表观基因组信息。在基本层面上,基因组 DNA 紧密缠绕在组蛋白上形成核小体,这限制了除启动子和增强子等可及区域外对调控元件的访问。组蛋白携带翻译后修饰,如甲基化和乙酰化,通过调节染色质状态和招募调控因子来影响基因表达。核小体进一步包装成更高级的三维结构,这些结构作为基因组调控的功能框架,深刻影响转录活性。
基于测序的技术最新进展,包括用于染色质可及性的染色质可及性测序 (ATAC-seq)、用于组蛋白修饰的切割目标并标记 (CUT&Tag) 和用于 3D 基因组结构的 Hi-C,已经能够对多种生物样本中的这些表观基因组特征进行表征。然而,为了全面理解这些调控层如何协同作用以定义细胞身份和功能,必须在同一细胞内同时测量多种表观基因组模式和基因表达。单细胞多组学技术,包括最近报道的包含 3D 基因组表征的方法,已经开始应对这一挑战,但大多数只能捕获两种或三种模式。尽管这些数据集可以在计算上整合,跨实验方法容易受到批处理效应和技术变异的影响,并且它们不能确保在不同细胞中测量的模式真正反映了同一细胞核内的调控汇聚。
最近,Chen等人开发了 CHARM——一种用于染色质构象、组蛋白修饰、染色质可及性和 RNA 表达多组学分析的单细胞检测方法。使用 CHARM,在小鼠胚胎干细胞(mESC)和脑组织中绘制了单细胞分辨率的基因调控图谱。这个全面的多组学数据集使我们能够将细胞类型特异性的调控元件与其靶基因联系起来,并解析表观遗传调控不同层次之间的复杂相互作用。
CHARM 的设计与验证
作者们先前开发了一种单细胞多组学测序技术,Hi-C 和 RNA 测序同时应用(HiRES),该技术能够在同一细胞内联合分析 3D 基因组结构和转录组。基于 HiRES,进一步结合了使用 Tn5 转座酶进行染色质标记的步骤,以靶向可及染色质区域和特定的组蛋白修饰,类似于 ATAC-seq 和 CUT&Tag(图 1a)。在逆转录和邻近连接之后,单细胞通过流式细胞仪分选到单独的管中,其中基因组、表观基因组和转录组材料在单个反应中共同扩增。随后,来自每种模式的测序读数使用在标记化和逆转录步骤中引入的唯一序列标识符在计算机中分离。这种策略消除了对分子组分进行物理分离的需要,从而提高了效率并简化了高通量应用的流程。
作为一个概念验证,作者们将 CHARM 应用于来自 C57BL/6J × CAST/EiJ 杂交品系的 mESC。测序后,960细胞里面的805个在所有 4 种模态均通过了质量控制。在去除重复读数后,CHARM 从 5,432 个基因中检测到每细胞中中位数为 17,163 个 RNA 独特分子标识符(UMI)、52,302 个染色质可及性片段、103,765 个 H3K27me3 修饰片段和 1,850,796 个染色质相互作用。与现有的单细胞多组学方法相比,CHARM 在整合更广泛模态的同时实现了相当或更高的灵敏度(图 1b–e )。
每个模态的聚合单细胞 CHARM 谱图与已建立方法的数据显示出高度一致性。图 1f 展示了在两个代表性位点:Sox2 和 Hoxd 基因簇的 CHARM 数据。SOX2 是一种关键转录因子,对于维持 mESCs 的多能性至关重要,它受一个远端下游增强子的调控。CHARM 检测到 Sox2 启动子和增强子区域的染色质可及性,以及连接这两个区域的染色质环(图 1f)。值得注意的是,Sox2 表达与增强子-启动子相互作用强度没有相关性,这与之前的活细胞成像研究一致。相比之下,Hox 基因通过 Polycomb 介导的 H3K27me3 沉积在 mESCs中被转录沉默。CHARM 揭示了 Hoxd 簇中强烈的 H3K27me3 富集,形成了一个被转录活跃区域包围的抑制性染色质域。

图1 CHARM 的设计与验证。a, CHARM 工作流程的示意图。Ab, 抗体;Mod., 修饰;pG–Tn5,蛋白 G–Tn5。b–e,小提琴图显示了 CHARM 检测到的每个细胞中的 Hi-C 接触数(b)、可及片段(c)、H3K27me3 片段(d)和 RNA UMI(e),并与每种相应模式的先前建立的方法进行比较。方框表示中位数和 25 至 75 百分位数,虚线延伸至 1.5×四分位距。f,mESC 中 Sox2 位点(左)和 Hoxd 基因簇(右)的 CHARM 数据基因组浏览器视图,显示聚合的 Hi-C 接触图(顶部热图)以及染色质可及性、H3K27me3 和 RNA 表达的轨迹。每个轨迹下方显示相应的单细胞谱。可及性、H3K27me3 和 RNA 轨迹以每百万计数表示
Tn5 转座酶优先插入可及的基因组区域,这一特性使其在染色质可及性分析中具有实用性,但在检测抑制性染色质特征时可能引入偏差。为评估 CHARM 是否受此偏差影响,检查了染色质可及性和 H3K27me3 富集在转录起始位点(TSS)周围。正如预期,活性转录基因的启动子区域可及性显著增强,而沉默基因的可及性则明显降低。相比之下,H3K27me3 是一种与转录抑制相关的标记,在活性 TSS中大量缺失,与其他基于 Tn5 的方法相比,表明染色质开放性偏好性极小。
对非活性基因的进一步分析表明,H3K27me3 在双价启动子区域富集,这些是同时被活性与抑制性组蛋白修饰标记的调控区域。在这些区域,在单细胞中观察到染色质可及性与 H3K27me3 片段的富集共现,这与双价染色质在分化过程中维持发育基因处于快速激活的预备状态的作用一致。综合这些数据表明,CHARM 能够实现可靠的单细胞多组学分析,这使我们能够进一步在单细胞分辨率下对染色质结构、表观遗传状态和基因表达进行整合分析。
参考文献
[1] Chen, Y., Liu, Z., Xu, H. et al. Gene regulatory landscape dissected by single-cell four-omics sequencing. Nature (2026). https://doi.org/10.1038/s41586-026-10322-z
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库
42. CircTarget:多种细胞类型circRNA调控综合数据库
43. GreenCells:植物lncRNA单细胞分析资源
44. RM2Target 2.0:RNA修饰的写入者、擦除者和读取者靶基因数据库

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-4-28 19:04
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社