||
人类大脑发育的单细胞蛋白质组图谱
蛋白质协调生物过程并执行维持细胞活动的重要功能。虽然遗传学研究加深了我们对复杂疾病的理解,但将这些发现转化为机制见解取决于蛋白质水平的验证。虽然 mRNA 提供了转录活动的一个便捷快照,但越来越多的证据揭示了它在准确反映蛋白质丰度方面的局限性。
近期研究表明,在多种人类组织中,RNA 水平和蛋白质水平之间存在不一致性,其中在脑皮层的不一致性最为显著。当蛋白质水平的反应偏离 mRNA 模式时,基于转录组学的疗法可能会失败。加剧这一问题的是,之前观察到的 mRNA 和蛋白质不一致性主要基于组织样本,其中细胞间的差异被平均化。因此在单细胞水平上,不一致性的真实规模可能更为突出,特别是在像快速发育的大脑这样的动态系统中。
单细胞蛋白质组学正处于 一个关键的转折点。靶向方法如 CyTOF 和 CITE-seq 被广泛使用,但仅提供半定量测量,依赖于抗体的可用性和特异性,并且总共捕获的蛋白质组不到 1%。相比之下,非靶向质谱(MS)理论上可以在一次运行中分析整个蛋白质组。然而,早期的实施需要大量的细胞输入,在如~100 μm 卵母细胞等特别大的细胞中,每个细胞仅检测到~400 种蛋白质。随后的多重检测技术创新,使用等压标记和载流通道,通过混合多个细胞的材料来提高蛋白质覆盖范围。然而,这些收益伴随着权衡——比例压缩、批次效应和增加的数据变异性——最终限制了这些策略在高分辨率组织图谱中的应用。
近年来,质谱硬件和采集策略的进步催生了新一代无标记、直接的单细胞蛋白质组学平台。这些平台能够从单个培养细胞中定量数百至数千种蛋白质,例如 HeLa 细胞(每个细胞约 250 pg 蛋白质),绕过多重检测特异性伪影,并在无需样本混合的情况下实现显著深度。迄今为止的大多数应用侧重于永生细胞系、血液细胞或中等规模数据集(约 100 个细胞)的方法开发和基准测试,仅有限地探索了原代组织。在已对原代细胞进行表征的情况下,研究重点集中在体积上具有天然优势的大型细胞类型上,例如心肌细胞(长度=100–150 μm;宽度=17–25 μm)和肝细胞(直径=20–30 μm,多核/多倍体细胞可达~40–50 μm),这些细胞在蛋白质组学上具有天然优势。相比之下,大多数人类细胞体积要小得多(直径~10–20 μm;胎儿皮质神经元胞体~7–10 μm;初始 T 细胞~6–8 μm),其体积比肝细胞或心肌细胞小约一个至两个数量级。使用每个 HeLa 细胞约 250 pg 蛋白质的常见估计值,简单的体积缩放表明一个 7–10 μm 的胎儿神经元含有约 5–50 pg 蛋白质,远低于许多当前单细胞质谱工作流程中验证的输入量的下限。
这个差距定义了下一个前沿:直接在其天然环境中对原始人类组织进行映射,捕捉细胞类型、大小和蛋白质组负载中的自然异质性,而不是依赖于尺寸优势细胞或均匀制备。因此,重点有两个:(1) 在跨越不同大小和蛋白质质量的原始人类单细胞中建立可行性和定量性能;(2) 对原始人类组织进行全球非靶向单细胞蛋白质组映射,直接解决细胞类型和状态多样性,而无需事先基于细胞类型的分选或富集。
最近,Wu等人结合了优化的实验流程与先进的单细胞质谱分析技术(图1),生成了人类大脑发育单细胞蛋白质组图谱的高分辨率地图(https://cell.ucsf.edu/SCProteome/)。该数据集在蛋白质水平上区分了主要细胞类型,并揭示了不同细胞类型间协同与分化的 mRNA-蛋白质关系。独立验证证实,观察到的差异反映了生物学调控而非技术偏差。值得注意的是,与 mRNA 谱相比表现出最大差异的蛋白质富集了与神经发育障碍(NDD)相关的基因,这突出了在探究疾病机制时进行直接蛋白质水平测量的必要性。进一步证明,蛋白质比其对应的 mRNA 表现出更高的细胞类型特异性,而 mRNA 通常具有更广泛和弥散的表达模式。单细胞蛋白质组数据集使我们能够重建详细的发育轨迹,从放射状胶质细胞(RG)通过中间祖细胞到成熟的兴奋性神经元(EN),在蛋白质水平上追踪细胞转变过程。 在这个发育通路中,作者们发现了一个蛋白质模块,其丰度从中间祖细胞阶段开始急剧增加。值得注意的是,这个蛋白质模块显示出进化保守性,并与自闭症谱系障碍(ASD)有强关联,这突出了单细胞蛋白质组学分析揭示的易感关键发育窗口。通过连接基因表达和功能蛋白质状态之间的差距,该框架揭示了细胞身份的潜在调控逻辑,并揭示了基于 RNA 方法无法看到的与疾病相关的分子参与者。
图1 人类发育中的无标记单细胞蛋白质组分析。a,工作流程—微解剖的胎儿端脑按以下步骤处理:在孕周 13 周时,整个端脑作为一个整体进行解离;在孕周 15 周和19 周时,背侧大脑皮层被划分为 GZ 区和 CP 区。单个细胞通过流式细胞术分选到多孔板中,并通过无标记的液相色谱-质谱(每个细胞进行一次质谱运行)进行分析,定量的蛋白质组用于下游分析。b,每个细胞的蛋白质产量。小提琴图显示了每个细胞在不同发育阶段和区域中识别的蛋白质组(每个点是一个细胞)。空白孔对照证实背景极小。在各个队列中,~1,000 到~2,000 种蛋白质每个细胞中的蛋白质定量结果,通常在较晚的妊娠阶段和 CP 中产量较高,相对于 GZ。c,与先前研究的背景。将文献中代表性单细胞蛋白质组学研究的分析细胞数量进行了比较,条形图按研究类型着色(细胞系、卵母细胞、原代人类细胞和本研究)。对于原代细胞数据集,细胞体积估计是相对于人类胎儿神经元的尺寸报告的。本研究从复杂的发育组织中分析了大量小直径脑细胞(通常<10 μm),能够解析异质性细胞类型和发育轨迹
参考文献
[1] Wu, T., Jiang, L., Mukhtar, T. et al. Single-cell proteomic landscape of the developing human brain. Nat Biotechnol (2026). https://doi.org/10.1038/s41587-025-02980-7
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库
42. CircTarget:多种细胞类型circRNA调控综合数据库
43. GreenCells:植物lncRNA单细胞分析资源
44. RM2Target 2.0:RNA修饰的写入者、擦除者和读取者靶基因数据库

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-2-15 01:11
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社