博文

代谢组学：中医学者应用时，“看见”和“丢失”了什么？

已有 568 次阅读 2026-6-25 13:12 |个人分类:思考中医|系统分类:科研笔记

引言：一张永远拍不全的“全家福”

如果你是一位中医学者，正在尝试用现代科学语言阐述“气虚证”或“扶正祛邪”的生物学基础，代谢组学几乎是一个绕不开的工具。它被寄予厚望——能够在一滴血、一份尿液中，同时检测成百上千种小分子代谢物，绘制出人体在某一时刻的“化学指纹”。这听起来，似乎正是中医药“整体观”所需要的科学证据。

然而，在你兴冲冲地将样本送进质谱仪之前，有必要先问一个问题：那张最终呈现在你电脑屏幕上的代谢物列表，到底是人体代谢组的“全家福”，还是一张注定漏掉了许多成员的“精选合影”？

答案是后者。而且，这并非因为某个实验室操作不当，而是代谢组学在技术原理、分析流程和哲学前提上，都注定了它只能“看见”一部分，同时无可避免地“丢失”另一部分。这不是代谢组学的失败，而是它的本质。对于希望借助代谢组学来验证中医药科学性的研究者而言，认识这份本质，是避免误读数据、过度外推、乃至在学术争论中留下软肋的前提。

本文将围绕“看见”与“丢失”这对核心矛盾，系统梳理代谢组学能带给我们什么、不能带给我们什么，以及中医学者在使用这一工具时应持守的那份必要审慎。

1 代谢组学的位置：它到底在测什么？

1.1 从“证候”到“分子”：一个诱人的翻译

在中医药现代研究的语境中，代谢组学的魅力显而易见。中医的“证”，是对患者整体功能状态的一种综合判断——气虚、血瘀、痰湿、阴虚，这些概念的背后，应当有其生物学基础。如果“证”的不同确实意味着体内化学环境的不同，那么代谢组就是捕捉这种差异最直接的窗口。

代谢物是基因表达和环境互作的最终产物。我们吃什么、如何运动、情绪如何、肠道菌群在做什么——所有这些最终都会在代谢物层面留下痕迹。相比基因组（告诉你“可能发生什么”）和蛋白质组（告诉你“正在发生什么”），代谢组告诉你的是“已经发生了什么”。这个“已经发生”，恰好最接近中医所关注的“当前状态”。

1.2 代谢组学凭什么“看见”这些分子？

目前代谢组学的两大核心技术是质谱（MS）和核磁共振（NMR）。两者互为补充，各有优劣。

质谱的工作原理是将分子电离，然后根据其质量与电荷之比（质荷比）进行分离和检测。当质谱前端耦合了色谱（气相色谱GC或液相色谱LC）时，样品先被分离，再进入质谱检测。这就像先将一群人按身高排好队，再逐个识别每个人的面孔。

核磁共振则利用原子核在强磁场中的共振行为来获取分子结构信息。它的优势在于无需复杂的样品处理，对样品几乎无损，定量准确，但灵敏度远低于质谱。

无论哪种平台，它们都在做同一件事：从一份复杂的生物样品中，尽可能多地识别出那些小分子化合物的身份和含量。

2 技术层面：每一步都在“选择”，每一步都在“丢失”

如果你想理解代谢组学“丢失”了什么，最好的方法是跟随一份样品走完整条分析流程。你会发现，每一步都在进行筛选——有些筛选是主动设计的，有些是物理规律强加的。

2.1 提取：第一道筛子

代谢组学的第一步是从血液、尿液、组织等样品中提取代谢物。你用什么溶剂？甲醇提取极性代谢物效果好，但脂溶性分子可能丢失；氯仿适合脂类，水溶性分子则提取不足。选择一种提取方案，就意味着你已经在方法论层面决定了哪些代谢物有机会被你“看见”，哪些将被挡在第一道门外。

更棘手的是不稳定的代谢物。抗坏血酸（维生素C）在空气中极易氧化；某些硫醇类代谢物在提取过程中就降解了。当你最终在数据中“看到”一个代谢物信号时，它可能已不是它在体内的原始形态。

2.2 色谱：又一次选择性“放大”

提取后的样品进入色谱柱进行分离。气相色谱要求样品具有挥发性，不挥发或热不稳定的代谢物需要衍生化处理——但这个反应本身就有选择性。液相色谱根据分子与固定相的亲和力进行分离：反相色谱擅长非极性分子，亲水作用色谱擅长极性分子。没有一根色谱柱能一视同仁地分离所有类型的代谢物。

2.3 质谱：不是所有分子都能被“电离”

这是代谢组学“选择性盲区”最突出的环节。质谱检测的前提是分子被离子化——带上电荷。电喷雾离子源（ESI）对极性、可电离的分子响应极好，但对非极性分子（如胆固醇、某些脂类）则信号微弱甚至全无。即使能被电离，高丰度分子的信号还可能“压制”低丰度分子——这叫离子抑制效应。

用影像的类比来说：质谱是一只目光锐利的鹰，但它只能看清特定焦距范围内的目标；核磁共振则像一个广角镜头，视野宽阔但远处的细节模糊不清。

2.4 一张总结性表格

分析步骤	“看见”的偏好	“丢失”的分子类型
样品提取	取决于溶剂选择	与溶剂不互溶的代谢物；不稳定代谢物
色谱分离	取决于色谱模式	与固定相无保留或保留过强的分子
离子化	极性、可电离分子	非极性、难电离分子
质谱检测	高丰度分子	受离子抑制的低丰度分子
NMR检测	高丰度、含¹H的分子	低丰度分子；不含检测核的分子

3 数据层面：看到了信号，不等于认出了身份

即使代谢物幸运地走完了上述全流程，在质谱上产生了一个漂亮的峰，它距“被鉴定”还有很长一段路。

3.1 数据库的“已知”牢笼

代谢物鉴定主要依赖与标准品或数据库进行比对。人类代谢组数据库（HMDB）收录了超过20万条条目，听起来很庞大。但据估计，仅人体内的代谢物就可能超过百万种。来自肠道菌群的转化产物、中草药成分的体内代谢物、饮食来源的外源化合物——大量分子根本不在任何数据库中。

如果你的研究恰好涉及中药干预后的代谢变化，情况会更加严峻。中药复方中的许多成分在体内的代谢产物是结构复杂的次生代谢物，它们极有可能不在HMDB等标准数据库中。这意味着，那些最有可能反映中药“整体调节”效应的分子，恰恰是代谢组学数据库最可能“不认识”的。

3.2 未知物的迷宫：看得见，认不出

对于那些数据库匹配不上的谱图特征，常规做法是以“未知物1号”“未知物2号”的编号存档。它们明明在你的样品中存在，在不同组别之间有显著差异，但你不知道它们是什么。鉴定一个全新代谢物结构需要耗费数周乃至数月的高成本专业工作。在大多数研究中，这些“未知物”所承载的生物学信息，被永久地搁置在了黑暗之中。

3.3 统计分析中的“过度修剪”

常规代谢组学数据处理中，常会剔除那些在大多数样本中检出率低或变异过大的代谢物。这种操作的出发点是控制数据质量，但可能带来的后果是：某些具有重要生物学意义、但本身浓度低或个体差异大的代谢物，被当作“噪声”一并剪除了。你最终用于统计分析的数据集，是经过多轮“修剪”之后的产物，而非原始生物信息的忠实呈现。

4 当数据被“发现”之后：从信号到“解释”的跳跃

这是中医学者尤其需要保持清醒的关键地带。

4.1 你所看到的，未必是你以为的

假设你做了一个完美的实验，鉴定出了几十种与“气虚证”显著关联的代谢物，并在通路分析中发现“能量代谢通路显著富集”。然后你很自然地推论：“气虚证的本质是能量代谢障碍”。这个推论对吗？

需要审慎。代谢组学提供的是相关性的快照，不是因果链的证明。你所看到的代谢物浓度变化，究竟是你所关注的“证”的原因，还是结果，还是机体为代偿而启动的另一套程序的副产品？在没有后续机制实验验证的情况下，你不清楚。相关性不等同于病因，这是在解读代谢组学结果时必须恪守的底线。

4.2 “差异代谢物列表”不是“生物学机制”

论文中常见这样的叙事结构：“我们发现了A、B、C三个代谢通路被显著富集，因此中药X通过调控A、B、C通路发挥了扶正作用”。这当中省略了一个巨大的逻辑跳跃。通路分析工具（如MetaboAnalyst、KEGG）提供的是统计富集结果，它告诉你“这些差异代谢物恰好落入了这几个通路”，而不是“这些通路确实被调控了”。

通路是静态的数据库映射，而生物学调控是动态的、立体的、网络化的。从“落在通路里”到“调控通路”，中间需要的是独立的实验验证——蛋白表达检测、基因敲除、酶活测定——而不是另一轮代谢组学实验。

4.3 中医概念的“逆向翻译”陷阱

还有一种常见的操作：做了代谢组学，发现差异代谢物富集在某通路，然后倒回去查中医理论，说“该通路正好对应我们预设的‘健脾益气’”。这种“逆向翻译”有循环论证的嫌疑——你用数据印证了你预设的理论，但数据的选择性“看见”和解释的灵活性，几乎总能让数据支持你的预设。

这并不是说你不应该将代谢组学数据与中医理论互参。而是说，这种互参的质量，取决于你是否在实验设计阶段就预设了明确的假设、严格的判断标准和可证伪的边界——如果一个结果出现就会支持你的理论，如果相反的结果出现你也可以“合理”地解释掉，那么这样的研究设计实际上是无法被证伪的，科学价值也就有限。

5 在“看见”与“丢失”之间：一份建议清单

代谢组学注定是不完美的，但它仍然是有用的。关键在于以清醒的头脑使用它。

5.1 对中医研究者的务实建议

承认局限，预先声明：在论文的“材料与方法”或“讨论”中，诚实地说明你采用的提取方法、色谱模式、质谱平台对哪些类型的代谢物可能存在系统性盲区。这不是示弱，而是科学诚信。

报告鉴定置信度：代谢物鉴定标准倡议（MSI）将代谢物鉴定分为四个置信等级。明确标注你报告的那些代谢物处于哪个等级，让读者自行判断结论的坚实程度。

拒绝过度解读：明确区分“我们发现差异代谢物富集在通路X”与“通路X被调控”。前者是数据呈现，后者是理论推断，需要独立的实验证据。

多平台互补：如果条件允许，用LC-MS和GC-MS（甚至NMR）互补覆盖。单一平台的“丢失”是多平台互补的逻辑前提。

保护你的原始数据：按照FAIR原则（可查找、可访问、可互操作、可重用）管理数据。经多轮“修剪”后的数据集是你的结论，但原始数据是你可以回溯和自证的起点。

5.2 建立学术对话中的“批判性共识”

当中医学者与基础科学或临床医学领域的同行交流时，对代谢组学局限的自觉认知本身就是一种话语能力。当你能够主动说“我清楚我们的代谢组数据能看到什么、不能看到什么”时，你反而能赢得对方在方法论层面的尊重。反之，如果试图用一份差异代谢物列表去“证明”一套完整的中医理论，很有可能在同行评议和跨学科对话中陷入困境。

结语：不完美的工具，依然有价值的探索

代谢组学永远无法实现“全覆盖”。从提取到检测到数据清洗到生物学解释，每一步都在“看见”一些的同时“丢失”另一些。这不是技术的暂时缺陷，而是任何分析手段的永恒处境。

但这并不否定代谢组学的价值。那些被它“看见”的代谢物，已经在疾病诊断、疗效评价、机制探索中发挥了不可替代的作用。当我们不再声称自己拍到了“全家福”，而是诚实地展示一张标注了镜头焦距、光圈和取景范围的“精选合影”时，这张照片反而能够更有说服力地承载它所记录的瞬间。

对于中医学者而言，代谢组学是一个工具，不是一个答案。它能打开一扇窗，但不能替代你对窗外风景的独立判断。当你在“看见”与“丢失”之间谦卑地行走时，你不仅是在做科学研究，也在守护着学术的诚实——这份诚实，最终才是中医药现代研究能够获得广泛尊重的根基。

转载本文请联系原作者获取授权，同时请注明本文来自聂广科学网博客。
链接地址：https://blog.sciencenet.cn/blog-279293-1540885.html

上一篇：人类文明中心的迁徙路径

欢迎参加科学网十佳博文评选活动！

主办单位：