思想散步分享 http://blog.sciencenet.cn/u/fqng1008 前三十年写日记,后三十年写博客

博文

代谢组学:中医学者应用时,“看见”和“丢失”了什么?

已有 568 次阅读 2026-6-25 13:12 |个人分类:思考中医|系统分类:科研笔记

引言:一张永远拍不全的“全家福”

如果你是一位中医学者,正在尝试用现代科学语言阐述“气虚证”或“扶正祛邪”的生物学基础,代谢组学几乎是一个绕不开的工具。它被寄予厚望——能够在一滴血、一份尿液中,同时检测成百上千种小分子代谢物,绘制出人体在某一时刻的“化学指纹”。这听起来,似乎正是中医药“整体观”所需要的科学证据。

然而,在你兴冲冲地将样本送进质谱仪之前,有必要先问一个问题:那张最终呈现在你电脑屏幕上的代谢物列表,到底是人体代谢组的“全家福”,还是一张注定漏掉了许多成员的“精选合影”?

答案是后者。而且,这并非因为某个实验室操作不当,而是代谢组学在技术原理、分析流程和哲学前提上,都注定了它只能“看见”一部分,同时无可避免地“丢失”另一部分。这不是代谢组学的失败,而是它的本质。对于希望借助代谢组学来验证中医药科学性的研究者而言,认识这份本质,是避免误读数据、过度外推、乃至在学术争论中留下软肋的前提。

本文将围绕“看见”与“丢失”这对核心矛盾,系统梳理代谢组学能带给我们什么、不能带给我们什么,以及中医学者在使用这一工具时应持守的那份必要审慎。

1  代谢组学的位置:它到底在测什么?

1.1  从“证候”到“分子”:一个诱人的翻译

在中医药现代研究的语境中,代谢组学的魅力显而易见。中医的“证”,是对患者整体功能状态的一种综合判断——气虚、血瘀、痰湿、阴虚,这些概念的背后,应当有其生物学基础。如果“证”的不同确实意味着体内化学环境的不同,那么代谢组就是捕捉这种差异最直接的窗口。

代谢物是基因表达和环境互作的最终产物。我们吃什么、如何运动、情绪如何、肠道菌群在做什么——所有这些最终都会在代谢物层面留下痕迹。相比基因组(告诉你“可能发生什么”)和蛋白质组(告诉你“正在发生什么”),代谢组告诉你的是“已经发生了什么”。这个“已经发生”,恰好最接近中医所关注的“当前状态”。

1.2  代谢组学凭什么“看见”这些分子?

目前代谢组学的两大核心技术是质谱(MS)和核磁共振(NMR)。两者互为补充,各有优劣。

质谱的工作原理是将分子电离,然后根据其质量与电荷之比(质荷比)进行分离和检测。当质谱前端耦合了色谱(气相色谱GC或液相色谱LC)时,样品先被分离,再进入质谱检测。这就像先将一群人按身高排好队,再逐个识别每个人的面孔。

核磁共振则利用原子核在强磁场中的共振行为来获取分子结构信息。它的优势在于无需复杂的样品处理,对样品几乎无损,定量准确,但灵敏度远低于质谱。

无论哪种平台,它们都在做同一件事:从一份复杂的生物样品中,尽可能多地识别出那些小分子化合物的身份和含量。

2  技术层面:每一步都在“选择”,每一步都在“丢失”

如果你想理解代谢组学“丢失”了什么,最好的方法是跟随一份样品走完整条分析流程。你会发现,每一步都在进行筛选——有些筛选是主动设计的,有些是物理规律强加的。

2.1  提取:第一道筛子

代谢组学的第一步是从血液、尿液、组织等样品中提取代谢物。你用什么溶剂?甲醇提取极性代谢物效果好,但脂溶性分子可能丢失;氯仿适合脂类,水溶性分子则提取不足。选择一种提取方案,就意味着你已经在方法论层面决定了哪些代谢物有机会被你“看见”,哪些将被挡在第一道门外。

更棘手的是不稳定的代谢物。抗坏血酸(维生素C)在空气中极易氧化;某些硫醇类代谢物在提取过程中就降解了。当你最终在数据中“看到”一个代谢物信号时,它可能已不是它在体内的原始形态。

2.2  色谱:又一次选择性“放大”

提取后的样品进入色谱柱进行分离。气相色谱要求样品具有挥发性,不挥发或热不稳定的代谢物需要衍生化处理——但这个反应本身就有选择性。液相色谱根据分子与固定相的亲和力进行分离:反相色谱擅长非极性分子,亲水作用色谱擅长极性分子。没有一根色谱柱能一视同仁地分离所有类型的代谢物。

2.3  质谱:不是所有分子都能被“电离”

这是代谢组学“选择性盲区”最突出的环节。质谱检测的前提是分子被离子化——带上电荷。电喷雾离子源(ESI)对极性、可电离的分子响应极好,但对非极性分子(如胆固醇、某些脂类)则信号微弱甚至全无。即使能被电离,高丰度分子的信号还可能“压制”低丰度分子——这叫离子抑制效应。

用影像的类比来说:质谱是一只目光锐利的鹰,但它只能看清特定焦距范围内的目标;核磁共振则像一个广角镜头,视野宽阔但远处的细节模糊不清。

2.4 一张总结性表格

分析步骤

看见”的偏好

丢失”的分子类型

样品提取

取决于溶剂选择

与溶剂不互溶的代谢物;不稳定代谢物

色谱分离

取决于色谱模式

与固定相无保留或保留过强的分子

离子化

极性、可电离分子

非极性、难电离分子

质谱检测

高丰度分子

受离子抑制的低丰度分子

NMR检测

高丰度、含¹H的分子

低丰度分子;不含检测核的分子

3  数据层面:看到了信号,不等于认出了身份

即使代谢物幸运地走完了上述全流程,在质谱上产生了一个漂亮的峰,它距“被鉴定”还有很长一段路。

3.1  数据库的“已知”牢笼

代谢物鉴定主要依赖与标准品或数据库进行比对。人类代谢组数据库(HMDB)收录了超过20万条条目,听起来很庞大。但据估计,仅人体内的代谢物就可能超过百万种。来自肠道菌群的转化产物、中草药成分的体内代谢物、饮食来源的外源化合物——大量分子根本不在任何数据库中。

如果你的研究恰好涉及中药干预后的代谢变化,情况会更加严峻。中药复方中的许多成分在体内的代谢产物是结构复杂的次生代谢物,它们极有可能不在HMDB等标准数据库中。这意味着,那些最有可能反映中药“整体调节”效应的分子,恰恰是代谢组学数据库最可能“不认识”的。

3.2  未知物的迷宫:看得见,认不出

对于那些数据库匹配不上的谱图特征,常规做法是以“未知物1号”“未知物2号”的编号存档。它们明明在你的样品中存在,在不同组别之间有显著差异,但你不知道它们是什么。鉴定一个全新代谢物结构需要耗费数周乃至数月的高成本专业工作。在大多数研究中,这些“未知物”所承载的生物学信息,被永久地搁置在了黑暗之中。

3.3  统计分析中的“过度修剪”

常规代谢组学数据处理中,常会剔除那些在大多数样本中检出率低或变异过大的代谢物。这种操作的出发点是控制数据质量,但可能带来的后果是:某些具有重要生物学意义、但本身浓度低或个体差异大的代谢物,被当作“噪声”一并剪除了。你最终用于统计分析的数据集,是经过多轮“修剪”之后的产物,而非原始生物信息的忠实呈现。

4  当数据被“发现”之后:从信号到“解释”的跳跃

这是中医学者尤其需要保持清醒的关键地带。

4.1  你所看到的,未必是你以为的

假设你做了一个完美的实验,鉴定出了几十种与“气虚证”显著关联的代谢物,并在通路分析中发现“能量代谢通路显著富集”。然后你很自然地推论:“气虚证的本质是能量代谢障碍”。这个推论对吗?

需要审慎。代谢组学提供的是相关性的快照,不是因果链的证明。你所看到的代谢物浓度变化,究竟是你所关注的“证”的原因,还是结果,还是机体为代偿而启动的另一套程序的副产品?在没有后续机制实验验证的情况下,你不清楚。相关性不等同于病因,这是在解读代谢组学结果时必须恪守的底线。

4.2  “差异代谢物列表”不是“生物学机制”

论文中常见这样的叙事结构:“我们发现了A、B、C三个代谢通路被显著富集,因此中药X通过调控A、B、C通路发挥了扶正作用”。这当中省略了一个巨大的逻辑跳跃。通路分析工具(如MetaboAnalyst、KEGG)提供的是统计富集结果,它告诉你“这些差异代谢物恰好落入了这几个通路”,而不是“这些通路确实被调控了”。

通路是静态的数据库映射,而生物学调控是动态的、立体的、网络化的。从“落在通路里”到“调控通路”,中间需要的是独立的实验验证——蛋白表达检测、基因敲除、酶活测定——而不是另一轮代谢组学实验。

4.3  中医概念的“逆向翻译”陷阱

还有一种常见的操作:做了代谢组学,发现差异代谢物富集在某通路,然后倒回去查中医理论,说“该通路正好对应我们预设的‘健脾益气’”。这种“逆向翻译”有循环论证的嫌疑——你用数据印证了你预设的理论,但数据的选择性“看见”和解释的灵活性,几乎总能让数据支持你的预设。

这并不是说你不应该将代谢组学数据与中医理论互参。而是说,这种互参的质量,取决于你是否在实验设计阶段就预设了明确的假设、严格的判断标准和可证伪的边界——如果一个结果出现就会支持你的理论,如果相反的结果出现你也可以“合理”地解释掉,那么这样的研究设计实际上是无法被证伪的,科学价值也就有限。

5  在“看见”与“丢失”之间:一份建议清单

代谢组学注定是不完美的,但它仍然是有用的。关键在于以清醒的头脑使用它。

5.1  对中医研究者的务实建议

承认局限,预先声明:在论文的“材料与方法”或“讨论”中,诚实地说明你采用的提取方法、色谱模式、质谱平台对哪些类型的代谢物可能存在系统性盲区。这不是示弱,而是科学诚信。

报告鉴定置信度:代谢物鉴定标准倡议(MSI)将代谢物鉴定分为四个置信等级。明确标注你报告的那些代谢物处于哪个等级,让读者自行判断结论的坚实程度。

拒绝过度解读:明确区分“我们发现差异代谢物富集在通路X”与“通路X被调控”。前者是数据呈现,后者是理论推断,需要独立的实验证据。

多平台互补:如果条件允许,用LC-MS和GC-MS(甚至NMR)互补覆盖。单一平台的“丢失”是多平台互补的逻辑前提。

保护你的原始数据:按照FAIR原则(可查找、可访问、可互操作、可重用)管理数据。经多轮“修剪”后的数据集是你的结论,但原始数据是你可以回溯和自证的起点。

5.2  建立学术对话中的“批判性共识”

当中医学者与基础科学或临床医学领域的同行交流时,对代谢组学局限的自觉认知本身就是一种话语能力。当你能够主动说“我清楚我们的代谢组数据能看到什么、不能看到什么”时,你反而能赢得对方在方法论层面的尊重。反之,如果试图用一份差异代谢物列表去“证明”一套完整的中医理论,很有可能在同行评议和跨学科对话中陷入困境。

结语:不完美的工具,依然有价值的探索

代谢组学永远无法实现“全覆盖”。从提取到检测到数据清洗到生物学解释,每一步都在“看见”一些的同时“丢失”另一些。这不是技术的暂时缺陷,而是任何分析手段的永恒处境。

但这并不否定代谢组学的价值。那些被它“看见”的代谢物,已经在疾病诊断、疗效评价、机制探索中发挥了不可替代的作用。当我们不再声称自己拍到了“全家福”,而是诚实地展示一张标注了镜头焦距、光圈和取景范围的“精选合影”时,这张照片反而能够更有说服力地承载它所记录的瞬间。

对于中医学者而言,代谢组学是一个工具,不是一个答案。它能打开一扇窗,但不能替代你对窗外风景的独立判断。当你在“看见”与“丢失”之间谦卑地行走时,你不仅是在做科学研究,也在守护着学术的诚实——这份诚实,最终才是中医药现代研究能够获得广泛尊重的根基。



https://blog.sciencenet.cn/blog-279293-1540885.html

上一篇:人类文明中心的迁徙路径




    
收藏 IP: 120.231.245.*| 热度|

5 农绍庄 高宏 王涛 郑永军 钟炳

该博文允许注册用户评论 请点击登录 评论 (7 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-6-26 13:33

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部