许培扬博客分享 http://blog.sciencenet.cn/u/xupeiyang 跟踪国际前沿 服务国内科研

博文

药物发现AI智能体

已有 123 次阅读 2026-4-26 07:28 |个人分类:热点前沿|系统分类:科研笔记

药物发现AI智能体,是指能够自主规划、调用工具并执行复杂任务,以推动药物研发流程的智能系统。它不仅仅是预测模型,更是一个能替代或辅助科学家进行“思考”和“操作”的虚拟助手。

核心目标与理想工作流

其终极目标是模拟资深药物化学家的决策过程,自动化完成从靶点发现到候选药物优化的漫长链条。一个理想的智能体应能:

  1. 分析文献与数据,提出新靶点假说。

  2. 设计全新分子,并预测其活性、毒性等性质。

  3. 规划实验,调用模拟工具验证设计。

  4. 分析结果,并基于反馈循环优化设计。

现实挑战:能力鸿沟

然而,正如前沿评估所指出的,当前系统与真实世界需求存在显著差距,主要体现在五大能力鸿沟:

  1. 分子表示偏见:过度依赖小分子(SMILES),缺乏对治疗性肽段、抗体等大分子的支持。

  2. 数据整合局限:擅长处理体外和计算数据,但难以整合关键的体内实验、影像组学、临床数据。

  3. 计算范式单一:主要依赖大语言模型调用现有工具,缺乏集成机器学习模型训练、强化学习等核心计算的能力。

  4. 资源假设不切实际:其工作流通常假设拥有大型药企的无限数据和算力,难以在资源受限的真实研发环境中应用。

  5. 优化目标简单:通常进行单目标优化,而真实药物发现需要权衡效力、安全性、药代性质等多重目标的帕累托最优。

价值与未来

尽管存在鸿沟,AI智能体仍是变革药物研发的关键方向。它能够极大提升搜索效率,探索人类难以想象的化学空间,并标准化和记录研发决策过程。未来的突破在于构建能融合多模态数据、支持复杂计算范式、并能在资源约束下进行多目标优化的新一代系统。

目前,该领域正处于从概念验证走向解决实际问题的关键阶段。

根据《Beyond SMILES: Evaluating Agentic Systems for Drug Discovery》研究对六款主流AI智能体框架的系统评估,现有药物发现AI智能体存在五大关键能力鸿沟,真实覆盖率不足17%,远未达到真实世界需求。

五大能力鸿沟深度解析1. 小分子表示偏见:缺乏蛋白质语言模型支持

当前所有智能体系统架构均围绕小分子展开,依赖SMILES字符串、分子指纹、对接评分等表示方法。这套体系在药物化学领域有效,却在治疗性肽段领域彻底失效。

核心问题

  • 所有六个框架均假设小分子表示,对肽段特异性工作流程(生成式肽段设计、肽段-受体结合、肽段-酶稳定性等)覆盖率为零

  • 没有任何框架将蛋白质语言模型(ProtBERT、ESM-2、ProGen)作为面向序列治疗药物设计的核心组件

  • 治疗性肽段(2至50个氨基酸)介于小分子与生物制剂之间,具有高度构象灵活性,但面临聚集、蛋白酶降解和渗透性屏障等挑战

2. 缺乏体内外数据整合能力

智能体系统在体外自动化方面表现出色,但关键的药物验证发生在体内环境——候选药物在此面临药代动力学、生物分布、代谢、毒理学等复杂挑战。

数据支持层级

  • 原生支持:SMILES字符串、文献摘要、PDB结构、CSV测试数据

  • 需大量预处理的部分支持:组织影像、临床轨迹、临床记录

  • 无任何支持:行为视频、RNA-seq数据

现实案例:神经损伤模型中,一种肽段在体外可使细胞增殖提升三倍,但在体内展示出截然不同的动态:炎症反应(第1-3天)、祖细胞增殖(第7-10天)、功能恢复(第28天)。现有智能体无法构建剂量-响应曲线、计算LD50置信区间或建模跨物种转化不确定性。

3. 计算范式支持不足:仅依赖LLM推理

所有六个框架均采用"LLM即编排器"架构,将计算任务简化为LLM推理与工具API调用的组合。这种架构无法支持需要机器学习模型训练或强化学习优化的工作流程。

架构局限

  • 无法将机器学习模型训练作为核心操作

  • 缺乏强化学习优化能力

  • 将复杂计算简化为工具调用,如同"给厨师配了全套顶级食材,却只给他一个微波炉"

4. 假设大型药企资源环境

现有系统主要适配小分子工作流程、高通量体外测试,以及拥有大规模数据集和丰富计算资源的大型机构。一旦这些前提条件不满足,系统性能将大幅下降。

现实差距:研究来自一家小型生物技术公司的第一手实践,揭示了在资源受限环境中系统的实际局限性,这些在演示环节中往往无从察觉。

5. 单目标优化忽视多维权衡

所有框架均优化单一目标或使用固定加权求和,没有框架支持帕累托优化、约束满足或不确定性感知的候选药物选择。

真实药物发现需求:候选药物必须同时满足生物活性、选择性、安全性、稳定性、可制造性和成本要求。智能体需要跨迭代维护状态、记录决策、使假设显式化,但现有系统缺乏这些能力。

评估结果与覆盖率

研究评估了六款主流框架(ChemCrow、Coscientist、PharmAgents、ChatInvent、MADD、DiscoVerse)对15类药物发现任务的支持情况:

任务类别

ChemCrow

Coscientist

PharmAgents

ChatInvent

MADD

DiscoVerse

ML生物活性预测

×

×

×

生成式肽段设计

×

×

×

×

×

×

肽段-受体结合

×

×

×

体内恢复建模

×

×

×

×

×

×

肽段-酶稳定性

×

×

×

×

×

×

PLM受体预测

×

×

×

×

×

×

蒙特卡洛优化

×

×

×

×

×

×

RNA-seq/scRNA-seq

×

×

×

×

×

×

基于图像的定量

×

×

×

×

×

×

免疫应答谱分析

×

×

×

功能注释

×

×

×

行为表型

×

×

×

×

×

×

体内外桥接

×

×

×

×

×

×

RL肽段生成

×

×

×

×

×

×

安全性/毒理学

×

覆盖率:6.7% - 16.7%,平均不足17%

根本原因与未来方向

研究揭示,现有框架的瓶颈在于架构设计而非基础模型的知识储备。下一代系统需要从"LLM工具调用"范式转向"多范式工作流编排"范式,方能真正服务于从靶点识别到临床候选药物筛选的完整发现链条。

修复路径:构建整合管道,而非重新训练模型。需要将蛋白质语言模型、体内外数据整合、机器学习训练能力、资源约束感知和多目标优化等关键能力纳入核心架构设计。

这一评估为AI制药领域提供了明确的改进方向,揭示了当前技术演示与实际应用之间的巨大差距,强调了面向真实世界需求的系统设计的重要性。



https://blog.sciencenet.cn/blog-280034-1532137.html

上一篇:如何降低论文AI率?
下一篇:DeepEvidence 循证医学
收藏 IP: 39.157.88.*| 热度|

2 刘进平 孙颉

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-4-26 11:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部