精选
|
文章从图学习视角系统综述了药物设计中基于二维图表示的从头分子生成方法,将其按生成粒度分为一次性生成、基于片段生成和逐节点生成三类,还梳理了相关公开数据集、评价指标,并分析了领域现存挑战。研究发现不同生成策略各有优劣,扩散模型成为新兴主流但仍存在分子有效性等问题,变分自编码器则在多策略中表现出良好适配性。该综述为药物设计领域的分子生成研究提供了结构化的方法框架和清晰的研究脉络,同时指出的大分子设计、3D 药物发现等方向,为后续相关研究和实际药物研发应用指明了探索路径。

中文标题:从图学习到药物设计,这篇综述讲透分子生成核心方法与未来方向
英文原题:Molecule generation for drug design: a graph learning perspective
通讯作者:
严骏驰,上海交通大学
第一作者:
杨念祖,上海交通大学
吴怀瑾,上海交通大学
关键词:药物设计,机器学习,生成模型,图表示学习,图生成
背景介绍
药物研发是个耗时费力的大工程,单是新分子的设计与筛选,就需要投入大量的时间、资金和人力。而机器学习,尤其是图学习技术的出现,为药物设计中的分子生成打开了新大门 —— 它能高效生成具有潜在药用价值的分子结构,大幅加速药物发现进程。上海交通大学严骏驰团队发表的这篇综述,就从图学习视角出发,系统梳理了药物设计中二维图表示的分子生成技术,为跨领域科研学者搭建了清晰的研究框架,也为后续研究指明了关键方向。
为什么图学习能成为分子生成的核心工具?
分子的结构天然可以用图来表示:原子是节点,化学键是边,这种二维图表示能精准刻画分子的固有结构,还能保证生成分子的化学有效性,这是传统一维表示方法难以做到的。而图学习技术擅长处理这种图结构数据,能从海量分子数据中学习结构规律,进而生成新的、符合化学规则的分子,这让它成为药物设计中分子生成的主流方法,也是这篇综述的核心研究视角。
这篇综述到底梳理了哪些分子生成方法?
研究将当前主流的基于图学习的分子生成方法,按生成粒度和策略分为三大类,图1,清晰界定了每种方法的核心逻辑:一是一次性生成,一步直接产出完整的分子图,效率极高,适合高通量分子生成场景;二是基于片段生成,把分子碎片当作基本构建单元,通过拼接碎片形成完整分子,能很好保留分子的功能基团完整性;三是逐节点生成,以原子为单位逐步构建分子,能实现原子级的精细修改,灵活性拉满。同时,综述还对每类策略下的主流模型(如 VAE、扩散模型、强化学习模型等)进行了详细分析,对比了不同模型的优势与局限性。

图1 该图从基本生成单元角度,阐释了三种从头分子生成策略的核心差异:①一次性生成法,一步生成完整分子图;②基于片段生成法,以分子片段为单元构建分子图;③逐节点生成法,逐个添加原子逐步构建分子图。
除了方法分类,研究还梳理了哪些实用内容?
对于跨领域研究者而言,这篇综述的实用价值远不止方法梳理。它还汇总了分子生成领域的核心公共数据集(如 DrugBank、ZINC15、QM9 等),明确了有效性、新颖性、多样性等通用评价指标,让不同研究的结果有了可对比的统一标准。同时,研究还对比了三种生成策略的优劣:一次性生成效率高但灵活性不足,基于片段生成兼顾效率与功能保留,逐节点生成灵活但效率偏低,而扩散模型作为新兴模型,虽表现出良好潜力,却仍未解决分子 100% 有效性的问题。
这篇综述为后续研究指明了哪些方向?
在梳理现有研究的基础上,团队也指出了当前领域的核心挑战和六大未来研究方向,为跨领域合作提供了切入点:包括针对大分子、3D 分子的设计研究,结合蛋白质靶点的基于结构的药物设计,分子生成领域的图基础模型构建,以及逆合成预测、实际场景的落地应用等。这些方向既贴合机器学习的技术发展趋势,又紧扣药物研发的实际需求,为计算机、化学、生物等跨领域学者的合作研究提供了思路。
这篇综述是药物设计与图学习交叉领域的一份重要参考资料,它不仅为初入领域的研究者梳理了清晰的研究脉络和结构化的方法框架,也为资深研究者指明了未来的探索方向。而其强调的 “让 AI 分子生成技术落地实际药物研发” 的核心目标,也让跨领域合作成为这一领域发展的关键。
引用本文
Nianzu Yang, Huaijin Wu, Kaipeng Zeng, et al. Molecule generation for drug design: A graph learning perspective. Fundamental Research, 6(1) (2026) 40-52.
原文链接:
https://www.sciencedirect.com/science/article/pii/S2667325824005259
关于Fundamental Research
Fundamental Research是由国家自然科学基金委员会主管、主办的综合性英文学术期刊。创刊于2021年,期刊立足反映国家自然科学基金资助的优秀成果,全方位报道世界基础研究前沿重要进展和重大创新性成果,提升中国基础研究和中国科学家在国际科学界的显示度和影响力,为中外科学家打造一个高端的国际学术交流平台。内容涵盖数学物理、化学化工、生命科学、地球科学、工程与材料科学、信息科学、管理科学、健康医学、交叉科学等领域,设置Article、Review、Highlight、Perspective、Commentary、Letter和News&Views等栏目。期刊已被ESCI、Scopus、DOAJ、PubMed、CAS(美国化学文摘社)、CSCD(中国科学引文数据库)、CSTPCD(中国科技论文与引文数据库)等国内外知名数据库收录。2024年影响因子6.3,位于综合性期刊Q1区。2024年入选中国科技期刊卓越行动计划二期英文梯队期刊项目。2025年入选《FMS管理科学高质量期刊推荐列表》B区。欢迎广大科研工作者关注、投稿、引用!
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-4-20 15:39
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社