氢分子医学分享 http://blog.sciencenet.cn/u/孙学军 对氢气生物学效应感兴趣者。可合作研究:sunxjk@hotmail.com 微信 hydrogen_thinker

博文

具备化学专业能力的AI 精选

已有 665 次阅读 2026-1-30 09:07 |系统分类:海外观察

具备化学专业能力AI

这款人工智能具备化学专业能力——助力合成35种全新化合物

一款开源程序帮助科研人员突破化学合成过程中的一大瓶颈

图片1.png

用于从反应混合物中提取产物的水蒸气蒸馏装置。

化学合成是利用更简单的前体物质制备复杂化合物的过程。

对于化学家而言,寻找重磅药物与神奇材料是一项艰巨的任务。要合成出具有研究价值的目标化合物,他们必须在数百万种已知化学反应中逐一筛选,且每年还会新增数十万种反应,之后还要验证这些化合物是否具备可合成性。

如今,研究人员研发出一套人工智能系统,能极大简化并加速化学合成流程。该系统名为MOSAIC,相关研究成果于1月19日发表在《自然》杂志上。系统给出的反应条件,可直接被研究人员用于制备35种具备潜在应用价值的化合物,这些化合物有望成为药物、农用化学品或化妆品原料,无需再进行额外的筛选与条件优化。

“小分子合成是药物研发及其他多个重要领域的限速步骤。”该研究的合著者、康涅狄格州纽黑文市耶鲁大学的化学家蒂莫西·纽豪斯表示。

纽豪斯补充道,MOSAIC有望打破这一瓶颈,进而推动更多优质化合物的研发。该系统“能够生成完整的实验操作方案,细节详尽到可供化学家直接参照执行,助力合成此前从未存在过的分子”。

人工智能辅助化学研究

预测化学反应条件,一直是人工智能在化学领域应用的核心方向。其中最具代表性的工具是IBM公司的「化学RXN」系统,它基于大型语言模型构建。

该系统采用**简化分子线性输入规范(SMILES)**,将化学物质的三维结构转化为字母、数字与标点符号组成的字符串,更适配语言识别模型的处理逻辑。与之不同,ChemCrow等大型语言模型则利用自然语言数据进行化学相关任务的训练。

人工智能聊天机器人展现出预测化学性质与反应的惊人天赋

基于SMILES的处理方式,能更便捷地处理起始原料、溶剂等化学信息。“我们的目标是打造一款通用模型,能够像化学家书写实验记录一样读懂化学知识,通过学习实验操作的专业表述,快速将这些集体经验转化为切实可行的实验建议。”纽豪斯说道。他还表示,将MOSAIC生成的分步实验指令整合到自动化实验系统中,将是“顺理成章的下一步研究方向”。

研究团队借助此前自主研发的一套人工智能系统,将从专利中提取的约100万条化学反应数据聚类为2285个子集。基于这些子集,团队对Meta公司推出的部分开源大型语言模型Llama进行训练,构建出2498个独立的专家模型,每个模型均专精于一类特定分子起始的化学反应转化。该方案可在本地计算机上运行,因为其参数量远少于主流大型语言模型。

北卡罗来纳州罗利市北卡罗来纳州立大学的材料科学家马丁·塞弗里德评价,MOSAIC的亮点在于没有“用最大规模的模型解决问题,而是选择构建一套精心设计、由众多小型‘专家’模型组成的系统”。“每个专项模型在其对应的领域内都具备更高的预测准确度。”塞弗里德说。

瓶颈被打破

研究人员利用MOSAIC为52种新物质的合成提供反应条件建议,经实验室验证,其中35种物质成功合成。此外,MOSAIC还能精准预测这些化合物的颜色与形态。

MOSAIC还为专家模型训练数据中未包含的全新反应方法提供了条件建议,提出了一种合成氮杂吲哚类分子的全新路径,该方法经实验验证取得成功。

打破化学键的创新方法拓展分子合成的广阔前景

耶鲁大学团队与跨国制药公司勃林格殷格翰康涅狄格分部的研究人员合作研发MOSAIC,该分部已开始投入使用这套系统。“他们致力于设计全新的合成路线。”同样任职于耶鲁大学的理论与计算化学家、该研究合著者维克托·巴蒂斯塔表示,“如果能减少合成步骤,就能节省大量成本。”他补充道,MOSAIC已开源,可供其他研究团队免费使用。

中国广州国家实验室的化学家廖旷飙认为,这种专家模型框架的应用是“人工智能辅助化学领域的一项重要概念性突破”。“它将反应条件的选择重新定义为决策问题,而非单一输出的预测任务,推动人工智能从单纯预测走向实际应用。”他表示,该框架“保留了多种并行的化学优化目标,而非将其整合为单一的平均化模型,更贴合化学家在实验台上的实际推理逻辑”。

英国利物浦大学的计算机科学家泽诺丰·伊万格洛普洛斯也认同该方法具备更广泛的应用潜力。“除了作为化学合成领域可靠的人工智能工具所具备的实际应用价值外,MOSAIC还建立了一套可扩展的范式,通过模块化专项化的方式整合全球化学知识。”他说道。



https://blog.sciencenet.cn/blog-41174-1520436.html

上一篇:小运动大收益
收藏 IP: 117.143.180.*| 热度|

1 雒运强

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-1-30 12:28

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部