|||
化学领域的数字化突破,可能会改变制药行业
诸平
美国东部时间2020年10月24日,美国消费者新闻与商业频道(Consumer News And Business Channel, CNBC)网站,发表了查理·伍德(Charlie Wood)撰写的文章,题为“科学家在化学领域取得了数字化突破,可能会改变制药行业(Scientists make digital breakthrough in chemistry that could revolutionize the drug industry)”,2天之后对其内容进行了更新。关键点包括三方面内容:
1)在英国格拉斯哥大学的克罗宁实验室(Cronin Lab at the University of Glasgow),化学家开发了一种软件,该软件可以将化学家之言转化为机器人可以理解的分子配方。
2)该实验室的主要研究人员李·克罗宁(Lee Cronin)教授设计了一个机器人化学家,称其为“ chemputer”,可以通过XDL程序生产化学药品,包括药物瑞德西韦(remdesivir),这是一种美国FDA批准的抗冠状病毒治疗药物。
3)李·克罗宁和他的同事仅仅是许多将化学带入数字时代的研究团体之一。
2020年6月,美国政府购买了全世界供应的绝大部分瑞德西韦,这是美国FDA批准的一种Covid-19抗病毒药物。生产该化合物的公司吉利德(Gilead)最近宣布,它将在10月底前满足国际需求。然而,一直以来,只需按一下按钮,就可以生成一批将近400个原子的分子的数字指令,就一直存在于一个在线软件存储库Github上。
格拉斯哥大学的李·克罗宁(Lee Cronin,Leroy Cronin)实验室里,陈列着十余台这样的机器人化学家(chemputer),李·克罗宁作为一位化学家,他设计了由管道、泵和烧瓶组成的鸟巢(bird's nest),并编写了代码在机器人化学家(chemputer)上面运行了瑞德西韦分子的合成。他花了好多年的时间就是为了实现这一梦想,梦想着在未来,研究人员可以像发送电子邮件和打印PDF文件一样轻松地分配和生产任何分子,从而使无法订购药物的现象再也不会出现,只能成为过去的历史。他说:“如果我们拥有发现分子,合成分子,然后制造它们的标准方法,那么突然之间断货或者供不应求也就荡然无存了。这种方法它就像一种化学电子书阅读器,一切化学问题都有可能迎刃而解。”
李·克罗宁和他的同事2019年曾经描述过他们的机器产生多个分子的能力,现在,他们已经迈出了第二个重要的步骤,以一种易于使用的方式对机器进行编程来对化学数字化。他们的软件将学术论文转化为可执行的化学程序,研究人员可以在无需学习编码的情况下进行编辑,详见他们2020年10月初在《科学》杂志上发表的研究成果——S. Hessam M. Mehr, Matthew Craven, Artem I. Leonov, Graham Keenan, Leroy Cronin. A universal system for digitization and automatic execution of the chemical synthesis literature. Science, 02 Oct 2020: Vol. 370, Issue 6512, pp. 101-108. DOI: 10.1126/science.abc2986
李·克罗宁(Leroy Cronin)带领的团队他们并不孤单。该团队仅仅是代表了跨越学术界和企业界的数十个小组之一,他们都在竞相将化学技术带入数字时代,这一发展可能会导致更安全的药物,更高效的太阳能电池板以及颠覆性的新产业问世。
李·克罗宁也称为勒罗伊·克罗宁(Leroy Cronin)。克罗宁小组希望他们的工作能够实现他们所说的“化学数字化(Spotify for chemistry)”,成为一个可下载重要分子配方的在线知识库,他们说,这可以帮助发展中国家更轻松地获取药物,实现更有效的国际合作,甚至支持人类对空间的探索。除此之外,斯坦福研究所(SRI)国际部(SRI International)作为一家研究公司,虽然并未参与格拉斯哥的研究(Glasgow research),但是他们开发了另一套自动化化学系统。SRI国际部的SRI 生物科学(SRI Biosciences)首席战略官内森•柯林斯(Nathan Collins )表示:“大多数化学方法是过去200年以来沿用的方法,而且一直尚未改变。这是非常手工的,由工匠推动的过程。” 而自动化“那里有数十亿美元的机会”等待开发。
勒罗伊·克罗宁新作品的核心是他所谓的化学描述语言或XDL。X表示希腊语中化学词(χημεία)的第一个字母。XDL对于chemputer而言,就像是超文本标识语言(HTML)条件下的浏览器,它告诉机器该做什么。该小组还创建了名为合成浏览器(SynthReader)的软件 ,该软件可以扫描经过同行评审的文献中的化学配方(chemical recipe),例如六步法合成remdemisvir,并使用自然语言处理来挑选动词,例如“添加”,“搅拌”或“加热” ; 修饰符如“逐滴”以及其他详细信息,例如持续时间和温度。系统将这些指令转换为XDL,XDL指导chemputer使用其加热器和试管执行机械动作。
根据勒罗伊·克罗宁的说法,该框架的优势之一是化学家可以用简单的英语编辑化学方案。该功能使研究人员无需经过任何训练即可操作机器,而且,至关重要的是,他们可以利用自己的化学专业知识来发现代码中的错误。当然电脑崩溃是一件很严重的事情。他说:“需要有人对其进行监管,以确保运行正常,别出差错。”
研究人员对该系统进行了测试,尚未发现异常。该小组报告说从化学文献中提取了12种示范配方,例如以麻醉剂利多卡因(lidocaine)合成为例,chemputer可以与人类化学家相似的效率进行操作。
化学机器人的改造
勒罗伊·克罗宁建立了一家名为Chemify的公司来销售化学机器人和XDL软件包,尽管他还在线上发布了免费指令(posted free instructions),用于构建和编程化学机器人。该设备已经在化学领域取得了进展。2019年5月,该团队在制药公司葛兰素史克(GlaxoSmithKline,GSK)就已经安装了一个原型。GSK人工智能和机器学习全球负责人金·布兰森(Kim Branson)表示:“chemputer和勒罗伊·克罗宁所做的工作确实具有很大的变革性。” 该公司正在探索各种自动化技术,以帮助其更高效地生产各种化学品,但金·布兰森表示,特别是勒罗伊·克罗宁的工作可能会让GSK在公司内“传送专业知识(teleport expertise)”。一旦化学家设计出了一种有前途的分子配方,而不是撰写报告或教同事如何进行操作,他们只要按一下共享按钮即可进行试生产。
研究人员说,尽管Chemify不是最复杂的自动化化学平台,但它可能是最容易使用的、最易于访问的平台。它围绕烧杯和试管的传统工具构建,并按照化学家使用了几个世纪的“分批”模式逐步发挥作用。勒罗伊·克罗宁还希望它具有通用性:与任何批处理化学机器人兼容。拥有自己机器的研究人员只需要告诉软件他们拥有什么部件,并给它一些数据,例如加热器的温度即可开始进行工作,执行化学操作,进行化学实验来生产目标产物。
其他研究小组则押注于一个更戏剧性的突破,摆脱化学的根基。在SRI,内森•柯林斯监督一个名为AutoSyn的平台开发,该平台使用了一种叫做“流动”化学("flow" chemistry)的替代方法。在流动中,化学反应持续进行,而不是在一个烧杯中混合一种物质,然后将其移到另一个烧瓶中。化学物质在管道中流动,在那里发生反应,然后被带走。内森•柯林斯和他的同事在6月份发表的一篇文章(in a publication in June)中提到,有超过3000条途径,AutoSyn可以重现几乎任何一种基于液体的反应。
内森•柯林斯说,在流动中进行化学反应研究需要专门的硬件和额外的努力,才能从其批次描述中转换化学过程,但是这笔投资购买了对传热和混合等方面的“精细”控制。如果像AutoSyn这样的机器,能自动对已发表的反应进行数百次细微的改变,那么它们所产生的详细数据集就能突出说明生产化学品的最佳方式。
文献可能是一个很好的起点,但是许多已发表的实验都有缺陷。内森·柯林斯估计,化学家会花费30%至70%的时间来找出已知反应中的遗漏细节。他说:“(反应)是由一个人坐下来,根据前一天做的事情或六个月前做的事情写下来的。”
尽管当今AutoSyn和Chemputer都能够复制大多数已发表的反应,但下一步将是使这些机器更可靠,并像勒罗伊·克罗宁所说的那样“使苹果出色(Apple groovy)”——锦上添花。 内森•柯林斯说,AutoSyn过去需要工程师花费一半以上的时间来保持其运行,但现在需要修复的时间不到10%。他希望最终,用户将通过电话对系统进行故障排除。 他说:“这仍然是一门非常新的科学。” “在过去的一年半(18个月)时间内,它确实出现过爆炸。”
导致爆炸的一个因素是国防高级研究计划局(Defense Advanced Research Projects Agency, DARPA)。它总结了一个名为Make-It的为期四年的计划,其中包括Chemputer和AutoSyn。该计划的经理安妮·菲舍尔(Anne Fischer)的长远目标是加快发现有用分子的过程,这在历史上涉及很多等待,而化学家们努力地将原子精加工成新颖的构型。她说:“缓慢的步骤始终是制造和测试分子。”
但是,现在Make-It已经帮助生产出机器人工具来制造分子,像Chemputer, AutoSyn以及其他等。她(安妮·菲舍尔)正在指导一项新的DARPA项目,加速分子发现(Accelerated Molecular Discovery),该项目将着眼于下一个阶段:开发更智能的软件来告诉机器人应该制造什么分子以及如何制造它们。
她说:“我们现在正在尝试利用在Make-It中所做的工作并将其扩展到其他地方,以便我们可以教计算机如何发现新分子。”
许多人认为,这样做的秘诀是基于机器学习。而且一些能够进行基本化学学习的机器也正在开发中。美国麻省理工学院(MIT)的化学家康纳·科利(Connor Coley)是一个团队的成员,该团队去年(2019年)将自动流动化学系统与一种控制系统的算法进行了配对,以对其进行指导。该算法在包含数十万个反应的数据库上进行了训练,并且能够预测新产品的配方。康纳·科利说:“它试图根据这些模式来理解,什么样的转化方式应该适用于从未见过的新分子。”
他强调说,该体系还有很长的路要走。它的预测是基于相似的分子,人类化学家需要充实机器生成的轮廓中缺少的细节。尽管如此,这项工作还是支持了软件可以提出有用配方的观点。美国麻省理工学院正在与十几家化学公司和制药公司合作,以改进其分子预测算法,而且一些公司已经将该软件投入使用。默克公司(Merck)负责计算和结构化学的副总裁助理胡安·阿尔瓦雷斯(Juan Alvarez)表示,科利的机器学习算法是公司向内部研究人员提供的多种化学预测工具之一。他说:“它的部署绝对会影响我们今天的时间表。”
尽管每个小组都从不同的角度来探讨自动化,但他们都在解决相同的问题。存在着几乎无限多种可能的分子-其中某些肯定是可以挽救生命的药物或革命性的新材料-但几乎没有人具备分析、制造和测试这些化合物的专门技能。
他们的目标是避免浪费那些稀有技能。在某些方面,化学家的工作仍然与抄写员的工作相似,抄写员曾经煞费苦心地抄写和修改别人的著作。像克罗宁(Cronin)等研究人员都希望,借助印刷机、文字处理器和自动校正来处理化学等价物,未来的化学家将花费更少的时间进行重建,而花费更多的时间来进行创造。
安妮·菲舍尔说:“这不是要取代化学家。” “这是为化学家提供工具,使他们能够实施和应用化学方法,并使他们成为富有创造力的高级思考者。”更多信息请注意浏览原文或者相关报道。
A typical chemist running a known reaction will start by finding the method described in a published paper. Mehr et al. report a software platform that uses natural language processing to translate the organic chemistry literature directly into editable code, which in turn can be compiled to drive automated synthesis of the compound in the laboratory. The synthesis procedure is intended to be universally applicable to robotic systems operating in a batch reaction architecture. The full process is demonstrated for synthesis of an analgesic as well as common oxidizing and fluorinating agents.
Science, this issue p. 101
Robotic systems for chemical synthesis are growing in popularity but can be difficult to run and maintain because of the lack of a standard operating system or capacity for direct access to the literature through natural language processing. Here we show an extendable chemical execution architecture that can be populated by automatically reading the literature, leading to a universal autonomous workflow. The robotic synthesis code can be corrected in natural language without any programming knowledge and, because of the standard, is hardware independent. This chemical code can then be combined with a graph describing the hardware modules and compiled into platform-specific, low-level robotic instructions for execution. We showcase automated syntheses of 12 compounds from the literature, including the analgesic lidocaine, the Dess-Martin periodinane oxidation reagent, and the fluorinating agent AlkylFluor.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-11 01:15
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社