路漫漫其修远兮分享 http://blog.sciencenet.cn/u/zhpd55 追求科学,勇于探索,苦海无涯,愿作小舟。

博文

Chematica软件:化学合成无所不能吗?

已有 2150 次阅读 2018-3-13 21:30 |个人分类:新观察|系统分类:海外观察| 化学合成, Chematica, 计算机辅助

 Chematica软件:化学合成无所不能吗?

诸平

science[1].jpg

1-s2.bmp

        对于Chematica软件已经有文介绍(Chematica:化学合成的骇客帝国),褒贬不一。虽然很多有机合成化学家质疑Chematica的能力,但来自韩国蔚山国立科学技术研究所(Ulsan National Institute of Science and Technology, UNIST)的巴托兹·泽博尔斯基(Bartosz Grzybowski)教授坚信这款软件在未来将是设计合成路线必不可少的工具,它将开启一个化学合成的新纪元。英国布里斯托尔大学(University of Bristol)的有机合成资深学者V.阿加沃尔(Varinder Aggarwal)也说:计算机真的能判断出哪条路线管用?哪条路线高效?如果是真的,那将是个了不起的突破。从简单的原料开始合成一个复杂化合物是非常困难的,例如某个重磅药或一段DNA序列。研究者必须拼命回忆脑子里的反应或机理,再查阅大量文献,动用逆合成分析,拟定出一个有可能管用的合成路线。至于产率、成本、原料易得性等影响因素都来不及考虑太多,路线打通了再来考虑其他问题。

在有机合成天然产物的历史上,有许多合成过程就如同修建长城一样,需要许许多多科学家通过许许多多反应步骤,耗费巨大的精力、时间和经费才达成目标。我们也看到,另外有一些天然产物全合成,却是如同武侠小说中的顶尖高人出手,看似极简单几招,就克敌制胜。这种由简捷路径获得复杂天然产物的过程,又像是芭蕾舞演员优雅的舞步,充满了化学合成的美感,有时也给人以“大道至简”的感悟。但是,如何这项工作有计算机来协助完成,而且产率、成本、合成途径更优,你允许不可能信以为真。但是,购买Chematica软件的一家公司——密理博·西格玛(Millipore Sigma)公司的化学家研究团队,他们对于Chematica软件生成合成路线,创建所需的一系列反应合成目标产物能力进行实验室测试结果,会使人改变偏见,来重新认识和对待Chematica软件的潜力。测试结果已经在《化学》(Chem)杂志上发表——Tomasz Klucznik, Barbara Mikulak-Klucznik, Michael P. McCormack, Heather Lima, Sara Szymkuc, Manishabrata Bhowmick, Karol Molga, Yubai Zhou, Lindsey Rickershauser, Ewa P. Gajewska, Alexei Toutchkine, Piotr Dittwald, Michał P. Startek, Gregory J. Kirkovits, Rafał Roszak, Ariel Adamski, Bianka Sieredzinska, Milan Mrksich, Sarah L.J. Trice, Bartosz A. Grzybowski. Efficient syntheses of diverse, medicinally relevant targets planned by computer and executed in the laboratory, Chem, 2018, 4(3): 522–532. DOI: 10.1016/j.chempr.2018.02.002. https://www.sciencedirect.com/science/article/pii/S2451929418300639.(原文详见附件)

Efficient Syntheses of Diverse, Medicinally Relevant Targets Planned by Computer.pdf

该研究小组描述了给定软件8个种目标产物及其性能的测试报告。参与此项测试的科学家分别来自波兰科学院有机化学研究所(Institute of Organic Chemistry, Polish Academy of Sciences)、美国密理博·西格玛公司(MilliporeSigma)、美国西北大学化学系(Department of Chemistry, Northwestern University, USA)、波兰华沙大学数学、信息学以及机械学学院(Faculty of Mathematics, Informatics, and Mechanics, University of Warsaw)、韩国蔚山国立科学技术研究所(UNIST

    在化学中,设计合成是劳动密集型的,因此效率低下。化学家需要多年的知识沉淀和实践经验的积累,为了能够合成出一个理想目标产物,需要大量的时间和精力来开发一个反应序列。因此,化学家们多年来一直在想,计算机是否能完成这项任务。自20世纪70年代以来,人们的努力从未中断,但到目前为止,其结果并不尽人意,尚未令人印象深刻。最近,一个致力于Chematica算法的研究小组报告了有希望的结果,这可能就是为何2017年它被密理博·西格玛(Millipore Sigma)公司收购的原因所在。

    在这项新测试工作中,该项目的最初创建者之一——B. 泽博尔斯基与密理博·西格玛(Millipore Sigma)公司的其他人员,以及来自美国西北大学米兰密克西切教授(Prof. Milan Mrksich),通过具体合成实例来检验其速度和能力。该小组选择了8个具有药物潜在开发前景的目标物,其中有6种目标物是由密理博·西格玛研究团队提出的,另外2种目标物分别由B. 泽博尔斯基和M. 密克西切提出。

    他们在论文中报告,该计划花费了大约15-20 min时间来规划每一条合成路线,其中也包括了反应条件。对于8种目标物的合成测试,密理博·西格玛(Millipore Sigma)公司研究人员进行了4种,而另外4种目标物合成测试是由研究生和博士后完成的。为了检验结果,化学家需要沿着Chematica软件给出的合成路线进行合成实验,看看这个程序是否能产生预期的目标物。该研究小组报告称,Chematica软件成功地为事先设定的合成目标提供了理想的合成路线。此外,对于其中的7种目标物的合成,该项目创建的路线比以前的化学家创建的合成路线所经历的步骤更少,产量提高,耗时更短或成本更低。另外一种目标物的合成路线,是该程序产生的首条路线,而且成功地获得目标产物。 对于Chematica软件的能力考验,可能还需要更多的实践来检验,现在要给出化学合成无所不能的结论,可能还为时过早。更多信息请注意浏览原文或者相关报道。

 Read more at: https://phys.org/news/2018-03-chemists-chematica-ability-synthetic-routes.html

Sam Lemonick. Chematica put to the test. C&EN, 2018, 96 (10): 3. (March 5, 2018)

https://pubs.acs.org/doi/full/10.1021/cen-09610-leadcon

相关信息

氘氘斋.Chematica:化学合成的骇客帝国X-MOL. (2016-08-18). [2018-03-11]. http://www.x-mol.com/news/3025

     IT技术的进步,或许真的能改变一切,包括化学合成。有一款神奇的软件系统Chematica,包含上百万种已知分子和化学反应,听起来像是词典?NO NO NO!它还包含了信息间的联系和比对功能,就像化学世界的互联网一种。虽然很多有机合成化学家质疑Chematica的能力,但来自韩国蔚山国立科学技术研究所(Ulsan National Institute of Science and Technology, UNIST)的巴托兹·泽博尔斯基(Bartosz Grzybowski)教授坚信这款软件在未来将是设计合成路线必不可少的工具,它将开启一个化学合成的新纪元。英国布里斯托尔大学(University of Bristol)的有机合成资深学者V.阿加沃尔(Varinder Aggarwal)说:计算机真的能判断出哪条路线管用?哪条路线高效?如果是真的,那将是个了不起的突破。从简单的原料开始合成一个复杂化合物是非常困难的,例如某个重磅药或一段DNA序列。研究者必须拼命回忆脑子里的反应或机理,再查阅大量文献,动用逆合成分析,拟定出一个有可能管用的合成路线。至于产率、成本、原料易得性等影响因素都来不及考虑太多,路线打通了再来考虑其他问题。在这种工作模式下,研究者的记忆力对设计合成路线显得尤为重要。不过知识一旦生疏就会遗忘,就是比较熟悉的一两年不用某个反应也可能遗忘也不是没有。

化学定向越野

    在合成路线打不通的沮丧中,Chematica横空出世。过去15年间,B. 泽博尔斯基和同事们手动录入了1000万个分子和反应,并将它们彼此链接,成就了一款非常复杂的软件。Chematica看起来很像航线图,有中转,也有枢纽。这种网状布局使Chematica能够快速找到合理的路径,比从数据库或列表中搜索要节省时间。这就好比坐地铁时,地铁线路图要比地铁站名A-Z列表更好用一样。

http://xpic.img-cn-hangzhou.aliyuncs.com/upload%2F20160817%2F62601471430595292.jpg

Chematica给出的成本最优化的伐地那非合成路线,用到的反应跨越半个世纪。图片来源:Wiley

       化学家只需把目标分子输入Chematica就能得到基于成本、底物易得性、步骤数等影响因素筛选出的反应路线,这一切仅仅需要数秒钟。每一步反应及产物都会基于两个方程进行评分:反应评分函数化合物评分函数。如果涉及的化学反应很难操作,反应评分就会变低;如果涉及的化合物结构比较简单或常见,化合物评分就会较高,反应路线也就显得更合理。这些评分函数使Chematica能够评估每条路线,将那些明显不可行的去掉。

 步步为营

        有人认为Chematica的算法和下棋程序类似,不过B. 泽博尔斯基觉得这个类比不够准确。他认为下棋时,由于落子不悔的规则,你只需瞻前,无需顾后。合成路线设计则复杂得多。

        领导Dial-a-molecule网站(‘Dial-a-molecule’ network)的理查德·惠特比(Richard Whitby)认为准确、高质量的数据是关键的基础。他举例说,逆合成分析工具ARChem SynChem效果不是太好,因为它们的数据来源是ReaxysR. 惠特比称:“这些数据充满错误和缺陷,ARChemSynChem以此为基础,给出的建议就会很愚蠢。让软件接受并运用化学反应规则也非常重要。这里不得不提有机合成大师E. J. 科里(E. J. CoreyJuly 12, 1928-)在20世纪70年代开发的逻辑和启发式应用于合成分析(Logic and Heuristics Applied to Synthetic Analysis——LHASA软件,该软件中写入了很多化学规则。但很可惜E. J. 科里研究小组只录入了300个规则,这显然是不够的。

继续前进

        B. 泽博尔斯基用自动化平台开发了另一款软件:Syntaurus。过去十年间,B. 泽博尔斯基团队已经手动编码了20000条化学规则。这些规则涉及不能共存的基团、保护基策略、甚至键长键角的细微差别等。如果不能依靠机器学习,这将是个大麻烦。化学规则的数据量可能比《大英百科全书》还多。

http://xpic.img-cn-hangzhou.aliyuncs.com/upload%2F20160817%2F32921471430595826.jpg

Syntaurus只用了几个小时就找出了epicolactone最佳合成路线

来源:Chemistry World

 

       最近的研究中,B. 泽博尔斯基证明了Syntaurus的潜力。该程序成功给出了epicolactone的全合成路线,该物质2012年提取自真菌中,是结构复杂的天然产物。合成化学家花了将近3年时间设计了一条生物合成路线(点击阅读相关[20],Syntaurus只花了几个小时。

http://www.x-mol.com/news/993

    在有机合成天然产物的历史上,有许多合成过程就如同修建长城一样,需要许许多多科学家通过许许多多反应步骤,耗费巨大的精力、时间和经费才达成目标。我们也看到,另外有一些天然产物全合成,却是如同武侠小说中的顶尖高人出手,看似极简单几招,就克敌制胜。这种由简捷路径获得复杂天然产物的过程,又像是芭蕾舞演员优雅的舞步,充满了化学合成的美感,有时也给人以“大道至简”的感悟。

    德国慕尼黑大学的化学生物学与遗传学教授迪尔克·特劳纳(Dirk Trauner)及其团队,他们合成了一种从内生真菌中分离的化合物epicolactoneEpicolactone2012年才被从一种叫做附球菌的内生真菌中纯化出来,这种内生真菌生长在农业上很重要的热带植物上,如甘蔗和可可树。从结构上来看,epicolactone是一个高度复杂的天然产物,包含多个立体中心,其特征是互相连接的环组成一个复杂的网络。我们想知道生物体怎样合成这个非常美丽的结构,并希望利用这方面的知识来设计一个高效的全合成途径D. 特劳纳说。

http://xpic.img-cn-hangzhou.aliyuncs.com/upload%2F20150916%2F62051442360015846.jpg

目前epicolactone的生物合成途径还是未知的,但该研究团队注意到它的结构和化合物棓酚之间的相似性。棓酚是一类天然色素,其中一些是使发酵茶和许多种真菌的颜色变深的成份。棓酚的生物合成已经研究的很透彻了,这使我们能够设计出epicolactone的仿生全合成方案。这种途径始于香草醇,只需8个步骤就可以合成出epicolactone” D. 特劳纳说。这是如何利用简单前体组装结构复杂的天然产物的又一典型实例。这种合成途径也能得到另一种称为isoepicolactone的相关化合物,D. 特劳纳认为这也可能是附球菌中的一种天然产物。根据这一合成途径,D. 特劳纳等人也提出了epicolactone的生物合成途径的假设。

http://xpic.img-cn-hangzhou.aliyuncs.com/upload%2F20150916%2F61751442360015925.jpg

新的发现使人们有可能在实验室制备足够量的epicolactone以进行药用研究。该团队还计划进一步阐明其化学级联反应的精确机制,以了解其更广泛的生化意义。D. 特劳纳说,我们这项工作是所有已知天然产物全合成中最短和最优雅的一个。道法自然,或许也是追寻漂亮全合成的一条道路。

[20] Pascal Ellerbrock, Nicolas Armanino, Marina K. Ilg, Robert Webster, Dirk Trauner. An eight-step synthesis of epicolactone reveals its biosynthetic origin. Nature Chemistry, 2015, 7: 879–882.

doi:10.1038/nchem.2336. http://www.nature.com/nchem/journal/vaop/ncurrent/full/nchem.2336.html

回应质疑

        ChematicaSyntaurus的质疑声音当然没有消失。英国布里斯托尔大学(University of Bristol)的有机合成资深学者V.阿加沃尔说,下一步的打算应该是让计算机合成相当复杂的分子,在实验室中验证。如果复杂分子也能成功,那我必须承认这些软件是有用的。” R. 惠特比则乐观得多,只要你真的去用Chematica,就很可能收获有意义的结果,这一点我们非常确信。

     不过B. 泽博尔斯基则宣布Syntaurus接受了V.阿加沃尔的挑战(复杂分子合成),并且已经取得成功。尽管他本人对该项目守口如瓶,他的团队还是透露Syntaurus可以给出一种重磅药的最短、最便宜的合成路线,实验室已经验证过。尽管如此,对于Syntaurus的真正价值还有待进一步检验。但利用计算机服务化学研究、推动化学进展是大势所趋。化学知识进一步积累,计算机对化学知识检索、整理能力的进一步提升,未来真的有可能实现天下无不可合成之分子

参考文献:

[1]  Mikołaj Kowalik, Chris M Gothard, Aaron M Drews, et al. Parallel optimization of synthetic pathways within the network of organic chemistry. Angew. Chem. Int. Ed., 2012, 51(32), 7928-7932. (DOI: 10.1002/anie.201202209)

[2]  E. J. Carey, W. Todd Wipke, Richard D. Cramer, et al. Computer-assisted synthetic analysis. Facile man-machine communication of chemical structure by interactive computer graphics. Journal of the American Chemical Society, 1972, 94, 421-430. (DOI: 10.1021/ja00757a020)

[3] Sara Szymkuć, Ewa P. Gajewska, Tomasz Klucznik et al. Computer-assisted synthetic planning: The end of the beginning. Angew. Chem. Int. Ed., 2016, 55, 5904-5937. (DOI: 10.1002/anie.201506101)

[4] Matthew Gunther. Revolutionary computer program could change chemistry forever. Chemistry World, (10 August 2016). [10 March 2018].

http://www.rsc.org/chemistryworld/2016/08/chematica-syntaurus-revolutionary-computer-program-synthetic-pathway-software

 米兰密克西切(Milan Mrksich)教授简介
     
米兰密克西切博士是生物物理动力学研究所的创始人之一,美国西北大学生物医药、细胞生物与分子生物领域杰出教授。米兰密克西切博士的研究小组的研究计划融合了有机化学、生物学和材料学三大领域。其中,化学生物学方向运用了结构完善的基质作为细胞外基质的模型,来研究细胞粘附性、移动性和分化性。另一项相关的计划则通过工程学的方法,用电子材料来整合细胞,并开发了电气化学方法来控制和解读粘附细胞的行为。第三个研究项目是在蛋白质制备的基础上通过仿生学方法,研发出新型纳米结构材料。第四个研究项目是通过对液体-固体界面反应的基础研究,阐明了影响界面反应的有机物理学原则。
    
米兰密克西切博士已发表了75篇学术论文,并受邀进行了超过100场讲座。他获得了诸多荣誉,包括:Camille and Henry Dreyfus新教师奖、Searle学者奖、Alfred P. Sloan研究奖金、Camille Dreyfus教师学者奖和美国化学学会Arthur C. Cope学者奖。他被《技术评论》杂志评选为100位年轻创新者之一。
    
米兰密克西切博士在美国国防部高级研究计划局国防科学研究委员会,为阿尔贡国家实验室(Argonne National Laboratory朗缪尔Langmuir)科技顾问委员会编辑顾问,也是多家生物科技公司的长期顾问和顾问委员会成员。

 Milan Mrksich

 

"Cells perform a broad range of functions—including the control of muscle              contraction, the storage of memories, and the mounting of immune               responses—through the collective actions of thousands of proteins.                I'm interested in the roles of the individual proteins in these processes, and I'm developing tools to gain a systems-level understanding that reveals             the design rules used in biology." 


 

Current research interests include; Biomaterials and interfaces, Cell adhesion and migration, Electroactive interfaces, Physical organic chemistry of         interfacial reactions, and Bio-Inspired Nanostructured Materials and Biochips.

 

Education

 

1989 B.S. in Chemistry, Magna Cum Laude                        University of Illinois, Urbana-Champaign, Illinois

1994 Ph.D. in Organic Chemistry                        California Institute of Technology, Pasadena, California

 

Research Experience and Positions

 

1987-1989 Undergraduate Research Assistant with Professor Steven C. Zimmerman                        University of Illinois at Urbana-Champaign,  Illinois

1989-1994 Graduate Research Assistant with Professor Peter B. Dervan                        California Institute of Technology,  Pasadena, California

1994-1996 Postdoctoral Fellow with Professor George M. Whitesides                        Harvard University, Cambridge, Massachusetts

1996-2000 Assistant Professor of Chemistry, The University of Chicago

1997-2011 Institute for Biophysical Dynamics, The University of Chicago

2000-2003 Associate Professor of Chemistry, The University of Chicago

2001- Associate Director, Nanoscale Science and Engineering Center at Northwestern

2003-2011 Professor of Chemistry, The University of Chicago

2005- Investigator, Howard Hughes Medical Institute

2011- Henry Wade Rodgers Professor in Biomedical Engineering, Chemistry, and Cell and Molecular Biology 


Honors

 

1989 University of Illinois Marvel Undergraduate Research Award

1990-1993 National Institutes of Health National Research Service Award

1993-1994 Ralph M. Parsons Foundation Graduate Fellow

1994-1996 American Cancer Society Postdoctoral Fellow

1996-1999 Searle Scholar Award

1996-2001 Camille and Henry Dreyfus New Faculty Award

2000 Sloan Research Fellow

2000 Camille Dreyfus Teacher-Scholar Award

2000 Sara Jane Rhoads and Rebecca Raulins Lecturer,  University of Wyoming

2002 TR100 Young Innovator Award

2002 R.C. Fuson Visiting Scholar,  University of Illinois

2003 ACS Arthur C. Cope Young Scholar Award

2005 Fellow, American Association for the Advancement of Science

2007 Murtiashaw Lecture, University of South Carolina

2008 Margaret Etter Lecture, University of Minnesota

2013 Fellow, American Institute for Medical and Biological Engineering

Service and Advisory Positions

1996- DARPA Defense Sciences Research Council (2006-08,  Chair)

1997- Editorial Board of Langmuir

1998-2000 Scientific Advisory Board of Cellomics

1999-2007 Scientific Advisory Board of ChemoCentryx

1999-2005 Scientific Advisory Board of Surface Logix

2000 WTEC Panel for International Evaluation of Tissue Engineering Programs

2000- Editorial Board of E-Biomed: The Journal of Regeneartive Medicine

2001 Extramural Chair for NIH/BECON Symposium on Biosensors

2002- National Institutes of Health EBT Study Section (2005-07, Chair)

2002 International Panel for Review of Materials Research in United Kingdom

2002 WTEC Panel for International Evaluation of Biosensor Programs

2002-2005 Board of Directors of the Pittsburgh Tissue Engineering Initiative, Inc.

2002-2003 Science and Technology Advisory Committee for Argonne National Laboratory

2003-2008 Board of Governors for Argonne National Laboratory

2003-2008 Scientific Advisory Board of Helicos

2004- Editorial Board of IEEE Transactions on NanoBioscience

2004- Editorial Board of Chemistry & Biology

2004- Advisory Board of the Searle Scholars Program(2007-Present, Chair)

2004- Editorial Advisory Board of Chemical Society Reviews

2005- Founder and Scientific Advisory Board of WMR Biomedical Inc.

2007- Sceintific Advisory Board of NanoInk, Inc.

2008- Editorial Board of Small

2011- Editorial Board of Disruptive Science and Technology

 Milan Mrksich_Page_1.jpg



http://blog.sciencenet.cn/blog-212210-1103745.html

上一篇:克罗斯比:现代血液学研究的创始人之一
下一篇:[转载]我安然地对这一生表示满意

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2018-9-20 11:27

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部