|||
关于计算机辅助药物设计的几点思考
摘要:
本文讨论了计算机辅助药物设计中的若干问题,仅为一家之言,供参考。
1. LBDD和SBDD方法的对应
2. LBDD和SBDD方法的整合
3. 药物设计方法的层次
4. 关于虚拟筛选
5. 关于药物设计软件
6. CADD研究的困难
关键词:计算机辅助药物设计;讨论;CADD;LBDD;SBDD;
计算机辅助药物设计(computer-aided drug design,CADD)大大加快了药物发现的速度。广义的CADD泛指在信息技术在药物分子设计与开发过程中的所有应用,包含信息分析技术、数据处理过程等;而通常意义上的CADD仅指基于分子模拟(计算化学)的分子设计技术,又可分为基于受体结构的药物设计(receptor-based or structure-based drug design, SBDD)和基于配体的药物设计(ligand-based drug design, LBDD)。SBDD从受体的结构和性质出发寻找可以与其特异结合的配体分子,所以也称为直接药物设计,包括基于受体结构的分子对接、活性位点分析、从头药物设计(生长或连接算法)等具体方法;LBDD根据已知活性的先导分子,构建结构-活性关系或药效基团模型,称为间接药物设计,包括定量构效关系(QSAR)、药效基团模型、受体映射、基于分子形状的叠合等具体的方法。在实际工作中,根据已知信息的多少可以选择相应的研究方法,当然已知信息越多越准确的时候,结果就越可靠。
本文结合作者从事相关工作的实践,谈一下对CADD的几点思考。
当然关于CADD本身的“有用”与“无用”的争辩,这里也就免了。(假舆马者,非利足也,而致千里;假舟楫者,非能水也,而绝江河。君子生非异也, 善假於物也。(《荀子·劝学》))
1. LBDD和SBDD方法的对应
虽然SBDD和LBDD两种方法有完全不同的出发点,但是二者在方法学或设计思想上存在细微而有趣的对应关系。任伟同学将我在《药物设计概论》课程中的这个观点整理成了一篇论文——《基于配体和受体的药物设计方法的对应性》,发表在《生命科学仪器》(2009,7:19)上。在这里将这一对应简单整理如下表,供感兴趣的朋友参考:
Table 1 Corresponding of receptor and ligand based drug design methods
表1 基于受体和配体药物设计方法的对应
|
SBDD example |
LBDD example |
|
Grid based Step sized or random placed |
Atomic probe |
Grid |
CoMFA, COMSIA, SOMFA, MFA |
Fragment probe |
MCSS, MFS
|
TopomaCoMFA |
|
Docking |
Traditional docking DOCK, FlexX, GOLD, AutoDock, FRED, SurflexDock, Glide |
Reversed docking RT-Dock |
|
Feature Based |
Pharmacophore based on protein Or Feature based protein site similarity/classfication |
Pharmacophore DISCO, Catalyst |
|
Fragment based |
Fragment searching Ludi, MFS, MCSS |
Legend, HQSAR, TopmaCoMFA, Scafflod hopping, Fragment based similarity, |
|
Alignment or superimpose
|
Structure or sequence based protein alignment |
Core structure, pharmacophore or field based alignment |
|
Knowledge based
|
Target like Active site like Protein diversity universe |
Drug like Lead Like Diversity |
|
Similarity or drug-target network |
Protein similarity landscape |
SAR-MAP and Chemical space analysis |
|
Hypothetical model
|
Initial design |
Hypothetical receptor model HASL |
下面的思维导图也供参考:
药物设计中SBDD和LBDD的对应甚至可以体现在整体水平上——蛋白质设计与改造 vs. 配基设计。药物设计是根据蛋白质的结构设计小分子配体,蛋白质设计是设计或改造基因序列,使表达后的蛋白具有特定的功能(如结合或催化底物),二者都是基于分子之间的相互作用。蛋白质改性、设计是一个十分重要并充满挑战的领域,并有可能藉此推动生命起源研究的发展。在蛋白设计发展到一定阶段说不定会出现潜在活性的蛋白库(虚拟的或者实体商品库)。到那时,将会出现与现在配体库的分析相对应的蛋白质的定量结构功能关系、蛋白商品库的多样性分析、生物相关性、稳定性研究等等研究方向。
可见,SBDD、LBDD这两种出发点完全不同的药物设计方法确实存在着微妙的对应关系。认识到这种对应关系不仅为药物设计方法的发展研究提供了素材,而且更为重要的是为今后药物设计方法的创新提供了重要的提示。例如,可以根据某种SDBB方法设计对应的LBDD方法,反之亦然。这为今后的药物设计方法的开发指出了一个捷径。
2. LBDD和SBDD方法的整合
SBDD以锁匙模型为基础,寻找可以与靶标结合的配体分子;而SBDD以相似性原理为基础,寻找与已知抑制剂具有潜在相同作用方式的配体分子。SBDD结果准确,可直接预测结合能,缺点是需要受体结构,速度慢;LBDD速度快,无需蛋白结构,但是有时由于缺乏具体结合方式的指导,结果外推时常常误差很大。这两种方法、理论是独立发展,各有其适用条件和利弊的。同时,这两类方法也是紧密联系的,将两种方法结合使用,特别是基于分子对接的三维定量构效关系研究(CoMFA based on Docking)常见于报道。以下是部分相关的文献:
l An Integrated Approach to Ligand- and Structure-Based Drug Design: Development and Application to a Series of Serine Protease Inhibitors. J. Chem. Inf. Model. 2008, 48, 1211–1226
l Combining Structure-Based Drug Design and Pharmacophores. Journal of Molecular Graphics and Modelling 23 (2005) 439–446
l Pseudoreceptor models in drug design: bridging ligand- and receptor-based virtual screening. NRDD, 2008,7:667
l Combined Target-Based and Ligand-Based Drug Design Approach as a Tool To Define a Novel 3D-Pharmacophore Model of Human A3 Adenosine Receptor Antagonists: Pyrazolo[4,3-e]1,2,4-triazolo[1,5-c]pyrimidine Derivatives as a Key StudyJ. Med. Chem. 2005, 48, 152-162
l Comparison of Ligand-Based and Receptor-Based Virtual Screening of HIV Entry Inhibitors for the CXCR4 and CCR5 Receptors Using 3D Ligand Shape Matching and Ligand-Receptor Docking. J. Chem. Inf. Model., 48 (3), 509 -533, 2008.
l A combined ligand-based and target-based drug design approach for G-protein coupled receptors: application to salvinorin A, a selective kappa opioid receptor agonist. J Comput Aided Mol Des (2006) 20:471–493
l Combining ligand-based and structure-based drug design in the virtual screening arena. EODD January 2007, Vol. 2, No. 1, Pages 37-49
LBDD和SBDD方法整合的趋势也体现在数据库的设计上,不仅大分子数据库加入了抑制剂等配基的信息,将小分子数据库中加入活性数据(PubChem,ChemBL,DrugBank)上,而且在系统生物学的高度上,将大小分子信息整合为一个生物代谢调控的网络,并用于药物设计和生物基础研究。
此外,不同的LBDD或SBDD方法之间还可以相互整合,如多拷贝子结构搜寻(MCSS,in Insight II or Discovery Studio)、多片段搜寻(MFS,in MOE)是基于片段的药物设计方法和基于格点的药物设计方法的整合。基于药效团的QSAR是LBDD中内部结合使用的例子。现在将两种方法结合使用的趋势越来越受到重视。
下图仅供参考:
Grid是一个很有特色的方法,DDT上有一篇论文对此进行了讨论,S. Cross, G. Cruciani, Drug Discov Today 2010, 15(1-2), 23-32。我们都知道ComFA是用探针对小分子进行格点扫描。Grid软件是用格点方法扫描大分子。不过,用于蛋白质活性口袋的表征时,GRID软件不仅使用原子探针(如碳正离子),还使用分子片段探针(羟基、氨基、羧基、苯环等),甚至允许使用整个分子作为探针(类似于分子对接)。(多原子探针的方法还应用在Accelrys公司的Ludi、MCSS、CGC公司的MOE中MultiFragment Search(MFS)等模块上,但是它们都允许这些小分子片段运动/优化其位置。)
可见,药物设计分析方法存在着层次差异:
l 电子:量化计算得到的静电势、电子云密度,轨道信息
l 亚原子:Grid探针的点阵扫描
l 原子:原子生长法,基于原子类型的LogP、MR计算;
l 片段:片段连接法、HQSAR、骨架迁越、TopomaCoMFA、Hansch、FreeWilson
l 分子:分子对接、分子描述符
相应地,我们都知道分子描述符可以分为:一维、二维、三维甚至多维;大分子的研究水平也可以分为一级序列(AA)、motif、二级结构和Fold、三级结构、结构域等水平。
//本来想花点时间,基于SBDD、LBDD的对应、整合以及药物设计层次的分类,整理出计算机辅助药物设计中QSAR、SBDD等方法的理论策略和技术发展的路线图,给出各种药物设计方法之间的联系(横向)及其发展脉络(纵向)。可是实在事情太多,而且能力有限,只好留爪在此,以后再说。
在药物设计中,大家常常会用到”虚拟筛选”这一名词,通常是指分子对接和基于药效基团的数据库搜寻。由于PDB数据库中蛋白质结构数量的快速增加,以及分子对接方法的进展,分子对接得到了全面的发展和广泛的应用,几乎成了虚拟筛选(VS)的代名词。其实,所有的CADD工作都可以看作虚拟筛选,即从众多的化合物(也包括虚拟的化合物)中得到活性的化合物。无论是分子对接、QSAR、药效基团、分子相似性筛选、三维结构叠合、分子骨架拆分等等都是虚拟筛选的途径。VS是目的,不是方法,CADD = VS。所有的SBDD都是基于互补的筛选,而所有的LBDD方法是基于相似性的筛选。各种筛选方法有不同的条件限制和速度,应采用先粗筛、再精筛的策略,在有限的时间内完成先导化合物的发现。
药物设计中最重要的是人的经验,特别是药物化学、药理学基础知识的经验,而不全是软件的优劣。相同的软件在不同的学者手中发挥的作用是不同的。CADD离不开软件,一个软件就是一种思维方式、问题求解思路的体现。从这个意义上讲,尽管各种对接软件采用不同的搜索算法、结合能力评价方式,但是所有的分子对接的软件都具有相同的思想,即配体和蛋白质之间的互补。可能一个新的对接软件采用了更高效的算法、更准确的打分,解决的还是同一个问题。虽然筛选策略的创新需要技术方法的支持,但是,研究策略的创新显然比纯粹方法上的改进更有意义。
软件的学习要熟悉该软件的理论方法和应用条件,特别是软件的新思想,而不是软件的用法。随着时间的推移,软件的界面、选项、平台都有可能发生变化,仅仅是学习软件的使用方法意义不大。每个软件的力场和理论虽然有所差别,可是基本理论还是一样的,大同小异而已,只有学会软件的基本理论才能以不变应万变。因此,要注意软件背后的原理,熟悉软件的适用条件和体系。
药物设计软件正两个方向发展,一个是综合平台越来越多,所以专业综合软件的价格越来越低,从这个方面说,药物设计软件已经不是从事药物理论研究的瓶颈,几乎每一个研究所,每一个公司都可以支撑一个CADD项目组。另外一方面,单功能的药物设计软件的力量也在加强,有些甚至强大到和综合软件相抗衡的地步,如Molecular Discovery的GRID历经多年依然年轻活力,而且衍生出一系列的应用(Volsurf等);此外,SARNavigator,Recore,Gold等软件,都是依靠其独特的算法、思路,专利的力量维持自己的发展,占据CADD软件市场一角。
药物设计软件中有免费和商业两种,对于制药公司,由于追求速度和效率,往往选择昂贵的商业软件,而对于科研用户,往往在二者之间徘徊,由于囊中羞涩,即向往于免费软件的自由,同时又觊觎商业软件操作的简便;虽然自由软件(特别是科研部门开发的软件)存在界面和操作上各种不足,但是其在应用领域的创新上,甚至是方法的创新上一直走在前列。以下是几个讨论文章:
l Drug Discov Today. 2005 Feb 1;10(3):219-22. Open-source software: not quite endsville.
l Drug Discov Today. 2005 Feb 1;10(3):213-7. The case for open-source software in drug discovery.
l Drug Discov Today. 2006 Feb;11(3-4):127-32. Optimizing the use of open-source software applications in drug discovery.
l Nat Rev Drug Discov. 2006 Sep;5(9):723-9. Epub 2006 Aug 18. Can open-source R&D reinvigorate drug research?
关于生物信息学和化学信息学软件开源的讨论参看我前面的博文。
6. CADD研究的困难
10年前,从事CADD研究的困难在于软硬件,昂贵的SGI机器、昂贵的sybyl、Insight II很少研究组能够买的起;5年前,主流药物设计软件都移植到了Linux平台,尽管用户体验还不是很好,毕竟已经开始平民化了,这个时候CADD工作者的困难变成了如何将理论同实验结合,真正的“辅助药物设计”;现在,从事CADD研究的困难则更多的在于缺乏新的药物设计思想,国内外众多的研究组都盯着为数不多的已经验证或者富有潜力的靶标,要想在资金和积累都十分有限的条件下脱颖而出是很困难的。比如HIV-1蛋白酶,已知的抑制剂数以千计,复合物的晶体结构估计也快400个了(09年7月份查询的结果是357个),采用传统的方法,要想做出突破真的是不容易。
几个策略方向:
l 药物设计最重要的是“靶标的选择”,靶标好,多花点钱,一定可以成功,靶标差,花了钱也会失败。现在的趋势是结合系统生物学、比较基因组学和网络药理学进行药物设计。
l 多靶标药物设计(单药多靶、多药协同);
l 数据挖掘(老药新用,DDT最近有一期专门讨论这个话题);
l 基于片段的药物设计和骨架跃迁;
l 高内涵筛选;
最后,以两幅忘了出处的图结束本文,以飨读者。
本文只为一家之言,由于知识、表达能力、时间有限,不足及错误之处难免,请原谅并不吝赐教。
本文的PDF版本:rasin.pdf 。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 20:49
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社