IMATSOFT的个人博客分享 http://blog.sciencenet.cn/u/IMATSOFT

博文

【自主研发】如何使用Discovery Studio进行反向找靶

已有 5880 次阅读 2022-11-10 11:43 |系统分类:科普集锦

反向找靶又被叫做靶点垂钓(Target Fishing)目前,通过计算机辅助进行反向找靶主要有三种方法:反向分子对接(Inverse Docking)、药效团模型搜索(Compound Profiling)及基于配体分子相似性分析(Lignad Similarity Search)。这三种方法可以实现反向筛选以搜索小分子药物的未知靶标、非预期靶标或二级靶点。这三种不同的计算方法是互补的,可以相互结合使用。相比之下,形状和药效团筛选更简单、更快捷,而反向对接更复杂、更慢。我们将在以下部分中详细介绍这三种方法。


123.png


基于配体分子相似性搜索(Lignad Similarity Search)

从二维(2D)的角度来看,形状筛选的基本原理是“结构相似的分子可能通过靶向相同的蛋白质而具有相似的生物活性;从三维(3D)的角度来看,基本原理是具有相似体积的分子在蛋白质的活性口袋中,可能具有与相同或相似大小的空间有效结合的潜力(考虑配体诱导的拟合效应)。为了使用形状筛选来预测小分子的靶标,需要用蛋白质靶标注释的小分子配体数据库。然后,可以单独测量查询分子与数据库中每个配体的整体形状相似性。最后,具有高相似性分数的匹配分子的蛋白质靶标可以被认为是查询分子的潜在靶标。形状筛选涉及两个级别的映射:第一个映射在查询分子和数据库中的配体之间,第二个映射在数据库中匹配的配体与其注释的蛋白质靶标之间。


形状相似性比较基于小分子的2D或3D拓扑结构。值得注意的是,2D方法最初是为了在配对分子之间获得更多相同的部分而创建的,而3D方法可用于增强支架多样性。2D方法中分子相似性比较的通用描述符是FingerPrint2D(FP2),它使用简单的位向量来表示各种化学特性,并在各种软件和数据库中编码,最常用的 FP2 类型是扩展连接指纹 (ECFP),它是圆形指纹。基于3D拓扑的结构匹配主要比较分子的3D几何形状,有时添加药效团、光谱团、或其他附加信息。2D 和 3D 方法中描述符的相似性可以通过谷本系数来衡量。谷本系数表示两个分子形状的结合与交集的比率。


Discovery Studio为研究者提供了多种基于配体分子相似性搜索的程序:分别为Find Diverse Molecules(根据所选的分子性质,从输入配体中找到不同的配体子集)、Find Similar Molecules by Numeric Properties(通过数值属性查找相似分子协议查找与参考配体相比具有相似属性的配体,在每个输入配体的性质和参考配体的性质之间测量一个距离,距离最小的配体被认为是最相似的)、Find Similar Molecules by Fingerprints(通过指纹查找相似分子协议在输入库中查找与参考配体相似的配体。相似性是通过比较选定的指纹属性来衡量的)。或根据帕累托方法从大型库中优化指定数量的子集,还可以使用帕累托优化方法从组合库中优化指定数量的子集库。


由于形状筛选是基于整体分子形状的比较,因此可能不适合预测过大或过小分子的潜在靶标。判断超大分子的潜在靶标是困难的,因为其最佳匹配配体通常显示低相似性分数,并且选择尺寸过小分子的潜在靶标很困难,因为它的匹配配体数量众多,相似度分数高。形状筛选适用于预测潜在靶标,其可用抑制剂的大小与查询分子的大小相似,但不太适合寻找新的靶标,这些靶标的当前抑制剂的大小与查询分子有很大不同,但由于强烈的诱导拟合效应,其活性口袋空间很容易调整以结合不同的配体。

 

药效团模型搜索(Compound Profiling)

药效团筛选的基本原理是某些药物与其蛋白质靶标的结合主要由关键功能药效团决定。因此,这些重要药效团的匹配可用于寻找小分子药物的新靶点。药效团是功能特征的空间排列,允许分子以特定的结合模式与靶蛋白相互作用,例如疏水中心(H),氢键受体载体(HBA),氢键供体载体(HBD),带正电的中心(P)或带负电的中心(N)。在药效团筛选中,查询分子的药效团特征与数据库中药效团模型的特征相继匹配。较高的匹配度表明匹配药效团模型的注释蛋白质靶标具有更大的潜力成为查询分子的靶标。药效团筛选还经历了两个层次的映射:第一个映射是查询分子的药效团模型和数据库中配体之间的映射,第二个映射是数据库中配体的匹配药效团模型与其注释的蛋白质靶标之间的映射。

药效团数据库是通过药效团建模建立的,可分为仅使用配体、仅使用受体结构或共结晶复合物结构。Discovery Studio为研究者提供多种构建药效团的程序和方法:如,Auto Pharmacophore Generation(从单个配体生成一组选择性药效团模型)、Interaction Pharmacophore Generation(生成非键相互作用药效团模型)、Common Feature Pharmacophore Generation(从一组配体生成共同特征药效团模型)、Ensemble Pharmacophore Generation(生成集合药效团模型)、3D QSAR Pharmacophore Generation(从一组配体生成药效团预测模型)、 Interaction Generation(基于受体活性口袋的药效团模型)等。

在药效团筛选中,药效团模型之间的成对适应度评分可以直接作为靶标评价的依据。一个分子与多个代表各靶标蛋白的药效团模型相互匹配,按照打分高低来判定可能与哪个靶标相互作用。Discovery Studio中包含目前市场上最大的受体-配体复合物药效团数据库PharmaDB,该数据库是基于scPDB(2017)13,657 个复合物晶体结构构建的,并且已根据不同的靶标类型进行了分类。Discovery Studio包含多个搜寻、提取药效团的程序,其中Ligand Profiler可自动实现多个分子和多个药效团模型的匹配并进行打分排序。因此,结合PharmaDB、自建药效团DB、自建小分子数据库,Discovery Studio可以快速有效且全面地进行靶标搜寻、中草药有效成分的确定以及化合物毒副作用评价。 

与形状筛选相比,药效团筛选可以提高预测的准确性,因为它侧重于匹配关键的药效团官能团。此外,它可以忽略分子的总大小。因此,药效团筛选可用于搜索具有大体积或小体积的查询分子的潜在靶标,也可用于寻找能够结合多种配体的新型蛋白质靶标。

 

反向分子对接(Inverse Docking)

反向对接的基本原理是小分子配体和潜在蛋白质靶标的结合强度由它们的相互作用能(对接能)决定。为了使用反向对接来预测查询分子的靶标,通常需要一个包含大量蛋白质靶标的结构网格数据库。然后,查询分子与数据库中的每个蛋白质结构单独对接。计算每个对接分数。最后,根据蛋白质靶标的对接能量对蛋白质靶标进行分类。通常,等级越高,表示蛋白质成为查询分子靶标的可能性越大。与形状筛选和药效团筛选相比,反向对接涉及一个级别的映射,这反映了查询分子与靶蛋白之间的直接关系。这是一个复杂的过程,包括识别结合位点、构建对接网格、分子对接算法、对接分数计算和目标评估等步骤。

在大多数情况下,蛋白质的活性位点是已知的,可以从其共结晶的小分子配体中确定。然而,对于一些没有共结晶配体的质外形式结构,对接程序必须首先识别这些蛋白质的活性结合位点。Discovery Studio提供多种识别蛋白质结合位点的方法,其一是自动识别从PDB数据库下载文件的活性位点;其二是根据配体位点定义活性位点;其三便是基于擦除算法根据蛋白口袋识别活性位点,这在我们没有蛋白质活性位点信息的情况下很有用。

反向对接考虑了形状筛选和药效团建模的关键要素。它通过对接确定查询分子的大小是否可以放入蛋白质靶标的结合袋内,并对分子中关键药效团基团与靶标的相互作用进行评分,以进行靶标评估。因此,反向对接原则上可能是三种方法中最全面的。与传统的分子对接类似,反向对接允许通过分析氢键的数量、关键氢键的存在与否和pi-pi共轭等来直观评估对接姿势,就像传统的虚拟筛选一样,以进一步辅助目标评估以获得更准确的预测。因此。反向对接是作为补充形状和药效团筛选的重要方法。

东方科软(北京)科技有限公司,在Discovery Studio中LibdDock对接的基础上,自主开发了基于LibDock的反向对接程序Invert Docking (LibDock)。该程序基于Pipeline Pilot编写,工作流如下。


234.png


LibDock是一个半柔性对接程序,使用放置在结合位点的网格和极性和非极性探针来计算蛋白质热点,是一个适合高通量筛选的分子对接程序。经笔者测试,在自定义参数下,1个受体对接来自Zinc15数据库超过80万个配体,仅需14小时,共生成143万个对接构象。

Invert Docking (LibDock)允许用户使用ScPDB数据库(需自行下载该数据库安装到本地,详情请见我们发布在Bilibili网站上的视频:[如何使用Discovery Studio进行反向分子对接实现反向找靶-一对多或多对多] 使用反向对接进行虚拟筛选,同时还允许用户构建属于自己的蛋白受体库进行虚拟筛选。经笔者测试,在默认参数下,1个受体对接来自ScPDB数据库超过3000个蛋白受体,仅需3小时即可完成对接。这解决了传统Discovery Studio只能正向对接的壁障,为科研工作者、Discovery Studio用户提供了便利,为药物开发、靶点筛选带来了福音。


科学网名片.jpg





https://blog.sciencenet.cn/blog-3536821-1363119.html

上一篇:使用Discovery Studio进行自由能计算教程——Free Energy Perturbation
下一篇:使用Discovery Studio从大量配体中生成药效团
收藏 IP: 36.112.196.*| 热度|

1 郑永军

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-27 03:47

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部