||
时光荏苒,距离上一篇高通量虚拟筛选基础篇已有六年。本文采用基于显水模型的对接方案,并根据蛋白—配体作用模式分析化合物的结合构象,以提高预测准确性。本文以EphB4激酶结构域为例,力图重现文献上通过高通量虚拟筛选发现的新型抑制剂。
1. 显水模型对接
水是生命之源。配体结合蛋白的过程也是配体置换蛋白空腔内水分子的过程。常规对接程序采用隐水模型,这种方法的缺点是不能有效处理水与蛋白的氢键作用。譬如,在隐水模型对接下,下图配体(黄色)的疏水尾巴发生折叠以最大化范德华作用力,这一过程导致两个结晶水(绿色圆点)被取代。疏水尾巴无法与蛋白形成氢键作用,替换这两个结晶水所需的能量因此不能得到补偿。隐水模型无法处理去溶剂化时的氢键作用,导致结合模式预测错误。在显水模型下,因为考虑了被取代水的能量,预测的结合模式(靛蓝色)与晶体构象(绿色)基本一致。
2. 计算步骤
从PDB下载蛋白坐标文件2vwx。以LePro处理蛋白,即去除共结晶水分子、配体、离子并为蛋白加氢,同时为后续对接生成参数文件dock.in。
$ lepro 2vwx.pdb
LePro自动根据His的化学环境进行加氢,但并没有优化Tyr、Ser、Thr的羟基氢原子位置。因为极性氢原子显著影响蛋白空腔内的水分子网络以及水的能量,因此需要手动调整一下Ser693与757的氢坐标,使其分别与蛋白骨架上的羰基氧原子形成氢键。一般而言,蛋白处理还须检查Gln、Asn的残基位置。在低分辨率或者晶体结构学家比较大意的情况下,残基的氧原子与氮原子位置有可能被放反了。结合空腔内如有缺失的原子,可以通过同源建模的方式补上。细节决定成败!
接下来计算结合位点内极性原子的水化位点以及能量。这一步大概需要3到5分钟。
$ lesite dock.in
随机从ZINC数据库下载50个分子并加上文献中的4个活性抑制剂组成一个化合物库,写入文件all.sdf中。推荐使用SDF格式而不是Mol2格式。把该化合物库文件加入到对接列表中。
$ ls all.sdf > ligands
采用支持显水模型的Omega版本进行对接,结果写入all_dock.sdf中。采用SDF格式,无需把每个化合物单独保存为一个文件,方便文件管理。SDF格式也方便后续对接处理。
$ ledock_omega dock.in -water
3. 结果分析
单纯以对接打分排序,排名前六的化合物中包含文献报道的四个活性化合物。另外两个化合物的对接模式虽有一定的合理性,但化合物可能有一定化学反应活性。虚拟筛选的活性富集通常依赖化合物跟蛋白形成特定的作用模式,譬如激酶抑制剂跟铰链区域形成氢键以及跟ATP后面的疏水空腔形成疏水作用。创建一个文本,写入以下参数并保存为poses.txt。
Score -7.0
WithinTopScore 0
[O,nX2] 2.6 15.920 5.552 12.530
[a] 3 7.765 1.203 13.027
后面两行指定与蛋白形成特定的作用模式。即,以氧原子或带孤对电子的芳香氮原子与铰链区形成氢键、及以芳香基团占据ATP后方的疏水空腔。运行以下命令
$ lepose all_dock.sdf poses.txt
满足上述条件的化合物只剩下了文献报道的四个活性化合物。LePose还可以分析结合构象中的二面角以及根据最大共子结构进行聚类分析等。
4. 讨论
上述显水模型对接时考虑了LeSite生成的所有水分子。这有可能导致搜索效率降低,而不能发现正确的结合构象。折衷的方案是去除关键位点的水分子,譬如铰链区的三个水分子,以提高搜索效率同时兼具较为准确的打分能力。
5. 结论
除了第一步蛋白处理以及第四步结合构象分析需要一定的专业知识外,整体而言技术路线还是很亲民的。
6. 参考文献
文中涉及的四个活性分子请参考PDB 4P4C、4G2F及其相关文献。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 17:30
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社