Terrence的个人博客分享 http://blog.sciencenet.cn/u/Terrence

博文

利用AI设计眼镜蛇蛇毒结合蛋白(I I)

已有 1247 次阅读 2025-10-30 04:06 |系统分类:论文交流

利用AI设计眼镜蛇蛇毒结合蛋白(I I)

             从本论文中可以看出当今可以设计出大幅提高功能的结合蛋白:即设计出亲和力很高的结合配体。对于蛇毒的三指状构象,作者设计出的结合蛋白产生空间位阻(steric hindrance)以阻止神经毒与nAChRs 的结合。这优于原先使用的抗体。后者的指标仅为结合神经毒(仅部分会有位阻效应)。

    另外,从文中可见,利用AI设计结合蛋白的方式已积累了一些方法,这样能够使得从设计的构象(结构)或序列起始,经过优化最终达到功能上有较好的效果(靶基因多肽与结合蛋白结合的亲和力高)。

      

     2024年该实验室的另一篇文献能说明此问题。该文以设计针对常见的激素类多肽的结合蛋白为例说明了具有高亲和力结合蛋白的设计思路。

一些激素类多肽,如甲状旁腺激素,神经肽Y等均含有alpha螺旋。本文中,作者根据参数或基于深度学习的方法设计针对alpha 螺旋构象肽段的结合配体。

 1, 根据参数优化设计

     其想法是对于单一的alpha螺旋多肽设计一组螺旋构象构架,该构架形成一个开放的沟(groove)以容纳单一螺旋多肽的结合蛋白(如图8B组图),但以此设计出的结合蛋白亲和性并不理想(结果见图8右侧图PTHKd>1uM)。

    于是作者在此基础上用RFjoint  Inpainting 算法优化设计,扩展了接合面。同时用Protein MPNN可以设计出氨基酸序列;这样设计出来的配体亲和力大大提高(图8 C)。

    用酵母展示技术筛选,192个设计中有44个显示可以结合PTH。用体积排阻色谱法(size-exclusion chromatography (SEC))纯化后最好的结合配体亲和力为6.04nM(靶蛋白为PTH),结合非常特异与PTH-related peptide 结合很少。

                                             

图 8结合蛋白设计后期构象优化可以提高亲和力

  图B 使用起初的参数设计出的结合蛋白亲和力并不高。 左图,依据螺旋距离(横坐标)和超螺旋(纵坐标)调整来设计结合蛋白。中图,据此得出的设计构象,右图,用Split nanoBiT测出的结合蛋白与PTH结合的亲和力指标 Kd>1uM,显示亲和力低。

  图 C 用图像修复结合蛋白优化方法进行优化。 左图,用RFjiont 重新设计基于参数(parametrically)产生的设计,扩展了接合面,并用ProteinMPNN重新设计序列,中图,用alpha-Folder2 预测优化后的结合蛋白与靶肽段PTH结合的构象。右图,用FP(fluorescence polarization)测定结合蛋白与PTH结合的亲和力,Kd=6.04nM。(Susana Vázquez Torres 2024)

      另一种优化方法称之为引线法(threading  approach)设计结合蛋白,该法基于参数从新(De Novo)设计构象中有凹陷结构的多个蛋白骨架(scaffold,注:这里应该指蛋白三级构象的骨架)。从几千个全部为螺旋构象(二级结构)的蛋白骨架文库开始挑选,将alpha螺旋的靶肽段像“线”一样与这些蛋白骨架凹型结构处形成复合物,筛选二者之间反应界面上的疏水反应最大化的那些骨架蛋白。选出的蛋白骨架在与靶肽段形成复合物的条件下用Protein MPNN 设计蛋白骨架的氨基酸序列,再用Alphafold2 算法推测并采用 alphafold2和Rosetta 指标进行筛选。这样设计出来的结合蛋白用酵母展示法验证,在66个设计出的候选蛋白中有4个可以结合SCT,大肠杆菌生产后发现这4个均可结合靶序列,最高的亲和力达2.7nM。

 

 

图9   “引线法”设计多肽配体。

        左图,从螺旋骨架蛋白开始,靶肽段像线一样穿在结合的螺旋上,再重新设计两者的反应面。中图,用AF2推测的蛋白骨架(除橘色外的所有颜色)与呈螺旋状的靶蛋白SCT(Secretin, 橘色)反应复合物中蛋白骨架的设计。右图,用FP检验(n=4),显示SCT结合蛋白与SCT的结合亲和力高(Kd=3.95nM)而与GCG(glucagon)结合的亲和力仅为12nM。(Susana Vázquez Torres 2024)

  2, 利用深度学习设计并优化结合配体

 

   用“幻觉”(hallucination)设计结合配体

      利用深度学习的幻觉从新产生一个全新的螺旋蛋白结合配体,此时并无事先的结合配体特征或肽段的空间构象(geometry)。用幻觉或称为激活最大化(activation maximization)的方法开始于从序列预测蛋白结构的网络,从众多可能的序列中优化序列,优化后的序列高级构象须具有所需(即可结合目肽段)的特征。这有利于无结构蛋白的配体设计。如凋亡相关BH3结构域bid 肽段,bid 是无结构肽段。但结合了Bcl-2家族成员后呈现alpha螺旋。因此可以作为靶蛋白设计结合bid的结合配体。

         从bid 肽段的序列开始,随机种下结合序列长度有60,70,80,90,或100个氨基酸的序列。在序列空间(多个顺序组合序列)用Mente Carlo 寻找并优化确信可以结合的配体,结果设计出的Bid结合蛋白具有高亲和力(Kd=7nM)。

图10 利用幻觉设计出的肽段结合配体,左从序列空间(即多种组合的序列库)中采用Markov Chain Monte Carlo (MCMC)一步一步地进行序列优化,每一步肽段序列要重新推测以此,这种改变基于肽段与配体接合面和AF2的指标给出接受或拒绝,最后的结构用ProteinMPNN重新设计序列。中图,AF2预测设计出的肽段(除蓝色外的所有颜色)和Bid靶肽段(蓝色),右图,FP测定(n=4)表明针对Bid肽段的亲和力为7nM。(Susana Vázquez Torres 2024)

下面以TNFR1( tumor  necrosis  factor  receptor)结合配体设计为例观察RFdiffusion与partial diffusion设计的作用。

TNFR作为炎症反应中关键的蛋白之一,其配体在临床上有重要价值。

   计算机通常设计一个结合配体是从已有的已经明确三级结构的一组蛋白骨架中与靶蛋白逐个结合,选出结合配体,同时结合配体与靶蛋白的结合应处于能量最低状态。采用这种方法设计结合配体其缺点是只能从有限的已知构象的数量中选择,这样筛选出的结合配体未必其结合亲和力高。尤其是当靶蛋白显示极性表面(多含氧,氮原子及其相连的氢原子)并且表面平坦有疏水基团,缺乏凹陷结构。这样构象的靶蛋白比较难以设计出高亲和力的结合配体。TNFR1就属于这一类型靶蛋白。

   David Baker实验室先采用RFdiffusion 算法,从完全随机的氨基酸残基分布开始产生大量蛋白,这样可选择的结合配体蛋白多样性大大增加。

 

AI技术用于蛋白设计发展之快,已经不仅限于最初的仅描述氨基酸序列与构象的关系,在开发蛋白多肽结合配体过程中,涌现出多种优化设计的方法,这样设计出的蛋白结合配体其亲和力远超自然界经过进化存在的蛋白。 

    另外,由AI设计的蛋白结合配体远不仅可以中和蛇毒,其结合配体还涉及炎症,肿瘤治疗甚至芯片,太阳能利用等领域。

 

      那么,人工蛋白设计的序列范围究竟有多大,以Davis Baker给的一张图为例,据估计,人类目前记录的蛋白肽链约1015个,若以由100个氨基酸残基做成的肽段为例,粗略估算理论上应该有20100种组合(20为氨基酸的大致种类,实际不止),远大于上述已记录的蛋白肽的数量;由此推测,今后人工蛋白肽段问世的数量将非常庞大。

   图11 今后人工设计蛋白肽段(以100个氨基酸长肽段为例)数量理论估计

      假设人工设计的蛋白肽段为100个氨基酸残基,理论上序列应该有20100种组合,其范围以图中青色区域表示,而其中的红色斑点示目前发现的天然蛋白数量,约为1015,而目前已经制作出的从新(头)设计的蛋白(或多肽)数量以其中的黑点表示。可见,理论上看,从头设计的、自然界中从未出现的蛋白或多肽数量将相当可观。(David Baker, 2025)

 

主要参考文献:

1, Susana Vázquez Torres et al Nature 2025 639:225-231

2, Susana Vazquez Torres et al Nature 2024, 626 435-441



https://blog.sciencenet.cn/blog-3576625-1508030.html

上一篇:利用AI设计眼镜蛇蛇毒结合蛋白I
下一篇:AlphaFold 蛋白结构预测促进生命科学研究
收藏 IP: 70.51.152.*| 热度|

1 王涛

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-12-5 23:50

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部