|
在操作过程中遇到问题可以联系我:744891290@qq.com
Modeller 进阶教程
基于多模板的同源模建
所用的数据在multimodel.zip
背景:
在基础教程中,我们利用1bdmA进行模建蛋白TvLDH,而1bdmA有一段loop区域(resi93-100)是缺失的,而这段区域对功能来讲很重要。构建出来的模型,在这段区域dope打分很高。
所以是不合理的,需要进行优化。
步骤:
Step1:
寻找合适的模版
在官网教程中是利用结构聚类的方法,找到1bdm的家族(2mdh:A,2mdh:B. 1b8p:Aand 1bdm:A).)
2mdh已经out了,被淘汰了,目前是4mdh取代2mdh。
也就是说官方的教程需要更新,
2mdh和4mdh的序列是完全不一样的。
也就是2mdh可能测序错误。
对他们进行结构序列的初步比对(salign.py);
建议在比对之前先在pymol中align观察下。
???
为什么不选用基础教程中分析的模板(1b8p:A 7mdh:A 1bdm)
知道答案的,请联系我.
从pymol的align来看的话我觉得7mdh要好一点,所以下面的操作我选用7mdh
Step2
多模板的初步序列3d比对
salign.py
得到fm00495.papfm00495.ali
Step3
序列比对2d
3个模板的序列和要建立模型的序列进行比对align2d_mult.py
把fm00495中的比对结果作为一个整体进行调整,同时插入空格
Step4
基于多模板建立模型
models2mode.py
Step5评价产生的模型
生成DOPE信息anly_dope.py,
Input:xxx.pdb
Out:xxx.profile
第一字段是氨基酸的序号,第42个字段是氨基酸的dope值
利用awk命令将其提取出来。
awk ‘{print$1 “ ”$42}’ xxx.profile >doep.score
然后作图分析。
参考
http://salilab.org/modeller/tutorial/advanced.html
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-26 06:41
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社