|||
做分子动力学模拟时,经常需要自定义氨基酸残基,或添加非氨基酸的残基,例如Fmoc基团等等。此时如果不清楚PDB中的残基命名规则,自己的残基就只能用C1,C2,H3,N4等等来命名,十分残念又难以记忆和理解,往往带来构建失败的结局。因此,了解PDB中的原子约定命名规则是很重要的。
笔者了解PDB的命名规则纯属偶然,乃观察PDB中下载的蛋白时偶然发现。
下面说明具体的命名规则。
氨基和羧基上的原子都采用本名,C, N, O, H, etc.
其它原子除 H 外,所有原子命名均采用“原子名+后缀[编号]”形式。整体命名方法类似于图论中求解最大流问题时所采用的标号法。首先α-C被命名为CA。其后按照成键关系逐级递推,名字后缀依次为 B-G-D-E-Z-H-...(此为希腊字母表顺序:α(A),β(B),γ(G),δ(D),ε(E),ζ(Z),η(H)……)。以上图中的色氨酸为例,和CA相邻的原子是β-C,故被命名为CB。和CB相邻的原子是γ-C,命名为CG(先不考虑 H)。和CG相邻的有两个δ-C,排到了 D,此处将其命名为CD1和CD2。再向后和CD1相邻的是N原子,和CD2相邻的是两个C原子,故将它们命名为NE1、CE2和CE3。NE1再后面没有未标号的重原子了,停止;CE2和CE3后面是两个C原子,故命名为CZ2和CZ3(标号延续上一原子)。最后还剩下一个C,标为CH2。
对于氢原子,命名采用“H+所连原子后缀[编号]”形式。例如连接在CD1上的H命名为HD1,连接在CB上的H命名为HB1和HB2, etc.。
对于自己构建的残基也是同样的道理,按照规则命名后,方便自行建立拓扑文件,即可进行后续的动力学模拟。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 02:18
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社