Science Blog of Dr. Yuan分享 http://blog.sciencenet.cn/u/albumns This blog is mainly on Molecular molecular modelling and simulations

博文

RMSD小常识

已有 40787 次阅读 2009-12-9 17:14 |个人分类:科研笔记|系统分类:科研笔记

昨天,和朋友一起讨论同源建模的问题。他告诉我说,建模的结果于模板之间的RMSD是0.347....当时就觉得有点奇怪,他是怎么计算这个数值的。所以这里一起讨论下RMSD

先看看RMSD的计算公式(转自http://en.wikipedia.org/wiki/Root_mean_square_deviation_(bioinformatics))
RMSD(Root Mean Squared Deviation)

RMSD=sqrt{frac{1}{N}sum_{i=1}^{i=N}delta_{i}^2}

where δ is the distance between N pairs of equivalent atoms (usually and sometimes C,N,O,).

Normally a rigid superposition which minimizes the RMSD is performed, and this minimum is returned. Given two sets of n points mathbf{v} and mathbf{w}, the RMSD is defined as follows:

mathrm{RMSD}(mathbf{v}, mathbf{w}) = sqrt{frac{1}{n}sum_{i=1}^{n} |v_i - w_i|^2}
  = sqrt{frac{1}{n}sum_{i=1}^{n}
            ({v_i}_x - {w_i}_x)^2 + ({v_i}_y - {w_i}_y)^2 + ({v_i}_z - {w_i}_z)^2}

An RMSD value is expressed in length units. The most commonly used unit in structural biology is the Ångström (Å) which is equal to 10–10m.



---> 用来表是蛋白质结构之间差异的参数是两个结构之间原子位置的 RMSD。

---> 计算RMSD时,可以针对目标蛋白质(如: 所有的原子、骨干部份或只考虑 alpha 碳原子等等)。不同的标准,计算RMSD的数值会有所差异。

---> RMSD 距离函数,以一个结构中的原子与另外一个结构中对应原子为计算标的,因此,如果两个分子在座标系统中以不同的位置开始计算,那么不管其结构是否相似,这两者之间的 RMSD 必定相当大。也因为这样,我们为了要计算有意义的 RMSD ,两者的结构要尽可能的重叠。
     对于docking而言,如果有reference ligand,一般不需要额外的重叠,否则会有伪造数据之嫌。

---> 可以通过计算 RMSD 来当作评估蛋白质结构的可信度: 在模拟过程中,分子会不断的发生变化,而对于我们而言,必须等到分子结构在稳定的状态下(fluctuation较小时)再进一步进行分析,这样才比较有意义。

对于序列和长度不同的蛋白结构,比较RMSD似乎意义不大。
对于存在序列和长度差异的蛋白,首先我们不知道软件本身在计算RMSD的时候究竟采用了何种计算方法:所有原子?骨架部分?还是CA?这样就很难给我们一个明确的概念。
另外,对于长短不一的蛋白,软件首先会对序列进行比较,本身比对的方法不同,显然会给后面的结果带来影响。
另外,对于长短不一的蛋白,软件究竟取多少残基作为计算RMSD的对象,我们也无从知道。

所以,对于不是同一个蛋白的RMSD的计算,其中的不确定性比较多,计算出来的结果只能作为参考,给我们一个大概的概念。

https://blog.sciencenet.cn/blog-355217-277393.html

上一篇:同源建模的优化问题
下一篇:Docking软件大比拼
收藏 IP: .*| 热度|

0

发表评论 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-26 13:18

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部