Science Blog of Dr. Yuan分享 http://blog.sciencenet.cn/u/albumns This blog is mainly on Molecular molecular modelling and simulations

博文

PDB文件详解

已有 13813 次阅读 2009-12-23 21:29 |个人分类:科研笔记|系统分类:科研笔记

PDB格式文件对大部分做模拟和计算的人来说都很熟悉,但其中各个参数的意义很多人并不是很了解。从网上搜集了一些文章,结合自己的知识来对PDB文件中各个参数的意义做个解释:

REMARK
该记录用来记述结构优化的方法和相关统计数据。如用Refmac进行结构优化,该记录将自动插入输出的PDB。

CRYST1 (NMR除外)
该记录用来记述晶胞结构参数 (a, b, c, α, β, γ, 空间群) 以及 Z值 (单位结构中的聚和链数)。

SCALEn(n = 1, 2, 3) (NMR除外)
该记录介绍数据中直角坐标向部分晶体学坐标的转换。

ATOM
该记录记述了标准氨基酸以及核酸的原子名,残基名,直角坐标,占有率,温度因子等信息。

HETATM
该记录记述了标准氨基酸以及核酸以外的化合物的原子名,残基名,直角坐标,占有率,温度因子等信息。

TER
该记录表示链的末端。在每个聚合链的末端都必须有TER记录,但是由于无序序列而造成的链的中断处不需要该记录。

MODEL
当一个PDB文件中包含多个结构时(例:NMR结构解析),该记录出现在各个模型的第一行。 MODEL记录行的第11-14列上记入模型序号。序号从1开始顺序记入,在11-14列中从右起写。比如说有30个模型,则第1至9号模型,该行的7-13列空白,在14列上记入1-9的数字;第10-30号模型,该行的7-12列空白,13-14列上记入 10-30的数字。

ENDMDL
与MODEL记录成对出现,记述在各模型的链末端的TER记录之后。

END
该记录标志PDB文件的结束,是必需的记录。

B-factoer
The B-factor (or temperature factor) is an indicator of thermal motion about an atom. However, it should be pointed out that the B-factor is a mix of real thermal displacement, static disorder (multiple but defined conformations) and dynamic disorder (no defined conformation), and all the overlap between these definitions.
是晶体学中的一个重要参数,晶体学中结构因子可以表达为坐标x , y, z与Bj 因子的函数。物理学上对于Bj 的表征有很多理论模型, 最成功的是由Debye 和Waller 提出的. 将固体内振荡的量子本质计算在内后,他们将Bj 表征为绝对温度T 和其他各基本参数的函数。由此可见, Bj 与原子的质量等基本性质有关,也与实验温度有关。

B 因子体现了晶体中原子电子密度的“模糊度”( diffusion) , 这个“模糊度”实际上反映了蛋白质分子在晶体中的构象状态. B 因子越高,“模糊度”越大,相应部位的构象就越不稳定。在晶体学数据中, B 因子一般是以原子为单位给出的,我们可以换算成相应残基的B 因子,从而分析残基的构象稳定性1) . 另外,计算出的B 因子中实际上包含了实验中的很多因素,如晶体结构测定的实验误差等,精度高的晶体结构数据提供较可靠的B 因子数据。

此外,另外温度因子还和占有率相关,如果本身结构解析过程中占有率低,也会导致温度因子升高。这个时候只能说是X-ray收集数据的时候这个地方的信号比较弱,而和结构本身的构象如何,没有关系。

PDB 中的晶体学数据是以原子为单位的,它所给出的B 因子是相对于每个原子的,统计中,首先将原子的B 因子换算成残基的B 因子,即把每个残基所有原子的B 因子取平均值。由于蛋白质分子表面残基的运动性比较大, B 因子相对较高, 所以在统计中除去了这部分残基,具体方法是将数据中B 因子高的残基去掉10 % ,对剩下的残基进行统计,计算平均值。

R-facoter
In overview, the R-factor is a measure of how well a particular model structure fits the observed electron density. Or simply, "a measure of agreement between the crystallographic model and the original X-ray diffraction data".

更多详情,请参考:http://pdbwiki.org/index.php/PDB_FAQ#Q:_What_is_the_R-factor.3F



https://blog.sciencenet.cn/blog-355217-280909.html

上一篇:Discovery Studio 2.1 模块功能介绍 zz
下一篇:模型的侧链优化策略
收藏 IP: 31.178.125.*| 热度|

1 apzc2529

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 16:02

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部