大毛忽洞分享 http://blog.sciencenet.cn/u/大毛忽洞 自留地是桃花源,只种颜色不耕田。 点击 【博文】 看分类目录 邮箱: lishchlishch@163.com;lishchlishch@gmail.com

博文

余瑞璜EET电子理论 vs蛋白质分子的键络参数 (1)

已有 267 次阅读 2026-6-26 10:22 |个人分类:AEC 原子环境计算|系统分类:科研笔记

余瑞璜EET电子理论 vs蛋白质分子的键络参数 (1)

1978年,余先生发表《固体与分子经验电子理论》(EET),48年过去,弹指一挥间。

我从1993年开始探索EET,到今天已经33年,我一直盯着余先生EET里的“分子”,这个“分子”不是水分子,也不是C60分子,而是晶体蛋白质分子。

编号为3UC8的蛋白质晶体,空间群为95号,一个晶胞包含8个蛋白质分子,每个蛋白质分子包含599个原子,不计氢原子。也就是说,对于3UC8蛋白质晶体,一个晶胞包含4792个原子。

请想象4792个原子组成的空间键络?

我可以告诉你的是,3UC8蛋白质晶体中,有599个局域团簇中心,原子围绕团簇中心如何分布?它们的配位数是多少?

EET计算蛋白质分子的价键参数,首先需要计算空间群每类占位原子的原子环境,进而求得EET的键络参数,最后求解EET的价键参数。

       我不懂晶体蛋白质生物学,我也不懂晶体蛋白质化学。但是,一旦晶体蛋白质落入到空间群里,晶体蛋白质的大部分问题就变成了一个数学问题,同时也勾画出了蛋白质分子的物理图像。此时此刻,晶体蛋白质也钻进了我的AEC(原子环境计算)。

       3UC8蛋白质晶体属于属于四方结构,点阵参数a= 36.848,b= 36.848,c= 66.212,单位为埃。空间群为P 43 2 2,是95号空间群。

        3UC8蛋白质晶体完整的晶体学数据,来自PDB数据库。全部数据有599行,原子占位对应95号空间群的8d(x,y,z)占位,保留5行,示例说明。

ATOM   1   N N   . GLY A 1 1  ? 12.338 -10.336 5.090   1.00 15.24 ? -1   GLY A N   1

ATOM   2   C CA  . GLY A 1 1  ? 10.932 -10.533 5.553   1.00 13.05 ? -1   GLY A CA  1

ATOM   3   C C   . GLY A 1 1  ? 10.003 -9.708  4.745   1.00 12.06 ? -1   GLY A C   1

ATOM   4   O O   . GLY A 1 1  ? 8.918  -10.115 4.413   1.00 12.34 ? -1   GLY A O   1

ATOM   5   N N   . ASP A 1 2  ? 10.401 -8.414  4.495   1.00 11.90 ? 1    ASP A N   1

秘书Al解读如下:

1. ATOM

英文:Record name 中文:记录类型(表示这是原子坐标行)

PDB 文件中常见的记录类型包括:

  • ATOM:蛋白质或核酸的标准原子

  • HETATM:非标准原子(如配体、金属离子、水)

2. 1

英文:Atom serial number 中文:原子序号

这是该原子在整个结构中的编号。

3. N

英文:Atom name 中文:原子名称

例如:

  • N(主链氮)

  • CAα碳)

  • C(主链羰基碳)

  • O(主链羰基氧)

4. N

英文:Alternate location indicator 中文:可选构象标记

通常为:

  • . 或空白:没有替代构象

  • AB:表示不同构象

5. .

英文:Insertion code / Placeholder 中文:插入码(或占位符)

在某些格式中用于表示残基插入(如 10A10B),这里为占位符。

6. GLY

英文:Residue name 中文:氨基酸残基名称

三字母代码:

  • GLY      = 甘氨酸

  • ASP      = 天冬氨酸

  • ALA      = 丙氨酸

  • 等等

7. A

英文:Chain identifier 中文:链标识符

例如:

  • A

  • B

  • C 用于区分蛋白质的不同链。

8. 1

英文:Residue sequence number 中文:残基序号

表示这是第 1 个氨基酸。

9. 1

英文:Residue ID / Model number 中文:模型编号(或残基 ID

mmCIF 格式中常出现,用于区分不同模型。

10. ?

英文:Uncertainty / Placeholder 中文:不确定性标记(占位符)

mmCIF 中常用 ? 表示未知或未提供

11–13. 12.338 -10.336 5.090

英文:Cartesian coordinates (x, y, z) 中文:笛卡尔坐标(x, y, z

单位:Å(埃,10⁻¹⁰ m

14. 1.00

英文:Occupancy 中文:占有率

表示该原子在晶体中出现的概率:

  • 1.00      = 100%

  • <1.0      = 多构象或部分占位

15. 15.24

英文:B-factor / Temperature factor 中文:B 因子 / 温度因子

反映原子位置的热运动或不确定性。 数值越大原子越模糊

16. ?

英文:Additional annotation 中文:附加注释(未知)

mmCIF 中常用 ? 表示未提供。

17. -1

英文:Formal charge 中文:形式电荷

例如:

  • -1 =      带负电

  • +1 =      带正电

  • 0 = 中性

18–20. GLY A N

英文:Full atom identifier 中文:完整原子标识符

格式: Residue name + Chain + Atom name 用于唯一标识该原子。

21. 1

英文:Model number 中文:模型编号

如果结构包含多个模型(如 NMR),这里区分不同模型。

总结(最简对照表)

字段

英文

中文

ATOM

Record name

记录类型

1

Atom serial number

原子序号

N

Atom name

原子名称

N

AltLoc

替代构象

.

Insertion code

插入码

GLY

Residue name

残基名称

A

Chain ID

链标识

1

Residue number

残基序号

1

Model/Residue ID

模型编号

?

Placeholder

占位符

x y z

Coordinates

坐标

1.00

Occupancy

占有率

15.24

B-factor

温度因子

?

Placeholder

占位符

-1

Charge

电荷

GLY A N

Atom identifier

原子标识

1

Model number

模型编号

 



https://blog.sciencenet.cn/blog-2321-1541010.html

上一篇:AEC计算蛋白质编程:Al把问题复杂化了




    
收藏 IP: 108.172.99.*| 热度|

2 郑永军 王涛

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-6-27 03:52

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部