Jerkwin分享 http://blog.sciencenet.cn/u/Jerkwin

博文

糖及其GLYCAM力场中的命名约定

已有 10109 次阅读 2017-3-31 22:34 |系统分类:科研笔记

  • 2017年03月31日 09:06:33

子曰:“必也正名乎!名不正,则言不顺;言不顺,则事不成。故君子名之必可言也,言之必可行也。”                 ——《论语·子路》

道可道非常道。名可名非常名。无名天地之始。有名万物之母。                 ——《老子·第一章》

【按】以下说明整理自维基百科 糖类, 并翻译自Amber 16手册以及GLYCAM网站说明.

糖(碳水化合物): 多羟基醛或多羟基酮及其缩聚物和某些衍生物的总称

  • 单糖

    • 羰基位置: 醛糖, 酮糖

    • 碳原子数: 丙糖, 丁糖, 戊糖, 己糖

    • 手性: D, L

  • 双糖

  • 低聚(寡)糖/多糖

半缩醛异构化: 呋喃糖(5元环)与吡喃糖(6元环)

葡萄糖

葡萄糖的α-与β-(后者)端基异构物。

注意结合在碳5上的CH2OH基团与端基异构碳上的羟基(红色或绿色)之间的空间关系:

两者异面为(α)型, 同面则为(β)型

葡聚糖
D-葡萄糖单体组成的多糖
α-葡聚糖
β-葡聚糖
结合类型名称主要存在场所结合类型名称主要存在场所
α-1,4直链淀粉大米β-1,4纤维素
α-1,6右旋糖酐乳酸菌β-1,3酵母多糖酵母
黑木耳多糖黑木耳
金藻昆布多糖金藻门
α-1,4/1,6糖原动物β-1,3/1,6海带多糖海草、蕈类
支链淀粉糯米热凝胶多糖细菌
普鲁兰多糖酵母愈伤葡聚糖植物
 
平菇多糖平菇
 

β-1,6:β-1,3香菇多糖香菇, 严格钝化


β-1,3/1,4地衣多糖地衣
纤维素

属于广义的糖类, D-葡萄糖以β-1,4-糖苷键组成的大分子多糖,分子量约50,000~2,500,000,相当于300~15,000个葡萄糖基


视图: 投影 正交
着色: 按链 按残基
模式: 飘带 骨架 管板 卡通
显示: 水分子 非键原子   名称
颜色: 氨基酸 形状 极性 酸性 彩虹
左键: 转动   滚轮: 缩放   双击: 自动旋转开关   Alt+左键: 移动

Fig.13.3 碳水化合物GLYCAM06力场
  • leaprc.GLYCAM_06j-1: 使用GLYCAM06的LEaP配置文件, 可单独用于碳水化合物或与ff14SB力场联合使用

  • GLYCAM_06j.dat: 寡糖参数

  • GLYCAM_06j-1.prep: 糖基残基的结构和电荷

  • GLYCAM_lipids_06h.prep: 一些脂类残基的结构和电荷

  • GLYCAM_amino_06j_12SB.lib: 与ff14SB力场兼容的糖蛋白库文件

  • GLYCAM_aminoct_06j_12SB.lib

  • GLYCAM_aminont_06j_12SB.lib

使用孤对电子(额外点)的GLYCAM06EP力场
  • GLYCAM_06EPb.dat: 寡糖参数

  • GLYCAM_06EPb.prep: 糖残基结构和电荷

  • leaprc.GLYCAM_06EPb: 用于GLYCAM-06EP的LEaP配置文件

3.3.7 GLYCAM中的碳水化合物命名约定

为了将碳水化合物以标准方式添加到建模程序中, 也为了提供用于X射线和NMR pdb文件的标准, 我们已经发展了一套三字符的编码命名方法. 使用三字符是基于RCSB PDB Advisory Committee (<www.rcsb.org/pdb/pdbac.html></www.rcsb.org>)pdb文件标准, 实用原因在于, 所有的建模和实验软件都可以读入三字符编码, 主要是用于蛋白和核酸.

作为单糖三字符PDB编码的基础, 我们为单糖引入了单字符编码(表3.5). 如果可能, 字符取自单糖名称的第一个字母(A=Ara, F=Fuc, G=Glc, I=Ido, M=Man, P=Psi, Q=Qui, R=Rib, T=Tal, X=Xyl), 但出于其他考虑, L被用于Gal, 尽管它比Lyz更不常用. 考虑到单糖衍生物存在无限多种变体, 26个字母的限制无法保证单字母(或三字母)编码能够不重复. 因此我们首先将单字符用于所有的戊糖和己糖, 非衍生的单糖. 接下来, 根据出现频率或生物重要性来分配字母.

使用三字符(表3.6到3.8), 目前的GLYCAM残基名称编码了下列内容: 碳水化合物残基名称(Glc, Gal等), 环类型(吡喃p或呋喃f), 端基异构(α或β), 异构体类型(D或L)和出现的连接位置(2-, 2,3-, 2,4,6-等). 连接位置信息非常重要, 且不能由单糖名称获知, 不像氨基酸那样. 进一步, 三字符编码选择时与氨基酸目前使用的编码不重合.

纤维二糖的GLYCAM命名约定

表 3.4: GLYCAM目前支持的单糖. (a) 目前正在开发. (b) 只有一种对映体和环类型可用.
Carbohydrate
碳水化合物
Pyranose 吡喃(己)糖
α/β, D/L
Furanose 呋喃(戊)糖
α/β, D/L
Arabinose 树胶醛醣/阿拉伯糖/阿糖yesyes
Lyxose 来苏糖yesyes
Ribose 核糖yesyes
Xylose 木糖yesyes
Allose 阿洛糖yes
Altrose 阿卓糖yes
Galactose 半乳糖yesa
Glucose 葡萄糖yesa
Gulose 古罗糖yes
Idose 艾杜糖a
Mannose 甘露糖yes
Talose 塔洛糖yes
Fructose 果糖yesyes
Psicose 阿卢糖yesyes
Sorbose 山梨糖yesyes
Tagatose 塔格糖yesyes
Fucose 海藻糖yes
Quinovose 奎诺糖/异万年青糖/鸡纳糖yes
Rhamnose 鼠李糖yes
Galacturonic Acid 半乳糖醛酸yes
Glucuronic Acid 葡(萄)糖醛酸yes
Iduronic Acid 艾杜糖醛酸yes
N-Acetylgalactosamine N-乙酰半乳糖胺yes
N-Acetylglucosamine N-乙酰葡糖胺yes
N-Acetylmannosamine N-乙酰甘露糖胺yes
Neu5Ac N-乙酰神经氨酸yes, byes, b
KDN 2-keto-3-deoxy-nonulosonatea,ba,b
KDO 2-keto-3-deoxy-octulosonatea,ba,b
表 3.5: 单糖GLYCAM残基名称的核心--单字母编码
编号碳水化合物a单字母编码b常用简写
1D-ArabinoseAAra
2D-LyxoseDLyx
3D-RiboseRRib
4D-XyloseXXyl
5D-AlloseNAll
6D-AltroseEAlt
7D-GalactoseLGal
8D-GlucoseGGlc
9D-GuloseKGul
10D-IdoseIIdo
11D-MannoseMMan
12D-TaloseTTal
13D-FructoseCFru
14D-PsicosePPsi
15D-SorboseBdSor
16D-TagatoseJTag
17D-Fucose (6-deoxy D-galactose)FFuc
18D-Quinovose (6-deoxy D-glucose)QQui
19D-Rhamnose (6-deoxy D-mannose)HRha
20D-Galacturonic AcidOdGalA
21D-Glucuronic AcidZdGlcA
22D-Iduronic AcidUdIdoA
23D-N-AcetylgalactosamineVdGalNac
24D-N-AcetylglucosamineYdGlcNAc
25D-N-AcetylmannosamineWdManNAc
26N-Acetyl-neuraminic AcidSdNeuNAc, Neu5Ac

KDNKNc,dKDN

KDOKOc,dKDO

N-Glycolyl-neuraminic AcidSGc,dNeuNGc, Neu5Gc
a 残基对应的prep文件目前不可用, 可联系Woods课题组(www.glycam.org)获取结构和电荷参数.
b 小写字母表示L型糖, 因此L-Fucose应表示为f, 参见表3.8.
c 对于不能指定单字母编码的不常用残基, 其名称忽略了一些信息.
d 在将来, 这些残基的命名方法可能会改变. 请查看www.glycam.org网站的最新信息.
表 3.6: 基于GLYCAM单字母编码, D型吡喃戊糖和己糖的三字母编码中连接位置与端基异构构象的指定方法
α-D-Glcpβ-D-Manpα-D-Arapβ-D-Xylp
连接位置残基名称残基名称残基名称残基名称
末端b0GAb0LB0AA0XB
1-c1GAc1LB1AA1XB
2-2GA2LB2AA2XB
3-3GA3LB3AA3XB
4-4GA4LB4AA4XB
6-6GA6LB

2,3-ZGAdZLBZAAZXB
2,4-YGAYLBYAAYXB
2,6-XGAXLB

3,4-WGAWLBWAAWXB
3,6-VGAVLB

4,6-UGAULB

2,3,4-TGATLBTAATXB
2,3,6-SGASLB

2,4,6-RGARLB

3,4,6-QGAQLB

2,3,4,6-PGAPLB

a 在吡喃糖中, A表示α构象, B表示β构象.
b 以前称为GA, 前缀0表示没有氧原子能够成键, 即, 残基位于链的结束处.
c 引入以便能形成 1-1' 连接, 如α-D-Glc-1-1'-α-D-Glc {1GA 0GA}.
d 涉及多于一个的连接位置时, 有必要避免使用前缀字母, 以免导致形成的三字母编码与氨基酸所用的重复, 如ALA
表 3.7: 基于GLYCAM单字母编码, D型呋喃戊糖和己糖的三字母编码中连接位置与端基异构构象的指定方法. 在呋喃糖中 D(down) 表示α; U(up)表示β.
α-D-Glcfβ-D-Manfα-D-Arafβ-D-Xylf
连接位置残基名称残基名称残基名称残基名称
末端0GD0MU0AD0XU
1-1GD1MU1AD1XU
2-2GD2MU2AD2XU
3-3GD3MU3AD3XU
···············
表 3.8: L型吡喃戊糖和己糖的三字母编码中连接位置与端基异构构象的指定方法.
α-L-Glcpβ-L-Manpα-L-Arapβ-L-Xylp
连接位置残基名称残基名称残基名称残基名称
末端0gA0mB0aA0xB
1-1gA1mB1aA1xB
2-2gA2mB2aA2xB
3-3gA3mB3aA3xB
···············



https://blog.sciencenet.cn/blog-548663-1042869.html

上一篇:统计轨迹中分子速度大小沿某一方向的分布
下一篇:Amber构建寡糖的方法
收藏 IP: 130.184.253.*| 热度|

1 梁洪泽

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 03:17

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部