博文

钱小红/秦伟捷团队合作报道，大规模尿液样本的糖基化组学分析新策略

已有 2719 次阅读 2020-2-13 14:54 |系统分类:科研笔记

O-糖基化修饰（O-GIcNAc）是一种动态可逆的、普遍存在的蛋白质翻译后修饰，广泛参与到诸如转录调控、细胞代谢、信号转导、蛋白降解等生物进程。糖基化蛋白通常位于细胞表面且容易分泌到循环系统中，具有作为疾病诊断生物标志物的巨大潜力。

近日，来自国家蛋白质科学中心（北京）、中国军事科学院军事医学研究院生命组学研究所钱小红团队、秦伟捷团队合作，发表了一种新的集成数据处理策略，基于参考库的MS1特征匹配和MS2识别传播，可快速识别、高深度和可重现的无标记的人类尿液O-糖基化定量蛋白质。这种策略将数据库搜索速度提高了20倍，并使单个样品中完整O-糖肽定量提高了30％-40％，重现性明显提高。

运用该集成数据处理策略，作者共在36个健康的人类尿液样本中鉴定出1300个完整的O-糖肽，缺失数据量减少了30％-40％。这是目前尿O-糖蛋白组学的最大数据集，证明了这种新策略在大规模临床研究中的应用潜力。相关研究成果发表在专业学术期刊Analytical Chemistry上。

尿液样本糖基化组学分析流程图

糖基化作为最复杂的蛋白质翻译后修饰之一，蛋白质组中丝氨酸和苏氨酸残基的广泛存在，以及数十种不同的O-聚糖类型，导致糖基化的数据库搜索需要非常长的时间。搜索典型的尿液O-糖蛋白组的原始MS文件包含120多个MS2谱图，需要花费120多个小时，即使将O-糖肽谱图整理出来，仍需要60个小时。除此之外，由于完整的O-糖肽的丰度低且离子化差，并且依赖于数据的MS2采集具有随机性，因此随着样品数量的增加，不可避免地会缺少大量数据，这破坏了样品之间的定量比较。这些因素的结合，是大型临床人群O-糖蛋白组学研究面临的挑战。

一、新集成数据处理策略，极大缩短数据库搜索时间

为了方便在大型队列中进行O-糖蛋白组学分析，作者提出了一种新的糖亚组特定数据库搜索策略，其中分类出的含唾液酸（SA）光谱和非唾液酸（non-SA）分别针对相应的SA和非SA聚糖数据库搜索质谱图。在这种策略中，通过筛选HexNAc的常见诊断碎片离子，从原始数据文件中首先对完整的O-糖肽光谱进行分类，然后根据特征的存在/不存在，将其进一步分为SA和非SA亚组。接下来，Byonic软件的内置聚糖数据库中的70个聚糖被分为SA（27种糖形式）和非SA（43种糖形式）聚糖数据库。以这种方式，仅针对聚糖数据库中的相应亚组搜索完整O-糖肽的每个光谱亚组。

作为概念证明，作者使用了包含26313、26713和24776个光谱的三个原始MS文件作为模型样本。对于完整的O-糖肽搜索，Byonic软件的聚糖数据库中的每个糖型均被视为MS2光谱数据库搜索的可变修饰。如图1所示，仅将O-糖肽光谱进行分类就可以将搜索时间减少一半。但是，将光谱分为SA组和非SA组并搜索由特定糖型组成的相应聚糖数据库后，搜索时间减少了20倍。数据库搜索所需的时间从> 120 h（使用所有MS2质谱图）减少到60 h（使用O-糖肽谱图），最后通过使用作者的糖型特异性策略进行数据库搜索，最终降至6 h。明显减少的数据库搜索时间，使得在大范围的人群中进行O-糖蛋白组分析成为可能。

图1、使用不同策略的数据库搜索时间

二、建立参考库，提高定量重现性

接下来，研究者运用新的糖型特异性数据库搜索策略，共获得了16个男性和20个女性尿液样品（样本策略）的O-糖蛋白组（质谱策略），每个原始MS文件的平均处理时间为6小时，研究总共鉴定出1300个完整的O-糖肽，对应于435个O-糖蛋白。

由于完整的O-糖肽的丰度低且离子化不佳，对36个尿液样品进行基于DDA的MS2采集会导致了定量重现性较差，初始缺失值为65.5％。为了解决这个问题，他们使用已鉴定的O-糖肽数据集的MS1功能和MS2光谱建立了参考库。经过特征匹配、光谱传播和后处理质量控制后，成功地估算出几乎一半的缺失值（图2）。在插补后，缺失值从65.6％降低到34.1％，获得更全面和可靠的尿液O-糖蛋白组动态范围，这可以有效促进不同尿液样本之间的大规模定量比较。

图2集成数据处理策略在人类尿液O-糖肽分析中的应用

（a） 36份人类尿液样本中缺失数据（显示为空白）和MS2识别的O-糖肽（显示为蓝色）的分布。（b） O-糖肽的输入缺失数据（红色显示）的分布

三、尿液O-糖蛋白组分析发现性别相关的差异

作者使用该策略估算缺失的O-糖肽并对36个尿液O-糖蛋白数据进行无标签定量比较（男性20例，女性16例）。结果表明，男性和女性组中23种蛋白质上的30种O-糖肽在静态上不同。这种差异在36个个体的尿液O-糖蛋白组的热图中更清楚地显示出来，其中12个O-糖肽在男性中没有明显调节，而其余18个被显著下调（图4下）。最近报道了几种性别相关的尿蛋白，但在这项工作中首次发现是糖蛋白。最新的尿液蛋白质组分析表明，性别是导致尿蛋白组个体差异的关键因素，本文的研究结果也佐证了这一观点。这表明性别相关的差异，可能是导致尿液蛋白质组中个体差异的共同特征，在未来的生物标志物筛选中必须考虑这些差异。

图3、尿液O-糖肽在男性组和女性组之间区别的热图

综上所述，在这项工作中，作者开发了一个集成的MS数据处理策略，包括糖类特异性数据库搜索、基于参考库的MS1特征匹配和MS2识别传播。作为概念证明，该策略能够在36份尿液样本中对完整的O-糖肽进行稳健的定量比较，使用合理的时间，而无需在每个样本中识别MS2。为进一步阐明O-糖蛋白组在疾病发生发展中的作用，有望在临床研究中应用于处理大量的O-糖蛋白组队列数据集。

参考文献

Zhao Xinyuan, et al., 2019, An Integrated Mass Spectroscopy Data Processing Strategy for Fast Identification, In-Depth, and Reproducible Quantification of Protein O-Glycosylation in a Large Cohort of Human Urine Samples. Analytical Chemistry.

本文由景杰学术团队原创，欢迎转发到朋友圈。如有转载、投稿、等其他合作需求，请添加微信ptm-market咨询。

转载本文请联系原作者获取授权，同时请注明本文来自卜晨科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3404471-1218328.html

上一篇：Science Signaling：整合蛋白组学分析揭示高盐饮食导致高血压-肾病机制
下一篇：深挖2019年诺奖热点，低氧-乳酸调控在免疫炎症抑制中的关键功能

收藏 IP: 1.180.106.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

卜晨

扫一扫，分享此博文

PTMBio的个人博客分享 http://blog.sciencenet.cn/u/PTMBio

博文

钱小红/秦伟捷团队合作报道，大规模尿液样本的糖基化组学分析新策略

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

卜晨

全部作者的其他最新博文

全部精选博文导读

相关博文

PTMBio的个人博客分享 http://blog.sciencenet.cn/u/PTMBio

博文

钱小红/秦伟捷团队合作报道，大规模尿液样本的糖基化组学分析新策略

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

卜晨

全部作者的其他最新博文

全部精选博文导读

相关博文

该博文允许注册用户评论请点击登录评论 (0 个评论)