PTMBio的个人博客分享 http://blog.sciencenet.cn/u/PTMBio

博文

钱小红/秦伟捷团队合作报道,大规模尿液样本的糖基化组学分析新策略

已有 2719 次阅读 2020-2-13 14:54 |系统分类:科研笔记

O-糖基化修饰(O-GIcNAc)是一种动态可逆的、普遍存在的蛋白质翻译后修饰,广泛参与到诸如转录调控、细胞代谢、信号转导、蛋白降解等生物进程。糖基化蛋白通常位于细胞表面且容易分泌到循环系统中,具有作为疾病诊断生物标志物的巨大潜力。

近日,来自国家蛋白质科学中心( 北京)、中国军事科学院军事医学研究院生命组学研究所钱小红团队、秦伟捷团队合作,发表了一种新的集成数据处理策略,基于参考库的MS1特征匹配和MS2识别传播,可快速识别、高深度和可重现的无标记的人类尿液O-糖基化定量蛋白质。这种策略将数据库搜索速度提高了20倍,并使单个样品中完整O-糖肽定量提高了30%-40%,重现性明显提高。

运用该集成数据处理策略,作者共在36个健康的人类尿液样本中鉴定出1300个完整的O-糖肽,缺失数据量减少了30%-40%。这是目前尿O-糖蛋白组学的最大数据集,证明了这种新策略在大规模临床研究中的应用潜力。相关研究成果发表在专业学术期刊Analytical Chemistry上。

尿液样本糖基化组学分析流程图

糖基化作为最复杂的蛋白质翻译后修饰之一,蛋白质组中丝氨酸和苏氨酸残基的广泛存在,以及数十种不同的O-聚糖类型,导致糖基化的数据库搜索需要非常长的时间。搜索典型的尿液O-糖蛋白组的原始MS文件包含120多个MS2谱图,需要花费120多个小时,即使将O-糖肽谱图整理出来,仍需要60个小时。除此之外,由于完整的O-糖肽的丰度低且离子化差,并且依赖于数据的MS2采集具有随机性,因此随着样品数量的增加,不可避免地会缺少大量数据,这破坏了样品之间的定量比较。这些因素的结合,是大型临床人群O-糖蛋白组学研究面临的挑战。

一、新集成数据处理策略,极大缩短数据库搜索时间

为了方便在大型队列中进行O-糖蛋白组学分析,作者提出了一种新的糖亚组特定数据库搜索策略,其中分类出的含唾液酸(SA)光谱和非唾液酸(non-SA)分别针对相应的SA和非SA聚糖数据库搜索质谱图。在这种策略中,通过筛选HexNAc的常见诊断碎片离子,从原始数据文件中首先对完整的O-糖肽光谱进行分类,然后根据特征的存在/不存在,将其进一步分为SA和非SA亚组。接下来,Byonic软件的内置聚糖数据库中的70个聚糖被分为SA(27种糖形式)和非SA(43种糖形式)聚糖数据库。以这种方式,仅针对聚糖数据库中的相应亚组搜索完整O-糖肽的每个光谱亚组。

作为概念证明,作者使用了包含26313、26713和24776个光谱的三个原始MS文件作为模型样本。对于完整的O-糖肽搜索,Byonic软件的聚糖数据库中的每个糖型均被视为MS2光谱数据库搜索的可变修饰。如图1所示,仅将O-糖肽光谱进行分类就可以将搜索时间减少一半。但是,将光谱分为SA组和非SA组并搜索由特定糖型组成的相应聚糖数据库后,搜索时间减少了20倍。数据库搜索所需的时间从> 120 h(使用所有MS2质谱图)减少到60 h(使用O-糖肽谱图),最后通过使用作者的糖型特异性策略进行数据库搜索,最终降至6 h。明显减少的数据库搜索时间,使得在大范围的人群中进行O-糖蛋白组分析成为可能。

图1、使用不同策略的数据库搜索时间

二、建立参考库,提高定量重现性

接下来,研究者运用新的糖型特异性数据库搜索策略,共获得了16个男性和20个女性尿液样品(样本策略)的O-糖蛋白组(质谱策略),每个原始MS文件的平均处理时间为6小时,研究总共鉴定出1300个完整的O-糖肽,对应于435个O-糖蛋白。

由于完整的O-糖肽的丰度低且离子化不佳,对36个尿液样品进行基于DDA的MS2采集会导致了定量重现性较差,初始缺失值为65.5%。为了解决这个问题,他们使用已鉴定的O-糖肽数据集的MS1功能和MS2光谱建立了参考库。经过特征匹配、光谱传播和后处理质量控制后,成功地估算出几乎一半的缺失值(图2)。在插补后,缺失值从65.6%降低到34.1%,获得更全面和可靠的尿液O-糖蛋白组动态范围,这可以有效促进不同尿液样本之间的大规模定量比较。

图2集成数据处理策略在人类尿液O-糖肽分析中的应用

(a) 36份人类尿液样本中缺失数据(显示为空白)和MS2识别的O-糖肽(显示为蓝色)的分布。(b) O-糖肽的输入缺失数据(红色显示)的分布

三、尿液O-糖蛋白组分析发现性别相关的差异

作者使用该策略估算缺失的O-糖肽并对36个尿液O-糖蛋白数据进行无标签定量比较(男性20例,女性16例)。结果表明,男性和女性组中23种蛋白质上的30种O-糖肽在静态上不同。这种差异在36个个体的尿液O-糖蛋白组的热图中更清楚地显示出来,其中12个O-糖肽在男性中没有明显调节,而其余18个被显著下调(图4下)。最近报道了几种性别相关的尿蛋白,但在这项工作中首次发现是糖蛋白。最新的尿液蛋白质组分析表明,性别是导致尿蛋白组个体差异的关键因素,本文的研究结果也佐证了这一观点。这表明性别相关的差异,可能是导致尿液蛋白质组中个体差异的共同特征,在未来的生物标志物筛选中必须考虑这些差异

图3、尿液O-糖肽在男性组和女性组之间区别的热图

综上所述,在这项工作中,作者开发了一个集成的MS数据处理策略,包括糖类特异性数据库搜索、基于参考库的MS1特征匹配和MS2识别传播。作为概念证明,该策略能够在36份尿液样本中对完整的O-糖肽进行稳健的定量比较,使用合理的时间,而无需在每个样本中识别MS2。为进一步阐明O-糖蛋白组在疾病发生发展中的作用,有望在临床研究中应用于处理大量的O-糖蛋白组队列数据集。

参考文献

Zhao Xinyuan, et al., 2019, An Integrated Mass Spectroscopy Data Processing Strategy for Fast Identification, In-Depth, and Reproducible Quantification of Protein O-Glycosylation in a Large Cohort of Human Urine Samples. Analytical Chemistry.

本文由景杰学术团队原创,欢迎转发到朋友圈。如有转载、投稿、等其他合作需求,请添加微信ptm-market咨询。




https://blog.sciencenet.cn/blog-3404471-1218328.html

上一篇:Science Signaling:整合蛋白组学分析揭示高盐饮食导致高血压-肾病机制
下一篇:深挖2019年诺奖热点,低氧-乳酸调控在免疫炎症抑制中的关键功能
收藏 IP: 1.180.106.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 04:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部