|
近日,《表型组学》(Phenomics)在线发表了由四川大学华西医院刘芳教授、国家蛋白质科学中心(北京)常乘副研究员、中国计量院戴新华研究员和方向教授,以及中国计量院赵洋副研究员和四川大学华西医院张勇副研究员等人合作的题为“A novel integrated pipeline for site-specific quantification of N-glycosylation”的研究论文。
该研究提出了一种新的、整合的完整 N-糖肽定量分析流程(称为GlycoQuant),其创新性地结合了自主开发的质谱碎裂新方法(EThcD-sceHCD)和完整 N-糖肽精准定量软件工具(已整合进蛋白质组定量软件PANDA v.1.2.5)。基于该策略,研究人员对健康(HC)志愿者(n=58),膜性肾病(MN)患者(n=48)以及IgA肾病(IgAN)患者(n=35)的血浆IgG 进行了位点特异性的 N-糖基化定量分析,发现了一系列差异的完整 N-糖肽,不仅能区分慢性肾病(CKD)和 HC,还能区分不同类型的CKD(MN 和 IgAN),其可能作为肾小管功能的精确诊断工具。此外,还利用该策略重新分析了来源于细胞、组织、体液样本中的完整 N-糖肽,证明了GlycoQuant对复杂临床样本分析的适用性。
论文DOI链接:
https://doi.org/10.1007/s43657-023-00150-w
论文pdf链接:
https://link.springer.com/content/pdf/10.1007/s43657-023-00150-w.pdf
引用格式:
Zhao, Y., Zhang, Y., Meng, B. et al. A Novel Integrated Pipeline for Site-Specific Quantification of N-glycosylation. Phenomics (2024). https://doi.org/10.1007/s43657-023-00150-w
研究背景
慢性肾病(CKD),包括膜性肾病(MN)和IgA肾病(IgAN),是常见的原发性肾小球疾病,可导致肾脏损伤和肾功能丧失,造成重大的全球负担。临床病理危险因素,如持续性蛋白尿、血尿、临床肾功能损害和肾小球滤过率(GFR)通常用于评估CKD。肾活检是CKD病理准确诊断最关键的“金标准”技术。然而,肾活检是一种侵入性手段,可能会导致一些不可避免的并发症,如肉眼血尿。此外,由于一些禁忌症,许多患者无法接受肾活检手术。因此,有必要寻找能够提高CKD诊断和治疗水平的无创或微创诊断性生物标志物。
蛋白N-糖基化是一种重要的翻译后修饰,参与多种生理病理过程,包括肿瘤和自身免疫性疾病的进展。免疫球蛋白IgG是循环系统中最丰富的由病原抗原诱导的糖蛋白,在抗原中和、细胞毒性、吞噬作用和免疫稳态中起关键作用。附着在四类IgG (IgG1、IgG2、IgG3和IgG4)Fc端的N-聚糖可以调节它们的功能。例如,IgG缺乏核心岩藻糖会增强抗体介导的细胞毒性,而IgG缺乏半乳糖通常发生在类风湿关节炎患者中。因此,IgG的N-糖基化变化可以作为早期准确诊断各种疾病的潜在生物标志物,包括癌症和CKD。
对IgG位点特异性N -糖基化分析的需求促进了该领域的许多进步,包括简单快速的样品制备方法,高分辨率液相色谱串联质谱技术创新,以及准确的N-聚糖结构表征等。研究人员已经对IgG分析的各种方法进行了综述,包括IgG的分离和纯化、N-聚糖的释放和标记、完整N-糖肽的制备和富集、N-聚糖或完整N-糖肽的LC-MS/MS分析以及数据分析等。然而,IgG位点特异性N-糖基化的定量分析仍然具有挑战性,并且MN和IgAN患者血浆IgG的完整N-糖肽定量分析尚未探索。幸运的是,课题组最近提出了一种新的质谱碎裂方法(EThcD-sceHCD),与其它方法(sceHCD、EThcD、sceHCD-pd-ETD)等相比,它提供了更高的谱图质量和鉴定深度,非常适合用于简单和复杂临床样本的位点特异性N/O糖基化表征。使用EThcD-sceHCD,已经对CKD的IgG进行了完整N-糖肽定性分析。然而,定量信息的缺乏使得将差异表达的完整N-糖肽应用于临床实践具有挑战性。
在本研究中,合作团队更新了PANDA软件工具(2019 Bioinformatics),使其能够定量完整的N-糖肽,并使其与新开发的EThcD-sceHCD质谱碎裂方法兼容。然后,使用PANDA来定量来自HC、MN和IgAN的IgG的完整N-糖肽,随后利用R软件包中进行统计和生物信息学分析。IgG差异表达的完整N-糖肽可能作为肾小管功能及相关疾病的准确诊断工具。此外,基于课题组采用GlycoQuant策略定量分析了之前发布的临床样本的EThcD-sceHCD采集数据,进一步强调了该策略处理多种类型临床样本(包括细胞、尿液、血浆和组织样本等)的可行性。
研究结果
近年来,许多先进的软件工具已经被开发用于大规模完整N-糖肽鉴定,如StrucGP,MSFragger-Glyco,Glyco-Decipher,GPSeeker,Byonic和pGlyco系列。这些软件开发的主要动机是提高完整糖肽鉴定的准确性和搜索效率。然而,对于许多软件工具来说,完整N/O糖肽的定量仍然是一个相当大的挑战。最近,pGlyco已经发展到满足这一需求,提供了定量分析功能。最近,我们在糖基化修饰分析软件工具的评估研究表明,Byonic在鉴定完整的N-糖肽方面表现得非常出色。然而,其在完整糖肽定量方面存在不足。为了解决这个问题,课题组整合了Byonic软件,并引入到一种新的整合流程(称为GlycoQuant),专门为完整N-糖肽定量而设计,提供了一套完整解决方案(图1)。该流程包括五个步骤: (1) 样品制备,包括糖蛋白提取、变性、还原、烷基化、酶切和可选的完整N -糖肽富集; (2) 采用EThcD-sceHCD进行LC-MS/MS分析,与其它方法相比具有更好的谱图质量和鉴定深度; (3) 使用可与多种碎裂模式和物种兼容的Byonic软件定性分析; (4) 使用PANDA进行定量分析,升级版PANDA可进行完整糖肽定量; (5) 利用R软件包进行生物信息学分析,进行数据预处理、统计分析和可视化等。EThcD-sceHCD和PANDA的开发对于实现大规模临床样本的准确完整N-糖肽定量至关重要,并且这两种工具都经过了系统评估。
这项工作中,课题组建立了一种新的用于定量糖蛋白组学分析的集成分析流程(GlycoQuant),包括样品制备、LC-MS/MS分析、鉴定、定量和生物信息学分析(如图1所示)。使用该工作流程,对HC (n=58)、MN (n=48)和IgAN (n=35)中的IgG使用EThcD-sceHCD分析,使用Byonic对数据文件进行完整N-糖肽鉴定,使用升级的PANDA v1.2.5重新分析了原始数据和Byonic搜库结果。基于Byonic和PANDA的结果,成功实现从不同组的IgG中定性和定量地分析完整N-糖肽。
图1 血浆IgG特异位点N-糖基化定量分析流程示意图。
为了全面评估GlycoQuant的实用性,该课题组试图利用IgG的定性和定量数据来识别潜在的生物标志物,以帮助诊断各种CKD患者群体。使用该流程获得IgG完整N -糖肽的定量信息,共鉴定出182个具有定量信息的IgG完整N-糖肽。随后,使用R limma包进行统计检验,确定不同患者组中IgG的N-糖肽的差异表达。
与健康对照组相比,IgAN患者中发现24条IgG完整N-糖肽下调,5条上调,而MN患者中发现38条IgG完整N-糖肽下调,3条上调(图2a和2b)。这一发现表明,当CKD发生时,IgG上的许多N-糖基化修饰可能丢失。相互比较,32条IgG完整N-糖肽在IgAN患者(与MN相比上调19条)和MN患者(与IgAN相比上调13条)之间显示出显著差异(图2c)。进一步分析这些差异表达的完整N-糖肽,发现所有三组共有11条差异糖肽(图2d)。
图2 HC、IgAN和MN患者血浆IgG中完整N -糖肽的差异表达。热图显示了IgAN患者和HC(a)、MN患者和HC (b)、IgAN患者和MN (c)之间IgG完整N -糖肽的差异表达。维恩图(d)显示了三个组中差异表达N-糖肽的重叠。
在差异表达的IgG 完整N-糖肽中,与MN患者和健康对照组相比,发生IgAN时,11条完整N-糖肽(均具有N-聚糖五糖核心结构)特异性丢失。值得注意的是,IGHG4上完整的N-糖肽IGP154 (PREEQFN171STYR-HexNAc(5)Hex(3)Fuc(1))和IGHG3上完整的IGP154 (PREEQYN221STFR-HexNAc(4)Hex(5)Fuc(1)NeuAc(1))在IgAN患者中明显缺失(图3a和3b),这可能对该疾病具有重要的诊断意义。对于MN疾病,10条完整的N-糖肽在疾病发生时完全丢失,包括IGHG2上的IGP163 (PREEQFN170STFR-HexNAc(5)Hex(5)Fuc(1))和IGHG3上的IGP164 (PREEQYN221STFR-HexNAc(5)Hex(3)Fuc(1))(图3c和3d)。仔细检查特定完整N-糖肽的表达模式,证实了它们的存在。为了更好地理解,图4描绘了IGP157和IGP163的谱图细节。
图3 IgAN和MN患者中典型的完整N-糖基化的IgG生物标志物。IG154 (a)和IG156 (b)在IgAN患者中缺失表达,而IG163 (c)和IG164 (d)在MN患者中缺失表达。
图4 IG154 (a)和IG163 (b)完整N -糖肽的MS/MS谱图鉴定和验证。
课题组还对这些特异性表达的完整N-糖肽的定量信息进行主成分分析(PCA),以研究它们有效区分HC、IgAN患者和MN患者的能力,并证明该流程的临床适用性。如图5a所示,根据所有21条特异性丢失的N-糖肽,可以区分HC、IgAN患者和MN患者。此外,通过无监督分层聚类分析,发现IgAN患者和MN患者可以根据自身特异性丢失的IgG的完整N-糖肽成功识别(图5b和5c)。综上所述,这些发现表明GlycoQuant是定量分析完整N-糖肽的有效策略,并且通过其使用可以发现潜在的CKD诊断生物标志物。
图5 无监督聚类分析证明了特异性丢失的N-糖肽在IgAN和MN患者中的潜在临床应用。(a) PCA图显示这些差异糖肽可有效区分HC、IgAN患者和MN患者。分层聚类分析证实IgAN患者(b)和MN患者(c)可以根据其特异性丢失的N-糖肽与其它组成功区分。
为了证明GlycoQuant策略对复杂样本的适用性,我们重新分析了之前发表的定性数据。在这项工作中,使用不同的模式(例如,EThcD, sceHCD, EThcD-sceHCD)分析了不同样品的完整N-糖肽,即前列腺癌(PCa)患者的血浆,IgAN患者的尿液,人肝癌细胞系(HepG2)和甲状腺癌(TC)患者的甲状腺组织。用Byonic比较鉴定了完整N-糖肽的数量。然而,之前的研究缺乏完整N -糖肽的定量信息。在这项工作中,我们可以使用升级的PANDA来量化这些完整N -糖肽。如图6所示,通过不同的模式(EThcD, sceHCD, EThcD-sceHCD)鉴定了完整N-糖肽,使用更新后的PANDA从不同的复杂样本中定量到不同数量的完整N-糖肽。其中,EThcD-sceHCD、EThcD和sceHCD分别定量了细胞中688、649和690条完整N-糖肽,缺失值的平均比例为7.3%。用EThcD-sceHCD、EThcD和sceHCD分别定量血浆中1076、915和981条完整N-糖肽,缺失值的平均比例为27.23%。用EThcD-sceHCD、EThcD和sceHCD分别定量尿中633、607和628条完整N-糖肽,缺失值的平均比例为14.5%。用EThcD-sceHCD、EThcD和sceHCD分别定量组织中891、876和881条完整N-糖肽,缺失值平均比例为13%。总的来说,EThcD-sceHCD比其它模式可以定量更多完整N-糖肽,并且细胞样品中缺失值的平均比例最低。同时,我们确定了GlycoQuant在临床N-糖蛋白组学研究中的适用性。
r
图6使用GlycoQuant从复杂样本中定量到的完整N -糖肽数量比较。
研究结论
该研究成功地实现了对临床样本的全面定量检测,证明了GlycoQuant策略的高灵敏度和准确性。这一策略有可能为IgAN和MN患者以及其它疾病的个性化诊断治疗和预后评估提供重要依据。
基金
四川大学华西医院刘芳教授、国家蛋白质科学中心(北京)常乘副研究员、中国计量院戴新华研究员和方向教授为共同通讯作者,中国计量院赵洋副研究员和四川大学华西医院张勇副研究员为共同第一作者。该项目获得国家重点研发计划项目(2022YFF0608401, 2022YFF0608404)、国家自然科学基金项目(批准号31901038)、四川省科技厅项目(2021YJ0479)、中国科学院医学科学创新基金项目(2019-I2M2-5-063)、中国计量科学研究院科研项目(AKYZD2111)的资助。
Abstract
The site-specific N-glycosylation changes of human plasma immunoglobulin gamma molecules (IgGs) have been shown to modulate the immune response and could serve as potential biomarkers for the accurate diagnosis of various diseases. However, quantifying intact N-glycopeptides accurately in large-scale clinical samples remains a challenge, and the quantitative N-glycosylation of plasma IgGs in patients with chronic kidney diseases (CKDs) has not yet been studied. In this study, we present a novel integrated intact N-glycopeptide quantitative pipeline (termed GlycoQuant), which combines our recently developed mass spectrometry fragmentation method (EThcD-sceHCD) and an intact N-glycopeptide batch quantification software tool (the upgraded PANDA v.1.2.5). We purified and digested human plasma IgGs from 58 healthy controls (HCs), 48 patients with membranous nephropathy (MN), and 35 patients with IgA nephropathy (IgAN) within an hour. Then, we analyzed the digested peptides without enrichment using EThcD-sceHCD-MS/MS, which provided higher spectral quality and greater identified depth. Using upgraded PANDA, we performed site-specific N-glycosylation quantification of IgGs. Several quantified intact N-glycopeptides not only distinguished CKDs from HCs, but also different types of CKD (MN and IgAN) and may serve as accurate diagnostic tools for renal tubular function. In addition, we proved the applicability of this pipeline to complex samples by reanalyzing the intact N-glycopeptides from cell, urine, plasma and tissue samples that we had previously identified. We believe that this pipeline can be applied to large-scale clinical N-glycoproteomic studies, facilitating the discovery of novel glycosylated biomarkers.
通讯作者
刘芳
医学博士,肾脏内科教授/主任医师,博士研究生导师。四川大学华西医院临床研究管理部部长,糖尿病肾病研究室主任。四川省学术技术带头人;四川省卫健委学术技术带头人。中华医学会肾脏病分会第八、九、十届青年委员;中国非公立医疗机构协会肾脏病透析专业委员会常委;中国肾脏病理生理学会常委;成都医学会肾脏病专委会主任委员;四川省卫健委临床研究专家委员会委员;ITMCTR专家咨询委员会委员;成都市第十六届政协常委。美国Baylor医学院肾脏病研究所访问学者。以第一/通讯作者身份在CJASN、JBC、Metabolism等杂志发表SCI论文87篇;主持国家、省部级纵向课题20余项;作为第一完成人“糖尿病肾病临床、基础研究与应用”课题获2014年四川省科技进步三等奖;参与《2019年中国糖尿病肾脏疾病防治临床指南》等编撰制定;副主编编撰人民卫生出版社《糖尿病肾病》专著一部。与澳大利亚Monash大学糖尿病肾病合作研究项目曾获澳中基金资助。
常乘
常乘,国家蛋白质科学中心(北京),副研究员,生物大数据研究室副主任,从事蛋白质组学及生物信息学研究。研发了大队列质谱数据保留时间精准对齐算法DeepRTAlign、蛋白质组数据定量软件PANDA、蛋白质组无标定量算法LFAQ、多组学分析平台ExpressVis等具有自主知识产权的大规模组学数据分析算法及软件。相关工作发表于Nature Communications, Nucleic Acids Research, Briefings in Bioinformatics, Analytical Chemistry等期刊(H-index 19),曾获2020年中国发明协会发明创新奖一等奖(排名第4)。授权国家发明专利6项、软件著作权6项。
第一作者
赵洋
中国计量科学研究院,副研究员,博士研究生导师。致力于蛋白质组及其翻译后修饰组的创新技术研究,建立了系列标准化分析流程与大数据生信分析策略,参与了绘制国际首个早期肝细胞癌分子特征图谱,实现了早期肝细胞癌的精准分子分型,为蛋白质组驱动的精准医疗研究(PDPM)做出了突出贡献;绘制了肺癌、脑癌、结直肠癌等重大疾病的多组学特征图谱,开发了配套的人工智能工具与软件,为疾病的精准诊断和治疗提供重要支撑;正深入研究蛋白质(组)的精准检测与计量标准,以确保数据的质量和标准化使用。至今,已在Nature, Cell, Sci.China Life Sci., JPR等杂志发表学术论文20余篇。
张勇
张勇,理学博士,四川大学华西医院博士后,副研究员,硕士研究生导师。国际组织COVID-19质谱联盟成员,四川省生物信息学学会理事。研究方向为临床转化糖蛋白质组学。主要围绕蛋白质组及其翻译后修饰(如糖基化修饰)建立新技术新方法,并在重大疾病(如癌症、慢性肾病以及新冠肺炎)中进行基础应用转化研究。通过生物信息学方法进行多组学数据整合分析,以期发现临床样本中具有诊断、治疗、预后价值的生物标志物或治疗靶点,并探索疾病发生发展的分子机制和新型干预手段。作为项目负责人主持国家重点研发专项子课题、国家自然科学基金、中国博士后基金、四川省科技厅以及卫健委基金等项目,作为参研人员参与国家重点研发计划、NSFC面上项目等。在Nature Methods、Advanced Materials、Biomaterials、Journal of Controlled Release、Protein Cell、MCP、JPR等领域杂志发表高水平论文50余篇。作为第一或主要发明人,申请中国发明专利7项。获得省部级科学进步一等奖1项。
欢迎投稿
我们诚挚地邀请广大科研人员投稿!
Phenomics官网:
https://www.springer.com/journal/43657
投稿链接:
https://www.editorialmanager.com/pnmc/
编辑部邮箱:phenomics@ihup.org.cn、phenomics@fudan.edu.cn
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-1 15:17
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社