wupengpro的个人博客分享 http://blog.sciencenet.cn/u/wupengpro

博文

蛋白质组启蒙篇

已有 4665 次阅读 2016-3-17 16:09 |系统分类:科研笔记

这篇文章是笔者从生物领域知识为零进入蛋白质组学/基因组学领域的启蒙篇,来自2009年新入学时期看的第一篇英文文献,由组学大牛Ruedi Aebersold主笔。对于理解蛋白质组的概念以及备受关注的定量问题很有帮助。


20世纪初孟德尔的研究发现,我们已经知道了生物体可见性状很大程度上由遗传功能元件控制。随后的数年中,在遗传学和功能基因组学领域,针对遗传分子基础以及解释表型机制的研究做出了众多努力,取得了很大进展。然而,基因组被视为能够解释表型的这一简单愿望仍然没有完成。

考虑到细胞系统的复杂,经过多年发展的技术已能够进行分子层面的综合分析。其中最大的进步就是拥有了系统水平上的代谢物和mRNA信息。然而,蛋白的系统信息是最关键的,蛋白质能够与其他级别的分子成分相互作用。突变也在不同水平上影响了蛋白质,包括它们的丰度,翻译后修饰的类型以及它们与细胞中其他成分相互作用的特性。蛋白性质的改变不能受限于蛋白自身的突变,突变会引出间接反应,影响其他蛋白的性质。

在过去,经典的蛋白质生化分析是一项困难又耗时的任务,并且产出的数据集不完整。此外,蛋白质丰度的变化不能仅仅归结于mRNA,因为mRNA丰度与蛋白质丰度相关性很小。近来,基于质谱的蛋白质组学已经完成了巨大的进步。尽管在大多数现有研究领域蛋白质组占有限部分,但它是目前在蛋白质水平系统识别分子变化唯一可用的方法。基于质谱(MS)的蛋白质组学第一次得到蛋白质组的定性和定量信息,系统地分析蛋白质修饰和相互作用,对基因组学提供了一系列机会来优化表型显现的模型。

 

质谱“鸟枪法”(shotgun

基于质谱的蛋白鉴定给出了基因组和蛋白质组之间相互联系的有用信息,它是利用定量质谱分析蛋白质组的基础。迄今为止,蛋白鉴定应用最广的方法即蛋白质组学MS鸟枪法。类似于基因组学中的鸟枪法测序,MS鸟枪法描述了从复杂样品中系统蛋白鉴定的方法。该方法综合了液相色谱(LC)分离胰蛋白酶酶解产生的肽段以及随后的串联质谱分析(MS/MS)。蛋白质组学MS鸟枪法的蛋白鉴定的基本流程下图所示。


   理想的来说,蛋白质组谱应该能够鉴定和定量一个细胞的所有蛋白组成。尽管技术上已经取得了很大的进展,复杂蛋白样品的综合描述仍然是一个巨大的挑战,需要广阔的时间、样品数量和仪器资源。鸟枪法MS的综合蛋白质鉴定面临的两个最大的挑战:细胞蛋白质组的复杂性和蛋白质表达较宽的动态范围。据估计,在人类细胞中,约100000种不同的蛋白质亚型是从20325个注释蛋白编码基因中表达的。在胰蛋白酶酶解之后,这些蛋白产生了高度复杂的肽混合物。蛋白质浓度变化从酵母4个数量级[1]至人类体液(包括血清)约10个数量级[2]不等。然而,质谱仪发现的动态范围一般在100010000之间。这就首先导致了大量的蛋白冗余鉴定,并且阻碍复杂样品中低丰度蛋白的鉴定。

尽管有上述限制,近来仪器的进步加上分馏技术的发展已经用于了一些基因模型组织的综合蛋白质组学的分析,其中包括酿酒酵母、果蝇、线虫和拟南芥[3-5]。这些研究完成的覆盖率通常在基因组编码蛋白的50%~80%。一项研究从果蝇中鉴定了9124种蛋白质,与预测的可读框对应63%。这些数据也揭露了新编码蛋白基因的存在,并提供了蛋白水平具体剪接异构体表达的证据[3-5]

 

定量蛋白质组

分子表型的比较分析依靠于定量质谱技术来探究不同样品间的蛋白质丰度变化的相对和绝对量。目前两种主要的方法正用于基于质谱的定量蛋白质组学:差异同位素标记和非标记定量。两种方法各有优点,同位素标记方法测量蛋白质丰度精度更高,而非标记法有更广的动态范围并且能完成更高蛋白质组覆盖水平。

 

同位素标记法。目前主流的同位素标记方法有iTRAQ和SILAC等。以肽段和蛋白质差异同位素标记为基础的质谱定量建立在稳定同位素稀释理论之上。该理论表述了从质谱仪获得的两种被分析物的相对信号强度代表了样品中两种被分析物的相对丰度,这两种被分析物化学性质一致但由不同的稳定同位素构成。不同样品中蛋白质丰度能够在一个单独的液相色谱-串联质谱(LC-MS/MS)实验中得到分析,该实验以差异同位素标记引起的可观察质量改变为基础。通常应用的两种主要的工作流程:分离蛋白质和肽段的体外标记(iTRAQ)或者是体内通过代谢标记结合同位素标记氨基酸(SILAC)。



非标记定量。非标记定量质谱方法基于二级谱图数计算或者一级质谱肽段母离子强度。谱图计算是作为一个在中等质量分辨质谱仪下分析鸟枪法MS数据的半定量方案。这种方法建立在一种假设的基础上,即肽母离子在质谱仪中被选中的概率与其丰度相关。对于相关蛋白质的定量,谱计数然后被平均为一个蛋白质丰度指数。其方法依靠MS/MS肽鉴定的质量。虽然该方法能可靠地用于高丰度蛋白,但是从低丰度蛋白中观察到的肽的数目对于精确的定量常常是不足的。基于一级质谱母离子强度的无标记定量方法以精确的质量和保留时间[6]为基础,建立在高质量高精度质谱仪平台基础上。肽段根据它们具体的保留时间坐标和精确的质荷比(m/z),可以得到质谱分析仪灵敏度范围内所有肽段的鉴定,而不依赖于二级谱图的获取。


 

总结

蛋白质组是一个动态、变化的整体,生物体内的蛋白质不能像核酸一样通过PCR扩增来增加样品量,因此其复杂性远远大于基因组。虽然蛋白质组学的研究有它的局限性。但是技术改进并未停止。新分离技术和高精度质谱仪已成为蛋白质组研究技术最主要的目标。蛋白质组学的建立开辟了功能基因组学研究的新领域。为研究蛋白质水平的生命活动展现了更为崭新的思路和广阔的前景。可以说其发展受技术限制,但同时也是受技术推动的。

随着生命科学及生物技术的迅速发展,生物质谱不仅成为有机质谱中最活跃、最富生命力的前沿研究领域之一,更成为多肽和蛋白质分析最有威力的工具之一。串联质谱是肽序列分析的最先进方法。分析串联质谱数据所代表的序列是一项费时费力的工作,这就对序列分析算法和软件等生物信息学交叉学科研究模式提出了严峻要求。在发展新技术的同时,还应该重视现有蛋白质组学研究技术的整合和互补。多种技术的联合应用可以全面、系统、综合地分析蛋白质的特征功能,强有力地推动人类基因组计划及其后基因组计划的实施。


 

参考文献

1.Ghaemmaghami, S. et al. Global analysis of protein expression in yeast. Nature425, 737–741 (2003).

2. Anderson, N.L. et al. The human plasma proteome: a nonredundant list developed by combinationof four separate sources. Mol. Cell. Proteomics 3, 311–326 (2004).

3. Schrimpf, S.P. et al. Comparative functional analysis of the Caenorhabditiselegans and Drosophila melanogaster proteomes. PLoS Biol. 7,e48 (2009).

4.Baerenfaller, K. et al. Genome-scale proteomics reveals Arabidopsisthaliana gene models and

proteomedynamics. Science 320, 938–941 (2008).

5. Brunner, E. etal. A high-quality catalog of the Drosophila melanogaster proteome. Nature

Biotechnol. 25,576–583 (2007).

6. Strittmatter,E. F., Ferguson,P. L., Tang, K. & Smith, R. D. Proteome analyses using accurate mass andelution time peptide tags with capillary LC time-of-flight mass spectrometry. J.Am. Soc. Mass Spectrom. 14, 980–991 (2003).


英文文献链接: http://www.ncbi.nlm.nih.gov/pubmed/19687803

即使目前已经进入高精度质谱时代,iTRAQ技术和非标全覆盖技术普遍流行,但文中蛋白质组的基础知识点永不过时。




https://blog.sciencenet.cn/blog-483076-963208.html

上一篇:2015年就要过去了
下一篇:蛋白质组学为主,其它组学为辅,多组学整合解析急性髓系白血病
收藏 IP: 60.28.141.*| 热度|

1 谢平

发表评论 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-10-20 03:16

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部