思想散步分享 http://blog.sciencenet.cn/u/fqng1008 前三十年写日记,后三十年写博客

博文

蛋白质概念史:生命核心地位的逐步揭示

已有 310 次阅读 2026-4-12 07:49 |个人分类:医学史话|系统分类:科普集锦

蛋白质,是生命体中最丰富、功能最多样的大分子。它们催化生化反应(酶),运输氧气(血红蛋白),抵御病原体(抗体),传递信号(受体),提供结构支撑(胶原蛋白),调控基因表达(转录因子)。“蛋白质”这一名称本身源自希腊语“πρώτειος”(proteios),意为“首要的”或“第一位的”——这个命名已暗示了它在生命中的核心地位。

然而,这一在今天被视为理所当然的概念,却是经历了近两个世纪的演变才得以确立的。从古代对“胶状物质”的模糊认知,到19世纪“蛋白质”的命名与元素分析,到20世纪氨基酸序列、肽键和各级结构的阐明,到当代蛋白质组学和人工智能预测——蛋白质概念的历史,折射出生命科学从整体到分子、从化学组成到三维结构、从分析到合成的深刻转型。

9.1  古代与近代早期:蛋白质的“前史”

在“蛋白质”这一化学概念出现之前,人类早已在日常经验中接触了这类物质。蛋清(albumin)加热后凝固,血液中的纤维蛋白原在空气中凝结成纤维,牛奶中的酪蛋白遇酸沉淀,动物皮肉煮沸后释放明胶(胶原蛋白的水解产物)。这些现象被观察到,但无人知晓其共同本质。

17-18世纪,化学家开始对这些物质进行初步分析。荷兰化学家马格拉夫从动物胶中分离出一种物质,后来被称为“明胶”。法国化学家鲁埃勒在18世纪中叶从牛奶中分离出“酪蛋白”(casein,源于拉丁语“caseus”即奶酪)。瑞典化学家舍勒从血液中分离出“纤维蛋白”(fibrin),并注意到它与明胶的相似性。但这些研究零散而缺乏统摄性概念。

真正的转折发生在18世纪末。法国化学家富克鲁瓦在其《化学原理》中,将来自动植物来源的、加热后凝固或遇酸沉淀的物质统称为“白蛋白”(albumin,源于拉丁语“albus”即白色)、“纤维蛋白”和“明胶”。他猜测这些物质属于同一类别,但未能提出统一名称。

9.2  概念的诞生:贝采利乌斯与“蛋白质”的命名

19世纪上半叶,有机化学的进展为蛋白质概念的建立提供了工具。

元素分析:瑞典化学家贝采利乌斯是这一时期的领军人物。他改进了元素分析方法,测定了多种有机物的碳、氢、氧、氮含量。他发现,蛋清、纤维蛋白、酪蛋白、明胶等物质的元素组成相似——都含有约50-55%的碳、6-7%的氢、20-23%的氧、15-18%的氮,以及少量硫和磷。这与碳水化合物(仅含C、H、O)和脂肪(C、H、O,但H/O比更高)明显不同。氮的存在成为蛋白质区别于其他有机物的关键标志。

Mulder的蛋白理论:1838年,荷兰化学家穆尔德在贝采利乌斯的启发下,对多种蛋白质进行了元素分析。他发现,这些物质的经验式都可以表示为C₄₀H₆₂N₁₀O₁₂,即它们似乎由一个共同的“核心”加上少量硫或磷构成。穆尔德将这个假想的核心称为“蛋白”(protein),源于希腊语“proteios”(首要的)。他提出“蛋白理论”:所有蛋白质物质都由一个共同的“蛋白”核心与不同数量的硫或磷结合而成。

贝采利乌斯在1838年给穆尔德的信中,正式建议使用“protein”一词来描述这一类物质。1840年代,“protein”作为术语被学界接受,后传入法语(protéine)、德语(Protein)和英语(protein)。中文“蛋白质”是后来根据其化学组成(含氮、有蛋白特性)和功能(生命的质料)翻译而来。

然而,穆尔德的“蛋白核心”理论后来被证明是错误的。更精确的元素分析显示,不同来源的蛋白质元素组成存在差异,并非由一个统一的“核心”加上可变修饰构成。但“蛋白质”这个名称保留了下来,尽管它最初基于一个错误的前提。

9.3  组成单元:氨基酸与肽键

19世纪下半叶,化学家开始探索蛋白质的组成单元。

氨基酸的发现:19世纪初,化学家已从蛋白质水解产物中分离出几种氨基酸。1806年,法国化学家沃克兰和罗比凯从芦笋中分离出天冬酰胺(天冬氨酸的酰胺)。1820年,法国化学家布拉孔诺从明胶水解物中分离出甘氨酸(最简单的氨基酸)和亮氨酸。1840年代,德国化学家李比希实验室从酪蛋白中分离出酪氨酸(含苯环)。此后数十年,更多氨基酸被陆续发现——丝氨酸、谷氨酸、苯丙氨酸、丙氨酸等。到1900年,已有十余种氨基酸被鉴定。

费歇尔的工作:德国化学家费歇尔是蛋白质化学的奠基人之一。1899-1908年间,他系统研究了氨基酸的连接方式。他发现,氨基酸通过一个氨基酸的氨基与另一个氨基酸的羧基脱水缩合,形成“肽键”(-CO-NH-)。多个氨基酸通过肽键连接形成“肽链”。费歇尔用化学方法合成了由18个氨基酸组成的多肽(十八肽),虽然远小于天然蛋白质(数百个氨基酸),但证明了蛋白质是氨基酸通过肽键连接的多聚物。费歇尔因此获得1902年诺贝尔化学奖(主要奖励糖化学和嘌呤化学,但他在肽合成方面的贡献同样卓越)。

蛋白质的“多肽链”概念:20世纪初,蛋白质被视为由氨基酸通过肽键连接而成的长链分子。但链是如何折叠的?是否存在二级、三级结构?这些问题直到20世纪中叶才逐步解决。

9.4  结构层次:从一级到四级

20世纪中叶,蛋白质结构的研究经历了革命性突破。

桑格与胰岛素测序:英国生物化学家桑格是蛋白质测序的先驱。1945-1955年,他选择胰岛素(分子量约5700,含51个氨基酸)作为研究对象。他使用2,4-二硝基氟苯标记氨基末端,用部分水解和色谱分离鉴定片段,最终在1955年发表了胰岛素的完整氨基酸序列。这是人类历史上第一个被测序的蛋白质。桑格因此获得1958年诺贝尔化学奖。他的方法开创了蛋白质一级结构测定的新时代。

鲍林与α螺旋:美国化学家鲍林是结构生物学的先驱。1951年,鲍林和科里利用X射线晶体学分析合成多肽和天然蛋白质(如角蛋白),提出了两种规则的二级结构:α螺旋(右手螺旋,每个螺旋3.6个氨基酸残基,由氢键稳定)和β折叠(伸展的肽链通过氢键平行排列)。α螺旋和β折叠至今仍是蛋白质二级结构的核心概念。鲍林因此获得1954年诺贝尔化学奖(主要奖励他关于化学键本质的研究,但α螺旋的发现是重要组成部分)。

安芬森与“自组装”假说:美国生物化学家安芬森在1950-1960年代研究了核糖核酸酶(RNase)的变性和复性。他发现,在变性剂(尿素+巯基乙醇)存在下,RNase失去活性并展开;去除变性剂后,RNase能自动重新折叠成有活性的天然构象。他由此提出“氨基酸序列决定三维结构”的著名论断(安芬森法则)。安芬森因此获得1972年诺贝尔化学奖。这一法则为蛋白质结构预测提供了理论基础。

肯德鲁与佩鲁茨的X射线晶体学:英国晶体学家肯德鲁和佩鲁茨是蛋白质三维结构解析的先驱。他们发展了“同晶置换法”来解决X射线衍射的相位问题。1958年,肯德鲁解析了肌红蛋白的6Å分辨率结构;1960年,佩鲁茨解析了血红蛋白的5.5Å分辨率结构。此后数十年,分辨率不断提高,最终获得原子水平的精确结构。肯德鲁和佩鲁茨因此获得1962年诺贝尔化学奖。

蛋白质四级结构:佩鲁茨对血红蛋白的研究揭示,血红蛋白由四个亚基(两个α、两个β)组装而成,亚基之间协同结合氧(别构效应)。他将这种多亚基组装称为“蛋白质的四级结构”。四级结构概念的建立,对理解酶的别构调控、信号转导、免疫识别等至关重要。

9.5  功能的多样性:从“一酶一蛋白”到多功能网络

20世纪,蛋白质概念的功能内涵不断扩展。

“一酶一蛋白”假说:1940年代,美国遗传学家比德尔和塔特姆通过对脉孢菌营养缺陷型突变的研究,提出“一个基因一个酶”假说。他们认为,每个基因控制一个特定酶的合成。这一假说首次将基因与蛋白质功能直接联系起来。虽然后来修正为“一个基因一条多肽链”,但其核心洞见——蛋白质是基因功能的最终执行者——影响深远。比德尔和塔特姆因此获得1958年诺贝尔奖。

非酶功能的发现:19世纪末至20世纪初,科学家已发现蛋白质具有多种非酶功能:血红蛋白(氧运输)、胶原蛋白(结构支撑)、角蛋白(保护)、抗体(免疫防御)、激素(胰岛素、生长激素)、受体(细胞信号)。这些发现使蛋白质概念从“酶”扩展为“多功能分子”。

分子伴侣:1980年代,德国生物学家哈特尔和美国生物学家霍维茨发现,某些蛋白质(如热休克蛋白Hsp60、Hsp70)能够协助其他蛋白质正确折叠,防止错误聚集。这些被称为“分子伴侣”。分子伴侣的发现揭示了蛋白质折叠不是完全自发的,而是需要辅助系统的参与。

朊病毒:1982年,美国生物化学家普鲁西纳在研究羊瘙痒症时发现,致病因子不是病毒或细菌,而是一种蛋白质——他称之为“朊病毒”(prion,proteinaceous infectious particle)。朊病毒是正常细胞蛋白的错误构象异构体,能够诱导正常蛋白转变为异常构象,导致神经退行性疾病(如疯牛病、克雅氏病)。这一发现打破了“遗传信息只能通过核酸传递”的中心法则,揭示了蛋白质本身也能传递信息。普鲁西纳因此获得1997年诺贝尔奖。

9.6  当代扩展:蛋白质组学与AI预测

21世纪,蛋白质概念经历了两次革命性进展。

蛋白质组学:1994年,澳大利亚科学家威尔金斯和威廉姆斯提出了“蛋白质组”(proteome)概念,指一个细胞或组织在特定条件下表达的全部蛋白质。蛋白质组学通过二维凝胶电泳、质谱技术系统分析蛋白质表达、修饰、相互作用。与基因组学不同,蛋白质组反映的是“实际发生”的功能活动,而非“潜在可能”。蛋白质组学是后基因组时代的核心领域之一。

AlphaFold与结构预测:蛋白质结构预测是生物学半个世纪以来的重大挑战。2020年,英国DeepMind公司开发的AlphaFold 2在CASP14竞赛中取得了GDT评分92.4(满分100)的惊人成绩,预测精度与实验方法相当。2021年,AlphaFold 2开源,并预测了人类基因组编码的全部约2万种蛋白质的结构。2022年,AlphaFold团队预测了地球上几乎所有已知蛋白质的结构(超过2亿个)。AlphaFold的成功标志着“结构生物学”与“计算生物学”的深度融合,将极大加速药物研发、疾病机制研究和合成生物学。其开发者哈萨比斯和江珀因此获得2024年诺贝尔化学奖。

蛋白质设计的逆转:如果说蛋白质组学和AlphaFold是“分析”——从序列预测结构,那么蛋白质设计就是“合成”——从所需结构设计序列。2020年代,基于深度学习的蛋白质设计方法(如RFdiffusion、ProteinMPNN)能够创造自然界不存在的全新蛋白质,用于催化、传感、药物递送、生物材料等领域。这标志着人类从“解读”蛋白质走向“编写”蛋白质。

9.7  概念史的启示

从穆尔德的“蛋白核心”,到费歇尔的肽键,到桑格的胰岛素序列,到肯德鲁-佩鲁茨的三维结构,到AlphaFold的预测——蛋白质概念的演变跨越了将近两个世纪。

这一演变给予我们几点启示:

第一,蛋白质概念经历了从“胶状混合物”到“精确序列大分子”到“动态三维结构”到“可预测、可设计的分子”的转变。早期蛋白质被视为不确定的胶体;20世纪揭示其确定的氨基酸序列和三维结构;当代能够从序列预测结构、从功能设计序列。每一步都依赖技术的突破——元素分析、色谱、X射线晶体学、质谱、冷冻电镜、人工智能。

第二,蛋白质的功能内涵不断扩展。从“酶”到“结构蛋白”到“信号分子”到“信息载体”(朊病毒),蛋白质概念的外延持续扩大。没有一种生物大分子能像蛋白质这样涵盖如此多样的功能谱系。

第三,蛋白质概念与“信息”观念的兴起紧密相关。“氨基酸序列决定三维结构”是信息论在生物学中的早期体现;基因组学将蛋白质视为“基因的表达产物”;AlphaFold将序列-结构-功能的关系纳入可计算的框架。蛋白质是连接遗传信息与生命活动的关键环节。

第四,蛋白质概念的当代演变正在重塑生命科学。AlphaFold使结构生物学从“实验解析”转向“预测+验证”混合模式;蛋白质设计使合成生物学获得新的工具箱;蛋白质组学正在揭示疾病标志物和药物靶点。蛋白质已不仅是研究对象,更是工程对象。

今天,“蛋白质”仍然是生命科学最活跃的研究领域之一。从基础研究中的蛋白质动态、翻译后修饰、相分离,到应用领域中的抗体药物、酶工程、蛋白质材料,蛋白质概念的内涵和外延仍在持续扩展。

蛋白质概念的历史告诉我们,理解生命的核心在于理解蛋白质——它们执行着生命的大多数功能,它们是药物最主要的靶点,它们记录了进化历史的分子指纹。正如生物化学家弗雷德里克·桑格所说:“蛋白质是生命的物质基础。理解了蛋白质,就理解了生命运作的机制。”

从贝采利乌斯的元素分析到AlphaFold的深度神经网络,人类对蛋白质的认知经历了从“首要物质”到“可编程分子”的跨越。而这一跨越的终点,还远未到来。



https://blog.sciencenet.cn/blog-279293-1529986.html

上一篇:8 脂质:一个庞大家族的拓展
下一篇:科学概念与技术进步(1)
收藏 IP: 120.231.209.*| 热度|

3 郑永军 范振英 王涛

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-4-12 17:55

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部