思想散步分享 http://blog.sciencenet.cn/u/fqng1008 前三十年写日记,后三十年写博客

博文

基因:推动遗传学本质进步的阶梯

已有 221 次阅读 2026-4-26 18:11 |个人分类:医学史话|系统分类:科普集锦

“基因”是20世纪生命科学最具统摄力的概念之一。它最初只是一个解释遗传现象的抽象符号,后来被定位于染色体上的物理实体,再后来被确认为具有特定核苷酸序列的DNA片段,最终又被发现其结构远比想象复杂——断裂基因、重叠基因、移动基因、非编码基因。基因概念的历史,是遗传学从思辨走向分子、从抽象走向具体、从简单走向复杂的缩影。

然而,这一概念的演变并非线性进步,而是充满了范式的断裂与概念的重新定义。每一次技术革命——从果蝇杂交到X射线诱变,从DNA测序到基因组编辑——都推动着“基因”内涵的嬗变。

23. 前史:混合遗传与孟德尔的“因子”

在19世纪之前,人们对遗传的理解普遍是“混合遗传”——父母的性状在后代中融合,如同调色。这一观念符合日常观察(黑人与白人子女肤色居中),但无法解释变异为何能够维持。

孟德尔的豌豆实验:1865年,奥地利修道士孟德尔在布吕恩自然科学学会宣读了《植物杂交实验》。他选择豌豆的七对明显性状(高茎/矮茎、圆粒/皱粒、黄子叶/绿子叶等),进行严格控制的杂交实验。他观察到:F1代全部表现显性性状;F2代显性与隐性性状以约3:1的比例分离。孟德尔提出:性状由成对的“因子”决定,在配子形成时分离(分离定律);不同性状的因子在配子中自由组合(自由组合定律)。孟德尔的“因子”就是“基因”的前身。

然而,孟德尔的工作被完全忽视。原因包括:他发表于鲜为人知的期刊;他的数学方法不被生物学家理解;他的结论与当时流行的“融合遗传”观念冲突;达尔文进化论主导了生物学界,而达尔文本人坚持融合遗传。

重新发现:1900年,三位植物学家——德弗里斯(荷兰)、科伦斯(德国)和切尔马克(奥地利)——独立地重复了孟德尔的实验,并追溯到孟德尔的原始论文。“孟德尔定律”被重新发现,遗传学作为独立学科诞生。

23.2  概念诞生:约翰森与“基因”命名

孟德尔的“因子”是一个操作概念——通过杂交实验推断存在,但无物质实体。

威廉·约翰森:1909年,丹麦植物学家约翰森在《遗传学原理》中,将孟德尔的“因子”重新命名为“基因”(gene),源于希腊语“genos”(种族、血统)。他区分了三个关键概念:

基因(gene):可遗传的、不可分割的遗传单位

基因型(genotype):个体的遗传组成

表型(phenotype):个体表现出的性状

约翰森强调,基因是“纯粹的存在概念”,不涉及任何物质假设。这一命名使遗传学摆脱了“因子”的模糊性,但基因的本质仍然未知。

23.3  物理定位:染色体理论与摩尔根学派

20世纪初,细胞学与遗传学的结合将基因定位于染色体。

萨顿与博韦里:1902-1903年,美国细胞学家萨顿和德国生物学家博韦里独立提出“染色体遗传理论”。他们观察到,减数分裂中染色体的行为与孟德尔因子的分离和组合完全平行——染色体成对存在,在配子形成时分离,不同染色体自由组合。他们推测:基因位于染色体上。

摩尔根的果蝇实验:哥伦比亚大学的摩尔根最初怀疑孟德尔主义。他选择果蝇(繁殖快、染色体少、易于饲养)作为实验对象。1910年,他偶然发现一只白眼雄蝇,将其与红眼雌蝇杂交,结果F1代全为红眼,F2代红眼:白眼=3:1,且白眼全为雄性。摩尔根推断:白眼基因位于X染色体上(性连锁遗传)。这是第一个被定位于特定染色体的基因。

连锁与互换:摩尔根及其学生(斯特蒂文特、布里吉斯、缪勒)发现了基因的连锁现象——同一染色体上的基因倾向于一起遗传。但他们也发现,同源染色体在减数分裂时可以交换片段(互换),导致连锁基因的重新组合。互换频率与基因间距成正比。斯特蒂文特据此绘制了第一张果蝇的遗传图谱(1913年),证明基因在染色体上呈线性排列。

摩尔根学派:摩尔根因染色体遗传理论获1933年诺贝尔奖。他的实验室培养了整整一代遗传学家,将基因概念从抽象的“因子”转化为可定位、可作图、可操作的实体。

23.4  化学本质:DNA作为遗传物质

尽管基因被定位于染色体,但其化学本质仍有争议。染色体由DNA和蛋白质组成,多数科学家认为蛋白质(20种氨基酸,可任意排列)才是遗传物质,而DNA(仅4种碱基,单调重复)只是结构骨架。

艾弗里实验:1944年,洛克菲勒研究所的艾弗里、麦克劳德和麦卡蒂用肺炎球菌转化实验证明:引起遗传转化的物质是DNA。他们用DNA酶处理提取物会消除转化活性,而蛋白酶处理不影响。这是第一次实验证明DNA是遗传物质。但这一结论遭到质疑——当时仍有人怀疑提取物中残留的微量蛋白质才是真正的转化因子。

赫尔希-蔡斯实验:1952年,赫尔希和蔡斯用放射性同位素标记噬菌体:³²P标记DNA,³S标记蛋白质。感染实验表明,只有DNA进入细菌细胞,并指导新噬菌体的合成。蛋白质留在外面。这为DNA是遗传物质提供了无可辩驳的证据。

基因的分子定义:1953年,沃森和克里克提出DNA双螺旋结构,揭示了遗传信息的存储(碱基序列)和复制(碱基互补配对)机制。基因被重新定义为“DNA分子上具有特定核苷酸序列的一段”。这一分子定义是基因概念的范式转换——从操作概念(通过杂交推断)到物理实体(可分离、可测序)。

23.5  精细结构:一个基因一个酶与共线性的确立

1940-1960年代,生化遗传学和分子遗传学揭示了基因的功能单位与结构单位。

比德尔与塔特姆:1941年,他们用X射线诱变红色面包霉,筛选出营养缺陷型突变(需要特定营养物质才能生长)。他们发现,每个突变对应一种酶的缺失。据此提出“一个基因一个酶”假说——基因的功能是控制特定酶的合成。后修正为“一个基因一条多肽链”。

本泽的精细作图:1950年代,本泽用T4噬菌体的rII基因座进行遗传重组分析。他发现,基因内部可以发生重组,证明基因不是不可分割的最小单位。他区分了三个概念:

突变子(muton):突变的最小单位,即一个核苷酸

重组子(recon):重组的最小单位,也是单个核苷酸

顺反子(cistron):功能单位,即一条多肽链的编码序列(后来称为“基因”)

本泽的工作将基因从“功能整体”解构为“可进一步分割的核苷酸序列”。

共线性:1960年代,科学家比较了噬菌体基因的遗传图谱与蛋白质的氨基酸序列,发现基因上的突变位点顺序与蛋白质中氨基酸置换的顺序一致。这证明了基因与蛋白质之间的“共线性”——DNA的核苷酸序列与蛋白质的氨基酸序列线性对应。

23.6  概念颠覆:断裂基因、重叠基因与移动基因

1970年代以后,基因概念的“简单性”被一系列发现打破。

断裂基因:1977年,夏普和罗伯茨独立发现,腺病毒的晚期基因在DNA上是“断裂的”——编码序列(外显子)被非编码序列(内含子)间隔。转录后,内含子被剪接去除,外显子拼接成成熟mRNA。他们因此获得1993年诺贝尔奖。断裂基因广泛存在于真核生物中,原核生物罕见。这一发现颠覆了“基因是DNA上连续的片段”的简单定义。

RNA剪接与可变剪接:进一步发现,同一基因的初级转录产物可以通过不同的剪接方式产生不同的成熟mRNA,进而翻译成不同的蛋白质(可变剪接)。人类约95%的基因存在可变剪接。基因不再是“一个基因一条多肽链”,而是“一个基因多条多肽链”。

重叠基因:1977年,桑格测序了噬菌体φX174的基因组,发现其基因存在重叠——同一段DNA序列以不同的阅读框编码不同的蛋白质。重叠基因在病毒中常见,是真核生物基因组中极少。

移动基因:1940-1950年代,麦克林托克在玉米中发现,某些遗传因子可以在染色体上移动位置,她称之为“跳跃基因”(转座子)。她的发现被长期忽视,直到1980年代在细菌和果蝇中被证实。移动基因揭示了基因组的动态性。

23.7  基因组时代:基因的计数、注释与功能

21世纪,基因组测序技术使“基因”的概念面临新的挑战。

基因计数:人类基因组计划(1990-2003)最初预测人类有约10万个基因,但实际只有约2万个,与线虫、果蝇相近。这被称为“基因数悖论”——生物复杂性与基因数量无关。

非编码基因:人类基因组中只有约2%的序列编码蛋白质,其余大部分转录为非编码RNA(miRNA、lncRNA、circRNA等)。这些非编码RNA具有调控功能。那么,“非编码RNA基因”算不算“基因”?当代定义已扩展为“产生功能性RNA或蛋白质产物的DNA片段”。

假基因:基因组中存在大量与功能基因相似但失去编码能力的序列(假基因)。它们是进化的“化石”。

基因的边界模糊:一个基因的转录产物可能通过可变剪接、可变启动子、可变polyA位点产生多种变体;基因之间可能存在重叠;某些lncRNA与邻近蛋白编码基因共享调控元件。“基因”的边界变得模糊。

23.8  基因概念的哲学反思

基因概念的演变史,引发了对“基因是什么”的深层追问。

基因作为“信息单位”:当代定义强调基因是“可遗传信息的单位”,而非“实体”。信息可以存储在DNA、RNA(RNA病毒)、甚至蛋白质(朊病毒)中。这一定义打破了“基因=DNA”的教条。

基因的“多重可实现性”:同一种遗传信息可以用不同的化学物质(DNA、RNA)承载,甚至可能用人工合成的非天然核酸(XNA)承载。基因不再是特定化学物质,而是特定功能角色。

基因的“分布性”:基因的调控元件可能远离编码序列(增强子可达数百万碱基之外);基因的表达受表观遗传修饰影响;基因的功能依赖于细胞内网络。基因不再是孤立的“粒子”,而是网络中的节点。

23.9  概念史的启示

从孟德尔的“因子”到基因组时代的“信息单位”,基因概念的演变跨越了150余年。这一演变给予我们几点启示:

第一,基因概念经历了从“抽象符号”到“物理实体”再到“信息单位”的转变。孟德尔的“因子”是统计推断的符号;摩尔根将其定位于染色体;沃森-克里克将其定义为DNA序列;当代将其视为“可遗传信息的功能单位”。每一次转变都是范式的断裂。

第二,基因概念的每次深化都与技术革命同步。杂交技术→孟德尔定律;细胞学技术→染色体理论;诱变与重组分析→基因精细作图;X射线衍射与测序→分子定义;重组DNA与PCR→基因克隆;高通量测序→基因组学;基因编辑→基因功能操纵。

第三,基因概念不断被“复杂化”。从连续到断裂(内含子),从一对一到一个对多(可变剪接),从静态到动态(移动基因),从编码到非编码(ncRNA),从独立到网络(调控元件)。基因越被深入了解,就越显得“不规则”。

第四,基因概念的历史是科学史上“本质主义”被“功能主义”取代的范例。早期寻求“基因的本质”(物质、结构),当代接受“基因是功能角色”(可因语境而变)。这一转变反映了科学哲学的深层变化。

今天,“基因”已深入公众意识。我们谈论“肥胖基因”“智力基因”“癌症基因”,但科学家的理解要复杂得多——绝大多数性状是多基因、环境、表观遗传共同作用的结果。

基因概念的历史提醒我们,科学概念不是一成不变的真理,而是人类理解自然的工具。它们随证据、技术和理论的变化而演变。正如遗传学家杜布赞斯基所说:“在生物学中,除了进化之光,没有什么东西是恒常的。”这句话同样适用于“基因”本身——它既是生命传承的物理基础,也是人类认知进化的见证。



https://blog.sciencenet.cn/blog-279293-1532204.html

上一篇:从“社会疫苗”到“卡脑子”问题——评高福院士“科普是社会疫苗”
收藏 IP: 120.231.245.*| 热度|

2 宁利中 郑永军

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-4-26 20:37

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部