||
“基因”是20世纪生命科学最具统摄力的概念之一。它最初只是一个解释遗传现象的抽象符号,后来被定位于染色体上的物理实体,再后来被确认为具有特定核苷酸序列的DNA片段,最终又被发现其结构远比想象复杂——断裂基因、重叠基因、移动基因、非编码基因。基因概念的历史,是遗传学从思辨走向分子、从抽象走向具体、从简单走向复杂的缩影。
然而,这一概念的演变并非线性进步,而是充满了范式的断裂与概念的重新定义。每一次技术革命——从果蝇杂交到X射线诱变,从DNA测序到基因组编辑——都推动着“基因”内涵的嬗变。
23. 前史:混合遗传与孟德尔的“因子”
在19世纪之前,人们对遗传的理解普遍是“混合遗传”——父母的性状在后代中融合,如同调色。这一观念符合日常观察(黑人与白人子女肤色居中),但无法解释变异为何能够维持。
孟德尔的豌豆实验:1865年,奥地利修道士孟德尔在布吕恩自然科学学会宣读了《植物杂交实验》。他选择豌豆的七对明显性状(高茎/矮茎、圆粒/皱粒、黄子叶/绿子叶等),进行严格控制的杂交实验。他观察到:F1代全部表现显性性状;F2代显性与隐性性状以约3:1的比例分离。孟德尔提出:性状由成对的“因子”决定,在配子形成时分离(分离定律);不同性状的因子在配子中自由组合(自由组合定律)。孟德尔的“因子”就是“基因”的前身。
然而,孟德尔的工作被完全忽视。原因包括:他发表于鲜为人知的期刊;他的数学方法不被生物学家理解;他的结论与当时流行的“融合遗传”观念冲突;达尔文进化论主导了生物学界,而达尔文本人坚持融合遗传。
重新发现:1900年,三位植物学家——德弗里斯(荷兰)、科伦斯(德国)和切尔马克(奥地利)——独立地重复了孟德尔的实验,并追溯到孟德尔的原始论文。“孟德尔定律”被重新发现,遗传学作为独立学科诞生。
23.2 概念诞生:约翰森与“基因”命名
孟德尔的“因子”是一个操作概念——通过杂交实验推断存在,但无物质实体。
威廉·约翰森:1909年,丹麦植物学家约翰森在《遗传学原理》中,将孟德尔的“因子”重新命名为“基因”(gene),源于希腊语“genos”(种族、血统)。他区分了三个关键概念:
基因(gene):可遗传的、不可分割的遗传单位
基因型(genotype):个体的遗传组成
表型(phenotype):个体表现出的性状
约翰森强调,基因是“纯粹的存在概念”,不涉及任何物质假设。这一命名使遗传学摆脱了“因子”的模糊性,但基因的本质仍然未知。
23.3 物理定位:染色体理论与摩尔根学派
20世纪初,细胞学与遗传学的结合将基因定位于染色体。
萨顿与博韦里:1902-1903年,美国细胞学家萨顿和德国生物学家博韦里独立提出“染色体遗传理论”。他们观察到,减数分裂中染色体的行为与孟德尔因子的分离和组合完全平行——染色体成对存在,在配子形成时分离,不同染色体自由组合。他们推测:基因位于染色体上。
摩尔根的果蝇实验:哥伦比亚大学的摩尔根最初怀疑孟德尔主义。他选择果蝇(繁殖快、染色体少、易于饲养)作为实验对象。1910年,他偶然发现一只白眼雄蝇,将其与红眼雌蝇杂交,结果F1代全为红眼,F2代红眼:白眼=3:1,且白眼全为雄性。摩尔根推断:白眼基因位于X染色体上(性连锁遗传)。这是第一个被定位于特定染色体的基因。
连锁与互换:摩尔根及其学生(斯特蒂文特、布里吉斯、缪勒)发现了基因的连锁现象——同一染色体上的基因倾向于一起遗传。但他们也发现,同源染色体在减数分裂时可以交换片段(互换),导致连锁基因的重新组合。互换频率与基因间距成正比。斯特蒂文特据此绘制了第一张果蝇的遗传图谱(1913年),证明基因在染色体上呈线性排列。
摩尔根学派:摩尔根因染色体遗传理论获1933年诺贝尔奖。他的实验室培养了整整一代遗传学家,将基因概念从抽象的“因子”转化为可定位、可作图、可操作的实体。
23.4 化学本质:DNA作为遗传物质
尽管基因被定位于染色体,但其化学本质仍有争议。染色体由DNA和蛋白质组成,多数科学家认为蛋白质(20种氨基酸,可任意排列)才是遗传物质,而DNA(仅4种碱基,单调重复)只是结构骨架。
艾弗里实验:1944年,洛克菲勒研究所的艾弗里、麦克劳德和麦卡蒂用肺炎球菌转化实验证明:引起遗传转化的物质是DNA。他们用DNA酶处理提取物会消除转化活性,而蛋白酶处理不影响。这是第一次实验证明DNA是遗传物质。但这一结论遭到质疑——当时仍有人怀疑提取物中残留的微量蛋白质才是真正的转化因子。
赫尔希-蔡斯实验:1952年,赫尔希和蔡斯用放射性同位素标记噬菌体:³²P标记DNA,³⁵S标记蛋白质。感染实验表明,只有DNA进入细菌细胞,并指导新噬菌体的合成。蛋白质留在外面。这为DNA是遗传物质提供了无可辩驳的证据。
基因的分子定义:1953年,沃森和克里克提出DNA双螺旋结构,揭示了遗传信息的存储(碱基序列)和复制(碱基互补配对)机制。基因被重新定义为“DNA分子上具有特定核苷酸序列的一段”。这一分子定义是基因概念的范式转换——从操作概念(通过杂交推断)到物理实体(可分离、可测序)。
23.5 精细结构:一个基因一个酶与共线性的确立
1940-1960年代,生化遗传学和分子遗传学揭示了基因的功能单位与结构单位。
比德尔与塔特姆:1941年,他们用X射线诱变红色面包霉,筛选出营养缺陷型突变(需要特定营养物质才能生长)。他们发现,每个突变对应一种酶的缺失。据此提出“一个基因一个酶”假说——基因的功能是控制特定酶的合成。后修正为“一个基因一条多肽链”。
本泽的精细作图:1950年代,本泽用T4噬菌体的rII基因座进行遗传重组分析。他发现,基因内部可以发生重组,证明基因不是不可分割的最小单位。他区分了三个概念:
突变子(muton):突变的最小单位,即一个核苷酸
重组子(recon):重组的最小单位,也是单个核苷酸
顺反子(cistron):功能单位,即一条多肽链的编码序列(后来称为“基因”)
本泽的工作将基因从“功能整体”解构为“可进一步分割的核苷酸序列”。
共线性:1960年代,科学家比较了噬菌体基因的遗传图谱与蛋白质的氨基酸序列,发现基因上的突变位点顺序与蛋白质中氨基酸置换的顺序一致。这证明了基因与蛋白质之间的“共线性”——DNA的核苷酸序列与蛋白质的氨基酸序列线性对应。
23.6 概念颠覆:断裂基因、重叠基因与移动基因
1970年代以后,基因概念的“简单性”被一系列发现打破。
断裂基因:1977年,夏普和罗伯茨独立发现,腺病毒的晚期基因在DNA上是“断裂的”——编码序列(外显子)被非编码序列(内含子)间隔。转录后,内含子被剪接去除,外显子拼接成成熟mRNA。他们因此获得1993年诺贝尔奖。断裂基因广泛存在于真核生物中,原核生物罕见。这一发现颠覆了“基因是DNA上连续的片段”的简单定义。
RNA剪接与可变剪接:进一步发现,同一基因的初级转录产物可以通过不同的剪接方式产生不同的成熟mRNA,进而翻译成不同的蛋白质(可变剪接)。人类约95%的基因存在可变剪接。基因不再是“一个基因一条多肽链”,而是“一个基因多条多肽链”。
重叠基因:1977年,桑格测序了噬菌体φX174的基因组,发现其基因存在重叠——同一段DNA序列以不同的阅读框编码不同的蛋白质。重叠基因在病毒中常见,是真核生物基因组中极少。
移动基因:1940-1950年代,麦克林托克在玉米中发现,某些遗传因子可以在染色体上移动位置,她称之为“跳跃基因”(转座子)。她的发现被长期忽视,直到1980年代在细菌和果蝇中被证实。移动基因揭示了基因组的动态性。
23.7 基因组时代:基因的计数、注释与功能
21世纪,基因组测序技术使“基因”的概念面临新的挑战。
基因计数:人类基因组计划(1990-2003)最初预测人类有约10万个基因,但实际只有约2万个,与线虫、果蝇相近。这被称为“基因数悖论”——生物复杂性与基因数量无关。
非编码基因:人类基因组中只有约2%的序列编码蛋白质,其余大部分转录为非编码RNA(miRNA、lncRNA、circRNA等)。这些非编码RNA具有调控功能。那么,“非编码RNA基因”算不算“基因”?当代定义已扩展为“产生功能性RNA或蛋白质产物的DNA片段”。
假基因:基因组中存在大量与功能基因相似但失去编码能力的序列(假基因)。它们是进化的“化石”。
基因的边界模糊:一个基因的转录产物可能通过可变剪接、可变启动子、可变polyA位点产生多种变体;基因之间可能存在重叠;某些lncRNA与邻近蛋白编码基因共享调控元件。“基因”的边界变得模糊。
23.8 基因概念的哲学反思
基因概念的演变史,引发了对“基因是什么”的深层追问。
基因作为“信息单位”:当代定义强调基因是“可遗传信息的单位”,而非“实体”。信息可以存储在DNA、RNA(RNA病毒)、甚至蛋白质(朊病毒)中。这一定义打破了“基因=DNA”的教条。
基因的“多重可实现性”:同一种遗传信息可以用不同的化学物质(DNA、RNA)承载,甚至可能用人工合成的非天然核酸(XNA)承载。基因不再是特定化学物质,而是特定功能角色。
基因的“分布性”:基因的调控元件可能远离编码序列(增强子可达数百万碱基之外);基因的表达受表观遗传修饰影响;基因的功能依赖于细胞内网络。基因不再是孤立的“粒子”,而是网络中的节点。
23.9 概念史的启示
从孟德尔的“因子”到基因组时代的“信息单位”,基因概念的演变跨越了150余年。这一演变给予我们几点启示:
第一,基因概念经历了从“抽象符号”到“物理实体”再到“信息单位”的转变。孟德尔的“因子”是统计推断的符号;摩尔根将其定位于染色体;沃森-克里克将其定义为DNA序列;当代将其视为“可遗传信息的功能单位”。每一次转变都是范式的断裂。
第二,基因概念的每次深化都与技术革命同步。杂交技术→孟德尔定律;细胞学技术→染色体理论;诱变与重组分析→基因精细作图;X射线衍射与测序→分子定义;重组DNA与PCR→基因克隆;高通量测序→基因组学;基因编辑→基因功能操纵。
第三,基因概念不断被“复杂化”。从连续到断裂(内含子),从一对一到一个对多(可变剪接),从静态到动态(移动基因),从编码到非编码(ncRNA),从独立到网络(调控元件)。基因越被深入了解,就越显得“不规则”。
第四,基因概念的历史是科学史上“本质主义”被“功能主义”取代的范例。早期寻求“基因的本质”(物质、结构),当代接受“基因是功能角色”(可因语境而变)。这一转变反映了科学哲学的深层变化。
今天,“基因”已深入公众意识。我们谈论“肥胖基因”“智力基因”“癌症基因”,但科学家的理解要复杂得多——绝大多数性状是多基因、环境、表观遗传共同作用的结果。
基因概念的历史提醒我们,科学概念不是一成不变的真理,而是人类理解自然的工具。它们随证据、技术和理论的变化而演变。正如遗传学家杜布赞斯基所说:“在生物学中,除了进化之光,没有什么东西是恒常的。”这句话同样适用于“基因”本身——它既是生命传承的物理基础,也是人类认知进化的见证。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-4-26 20:37
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社