思想散步分享 http://blog.sciencenet.cn/u/fqng1008 前三十年写日记,后三十年写博客

博文

《生命科学概念史 ——经验事实、抽象思维与技术实证的互动》-2 科学概念与抽象思维

已有 442 次阅读 2026-4-9 11:22 |个人分类:医学史话|系统分类:科研笔记

2.1 从观察到抽象:归纳的路径

科学知识的起点是观察,但观察本身并不自动产生知识。面对无数纷繁复杂的自然现象,科学家需要一种从个别事实中提炼一般性结论的思维工具,这就是归纳推理。归纳是从特殊到一般的跃迁,是科学概念得以从经验土壤中生长出来的主要路径。然而,归纳并非单一的机械操作,而是包含多种具体策略。以生命科学为例,我们可以区分出简单枚举归纳、穆勒五法和统计归纳三种基本形式,它们各自在不同类型的生物学问题中发挥着独特作用。

(1)简单枚举归纳

简单枚举归纳是最朴素、也是最古老的归纳形式。它的逻辑结构是:观察到某类事物中的若干个体都具有某种属性,且未发现反例,因此推断该类所有个体都具有该属性。经典的日常例子是“所有天鹅都是白的”——欧洲人在数个世纪中只见过白天鹅,便归纳出这一结论,直到在澳大利亚发现黑天鹅才将其推翻。

在生命科学中,简单枚举归纳广泛存在于早期分类学和形态学研究中。例如,18世纪的生物学家观察到若干种哺乳动物都具有毛发、胎生(单孔类除外)、哺乳等特征,于是归纳出“所有哺乳动物都有乳腺”这一结论。同样,林奈在建立植物分类系统时,通过大量观察归纳出“雄蕊数目决定植物纲的归属”这一规则。

简单枚举归纳的优势在于直接、易行,不需要复杂的实验设计。但其致命缺陷是结论的可靠性完全依赖于样本的代表性和无反例的假设。一个反例就足以推翻整个归纳——正如鸭嘴兽的发现对“哺乳动物胎生”这一归纳构成了挑战(鸭嘴兽是卵生哺乳动物)。

因此,在现代生命科学中,简单枚举归纳通常只用于初步的探索性阶段,其结论需要通过更严格的推理方式加以检验。

(2)穆勒五法

19世纪英国哲学家约翰·斯图亚特·穆勒在《逻辑体系》中系统总结了五种寻找因果关系的归纳方法,合称“穆勒五法”。这五种方法在生命科学的实验设计中具有基础性的方法论地位。

求同法的逻辑是:如果所研究的现象出现在多个不同的场合,而这些场合中只有一个共同的因素,那么该因素就是现象的原因。在传染病学中,约翰·斯诺1854年研究伦敦霍乱暴发时发现,所有病例都饮用过布罗德街水井的水,而其他条件(年龄、职业、居住地)各不相同。他由此归纳出“受污染的水是霍乱原因”的结论。求同法的关键在于选择尽可能不同的场合,以排除其他共变因素。

求异法则比较一个现象出现和不出现的两种场合,如果其他条件都相同,只有某一个因素在现象出现时存在、不出现时不存在,那么该因素就是现象的原因。这是生物学实验设计的黄金标准。例如,要检验某种候选药物是否能够降低血压,研究者将实验动物随机分为两组,除了给药与否之外,饲养环境、饲料、光照等所有条件完全相同。如果给药组血压下降而对照组不变,则药物就是原因。随机对照试验正是求异法在现代临床研究中的经典体现。

共变法适用于无法完全消除某一因素的情况。它考察:当某一因素发生变化时,所研究的现象是否也随之发生相应的变化。在生理学中,研究者可以通过改变细胞外液的钾离子浓度,观察心肌细胞静息电位的变化。如果钾离子浓度升高,静息电位绝对值减小;钾离子浓度降低,静息电位绝对值增大。这种共变关系强烈提示钾离子浓度与静息电位之间存在因果联系。共变法能够揭示剂量-效应关系,比单纯的求同或求异提供更丰富的信息。

剩余法用于从复杂现象中析出特定原因。其逻辑是:已知某些因素导致某些效应,从总效应中减去已知部分,剩余效应就归因于剩余因素。19世纪中期,法国生理学家贝尔纳在研究肝脏功能时,发现肝静脉血中含有葡萄糖而肝动脉血中没有。已知血液流经其他组织时会消耗葡萄糖,那么肝脏必然向血液中“添加”了葡萄糖。剩余法使得贝尔纳推断肝脏具有糖原合成和分解的功能,这是内分泌生理学的重要突破。

求同求异并用法是求同法和求异法的结合:先在一组出现现象的场合中找出共同因素(求同),再在一组不出现现象的场合中确认该因素不存在(求异),两组对照得出结论。在生态学研究中,要判断某种土壤真菌是否促进植物生长,研究者可以比较多个真菌存在的样地(求同)和多个真菌不存在的样地(求异),如果前者植物生长普遍优于后者,则得出因果推断。这种设计比单一求同或求异更具说服力。

穆勒五法的共同核心是排除其他可能的解释,通过控制或比较来锁定因果关系。它们构成了现代生命科学实验设计的逻辑基础——尽管在实际操作中,研究者往往结合统计方法使用。

(3)统计归纳

简单枚举归纳和穆勒五法在处理确定性关系时有效,但生命科学中大量现象并非“全或无”的必然关系,而是呈现概率性和变异性。同一个基因突变不一定在所有个体中都导致相同的表型;同一种药物对不同患者的疗效可能存在差异。此时,统计归纳成为从样本推断总体的必要工具。

统计归纳的核心是用部分(样本)来推断整体(总体),同时量化推断的不确定性。例如,要估计某地区人群的糖尿病患病率,研究者不可能检测每一个人,而是随机抽取一个代表性样本,测量该样本的患病率,然后借助统计理论推断总体的患病率及其置信区间。统计归纳的关键在于随机抽样和样本量计算:只有保证样本的随机性和足够大小,才能使得抽样误差可控。在生物医学研究中,统计归纳还用于假设检验——通过计算p值来判断观察到的效应是否不太可能由随机变异产生。例如,在比较两种治疗方案时,即使实验组的效果平均值高于对照组,统计归纳也要求评估这种差异在抽样误差背景下出现的概率。如果p值小于预设的阈值(通常0.05),研究者才归纳得出“两种治疗有真实差异”的结论。

统计归纳与简单枚举归纳的根本区别在于:前者承认并量化不确定性,后者则倾向于得出全称判断。现代生命科学已经将统计归纳作为标准方法,无论是基因组学中的差异表达基因筛选,还是流行病学中的风险因素分析,都离不开统计推断。然而,统计归纳也面临着样本偏差、多重比较、p值误用等挑战。认识到这些局限性,是科学地运用统计归纳的前提。

从简单枚举到穆勒五法再到统计归纳,归纳推理的演进反映了科学方法从朴素到精致、从定性到定量、从确定性到概率性的进步。每一种归纳路径都有其适用范围和局限性,高明的研究者能够根据具体问题选择恰当的归纳策略,并将归纳得出的概念性结论置于后续演绎和实验检验的循环之中。

2.2 定义的艺术

定义是科学概念的基石。没有清晰的定义,概念就如同失去锚点的船只,无法在理论的海洋中稳定定位。然而,定义并非只有一种形态,不同情境、不同目的需要不同类型的定义。掌握定义的艺术,意味着能够根据研究阶段和问题性质,选择或构造最恰当的定义形式。以下将结合生命科学实例,讨论属加种差定义、操作定义以及递归定义与公理化定义三种基本类型。

(1)属加种差定义

属加种差定义是西方逻辑学中最经典的定义方法,其结构是:先找出被定义概念所属的更大的类别(属),再指出该概念与同属中其他概念的区别性特征(种差)。亚里士多德在《工具论》中系统阐述的这一方法,至今仍是教科书定义的主流格式。

例如,“酶是具有催化功能的蛋白质”这一标准定义中,“蛋白质”是属,即酶所属的更大类别;“具有催化功能”是种差,即酶区别于其他蛋白质(如结构蛋白、转运蛋白、抗体等)的关键特征。类似地,“线粒体是细胞中进行有氧呼吸产生ATP的双层膜细胞器”——属是“细胞器”,种差包括“进行有氧呼吸”“产生ATP”“双层膜”等多个特征。属加种差定义的优点在于简洁、逻辑清晰,能够快速将陌生概念纳入已有的分类体系。但它也隐含假设:存在清晰的分类层级和明确的本质属性。对于边界模糊的概念(如“病毒”究竟算生物还是非生物),或者演化过程中属性不断变化的概念(如“物种”),单纯的属加种差定义往往力不从心。

在生命科学实践中,属加种差定义有时需要灵活处理。以“基因”为例,经典的属加种差定义可能是“基因是编码蛋白质的DNA片段”。然而,发现编码功能性RNA的基因、发现RNA病毒的基因由RNA构成、发现重叠基因和转座子等现象后,这一定义显得过于狭窄。现代分子生物学往往采用家族相似性的方式定义“基因”——不再执着于单一的本质属性,而是通过一组特征的组合来识别。这表明属加种差定义虽然强大,但并非万能。

(2)操作定义

操作定义由物理学家布里奇曼在20世纪初明确提出,其核心主张是:一个概念的意义等同于测量它的操作程序。操作定义不追问概念“本质是什么”,而是回答“如何测量它”。这种定义方式在生命科学中具有不可替代的地位,因为许多概念(尤其是涉及主观感受或复杂系统的概念)难以通过本质属性直接界定。

以“疼痛”为例,临床和实验中无法直接“测量”疼痛本身。研究者通常采用操作定义:让患者在0-10的数字评分量表上选择代表自身疼痛程度的数字(0为无痛,10为最剧烈的疼痛)。那么,“疼痛强度”在操作上就被定义为“患者在该量表上报告的数字”。类似地,“细胞活力”的操作定义可以是“在台盼蓝染色排除试验中,不能摄取染料的细胞所占百分比”——这里不追问“活力”的形而上学含义,只给出一个可重复的测量程序。“智力”在心理学中的操作定义通常是“韦克斯勒智力量表所测得的总分”,尽管这一操作定义长期以来受到“循环定义”(智力就是智力测验测到的东西)的批评,但它在实证研究中的实用性无可否认。

操作定义的关键优势在于可检验性和可重复性。任何遵循相同操作的研究者应当获得可比较的结果,这为科学知识的积累奠定了基础。但操作定义的局限性同样显著:它可能将概念窄化为特定的测量程序,忽略了概念的其他重要维度。例如,将“饥饿”操作定义为“禁食24小时后的状态”,就无法区分不同个体代谢差异导致的饥饿感受差异。因此,高水平研究往往采用多重操作定义——用多个不同的测量程序捕捉同一概念的不同侧面,再通过三角互证得出综合结论。

(3)递归定义与公理化定义

递归定义和公理化定义在生命科学中相对少见,但在某些特定领域具有重要应用。递归定义通过规定初始值(基础条件)和生成规则(递归步骤)来定义一个概念或序列。例如,在系统发育学中,“共同祖先”可以通过递归方式定义:两个物种的最近共同祖先是指能够产生这两个物种的最小演化分支的祖先节点;而“祖先”本身又可以递归地定义为某个节点的前驱节点。这种定义方式能够精确描述演化树中的层次关系。在种群遗传学中,“哈代-温伯格平衡”中的基因频率迭代也是一种递归逻辑:下一代等位基因频率由上一代频率按照特定规则计算得出。

公理化定义则借鉴数学逻辑的方法,通过规定一系列不证自明的公理和推导规则来定义概念体系。公理化定义在理论生物学中偶有尝试。例如,罗森(Robert Rosen)在《生命本身》中试图用范畴论和公理化方法定义“生命系统”——通过设定输入、输出、状态转换等基本公理,然后推导出生命系统的组织特征。又如,某些形式的“达尔文式种群”定义采用公理化方式:设定可遗传变异、适应性差异等公理,然后从公理推导出自然选择的必然性。公理化定义的优点是高度精确、逻辑自洽,但它需要较强的数学形式化能力,在目前的主流生命科学中应用有限,更多见于理论生物学和系统生物学的前沿探索。

综上所述,三种定义方式各有其适用场景。属加种差定义适合对成熟、分类清晰的概念进行标准界定;操作定义是实证研究的实用工具,尤其适合那些难以直接观察的概念;递归定义和公理化定义则在形式化和结构化要求较高的理论领域发挥作用。定义的艺术,不在于固守某一种方式,而在于根据研究目的、学科惯例和概念成熟度,灵活选择和组合不同的定义策略,从而使科学概念既具有逻辑严谨性,又保持与经验世界的可沟通性。

2.3 划分与分类

分类是科学思维的基本活动之一。面对自然界纷繁复杂的个体差异,人类必须通过分类将其纳入有限的范畴,才能进行有效的认知和交流。划分与分类是概念的逻辑操作——将一个属概念按照某种标准分解为若干个种概念,从而构建起概念之间的层级关系。不同的分类方法服务于不同的目的,也反映了不同的本体论承诺。理解二分法与多分法的区别、自然分类与人为分类的对立,并考察林奈分类系统与疾病分类学这两个经典案例,有助于我们深入把握科学分类的逻辑与方法。

(1)二分法与多分法

二分法是最简单的划分方式:每一次划分只依据一个标准,将一个属概念分成两个相互矛盾的种概念,通常以“有A”和“无A”的形式呈现。例如,将动物分为“脊椎动物”与“无脊椎动物”,将细胞分为“原核细胞”与“真核细胞”。二分法的优势在于逻辑上完备且互斥——任何一个个体必然属于两个子类中的一个,不存在第三种情况。在生物检索表中,二分法被广泛使用:植物志中常见的分科检索表,每一条分支都要求观察者回答“叶脉是平行还是网状”“花瓣是离生还是合生”等问题,通过一系列二分选择最终确定物种归属。

然而,二分法在面对多态性特征时往往显得生硬。许多生物学特征并非只有两种状态:花的颜色可以有红、黄、白、紫等多种;血型有A、B、AB、O四种。此时需要采用多分法,即依据同一标准将属概念划分为三个或三个以上的种概念。例如,根据消化系统的结构,哺乳动物可以分为食草动物、食肉动物和杂食动物。多分法更贴近生物多样性的实际情况,但其逻辑挑战在于如何确保子类之间互斥且穷尽——这往往需要事先建立完整的类型清单。

在实际的生物学分类中,二分法与多分法常常结合使用。高阶分类采用多分法(如界、门、纲、目、科、属、种的层级),每一层级内部则可能用二分法进行进一步的区分。两种划分方法的灵活性使得分类系统既保持逻辑严密性,又能适应生物世界的复杂多样性。

(2)自然分类与人为分类

分类史上最核心的争论之一,在于分类究竟应该反映“自然的”亲缘关系,还是服务于“人为的”实用目的。人为分类是根据一个或少数几个方便识别的特征进行归类的系统,其首要标准是操作便利而非内在联系。例如,按照药材的药用部位(根、茎、叶、花、果)对植物进行分类,或将昆虫按照翅的有无、触角形状分组,都属于人为分类。人为分类的优势在于简单、实用,尤其适合初学者或特定行业(如农学、药学)的快速识别。但其代价是割裂了生物之间的演化联系——亲缘关系极远的物种可能因外部形态相似而被归入同一人为类群,如仙人掌与大戟科的多肉植物。

自然分类则试图反映事物之间内在的、本质的、演化上的亲缘关系。在生物学中,自然分类的理想形态是谱系分类——类群的划分应当反映共同祖先和演化分支。自然分类的每一类群(演化支)都是一个单系群,即包含一个共同祖先及其所有后裔的集合。自然分类的优点是能够揭示生物世界的系统发育历史,具有强大的解释力和预测力:同一自然类群中的成员往往共享大量未用于分类的特征(如基因序列、胚胎发育模式、生理生化特性)。因此,自然分类成为现代生物学的金标准。

然而,“自然”与“人为”并非截然对立,而是一个连续谱。林奈本人在建立植物分类系统时,主要依据雄蕊和雌蕊的数目(人为特征),但他坚信自己在揭示“造物主的设计蓝图”——即某种意义上的自然秩序。当代分类学则明确区分:人为分类服务于教学、鉴定、资源管理等实用目标;自然分类服务于系统发育重建。二者可以并存,但必须澄清各自的目的和标准。

(3)经典案例:林奈分类系统

瑞典博物学家卡尔·林奈在18世纪建立的分类系统,是科学史上最具影响力的分类架构。其核心贡献有三:一是确立了双名法,即每个物种由属名和种加词两个拉丁词构成(如Homo sapiens),这一命名规则至今仍是国际通用的标准。二是建立了层级分类体系:界、纲、目、属、种,后来增加了门、科等中间等级,形成了嵌套式的分类框架。三是在《植物种志》等著作中对大量物种进行了系统的描述和归类。

林奈的分类主要依据形态特征,且以雄蕊和雌蕊的数目作为植物分类的首要标准。这一系统在操作上极为便捷,使得全欧洲的博物学家能够用统一的语言交流植物发现。然而,林奈本人并不认为自己的系统是“人为的”——他相信性系统反映了上帝创造的自然秩序。随着进化论的提出,林奈分类系统经历了根本性的重构:分类不再仅仅基于形态相似性,而是基于共同祖先。现代分类学(分支系统学)保留了林奈的层级框架和双名法,但将其内容替换为单系群原则。林奈系统的持久生命力,恰恰在于其形式框架能够容纳内容上的范式转换——这是分类方法优越性的体现。

(4)经典案例:疾病分类学

疾病分类学(nosology)是医学中对疾病进行系统分类的学科,其发展历程同样折射出分类逻辑的演变。早期的疾病分类主要依据症状,如希波克拉底将疾病分为急性、慢性、地方性、流行性等。18世纪,布尔哈夫和卡伦试图模仿林奈植物分类,将疾病按照“属-种”层级进行归类,如“发热”作为属,下属“间歇热”“持续热”等种。这种分类在临床教学中有一定价值,但其局限性明显:同一病因可导致不同症状,而不同病因也可表现相似症状。

19世纪后期,随着细菌学的发展,疾病分类转向病因学原则——依据病原体或病理机制进行分类。科赫法则的建立使得“传染病”可以按照致病微生物的种类进行自然分类。20世纪以来,疾病分类逐渐整合了病因、病理、分子机制和临床表现等多维标准。目前最权威的《国际疾病分类》(ICD)由世界卫生组织发布,它将疾病按照身体系统、病因学、病理过程和临床特征进行多轴分类。ICD不仅是医学研究的共同语言,更直接影响医疗保险、公共卫生统计和医院管理。疾病分类学的历史表明:分类标准的选择具有深远的实践后果——一个看似中立的分类系统,可以重塑整个医学实践和社会资源的分配。

综上所述,划分与分类是科学概念组织的核心操作。二分法与多分法提供了形式逻辑的工具,自然分类与人为分类反映了本体论和认识论的立场选择。从林奈分类系统到疾病分类学,成功的分类系统往往是逻辑严谨性、经验适切性和实践便利性的综合平衡。

2.4 类比与模型

(未完待续)



https://blog.sciencenet.cn/blog-279293-1529609.html

上一篇:弗里德里希·维勒:打破生命“神秘力量”的化学家
下一篇:《生命科学概念史 ——经验事实、抽象思维与技术实证的互动》-2 :科学概念与抽象思维(续)
收藏 IP: 120.231.209.*| 热度|

3 杜明斗 郑永军 王涛

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-4-10 13:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部