王继华的博客分享 http://blog.sciencenet.cn/u/hdmutong 主要研究家畜育种学原理与方法,和动物饲料配方设计技术。

博文

《动物科学中的线性模型》课程绪论

已有 6664 次阅读 2009-7-31 23:25 |个人分类:学海泛舟|系统分类:教学心得

    科学网的网友赵宏杰老师提出要我谈谈关于数学模型的观点和看法,想起了这个懒省事的法子:把我的讲稿粘贴到这里,算是交卷了吧?这里略去了思考题

 

 

目录

1.. 2

§1数学与生命科学.. 2

§1.1生命存在的方式—质和量.. 2

§1.2动物科学发展趋势.. 3

§1.3模型及其分类.. 4

§2数学模型.. 6

§2.1数学模型化方法.. 6

§2.2数学模型的种类.. 6

§2.3线性数学模型.. 10

§2.4数学模型的应用.. 10

§2.5数学模型化方法是现代研究方法的核心.. 11

§3本书主要内容与学习方法.. 12

§3.1本书主要内容.. 12

§3.2线性模型学习方法.. 13

1

一门科学,只有成功地运用数学时,才算达到了完善的地步—马克思。

动物科技人员的数学造诣深浅,决定了你在学术上能走多远—王继华。

在数量遗传学和数量生态学带动下,1970年代开始兴起用数学模型方法研究动物现象。用数学模型描述动物学现象和规律,通过数学或逻辑推理得到一些结论,然后再把这些结论用来解释、预测动物学现象和发现新的规律。在动物科学的各领域都在兴起使用数学模型的研究方法,标志着动物科学正在走向成熟和完善。

如今,动物科学家的角色已由真理发现者转换为模型建立者(model builder)。构造假设、建立模型、发展理论是科学家的首要任务。科学研究的过程由归纳—推理过程转变为假设—求证过程。科学理论的判断标准也不再是看它能否被证明绝对正确无误,而是看它能否被重复检验。

§1数学与生命科学§1.1生命存在的方式—质和量

人类对自然和生命的关注,通常体现在两方面:构成世间万物的本质是什么以及如何去认识和探寻这种本质。任何事物都有质和量两方面,对一个复杂事物,其量的表现常可用一个系统来描述,而这个系统的运动规律常是在各种素影响下发生的。把这些影响系统变化规律的因素表示为不同因子或变量(常量可看作是只取一个数值的变量),用数学模型来描述各变量间及各变量与整个系统间的相互关系,由此研究系统的运动变化规律,是科学研究和技术开发的核心技术。

家畜系统的存在和运动变化规律,也表现为质和量两方面。影响一个家畜系统的各种因子或变量间的关系,以及这些因子或变量与家畜系统之间的关系,同样可以而且应该用数学模型描述。只有把家畜系统中各变量间以及各变量与系统间的复杂关系用数学模型表述,这门科学才算发展到了高级阶段。

研究者用数学模型表示动物表现的科学规律,向世界传达他们的科学发现,已形成数学生理学、定量生物化学、尤其是生物信息学、计算生物学等学科;动物营养模型已成动物营养与饲料界研究热点之一;动物生产模型则已用于指导和优化现代化生产。这都昭示,整个动物科学开始向更高阶段迈进。

§1.2动物科学发展趋势

过去的动物科学研究,没有数学也取得了辉煌成绩。现在和今后的研究是否可以不用数学?

科学发展史表明,任何一门科学的初级阶段,总是以定性描述开始,把观测到的现象和事实定性描述出来,从各个侧面去观察。当人类对这门科学的研究深入到一定阶段,积累了大量研究结果,对本门科学有了一定程度了解之后,便开始总结人类对研究对象的认识,形成知识。在复杂的生物系统中,除人类本身外,家畜是人类接触最早、认识最深刻的一个子系统,每一种家畜都构成一个更详细的子系统。对于每种家畜构成的子系统,人类都进行了千万年的观察和研究,积累了大量感性认识,甚至已总结出不同侧面的知识,形成了动物科学的不同分支,例如生理学、生物化学、营养学、遗传学、繁殖学等。

模型化方法就是把研究对象(原型)的一些次要的细节、非本质的联系舍去,从而以简化和理想化的形式去再现原型的各种复杂结构、功能和联系的一种科学方法。作为一种现代科学认识手段和思维方法,模型具有两方面的含义,即抽象化和具体化。

数学模型技术正成为现代动物科学研究的关键方法。近年来数学模型技术与动物科学相互促进迅速升温。从世界级权威杂志J.Anim.Sci.发表的文章看,在1970年以前,没有发现“模型化”的论文,70年代是3.2%,80年代是17%, 90年代是31.5%,2000年后发表的论文有50%涉及数学模型(Ermias Kebreab 2010.Advangced in modelling ruminant nutrient utilizations. PPT)。大量业界人士预测,这会是一个增长最快的领域(R.Gous et al.2006)。再者,“模型化”的内涵也正在变为机理建模,而不再停留在经验建模水平上。动物系统的机理模型化已为理解动物科学原理和生产过程做出了很多贡献(J.France and E.Kebreab 2008)。进入21世纪,数学模型化方法正大步进入动物科学的所有学科。

§1.3模型及其分类

在人类认识发展的过程中,人们根据研究对象的本质,把对象抽象模拟为具体实体,这个模拟实体就是模型(Model)。例如地图和公路交通图,就是对地球表面的模拟,所以地图是模型的一种。又如圆的面积与其半经的关系,可表示为,这一关系式是对圆的面积与半经关系的本质的数学表达。模型是对自然现象有关性质的实物模拟和数学表达,是对自然的客观反映。

模型(Model)是原型的一种代表,是为一定目的而对原型进行的一个抽象、概括、提炼出来的原型替代物。它集中反映了原型中人们需要的那一部分特征,表明和指明那个现实象什么。并且,用数学,统计学,逻辑学和生物学知识分析研究主题与各现实因素间的关系。因此,模型即是现实的抽象或模仿,又在理论指导下对现实进行简化,是保持与现实类同关系的手段。

模型是按特定研究目的,在一定假设前提下,用物质的或思维的形式再现原型的某种本质特征,例如关于原型的某种结构(整体或部分)、功能、属性、关系、过程等。通过研究模型,来探讨原型的某种性质或规律。这种研究方法借助模型来获取对原型的认识,这就是模型化研究方法。

模型的形式有多种多样,概括起来有三类:第一是形象模型(Iconic model)或实物模型,有天然与人工两种。天然模型即以天然存在物为模型,人工模型即人工制作的模型。对那些不能进行直接观察和操作的微观世界、宇观世界、人体等研究对象,越来越多地制作人工模型进行模拟研究。例如我国载人航天就是先用模拟人上天的。第二是类比模型(Analog model)和模拟模型(Simulation model),用一组性质的东西去代替另一组性质的东西,只要两组性质间的关系相同。例如生物化学上的DNA 双螺旋模型;生理学上猪消化系统结构图等。第三类是用数学语言模拟研究对象的数学模型(Mathmatical model)或符号模型(Symbolic model),这类模型通过数字、字母或其他符号来表示变量间的关系,实际上就是指用来描述某种现象的特征或本质关系的数学关系式。它是最一般、最抽象的模型,通常用数学表达式,例如用方程或一组数学程序描述现实对象的结构。把现实对象抽象、简化为某种数学结构是数学模型的基本特征,它或能解释特定现象的现实状态,或能预测研究对象的发展,或能提供处理对象的最优决策或控制。

在数理统计模型中,数学模型是指描述观测值与影响观测值变异性的各因素间关系的数学方程。所有统计分析都是基于一定数学模型进行的,所以关键问题是数学模型要客观准确地描述有关变量间的关系。例如数量遗传学上最基本的考虑是把表型值(P)剖分为基因型值(G)和环境效应(E),建立遗传模型P=G+E。这个模型既反映了一定遗传现实,又有一定数学形式,换言之,它用数学形式反映了遗传传递过程的特殊规律。再如动物生产上,深入研究动物生产性能对日粮有效养分浓度的反应,就可根据特定市场系统中的有关投入和产出,制定出最佳营养方案。

§2数学模型§2.1数学模型化方法

数学模型就是用数学语言和方法对实际问题的抽象和描述。具体地说,就是对于一个现实对象,为了一个特定研究目的,经过科学分析而抽象出它的本质属性和特征及其内在规律,作出必要的简化假设,用适当数学工具,得到的一个数学结构—一种思维模型,常表现为抽象的、数学的、理论的形态。用这种科学模型来进行推理、演算和分析,从而获得关于原型的知识。

每一个从客观世界中抽象出来的数学概念、数学分支,都是客观世界中某种具体事物的数学模型。例如自然数1就是具体的一只羊、一头牛等的数学模型。数学模型对特定对象或特定现象的运动状态、运动规律的量的关系进行描述、预测,为控制其运动提供最佳决策。

建立数学模型是利用数学工具解决实际问题的重要手段。数学模型不仅能帮助我们从已有的动物科学实验和数据中抽象出模型和进行解释,它还可用于设计和建造动物科学模型,也许这些模型在自然状态下是不存在的。在这种意义上说,基于数学模型和假设进行的动物科学实验将更接近我们所熟知的物理学和化学实验,更多的依赖于抽象和理性,动物科学将上升到更高层面,不再是一门经验科学。

当用数学方法研究动物科学领域中的定量关系时,数学模型化就成为首要的、关键的步骤和这些学科发展与应用的基础。在这些领域里建立不同类型、不同方法、不同深浅程度模型的余地相当大,为数学模型提供了广阔天地。

§2.2数学模型的种类

数学模型可按不同方式分类,下面是常用的几种。

(1)按应用领域(或所属学科)分。如遗传模型、营养模型、生态模型、数学生理学模型、人口模型、环境模型等。范畴更大些则形成许多边缘学科如生物数学、医学数学、数量经济学、数学社会学等。

(2)按建立模型的数学方法(或所属数学分支)分。如初等数学模型、几何模型、微分方程模型、图论模型、马氏链模型、规划论模型等。

按第一种方法分类的数学模型教科书中,侧重某一专门领域中用不同方法建立数学模型,而按第二种方法分类的书里,是用属于不同领域的现成数学模型来解释某种数学技巧的应用。

(3)按建模目的分。有描述模型、分析模型、预报模型、优化模型、决策模型、控制模型等。

(4)按照对模型结构的了解程度分。有所谓白箱模型、灰箱模型、黑箱模型。这是把研究对象比喻成一只箱子里的机关,要通过模型化来揭示它的奥妙。

白箱主要包括一些机理清楚的学科描述的现象以及相应技术问题,这方面的模型多已基本确定,还需深入研究的主要是优化设计和控制等问题。灰箱主要指机理尚不十分清楚的现象,在建立和改善模型方面都还不同程度地有许多工作要做。黑箱主要指一些机理(数量关系方面)很不清楚的现象。有些问题虽然主要基于生理、生化原理,但由于影响因素众多、关系复杂和观测困难等原因也常作为灰箱或黑箱模型处理。当然,白、灰、黑之间并没有明显的界限,而且随着科学技术的发展,箱子的“颜色”必然是逐渐由暗变亮的。

(5)按照模型的表现特性又有确定性模型和随机性模型(是否考虑随机因素的影响),静态模型和动态模型(是否考虑时间因素引起的变化),离散模型和连续模型(指模型中的变量取为离散还是连续的)等。

虽然从本质上讲大多数实际问题是随机、动态、非线性的,但由于确定性、静态、线性模型容易处理,并且常可作为初步近似来解决问题,所以模型化时常先考虑确定性、静态、线性模型。而且实际上,很多非线性问题在小范围内可用线性模型来逼近。连续模型便于利用微积分方法求解,作理论分析,而离散模型便于在计算机上作数值计算,所以用哪种模型要具体问题具体分析。在具体模型化过程中将连续模型离散化,或将离散变量视作连续,也是常用方法。

(6)按变量间的关系可分为线性模型和非线性模型。按变量的形式可分为实变量模型和虚变量模型。实变量模型是指模型中的变量为连续变量,可取任意实数值,虚变量模型是指模型中的变量为离散型变量,有些变量只取值0或1。虚变量模型中,按模型中变量的性质,又可把模型分为固定模型、随机模型和混合模型。根据研究对象的观测值来源(资料获取方式)可把模型分为单向分类模型、双向分类模型、多向分类模型和系统分类模型。

(7)按模型对实际问题的配合程度看有三种类型:真模型、理想模型和可操作模型。

真模型(Real Model)只有对研究对象十分了解的白箱系统才可写出真模型。这类模型可精确描述数据,不留下不可解释的变异。真模型多数不能精确知道,也不一定是线性模型。

理想模型(Ideal Model) 对研究对象作出科学抽象,是一种简化或理想化。这类模型尽可能接近真模型。理论上说,应该用理想模型进行数据分析,但实践中,常由于种种原因而不能使用理想模型。

可操作模型(Apply model)是一类简化版的理想模型,能用于数据分析。要写出一个良好的可操作模型,需要掌握最贴近真模型的理想模型。可操作模型也不能做太多简化,不能简化到没有分析价值。所以应该知道自理想模型转化到可操作模型的过程所做的假定,这样才能判断可操作模型的质量。

科学研究离不开科学抽象,简化了的理想模型作为科学抽象的结果,在各门科学中比比皆是。例如数学中的点、线、面;物理学和化学中的质点、点电荷、绝对黑体、理想流体、理想溶液;生物学中的模式细胞等。由于这些理想模型反映了原型的本质属性,因而它们常常构成各门科学的基本概念。

数学模型化的优点是能够创建科学理论,可进行科学推断、解释和预测、得到观测范围以外的结果。缺点是,如果模型过于简化,为了在概念上可以控制,把原型简化成概念的骨架,那么,由此得到的结论在回用于原型时,符合程度就很差。原型越复杂,过分简化的缺点就越大。

(8)按数学模型的性质可分为微分方程模型、概率统计模型、逻辑模型等;按求解方法可分为最优化模型、数字模拟模型、启发式模型等;按研究对象可分为分派模型、网络模型、存储模型、排队模型、投入产出模型、预测模型、对策模型等。

(9)在应用领域,一般从三个方面对线性模型进行分类:一是按因子数目,分为单因子、二因子、三因子和多因子模型等,二是按因子性质分为固定模型、随机模型、混合模型等,三是按模型功能分为回归模型、方差分析模型、协方差分析模型、方差分量模型、混合模型等。上述分类方法只是考虑到模型的某一方面的特征,实践中的模型常要考虑各种特征。

一般从应用角度把数学模型的种类分为:

固定模型

单向分类模型

虚变量模型  双向分类模型

多向分类模型

系统分类模型

§2.3线性数学模型

线性统计模型简称线性模型(Linear model),一般认为是C.R.Rao(1973)提出的一种统计模型,它概括或统一了许多常规线性统计问题,例如平均数估计,线性回归,方差分析,协方差分析,和数量化方法I, 所以是生物学研究和应用领域最重要、最基本的一种数学模型。多数参数方法都可归为线性模型,其中线性的意思为“可加的”,基本思想是,观测指标的变异可解释为许多影响因子的效应之和。例如基本的遗传模型P=G+E,表明表型值是由基因型值和环境效应相加而来。

由线性模型发展来的各种方法和技术,可在一定范围内推广到非线性模型。实际问题多可用线性模型描述,或作为初级近似描述。模型参数的估计方法有多种,例如用实验数据直接估计,矩法,回归估计等。这些方法多可用线性模型理论解决。大学本科生物统计教材上介绍的经典问题,多可用线性模型表述。

统计模型化有两个基本思想。模型化一般基于某些假设,所以建立模型前验证这些假设非常重要。建好模型后,还要从两方面对模型好坏进行评价。第一是评价模型的拟合度。由模型拟合的数据是否接近观测到的样本数据?拟合数据与样本数据间的差是否呈随机分布?第二是评价把模型用于预测更广范围的数据时的可靠性。例如元明粉(无水硫酸钠)对生长猪的生理作用,当日粮中元明粉添加量在0~0.3%范围内时,具有健胃、促生长作用;在0.4~0.6%范围内时,具有健胃、促生长和软化粪便的作用;而用量在0.6%以上时,具有倾泻作用。此例准确解释了质变与量变的相互关系,是模型化研究中应该注意的重要问题。

§2.4数学模型的应用

(1)整合与创造。数学模型,尤其是机理分析模型,为整合知识和提出假设提供了有用方法。以数学模型形式表达的科学假设是现代研究方法的核心。数学模型化研究方法可提高动物试验的作用和效率,促进更深入地理解和控制动物的营养和遗传过程。随着科技进步,数据量巨增,不仅增加了处理数据的难度,也降低了研究者对每个数据的关注程度。通过数学模型化来掌控数据,可增加科学发现的机会。

(2)分析与设计。例如描述药物浓度在动物体内的变化规律以分析药物的疗效;建立描述动物营养需要的数学模型,用数值模拟设计新的营养模型等。

(3)预报与决策。动物生产过程中产品质量指标的预报、动物生长状态的预报等,都要有预报模型。使饲料厂经济效益最大的价格策略、使费用最少的饲料配方,是决策模型的例子。

(4)控制与优化。动物生产过程的最优控制、育种方案设计中的参数优化,要以数学模型为前提。建立大系统控制与优化的数学模型,是迫切需要和十分棘手的课题。

(5)规划与管理。动物生产计划、资源配置、物资管理等,都可用运筹学模型解决。

§2.5数学模型化方法是现代研究方法的核心

在科学研究中,模型是研究者与研究对象之间的一种特殊中介。一方面,模型是研究者创建、用来研究原型的工具或手段;另一方面,模型又是原型的代表,是研究的直接对象。所以,科学模型具有工具性与对象性双重性质。

模型作为研究对象,是为了能对模型的研究结果有效地外推到原型,因此,必须要求模型与原型具有相似性,而且是本质上相似。同时,模型作为研究手段,是为便于运用已有知识和方法,伸展研究者的各种才能,因此要求模型与原型相比,具有明显的简单性。要使相似性与简单性统一,并不容易,模型需要不断检验和改进,需要研究者善于综合、灵巧运用多种方法。

由于数学本身的普遍性、逻辑性、可操作性,使现代科学研究常借助数学模型技术来认识和处理研究对象,结果是,现代高新技术常以高度数学化、模型化为最典型的特征,所以说,数学模型化方法是现代高新技术研究的核心方法和技术,高新技术的出现已经把现代社会推进到数学模型化方法的时代。

研究方法是推动现代科学发展的基础。笔者在大学执教30多年,目睹了动物科学发展的近况,笔者发现,每一种研究方法的进步都会催生出大量的研究成果,因为一个新的研究方法会给研究人员提供一个新的思考模式,新的思维方法,新的研究角度。与其说这是学术进步的现实,不如说是科技人员发现新成果的契机。工欲善其事,必先利其器。不断学习、不断接受新的研究方法,是做学问的研究人员的必备素质。

§3本书主要内容与学习方法§3.1本书主要内容

数学模型除了锻炼敏锐的理解力、发现真理以外,还可以训练全面考虑科学系统的头脑。数学模型化的思考方式为组织和构造知识提供了方法,以至于当用于技术时就能使科学家和工程师生产出系统的、能复制的,并且可以传播的知识。由于计算机发展,近三十年来数学模型研究蓬勃发展,已成为数学科学向一切领域渗透的主要媒介。数学模型化已成为一种关键的、普遍的、能够实行的技术。所以,如何将实际问题转化为数学模型,如何用数学模型处理实际问题?数学模型化技术已经成为当代科技人员必备的基本素质和能力。

本书主要培养读者线性模型基本知识,包括模型建立、统计处理与分析、模型应用等,为后续学习和研究奠定基础。

一元线性模型是所有线性模型的基础。本书重点介绍线性模型的基本理论和方法,利用一些经典问题,例如回归分析模型、方差-协方差分析模型等,通过一元线性模型的理论来解决,以加深对线性模型的理解和认识。在这一部分,我们还把一元线性模型推广到多元线性模型的基本思路和方法做一简介,尤其是系统介绍了通径分析模型分析方法。

本书重点是线性混合模型。常见的动物科学模型都是混合模型,只有考虑混合效应才能得到固定效应的准确认识。预测随机效应的取值、估计随机效应的方差,也是线性混合模型要解决的重要问题。分析常见线性模型的相互关系,介绍其数学处理方法,尤其是多性状、多种血统关系时的通用计算方法,是本书核心内容之一;本书系统介绍方差分量知识,包括估计方差分量的Henderson法、最小范数二次无偏估计法,尤其是最大似然法和约束最大似然法,后者本身也是处理混合模型的基本方法,所以是本书的又一核心内容

本书是作者根据自己的讲稿修改而来,由于课程是为动物科学专业开设的,所以列举实例多是动物科学方面的问题,例如动物饲料、动物营养、动物生理生化和动物疾病防治等。

本书的基础是线性代数和数理统计。但有些知识在目前的线性代数和数理统计学教科书上没有论及或介绍不够,我们将在有关章节适当介绍。

§3.2线性模型学习方法

线性模型分析方法,从建立数学模型到模型参数的估计,模型性能分析和模型应用,也就是用数学模型化方法思考问题、提出问题、分析问题和解决问题,这是深入学习和研究的基本素质和基本技术。学习线性模型分析方法要注意以下几点:

(1)模型假设。这是把实际问题转化为数学问题的关键。实际问题很复杂,要抓住其重要、本质的特征。

(2)模型分析和检验。将所得模型还原为实际问题的解,看它是否符合实际,是否需要改进,如何改进。

(3)数学建摸需要严密的逻辑性。在建立模型的过程中,常要引入适当假设以简化问题,特别要注意假设的严密性,否则就会导致错误。

(4)熟练使用一种软件。公认的统计软件,如SAS,SPSS,S-Plus和Stata 等都引入了线性混合模型分析,方便了线性模型技术的应用。数学界使用最多的是美国的数值运算软件Matlab、Mathematica,和加拿大的Maple,而SPSS的最大特点是适合于非数学专业的科技人员。

(5)掌握一门计算机语言。早期的FORTRAN可在网上搜索到很多现成计算程序。C语言也可上网搜到程序库。此外还有一些专业计算包(非特定语言)。

 

 



https://blog.sciencenet.cn/blog-105515-246771.html

上一篇:电脑运行变慢的十大原因
下一篇:奥运规则与学界规则
收藏 IP: 222.222.244.*| 热度|

1 彭京伦

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-24 08:31

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部