|||
“谱模型”对应着“分布函数”--提炼科学问题的重要视角(2)
张学文,2011/12/15
在谱模型(1)里我们指出了“谱”大致对应着在一个群体内就某种特征而作的一一展开,如菜谱对应着把各种菜(群体)一一列出(配上照片、价格…),人口-年龄谱里的谱把全部人口在年龄这个侧面一一列出等等。但是,我们在“谱模型”的名称下还强调了它对应着“函数关系”。也就是说,你用这个模型考虑问题,所收获的不仅是类似而不同的个体有哪些(如不同年龄的人有哪些),而且是揭露了不同(特征)的个体与其占有的数量之间的关系,即客观规律!而这意味着你的科学研究可能提高了档次!
是呀,每年高考,我们关心自己熟悉的哪些学生的成绩,但是要从高考数据里提炼一个具有科学意义的问题,不妨研究“不同高考分数的学生各有多少”,而这个问题的答案就是一个函数。例如某城市有1万学生今年参加高考,我们单看每个学生的考试成绩是枯燥无味的事,但是把1万学生的成绩归结为下面的表,就比较有意思了。
分数档次 |
x1 |
x2 |
x3 |
x4 |
… |
该档次的学生数 |
y1 |
y2 |
y3 |
y4 |
… |
这个表给出每个高考成绩档次x的学生数量y,显然,各对x,y是一一对应的关系。如果以x为横坐标,以y为纵坐标,把这些离散的点点上去,就获得一个曲线。这个曲线自然就代表了一个函数了。好像2010年我就猜这个曲线可能符合所谓GAMMA曲线(欢迎证明或者否定):y=[an/(n-1)!]xn-1exp(-ax)。这说明拿着一摞高考成绩资料,我们可以恰当地整理出了一个函数关系—高考分数y与具有该分数的学生数量x的关系。
谱模型(1)里指出“不同的某某某各有多少”是针对一个群体(集合)来说的。哪里的某某某一般是指该群体中每个个体具有的某统一规定(统一关注)的标志的值(如高考分数、年龄…),而关于“各有多少”是指具有该标志值的个体的数量(具有该高考分数的学生数量)。
以标志值x为横坐标,以群体内据有该标志值的个体的数量为纵坐标y,就可以根据x,y的一一对应关系而绘出一条曲线来。这个曲线就是对你沿着谱模型思考问题的初步回报:你获得了一个x,y的关系、一个规律,而excel或者其他的软件还可以帮助你为这个来自调查的结果配一个合适的经验公式!
是的,你可以进行科学考察,从而获得一个新数据,或者一批数据。但是你把问题梳理为谱模型,则一个科学规律几乎就要到手了!
“不同的某某某各有多少”是谱模型提问题的模式。在你具有了大量资料的基础上,以“某某某的各个值”为横坐标,以其对应的“个体数量”为纵坐标,就把大量的数据资料整理为一个曲线关系,而它就是一个函数关系,这个函数我们一般地称为分布函数,即具有不同特征值的个体是如何分布在这个群体中的。
分布函数是对“不同的某某某各有多少”式的提问的一般回答模式。
做学生时我们学过很多函数、公式,做工程师时我们准确地套用过很多函数、公式。做研究自然是以发现一个公式、关系、函数为荣。谱模型是一种思路,它不仅帮助你在大量的数据面前提炼如何看待它们的角度,而且沿着这个思路去整理数据,就可能获得一个函数、公式、关系、规律…这为科学研究出成果迈出了一步!“分布函数”是为这样获得的函数的统一名称。
好了,本段从谱模型提出问题逐步转入如何获得(在具有对应资料的前提下)该问题的答案,即分布函数。其他的话以后再说。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-4-29 00:59
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社