||
评价指标的个数多少为好?
武夷山
我们看到,很多人喜欢设计一个非常复杂、庞大的指标体系来做评价,他们觉得,由于评价的对象很复杂,只有较多的指标才能完整地评价一个对象。但是,指标越多,指标之间相互独立的可能性就越小,数据可获性就越差,评价成本就越高。因此,需要做一个权衡。
Nature杂志2004年427卷总6972期发表了美国著名物理学家弗里曼. 戴森回忆其与天才物理学家费米会见的一篇短文章(A meeting with Enrico Fermi)。戴森写道:
费米说,做理论物理计算有两种方式,第一种,是我喜欢的方式,就是对所计算的过程有一个清晰的物理图像,另一种是具有精确、自洽的数学形式 (formalism)。
他问我,在某一计算中用了几个任意参数。我回答说:四个。费米评论道:我记得冯.诺伊曼说过, 用4个参数,我就能拟合一头大象,用5个参数,我能让大象晃动鼻子。(该期杂志的第297页)
冯.诺伊曼的意思可能是:如果不抓住关键的物理参数,即使你能用很多参数来拟合一个物体或物理过程,其实也是没有多大价值的。
理论物理计算与社会领域的评价当然不是一回事,但是,其中某些思想应该是相通的:
1. 要抓住关键的参数vs. 要抓住合适的评价指标。指标若不合适,越多越糟糕。我为某刊审稿时,看到一篇来稿是使用各省的专利申请数作为各省创新能力的替代指标,当即就把此稿毙了。用专利颁发数作为创新能力的替代指标,尽管也会有争议,但还是基本可行的。用专利申请数怎么可以呢?难道我们可以用论文投稿数,而不是发表数,来作为科研产出水平的替代指标吗?
2. 不要随意使用太多的物理参数 vs. 不要堆砌太多的评价指标。最合适的评价指标个数,应当随评价的复杂性而异,我直觉地以为:7个(正负2)指标可能在多数情况下比较合适,因为,人类社会总是很喜欢、很习惯7这个魔数(magic number)。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 11:46
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社