周华的博客分享 http://blog.sciencenet.cn/u/cfluid      交流.感悟.新知

博文

对论文的数量和质量问题的一些看法

已有 3590 次阅读 2011-2-27 15:04 |个人分类:忽发奇想|系统分类:观点评述

论文的数量和质量问题的讨论实际上是关于学术评价体系的一个讨论,而学术评价体系最终的设计目标是能够客观准确地评价一个人的学术水平,以便在职称、课题申报等过程中提供一个硬性的参考。由于这个问题实际上牵涉到每个科研工作者的切身利益,因而一直是学术圈的一个热门话题,仔细思考一下的话也可以算是一个很难的科学问题,即人的科学水平能否被量化的问题。
 
用量化指标考查一个人的学术水平的这个思路应该来源于工业上的质量管理体系,当你把科研人员看作一批基本特征相差不多的产品时,脑海中自然会涌现出这样一种量化管理的想法,事实上量化管理也是人力资源管理中的一种常见方法,工业上用量化指标做质量控制,人力资源中通过一系列的资格考试来判定从业资格,科学家也是人,因此似乎也是很科学的一种方法,特别是其中还使用了统计分析这么科学的工具,当然就显得更加“科学”。
 
然而,就如针对物理现象建立的模型一样,学术评价体系中使用的模型也必须能抓住现象的基本特征和主要机理,否则这个模型就是无效的,甚至可以说是错误的。目前的评价体系总体来看就是一个靠计算论文数量来评价一个人的学术水平的模型,这个评价体系的基本思想是:一个高水平的科学家必然是一个高产的科学家,因而论文数量的多寡就能够反映一个人的学术水平高低,学术点说就是这个模型假设“论文数量”与“学术水平”是正相关的,一旦这个假设不成立,则这个模型就失效了。
 
我在回复曾庆平教授的博文时曾经引用过《科学时报》上的一个统计分析,这个统计分析的数据表明,以数学、物理、化学三个领域每年发表的论文来做统计分析,则三个学科论文的数量在总数量中所占的比例是1:2:7,即数学专业每发表1篇文章,物理专业可以发表2篇文章,化学专业可以发表7篇文章,因此我们可以说,上述那个“数量”与“水平”之间存在正相关关系的假设在做这种跨专业的考查时是错误的。在那个假设下,我们可以得出这样的结论,即化学专业的学术水平普遍高于物理专业的,而物理专业的则普遍高于数学专业的,这显然与我们的常识是相抵触的。
 
从科学史上看,学术水平高同时发表论著数量巨大的科学家应该首数欧拉,欧拉甚至在失明后还凭借心算发表了200多篇文章,应该算是这方面的典型。但是在多数情况下,一个科学家的主要贡献往往仅由1~3篇文章或著作代表,这其中包括牛顿的三卷本《原理》、爱因斯坦建立狭义相对论的《论动体的电动力学》、阿基米德的《论浮力》等等,比较极端的例子是物理专业的Ising教授,他毕生只在博士生阶段发表过一篇建立Ising模型的文章。从这个数据上看,是否可以说,评价一个人的学术水平不必看他的文章数量,而只要看他的论文质量就可以了。所谓论文的“质量”,我觉得应该是指这篇论文对科学发展到底有多大贡献。一个人的“学术水平”应该指的是他的学识水平和科研能力。论文的“质量”对应的是“水平”,论文的数量对应的则应该是“工作量”。因此,“水平”是一个内涵量,“论文数量”则是一个外延量,用后者去评价判断前者就类似于用大米的数量去评价大米的口味,我们不能说10斤装的大米肯定比5斤装的大米好吃,也不能说发表10篇文章的学术水平一定比发表了5篇文章的高。
 
我也曾经问过一些担任领导工作的教授,问他们为什么明知这样做不合理,还一定要用论文数量做评价标准。他们的答案就是,在涉及利益的情况下,必须有一个硬指标才能体现公平,否则大家的意见会更大。所以,关键就是在操作过程中需要一个做对比的硬指标,即使明知这个硬指标不合理也要无奈地使用下去。而使用论文(含专著)数量做硬指标的副作用就是导致学界普遍的浮躁,垃圾论文满天飞,一篇文章分拆成几篇,甚至出现抄袭别人的论文来滥竽充数。
 
除了这个原因外,各高校把论文数量作为评价下级教师学术能力的做法可能还有在排行榜上争取好名次这样的原因——下级教师论文发表量少的话,学校的排名就会受影响,并进而影响招生等等一系列的东西。那么要在排行榜上有一个好的表现,就必须让下级教师多发文章,而能够驱使教师多发文章的办法就是把这个指标与教师的利益挂钩。如此,学校在排行榜上就会有好的表现,成为世界一流大学的步伐就能迈的快一点。这倒是体现了学校也不是世外桃源这样现实的一面。
 
简单用论文数量评价学术水平既然行不通,那么用引用数量是否就可以呢?引用数量反映了文章的影响力,还是拿Ising的文章做例子:虽然Ising只发表了一篇文章,但据说这篇文章现在每年有600多次的引用量,显然比600篇一次引用都没有的文章要强的多。但是仔细想了想,觉得还是会出现新的问题。有些领域比较热门,在这样的领域发表论文,相对应的引用次数就会比较多,而在一些冷僻的方向上做的工作,引用的次数就会比较少,显然用这样的指标做硬指标就会导致大家都集中在热门方向上,从而导致整个科研的畸形发展。另外有些老师曾经给我举出这样的例子,即某篇文章的引用次数多是因为这篇文章观点错误,引用这篇文章的文章大多是在批评其错误观点。因此,比较合理的办法是不是还是用引用次数做评价,但需要使用“正的引用次数”,即正面引用这篇文章的次数,同时按统计规律用各专业文章的平均正引用次数作为特征数量(甚至可以考虑在一些大学科下的小学科中进一步给出更小的特征数量),比如化学是7,物理是2,数学是1,然后用“正的引用次数”除以这个特征数,得到一个无量纲参数,再用这个参数做硬指标。如果把这个参数叫作“学术指数”的话,则:
 
学术指数=代表作的引用次数/本专业特征引用次数
 
如此便可以得到一个相对合理的硬指标。科研管理部门每年发布各专业的特征数,而任何一个人的学术指数都可以方便的通过计算得到。以上意见纯属抛砖引玉,仅供对这个问题有兴趣的朋友做个参考。
 


http://blog.sciencenet.cn/blog-387689-417030.html

上一篇:中文的专业图书太少了
下一篇:在大地震、海啸之后应该关注日本的核泄漏

4 季斌 卢东强 张宇宁 沈海军

发表评论 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-3-4 11:40

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部