||
摘要:本文利用英国《泰晤士报高等教育副刊》2007年世界大学排名的原始数据,分别采用主成分分析、因子分析、TOPSIS法、秩和比法、灰色关联法、熵权法六种客观赋权法进行评价。然后采用首尾一致率比较各种评价方法结果的一致性程度,采用区分度评价各种评价方法结果的可靠性。发现排名靠前大学的首尾一致率要超过排名靠后大学的首尾一致率;排名靠前与靠后大学的区分度要超过排名中间大学的区分度;虽然标准差反映了评价结果的分散范围,但区分度与评价结果的方差无关;综合评价结果适用于宏观分级评价,对于微观严格排序的评价,最好采用同行评议与客观赋权评价相结合的方式。
关键词:科学技术 教育 评价 首尾一致率 区分度
1引言
科技教育评价是科教管理工作的重要组成部分,是推动国家科教事业持续健康发展,促进科教资源优化配置,提高科教管理水平的重要手段和保障。目前国内外综合评价方法有数十种之多,包括模糊数学方法、系统工程方法、技术经济方法等等。这些评价方法各有其特点,但大体上可分为两类,其主要区别在确定权重的方法上。一类是主观赋权,多数采取综合咨询评分确定权重,然后对无量纲的数据进行综合,如综合指数法、模糊综合评判法、层次分析法、功效系数法等;另一类是客观赋权,根据各指标间相关关系或各指标值变异程度来确定权数,如主成分分析法、因子分析法、TOPSIS法等等。存在的主要问题是,针对同一评价对象,选取相同的指标,采取同样的数据,但不同评价方法得出的评价结果不一致,这个问题已被广大学者所注意到,有必要进行进一步的深入研究。
一些学者在各种主客观赋权法比较方面进行了研究。刘占伟、邓四二、滕弘飞[1](2003)从理论上分析了常见的几种评价方法的特点及存在的问题,包括层次分析法、模糊评价法、灰色理论法、物元分析法、聚类分析法、价值工程法、神经网络法以及综合评价法。陈衍泰,陈国宏,李美娟[2](2004)将各学科领域的综合评价方法归纳、分类,讨论了各类方法的基本原理、优缺点及适用领域,指出目前综合评价存在着三大问题:多方法评价结论的非一致性问题;方法针对性不强;理论研究与实际应用的脱节问题。吴清平、张丹[3](2003)在医疗工作质量评价中对秩和比法、层次分析法、TOPSIS法、系统聚类法的评价结果进行比较,发现秩和比法与其他方法具有一定的一致性。总体上这方面的研究不多,实证研究更少,较少有定量方法对各种不同评价方法的结果进行比较。
本文拟用首尾一致率作为衡量各种评价方法评价结果一致性程度的指标。用区分度作为各种评价方法评价结果的可靠性指标。区分度本来是考试中的概念,指试卷测试题目对被测试者知识和能力水平的鉴别能力。本文区分度是指各种评价方法评价结果对评价对象实际水平的区别能力。比如对5所大学进行综合评价,一种评价方法综合得分依次是10、9、7、6、5,另一种评价方法综合得分依次是10、9、7、5、3,很显然后一种评价方法的区分度要大于前者。这里首尾一致率与区分度并不是一个对应的概念,各种评价方法首尾一致率只有1个,而区分度和评价方法的数量是相等的。
为了进行实证研究,本文选取2007年《泰晤士报高等教育副刊》世界大学排名[4]数据进行分析。《泰晤士报高等教育副刊》每年推出世界大学排名,将同行评议与指标体系结合起来进行大学排名综合评价。从2007年开始,评价所利用的论文数据库已经由Elsevier的Scopus数据库取代了美国的SCI数据库,这是因为Scopus覆盖面更广,包括了许多非英语优秀科技期刊,这对发展中国家的大学而言相对公平。《泰晤士报高等教育副刊》除了公布主观赋权评价结果外,还公布了各大学各项指标的原始数据,这就为深入分析提供了可能。
本文首先用主成分分析、因子分析、TOPSIS、秩和比法、灰色关联、熵权法6种评价方法进行评价,将每种评价方法排序,然后计算首尾一致率与区分度,比较各种评价结果,并进行深入分析。
2研究方法
2.1首尾一致率
由于各种评价方法评价结果是不一致的,因此难以得到公认,但这并不是说评价就没有意义。根据正态分布的规律,最好的与最差的评价对象总是少数,因此,最好的与最差的评价对象之间相差一般较大,区分度较好,各种不同评价方法容易取得共识,因此可以用来作为各种评价方法评价结果一致性程度的指标,其实质是首尾评价结果一致的评价对象占首尾评价对象的百分比。
针对m个评价对象,将各种评价方法的所有评价结果全部进行降序排列,形成一张排序与评价方法的二维表,参考日常生活中的二八定律,在最好的20%的评价对象中,找出共同的x个评价对象;在最差的20%的评价对象中,找出共同的y个评价对象。则首尾一致率为: