俞立平博客——邗上居分享 http://blog.sciencenet.cn/u/yuliping 科技评价、技术创新、信息经济 镜像博客:http://www.yuliping.com

博文

基于极值法的学术期刊组合评价研究

已有 6898 次阅读 2009-9-9 19:31 |个人分类:科学计量|系统分类:人文社科| 学术期刊, 多属性评价, 极值法

基于极值法的学术期刊组合评价研究

俞立平  潘云涛  武夷山

摘要:为了解决学术期刊指标体系综合评价中不同评价方法结果不一致问题,本文利用中国科学技术信息研究所的医学院校学报数据,提出了一种新的基于极值法的组合评价方法。其原理是,首先选用各种可行的评价方法进行评价,然后将评价结果标准化,将同一期刊不同评价结果的极大值作为该期刊的最终评价结果,取得了较好的效果。研究表明,采用组合评价进行权重计算必须慎重使用;基于秩序的评价方法不能用于组合;基于极值法的组合评价方法有利于建立和谐的评价者与被评价者关系,结果容易得到公认。

关键词:学术期刊 多属性评价 极值法

1引言

期刊评价是文献计量学研究的重要组成部分,它通过对学术期刊的发展规律和增长趋势进行量化分析,揭示学科文献数量在期刊中的分布规律,为优化学术期刊的使用提供重要参考,同时可以提高学术期刊的内在质量,促进学术期刊的健康成长和发展。美国著名情报学家加菲尔德博士在20 世纪60年代对期刊文献的引文进行了大规模统计分析,得到了大量被引用文献集中在少数期刊上,而少量被引用文献散布在大量期刊中的结论,这可以被认为是国外期刊评价理论的起源。

学术期刊评价主要有两大类方法,一种是直接根据期刊评价指标进行对比,二是采用多指标综合评价方法,该方法克服了单指标评价容易带来的片面性,比较适合期刊的综合评价因此得到了较广泛的应用。学术期刊多指标综合评价是一项复杂的系统工程,牵涉到评价原则、指标选取、数据归一化、评价方法选择等诸多方面,国内外学者在该领域进行了大量广泛的研究。从评价方法的角度,Weiping YueConcepcion S. Wilson2004[1]利用结构方程的原理建立了一个期刊影响力的分析框架。苏新宁(2008[2]采用指标体系赋权进行中国人文社会科学期刊的评价。邱均平、张荣等(2004[3]提出了期刊评价指标体系的三维层次结构图,并利用灰色关联法进行评价。庞景安、张玉华等(2000[4]及李凯扬、贾玉萍(2005[5]利用层次分析法对期刊进行评价。王小唯、杨波等(2003[6]将期刊以往状态的评价结果作为各期刊基础条件的一种度量,再运用数据包络分析方法(DEA)测算出它们的二次相对评价值。李修杰、陈景武(2006[7]运用判别分析法建立的期刊评估指标体系。王玖、徐天和(2003[8]运用秩和比法进行医学学术期刊学术质量综合评价。陈汉忠(2004[9]应用主成分分析对学术期刊进行评价。凌春艳、莫琳(2004[10]提出自然科学学术期刊质量指标体系的属性数学综合评价模型并进行了评价。李继晓、蔡成瑛(2006[11]对各种核心期刊的评价方法进行了介绍和分析,认为选择核心期刊的评价方法并不是一件一劳永逸的事,只能通过不断实践、比较、分析,才能使核心期刊的评价日臻完善。此外,还有一些学者将两种或两种以上的评价方法进行有机融合,采用复合方法进行评价,如根据层次分析法确定权重,再采取加权TOPSIS法进行评价,由于复合评价方法只有一个评价结果,因此本质上仍然可以认为是一种多指标综合评价方法。

指标体系综合评价方法存在的主要问题是,针对同一评价对象,选取相同的指标,采取同样的数据,不同评价方法得出的评价结果不一致,结果难以得到公认,因此学术界提出了“组合评价”的思想,即将各种评价方法的不同结果进行组合,从而给出最终评价结果。传统的组合方法有Borda法、Copeland法等。毛定祥(2002[12]提出了一种最小二乘意义下的组合方法,即最佳权重必须与各种主客观赋权评价所得权重的偏差平方和最小,用线性规划求解。徐泽水,达庆利(2002[13]提出的组合方法最终评价结果与各种评价方法差距最小。彭猛业、楼超华等(2004)提出了加权平均组合方法,权重采取各评价结果与平均评价值的相关系数确定,最后计算组合评价结果。刘丽、张礼兵等(2004[14]利用遗传算法确定各评价方法的权重,然后计算组合评价结果。马溪骏、李敏(2006[15]提出了一种权重偏差平方和最小的组合方法。陈衍泰、陈国宏等(2005[16]提出了一种两阶段复合的组合评价方法。郭亚军、易平涛(2006[17]提出了一种基于整体差异的客观组合评价法,即存在一种评价结果(最佳组合),各评价方法投影到该评价结果后方差最大,体现了少数服从多数的思想。

将不同评价方法的评价结果加以组合,互相取长补短,是一种较好的解决方法。但是存在以下问题:

第一,目前几乎所有的组合评价方法都是一种类似的“平均”方法,那么,平均的理论依据是什么?在什么情况下进行平均?

第二,一些多属性决策的组合决策方法并不适合进行期刊评价,比如利润最大化的组合方法在期刊评价中并不适用,期刊评价的一个重要目的就是根据学术质量或影响力等因素对不同期刊加以区分,并不需要评价值最大。

第三,组合评价除了对评价结果的组合外,还有许多方法是对权重的组合,得出组合权重后再进行加权汇总,问题是许多评价方法已经用不到权重或者不是简单地根据权重加权平均,例如加权TOPSIS法就是如此,何况即使得到权重,也存在不同评价方法的选择问题,评价结果不唯一,失去了组合的意义。

第四,一些基于秩序的评价方法,并不适合进行组合评价,如秩和比法、BORDA法等,因为该类方法的评价结果是排序,并不能衡量期刊之间的真实差距。

本文以中国科学技术信息研究所的医学院校学报评价为例,分别采用主成分分析、因子分析、TOPSIS、熵权法进行评价,然后主要从测量误差和区分度的角度比较体育比赛与期刊评价的区别,在此基础上提出了一种新的基于极值的组合方法。

2研究方法

2.1几种评价方法

2.1.1主成分分析与因子分析

主成分分析是考察多个变量间相关性的一种多元统计方法,其产生的背景是,评价研究中经常牵涉到多项指标,这些指标间往往存在一定的相关,全部采用这些指标,不仅使计算过程复杂,而且可能因多重共线性而无法得出正确结论。主成分分析的目的就是通过线性变换,将原来的多个指标组合成相互独立的少数几个能充分反映总体信息的指标。它常被用来作为寻找判断某种事物或现象的综合指标,并且给综合指标所包含的信息以合适的解释,从而更加深刻的揭示事物的内在规律。

因子分析是从多个变量指标中选择出少数几个综合变量指标的一种降维的多元统计方法。该方法的基本思想是通过变量的相关系数矩阵或协方差矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系。然后根据相关性大小把变量分组,使得同组内的变量之间相关性较高,不同组的变量之间相关性较低。每组变量代表一个基本结构,这个基本结构称为公共因子。对于所研究的问题就可以试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。

建立因子分析模型的目的是找出主因子,解释每个主因子的实际意义,以便对实际问题进行分析。由因子模型矩阵得到的初始因子载荷矩阵,如果因子负荷的大小相差不大,对因子的解释可能有困难,因此,为得出较明确的分析结果,往往要对因子载荷矩阵进行正交旋转或斜交旋转。通过旋转坐标轴,使每个因子负荷在新的坐标系中能按列向01两极分化,同时也包含按行向两极分化。如果不对因子载荷矩阵进行旋转,就是主成分分析,因此,主成分分析实际上是因子分析的一种特殊情况。

2.1.2 TOPSIS

TOPSIS的全称是逼近理想解的排序法(Technique for Order Preference by Similarity to Ideal Solution),它是多目标决策分析中常用的一种方法。该方法的思路是根据各被评估对象与理想解和负理想解之间的距离来排列对象的优劣次序。所谓理想解是设想的最好对象,它的各属性值达到所有被评对象中的最优值;而负理想解则是所设想的最差对象,它的各属性值都是所有被评对象中的最差值。用欧几里德范数作为距离测度,计算各被评对象到理想解及到负理想解的距离,距理想解愈近且距负理想解愈远的对象越优。

2.1.3熵权法

熵概念源于热力学,后由Shannon引入信息论。信息熵可用于反映指标的变异程度,从而可用于综合评价。设有m个待评对象,n项评价指标,形成原始指标数据矩阵X=Xijm×n,对于某项指标Xj,指标值Xij的差距越大,该指标提供的信息量越大,其在综合评价中所起的作用越大,相应的信息熵越小,权重越大;反之,该指标的权重也越小;如果该项指标值全部相等,则该指标在综合评价中不起作用。

2.2基于极值法的组合评价原理

评价相当于体育比赛,需要对运动员的成绩进行排名,并了解各运动员之间的差距。对于体育比赛与评价之间的关系,可以从以下几个角度进行分析:

2.2.1不考虑测量误差,对评价(比赛)结果进行平均

体育比赛中,如果要从不同角度对运动员的表现进行评分,那么最好的方法是对运动员各方面的成绩进行汇总或平均,比如男子全能体操比赛,反映了运动员体操的综合水平,那么就将运动员的鞍马、自由体操、跳马、双杠、吊环、单杠的成绩进行汇总,这里汇总和平均的处理方式并没有本质的区别。这有些类似于期刊评价中的指标选取,不同学者在进行期刊评价时选取的指标不同,当然评价结果也不一样,但都是从不同侧面反映了期刊的水平,因此,在这种情况下,可以采取将不同专家评价结果汇总或平均的方式。当然,这与本文讨论的组合评价没有关系,组合评价必须在指标选取相同的情况下。

2.2.2在有测量误差的情况下,对评价(比赛)结果进行平均

在体育比赛中,还有一种情况需要进行汇总或平均,那就是在测量技术存在误差或精度不够时,有点类似用直尺测量长度,需要测量几次然后取平均值。例如体操比赛的成绩是由数名裁判给出的,非常容易出现误差,在这种情况下,采取类似平均的方法可以减少误差。在期刊评价中,如果采取主观或主客观相结合的某些评价方法,需要专家们对指标权重赋值,不同专家的结果难以一致,因此往往也采用平均的方法。当然,这也与本文重点研究的组合评价问题无关。

2.2.3在没有测量误差的情况下,取评价(比赛)的极大值

在体育比赛中,对于某些项目,比如铅球、跳高等,一般取运动员三次比赛的最好成绩作为最终成绩,当比赛人数只有8人或少于8人时,每人甚至可以试掷6次。当然,很多体育比赛只进行一次,如游泳、赛跑等,因为考虑到比赛成本和运动员的身体承受能力,如果100米游泳同一天比赛3次,取运动员最好成绩,运动员当然求之不得,国际泳联肯定不会答应。当然,5000米长跑也不能让运动员一天跑3次取最好成绩。

在期刊评价中,不同评价方法不存在测量误差,问题出在测量技术不成熟上,我们无法分清那种评价方法最优,那种评价方法最差。在这种情况下,如果采取将不同方法评价结果进行平均的做法,从理论上是站不住脚的,而且会受到来自期刊的批评。换个角度,将各种评价方法中某种期刊的最优值作为该期刊的最终评价结果,这种处理方法即使不是最佳的,也会得到绝大多数期刊的认同。现在有计算机作为辅助计算工具,不同评价方法实现成本很低,在这样的情况下,可以选取同一期刊在不同评价方法中的最高成绩作为最终成绩,容易实现,而且可以减少评价者与被评价者之间的冲突。

2.2.4在没有测量误差的情况下,对评价(比赛)结果进行平均

在没有测量误差的情况下,体育比赛有时也采取汇总(平均)的方法,比如射箭,根本原因是由于如果取每个运动员12支箭的最佳成绩的话,那么每个运动员可能都是10环,区分度太差,失去了体育比赛的意义。

在学术期刊评价中,不同评价方法本身的区分度一般都很好,因此没有必要采取汇总或平均的做法。

2.2.5极值法组合评价步骤

采取极值法进行不同评价方法的组合是一种较好的处理方式,为了使不同评价方法结果可比,必须将其标准化,假设有m个评价对象,采用n种评价方法,期刊的评价结果为Vi,j,标准化方法为:

                      1

从而每种评价方法中期刊最高得分为100,最低得分为0,这样具有可比性,然后再取某期刊n种评价结果的最大值作为最终评价结果,即

3数据

本文数据来自于中国科学技术信息研究所CSTPC数据库,以医学院校学报为例进行分析,共60种。中国科学技术信息研究所从1987年开始对中国科技人员在国内外发表论文数量和被引情况进行统计分析,并利用统计数据建立了中国科技论文与引文数据库,同时出版《中国学术期刊引证报告》。评价指标有总被引频次、他引率、扩散因子、学科影响指标、学科扩散因子、被引半衰期、影响因子、即年指标、基金论文比、平均作者数、平均引文数、引用半衰期、地区分布数、海外论文比共14个,表1为数据的描述统计量。

1 变量描述统计量

变量名

内容

 均值

 最大值

 最小值

 标准差

X1

总被引频次

500.433

2257.000

114.000

389.021

X2

他引率

0.886

0.990

0.430

0.106

X3

扩散因子

48.578

75.440

19.370

14.009

X4

学科影响指标

0.532

1.000

0.110

0.246

X5

学科扩散因子

4.782

11.980

1.950

2.291

X6

被引半衰期

4.701

6.560

2.630

0.785

X7

影响因子

0.266

0.640

0.076

0.142

X8

即年指标

0.037

0.163

0.004

0.031

X9

基金论文比

0.381

0.970

0.060

0.184

X10

平均作者数

4.094

5.740

2.040

0.777

X11

平均引文数

8.693

15.880

4.360

2.334

X12

引用半衰期

5.826

7.830

4.530

0.835

X13

地区分布数

12.767

31.000

2.000

5.809

X14

海外论文比

0.016

0.080

0.000

0.017

n

期刊数量

60

数据来源:中国科学技术信息研究所CSTPC

数据库2006年数据

由于要对期刊进行评价,所以必需对数据进行标准化处理,每项指标最大值设为100,然后按比例进行调整。此外,被引半衰期和引用半衰期是两个反向指标,必须进行适当处理,方法是用100减去其标准化后的结果后再做标准化,这种处理方式是线性处理方式,比反向指标取倒数的非线性处理方式要科学一些。另外海外论文比指标60种期刊中有14种为0,考虑到区分度很差,因此具体评价时删掉该指标。

4评价结果

 首先采用主成分分析、因子分析、TOPSIS、熵权法进行评价。在进行主成分分析与因子分析时,必须首先进行KMO检验与Bartlett检验。 KMO是对样本充分度进行检验的指标,一般要大于0.5。本文采用SPSS进行数据处理,KMO值为0.736,也就是说,比较适合进行主成分和因子分析;Bartlett值为627.119P<0.000,也就是说,相关矩阵不是一个单位矩阵,可以进行主成分和因子分析。换句话说,期刊采用主成分和因子分析的条件全部具备。前4个主成分(因子)的累计贡献率为82.17%,因此采用前4个主成分(因子)进行评价。

根据公式(1)将4种评价结果再做标准化,然后取4种评价结果标准化后的最大值作为各期刊的最终评价结果,如表2所示。

2 各种评价方法及组合评价结果

期刊名称

层次分析

因子分析

TOPSIS

熵权法

组合评价

排名

中国医学科学院学报

72.88

100.00

99.03

84.35

100.00

1

第四军医大学学报

100.00

78.93

100.00

100.00

100.00

1

中山大学学报医学科学版

51.24

98.11

73.85

57.72

98.11

3

浙江大学学报医学版

26.98

96.89

82.81

93.01

96.89

4

北京大学学报医学版

73.51

96.14

90.86

73.15

96.14

5

第三军医大学学报

85.30

81.17

96.05

85.73

96.05

6

医学研究生学报

27.84

89.56

74.68

80.72

89.56

7

第二军医大学学报

81.79

78.98

89.41

76.03

89.41

8

南方医科大学学报

67.13

75.05

87.68

71.81

87.68

9

吉林大学学报医学版

48.25

86.87

66.73

56.80

86.87

10

中国药科大学学报

69.96

79.73

86.01

74.69

86.01

11

郑州大学学报医学版

38.80

68.33

70.81

77.03

77.03

12

北京中医药大学学报

53.47

61.24

73.49

74.02

74.02

13

南京医科大学学报自然科学版

41.21

72.10

47.98

42.45

72.10

14

中南大学学报医学版

53.80

71.12

62.03

45.32

71.12

15

复旦学报医学版

53.92

68.79

63.78

48.42

68.79

16

四川大学学报医学版

55.60

68.19

66.94

50.58

68.19

17

西安交通大学学报医学版

43.37

68.19

67.37

61.34

68.19

17

军事医学科学院院刊

31.94

65.12

45.00

19.20

65.12

19

上海中医药大学学报

28.41

61.45

64.74

59.84

64.74

20

上海交通大学学报医学版

43.32

62.92

52.68

39.20

62.92

21

安徽医科大学学报

25.38

60.15

26.47

19.22

60.15

22

华中科技大学学报医学版

46.01

59.54

52.16

39.59

59.54

23

沈阳药科大学学报

41.91

53.90

56.77

58.00

58.00

24

山东大学学报医学版

30.45

54.98

32.68

10.98

54.98

25

福建医科大学学报

20.34

53.03

32.11

26.05

53.03

26

广州中医药大学学报

34.04

52.93

45.83

37.36

52.93

27

武汉大学学报医学版

27.04

50.96

32.78

15.17

50.96

28

东南大学学报医学版

18.65

50.77

33.81

16.87

50.77

29

军医进修学院学报

23.95

50.73

35.67

37.82

50.73

30

新乡医学院学报

12.69

47.53

26.07

30.19

47.53

31

成都中医药大学学报

20.83

34.06

46.08

42.06

46.08

32

重庆医科大学学报

25.81

43.08

32.55

21.55

43.08

33

广州医学院学报

19.47

42.56

26.87

7.01

42.56

34

首都医科大学学报

24.27

42.52

28.31

12.56

42.52

35

中国医科大学学报

30.98

41.81

34.15

22.68

41.81

36

哈尔滨医科大学学报

27.03

41.33

28.45

15.32

41.33

37

江苏大学学报医学版

12.46

40.90

18.13

3.67

40.90

38

温州医学院学报

11.02

39.98

20.27

8.72

39.98

39

武警医学院学报

16.56

18.41

37.04

3.90

37.04

40

湖南中医药大学学报

22.51

36.79

33.16

23.33

36.79

41

南京中医药大学学报

21.55

27.63

33.85

35.98

35.98

42

河北医科大学学报

23.57

34.72

31.29

12.38

34.72

43

安徽中医学院学报

28.25

34.01

34.39

24.11

34.39

44

山西医科大学学报

30.64

33.33

34.28

16.99

34.28

45

贵阳医学院学报

17.33

30.92

23.79

12.94

30.92

46

昆明医学院学报

6.95

30.80

17.74

6.01

30.80

47

广西医科大学学报

28.60

30.80

23.31

13.45

30.80

47

广东药学院学报

25.16

28.50

28.97

17.98

28.97

49

浙江中医学院学报

20.19

7.46

28.55

19.92

28.55

50

苏州大学学报医学版

24.73

27.56

26.59

13.41

27.56

51

江西医学院学报

18.78

27.07

27.52

12.06

27.52

52

蚌埠医学院学报

0.00

27.10

0.00

10.25

27.10

53

青岛大学医学院学报

4.25

26.50

7.49

0.00

26.50

54

青岛大学医学院学报

4.25

26.50

7.49

0.00

26.50

54

徐州医学院学报

14.74

25.00

19.59

3.85

25.00

56

山东中医药大学学报

16.82

16.54

23.19

22.93

23.19

57

大连医科大学学报

11.76

17.72

19.15

1.82

19.15

58

云南中医学院学报

6.84

12.95

14.85

8.38

14.85

59

贵阳中医学院学报

4.89

0.00

14.20

1.48

14.20

60

5结论与讨论

5.1 采用组合评价确定权重要慎重使用

一般情况下,采用组合评价法确定期刊的权重要慎重进行,撇开组合的方法不谈,即使能够得到各期刊评价指标的权重,究竟采取何种评价方法进行评价尚有很大的选择空间,因此其结果并不是唯一的,也起不到消除评价分歧的作用。

5.2基于秩序的评价方法不能用于组合评价

秩和比、BORDAELECTRE等基于秩序的评价方法是不太适合进行组合评价的,因为排序后无法确定期刊之间的差距,丢失了期刊的重要信息,比如,甲乙两个期刊的评分分别为9695,这和甲乙两个期刊评分分别为9680的情况是完全不同的,但二者的排序都是甲大于乙。

5.3基于极值法的组合评价方法具有独到的优势

基于极值法的组合评价方法有利于建立和谐的评价者与被评价者的关系,而且其结果是唯一的,在经过充分论证的基础上,慎重选取评价指标,然后选取可行的各种评价方法进行评价,在此基础上进行组合,容易达成一致结果。

    需要说明的是,由于条件所限,本文没有穷尽全部可行的方法进行期刊评价,但从理论上说不应影响本文的结论。

 

参考文献

[1]Weiping YueConcepcion S. Wilson.  Measuring the citation impact of research journals in clinical neurology: a structural equation modeling analysis[J]. Scientometrics,20043):317-334

[2]苏新宁. 构建人文社会科学学术期刊评价体系[J]. 东岳论丛,20081):35-42

[3]邱均平、张荣等. 期刊评价指标体系及定量方法研究[J]. 现代图书情报技术,20047):23-26

[4]庞景安、张玉华等. 中国学术期刊综合评价指标体系的研究[J]. 中国学术期刊研究,200011):217-219

[5]李凯扬、贾玉萍. 基于AHP的期刊全文数据库的模糊综合评价[J]. 情报科学,200511):1688-1703

[6]王小唯、杨波等. 学术期刊质量评估的二次相对评价方法[J]. 编辑学报,20036):231-232

[7]李修杰、陈景武. 运用判别分析法建立的期刊评估指标体系[J]. 江西图书馆学刊,20063):48-50

[8]王玖、徐天和. 秩和比法在医学学术期刊学术质量综合评价中的应用[J]. 数理医药学杂志 20033):266-267

[9]陈汉忠. 主成分分析在学术期刊评价中的应用[J]. 中国学术期刊研究,20046):658-660

[10]凌春艳、莫琳. 自然科学学术期刊质量指标体系的属性数学综合评价模型[J].数学的实践与认识,20045:1-7

[11]李继晓、蔡成瑛. 对各种核心期刊评价方法的分析[J]. 中国学术期刊研究,20062):253-256

[12]毛定祥. 一种最小二乘意义下主客观评价一致的组合评价方法[J].中国管理科学,20025:95-97

[13]徐泽水,达庆利. 多属性决策的组合赋权方法研究[J]. 中国管理科学,20022):84-86

[14]彭猛业、楼超华等. 加权平均组合评价法及其应用[J]. 中国卫生统计,20043): 146-149

[15]刘丽、张礼兵. 基于遗传算法的组合评价模型[J]. 合肥工业大学学报自然科学版,20048):899-902

[16]马溪骏、李敏等. 基于兼容一致性方法集成组合评价研究[J]. 中国管理科学,200610):20-23

[17]陈衍泰、陈国宏等. 应用合作博弈确定组合评价权重系数的方法研究[J]. 中国管理科学,20056):89-94

[18]郭亚军、易平涛. 一种基于整体差异的客观组合评价法[J]. 中国管理科学,20063): 60-64

 

本文发表于2009.8《图书与情报》

                                                     2009.9.9 俞立平于邗上

 



https://blog.sciencenet.cn/blog-45134-254538.html

上一篇:对国家自然科学基金项目网上查询的一点建议
下一篇:水平高了,小课题反而拿不到了
收藏 IP: .*| 热度|

1 赵星

发表评论 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-28 04:51

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部