|||
按:本文发表于《图书情报工作》2010. Vol. 54 (16)。
摘要:为了详细分析学术期刊影响因子在不同水平下的影响因素及其特点,本文利用分位数回归模型,分析了平均引文数、平均作者数、地区分布数、海外论文比、基金论文比、期刊时效性对影响因子的影响,结果表明,海外论文比与影响因子无关;高影响因子和低影响因子期刊,平均引文数与期刊影响因子无关;高影响因子期刊,基金论文比与影响因子无关。影响因子影响因素分析有助于期刊评价指标选取。对于不同水平期刊的评价,评价方法可能不同。
分位数回归是一种基于被解释变量Y的条件分布来拟合解释变量X的回归模型,是在均值回归上的拓展,最早由Koenker、Basset(1978)提出。它依据因变量的条件分位数对自变量X进行回归,这样得到了所有分位数下的回归模型。与普通最小二乘回归相比,分位数回归更能精确地描述自变量X对于因变量Y的变化范围以及条件分布形状的影响。
Koenker、Hallock(2001)和Bernd、Peter(2007)的研究认为,从理论上说,经典线性回归是拟合被解释变量Y的条件均值与解释变量X之间的线性关系,而分位数回归是通过估计被解释变量取不同分位数时,对特定分布的数据进行估计。最小二乘法估计的是解释变量对被解释变量的平均边际效果,而分位数回归估计的则是解释变量对被解释变量的某个特定分位数的边际效果。最小二乘法只能提供一个平均数,而分位数回归却能提供许多不同分位数的估计结果。
采用分位数回归,有利于我们发现隐藏在数据背后的很多有意思的现象。比如,通常情况下我们认为收入和工作时间正相关,但是对于极高收入和极低收入的人,这种情况可能并不存在,甚至不相关。
2010.8.30俞立平于江北
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-4 14:33
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社