武夷山分享 http://blog.sciencenet.cn/u/Wuyishan 中国科学技术发展战略研究院研究员;南京大学信息管理系博导

博文

重复发表现象在全世界居然如此严重 精选

已有 12681 次阅读 2010-7-24 06:41 |个人分类:科学计量学研究|系统分类:观点评述

(按:我曾经写过一篇博文“一项巧妙的研究设计”,http://www.sciencenet.cn/m/user_content.aspx?id=309601。这篇博文经修改补充后,成为正式发表的以下文字。已经看过以上博文的,就不必再读本文了。文章的标题是报纸编辑部拟定的,与我原标题不一样。)

 

重复发表现象在全世界居然如此严重

中国科学技术信息研究所 武夷山

(发表于《中华读书报》2010721日)

 

我最近读了一篇学术论文《影响因子的马太效应:文献计量学的一项自然实验》(刊于2010年第2期《美国信息科技学会会刊》),非常有意思。一般认为,一篇论文的水平越高,该文就越可能被多次引用。但是,有人提出疑问:除了论文自身水平外,发表论文的期刊的影响因子(“影响因子”指的是一种期刊上所有文章的平均被引用次数)大小是否也影响着论文被引用状况呢?这里是否存在着“马太效应”呢?即刊物影响因子越高,其上发表的论文越容易被引用?

为了回答这个问题,加拿大魁北克大学的文森特. 拉里维埃尔 (Vincent Lariviere)和伊夫斯. 金格拉斯(Yves Gingras想了一个好主意。他俩在汤森路透科技集团生产的“知识之网”(Web of Knowledge数据库中寻找重复发表的论文。他们对“重复发表”的操作性定义是:(1)两篇文章标题完全一样;(2)第一作者姓名完全一样;(3)两篇文章后面开列的参考文献的篇数完全一样。他们承认,按照这样的定义,不免有个别误判:有可能将不属于重复发表的论文归入了重复发表之列;也有可能是,明明是重复发表的论文,但根据这个定义却未能识别出来。不过,对于一项总体性的研究,少量误判影响不了分析结论。

他们总共找出了4918组重复发表的论文,即9836篇论文,其中4532组论文发表在影响因子有差异的刊物上(另外386组中的两篇论文发表在影响因子恰好相同的刊物上,对于本项研究而言,这386组论文就不适合作为研究对象了,需要排除掉)。4532个论文组中的两篇文章,多数发表在同一年。两位作者对这4532组论文被引状况的对比分析表明,发表在较高影响因子刊物上的论文,要比发表在较低影响因子刊物上的同样内容论文的被引次数,平均高1倍!文章是一样的文章,被引次数却有差异,这说明,文章被引用,反映的并非完全是论文的内在价值,还部分反映了发表这些论文的期刊的影响力和显示度。换句话说,马太效应在这里是存在的。

两位作者的目的是说明马太效应的存在,但很多读者和我最关注的却是文章中披露的重复发表数据。大家感到吃惊的是,重复发表(一般来说是一稿两投或一稿多投的结果)的现象居然在全世界都如此严重!难道天下乌鸦一般黑,天下学者一般坏?答案当然是否定的,因为在“知识之网”数据库的记录总量中,9836篇论文占的比例实在是微不足道,我估计大大低于万分之一。

问题在于,社会公众对科技人员的道德期望一向是比较高的,不断揭露出来的众多学术不端问题使他们非常失望。重复发表是很容易被识破的,都有那么多人敢冒险,那外人看不见的科研过程中,会有多少不端行为呢?想一想都害怕。过去,国际科技界十分强调学术自由,提倡道德自律,他们对外界干预是很反感的。随着科学技术在社会经济发展中的作用日益突出,政府对科学技术的投资力度不断加大,作为纳税人的公众必然要求知道:科技投资发生了什么效果?政府的科技投资有没有被滥用?因此,外界对科技界的监督就必然要提上议事日程。如何妥善处理学术自由与外部监督的矛盾,是世界各国科技界面临的共同挑战。

 



学术不端
http://blog.sciencenet.cn/blog-1557-346809.html

上一篇:有趣的同源字
下一篇:感谢Shiyang1013网友

34 吴跃华 李侠 赵星 杨学祥 王桂颖 阎建民 陈儒军 梁建华 钟炳 王修慧 丁甜 任国鹏 吕喆 杨芳 王启云 邸领军 柳东阳 赵帅飞 李学宽 马光文 张旭 鲍海飞 李泳 许培扬 唐常杰 李毅伟 孟羽 王永林 张欣 郑永军 baijiab pkuzeal colorfulll dulizhi95

发表评论 评论 (23 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-12-2 18:35

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部