博文

揭秘论文“引用”黑市！《自然》精选

已有 6736 次阅读 2024-8-22 09:11 |系统分类:海外观察

论文被引用是作为学术评价的重要指标，如果这都能买卖，只能说明，商业无孔不入，对学术的毒害无所不用其极。

研究诚信观察者对科学家伪造或操纵其研究引文数量的方式日益增加感到担忧。近几个月来，越来越大胆的做法浮出水面。一种方法通过一次诱捕行动被揭露，一组研究人员购买了50个引文，以增加他们创造的一个假科学家的谷歌学术资料库中的引用量。

这些科学家从一家似乎大量出售虚假引文的公司购买了价值300美元的引文。该团队表示，这证实了长期以来研究诚信侦探们所猜测的伪造参考的黑市确实存在。

纽约大学阿布扎比分校的计算机科学家亚西尔·扎基说：“我们开始注意到几个谷歌学术资料库中有可疑的引文趋势。”他的团队在2月份的预印本中描述了他们的诱捕行动。“当一份手稿在发表几天内获得数百个引文，或者当一个科学家的引文突然大幅增加时，你知道有些事情不对劲。”

这些做法令人不安，因为研究人员职业生涯的许多方面都取决于他们的论文获得的参考数量。许多机构使用引文计数来评估科学家，而引文数量也会影响诸如h指数这样的指标，旨在衡量学者的生产力及其研究的影响力。

引文操纵会产生真实后果。6月，西班牙报纸《El País》报道称，该国的研究伦理委员会已敦促萨拉曼卡大学调查其新任校长胡安·曼努埃尔·科尔恰多的工作情况，这位计算机科学家被指控人为提高他的谷歌学术指标。（科尔恰多没有回应《自然》杂志的置评请求。）

待售的参考文献

研究诚信观察者已经怀疑，在生产低质量研究的“论文工厂”和销售已接受论文作者位置的服务中，引文是可以买卖的，法国格勒诺布尔阿尔卑斯大学的计算机科学家西里尔·拉贝说。“论文工厂有能力将引文插入他们正在销售的论文中。”他说。

2023年11月，位于宾夕法尼亚州费城的数据分析公司Clarivate由于担心引文操纵和“过度发表”，将其年度高被引研究者名单中的1000多名研究人员排除在外。

在他们的行动中，扎基和他的同事为一个虚构的科学家创建了一个谷歌学术资料库，并上传了20篇使用人工智能制作的虚构研究。

然后，该团队联系了一家公司，这家公司是他们在分析数据集中一位作者相关的可疑引文时发现的，似乎在向谷歌学术资料库出售引文。研究作者通过电子邮件与该公司取得联系，并通过WhatsApp进行了后续沟通。该公司提供了两种选择：300美元购买50个引文，或500美元购买100个引文。作者选择了第一种选项，40天后，来自22种期刊的50个引文——其中14种被学术数据库Scopus索引——被添加到了虚构研究员的谷歌学术资料库中。

该团队没有与《自然》杂志分享公司的名称，因为他们担心透露它可能会吸引人们关注其网站，或是他们创建的假谷歌学术资料库，因为这可能会揭露植入假引文的研究的作者身份。当《自然》杂志询问谷歌学术是否知道其网站上可以创建假资料库时，该公司的杰出工程师阿努拉格·阿查里亚说：“虽然学术不端行为是可能的，但这是罕见的，因为所有方面都是可见的——文章被索引、作者在其资料库中包含的文章、引用作者的文章、引用文章的托管位置等等。世界上任何人都可以对此提出质疑。”

在引文操纵的另一次示范中，上个月研究人员为一只名叫Larry的猫创建了一个假的谷歌学术资料库，列出了十几篇以Larry为唯一作者的假论文。这些研究人员还在学术社交网络ResearchGate上发布了十几篇引用Larry论文的毫无意义的研究。在Larry的身份被揭露大约一周后，谷歌学术删除了这只猫的研究、引用Larry的研究以及累积的引文。ResearchGate也删除了引用Larry的虚假研究。

伪造的预印本

Zaki及其同事的诱捕行动源于评估伪造引文问题规模的更广泛努力。他们使用软件检查了大约有160万个至少有10篇出版物的谷歌学术资料库。他们寻找拥有超过200个引文的资料库，以及研究者的引文每年增加10倍或更多，或者增长量至少占总引文数25%的情况。该团队发现了1016个这样的资料库。

Zaki表示，这些资料库上的论文许多引文来自未经同行评审的预印本文章，它们通常列在论文的参考文献中，但并未在手稿的主体部分被引用。

“通过创建假预印本和通过付费服务，引文很容易被操纵。”共同作者、纽约大学阿布扎比分校的计算机科学家Talal Rahwan说。

作者还调查了在世界排名前10的大学工作的574名研究人员。他们发现，在这些大学中考虑引文计数来评估科学家的，超过60%的数据是从谷歌学术获得的。

可疑的模式

Labbé对调查声称谷歌学术广泛用于获取研究者的引文指标的说法不以为然。他说，过去曾有关于谷歌学术上引文操纵的指控浮出水面，学者们长期以来一直怀疑有供应商提供此类服务。但是，揭示引文卖家的诱捕行动是首次。

法国图卢兹大学的计算机科学家Guillaume Cabanac开发了一个工具，该工具可以标记包含奇怪措辞组合的伪造论文，这些措辞是为了规避抄袭检测软件而添加的，他说，许多研究出现了与研究主题无关的工作引文。

Labbé的团队正在构建一个自动标记可疑引文模式的工具，这可能指向操纵行为。

为了帮助实现这一点，Zaki的团队提出了一个名为引文集中度指数的指标，旨在检测科学家从少数来源获得大量引文的情况。这种活动通常是“引文圈”的迹象，即科学家们同意互相引用以膨胀彼此的指标。“可疑的通常会有大量的引文仅来自几个来源。”Rahwan说。

诚信侦探们担心的一个问题是，骗子会想出更微妙的做法来避免被发现。例如，Labbé指出，一种避免被引文集中度指数检测到的方法是一次购买少量的引文，而不是批量购买。

对Labbé来说，解决引文操纵的方式是改变学术界的激励机制，使科学家不必为了职业发展而尽可能多地积累引文。“出版和引文的压力对科学家的行为有害。”他说。

The citation black market: schemes selling fake references alarm scientists (nature.com)

转载本文请联系原作者获取授权，同时请注明本文来自孙学军科学网博客。
链接地址：https://blog.sciencenet.cn/blog-41174-1447424.html

上一篇：家庭必备的五样医疗小器械
下一篇：研究表明视频游戏可以改善心理健康

欢迎参加科学网十佳博文评选活动！

主办单位：

支持单位：

收藏 IP: 223.104.178.*| 热度|

当前推荐数：2 推荐人：王启云 王安良

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

孙学军

扫一扫，分享此博文

氢分子医学分享 http://blog.sciencenet.cn/u/孙学军对氢气生物学效应感兴趣者。可合作研究：sunxjk@hotmail.com 微信 hydrogen_thinker

博文

揭秘论文“引用”黑市！《自然》精选

当前推荐数：2 推荐人：王启云 王安良

该博文允许注册用户评论请点击登录评论 (0 个评论)

孙学军

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

氢分子医学分享 http://blog.sciencenet.cn/u/孙学军 对氢气生物学效应感兴趣者。可合作研究：sunxjk@hotmail.com 微信 hydrogen_thinker

博文

揭秘论文“引用”黑市！《自然》 精选

当前推荐数：2 推荐人： 王启云 王安良

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

孙学军

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

氢分子医学分享 http://blog.sciencenet.cn/u/孙学军对氢气生物学效应感兴趣者。可合作研究：sunxjk@hotmail.com 微信 hydrogen_thinker

揭秘论文“引用”黑市！《自然》精选

当前推荐数：2 推荐人：王启云王安良

该博文允许注册用户评论请点击登录评论 (0 个评论)