林墨分享 http://blog.sciencenet.cn/u/ZJUlijiang 分享以科学家为对象的研究论文

博文

h指数在一年之内飙至94的神人到底是谁?

已有 23246 次阅读 2018-6-16 11:08 |系统分类:科研笔记

说明:本博客与微信公众号“林墨”同步更新,所有内容均为原创,可授权转载请扫码关注“林墨”公众号

2.png

造假有套路,使用需谨慎!


熊泽泉 / 华东师范大学


谷歌学术、百度学术等学术搜索引擎以收录范围广泛、免费访问等优势逐渐抢占了学术文献全文的入口,这一点让web of science和Scopus等数据库商紧张不已。收录范围广便能够建立更庞大的引文网络,因此,谷歌学术、百度学术等学术搜索引擎收录的文献的被引次数更高,所以,一些学者在委托图书馆出具引文报告时,希望以谷歌学术的被引次数为依据,作为自己论文影响力的佐证。但是,学术搜索引擎中随意的数据给造假提供了极大的空间。


辛辛苦苦几十年,不如一键生成?


格勒诺布尔大学的CYRIL LABBE教授利用美国麻省理工大学(MIT)的研究人员发明的SCIgen,以“IKE ANTKARE”作为作者名(注意哦,作者并非真实存在),自动生成了102篇科研论文,让IKE ANTKARE在谷歌学术中的h指数一下飙升到了94,成为计算机科学领域科学家H指数排名第6的学者。


下图显示了该研究中使用的工具SCIgen,只要在SCIgen网页上的作者栏中输入作者名,程序就可以自动生成一篇拥有完整结构的computer science论文,包括Titles, authors, sections, bibliography, graphs, figures等等。


1.jpg

注:SCIgen 论文生成器


请看用SCIgen 论文生成器自动生成了一篇我的论文,是不是挺吓人?

2.jpg

注:SCIgen 论文生成器自动生成的论文


如何让谷歌学术收录自动生成的论文?


要想获得谷歌学术中的 h 指数值,首先得让谷歌收录你的论文。CYRIL LABBE用与上文所说的方法,利用SCIgen生成了100篇论文,每篇论文都对所有的100篇论文进行引用,然后生成该论文的html页面,html页面包含论文标题、摘要及PDF全文链接等信息。


3.jpg

注:图片来源于参考文献中的论文(伪造论文的引用关系)


为了让谷歌学术能够对这100篇论文进行索引,CYRIL LABBE在这100篇伪造论文的参考文献中加入了1篇真实的已被谷歌学术索引的论文,然后将这100篇论文上传到网上。不久,IKE ANTKARE的h指数就已经飙升到了94,甚至高于爱因斯坦的h指数84。


你可能引用了虚假论文


目前,谷歌学术已经对这批论文进行了处理,但是在百度学术中,仍能看到这些用软件生成的论文及其被引频次。


4.jpg

注:你可能引用了百度学术中的虚假论文


从这个案例中我们可以看到,数据随意的学术搜索引擎,很容易被人为操纵,因此不宜使用其引文数据作为学术评价的数据源。




3.png


LABBÉ, C. (2018). One of the great stars in the scientific firmament. ISSI NEWSLETTER, 6(2), 48-52.






https://blog.sciencenet.cn/blog-1792012-1119255.html

上一篇:在正文的1/3处被引用的文献更经典?
下一篇:我们要不要持久稳定地合作?
收藏 IP: 122.225.220.*| 热度|

10 武夷山 周健 文克玲 杨正瓴 迟延崑 许培扬 赵建民 吕洪波 张鹰 liyou1983

该博文允许注册用户评论 请点击登录 评论 (6 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-20 04:17

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部