老杨食话说分享 http://blog.sciencenet.cn/u/bxlh2008 要想得到常人所不能得到的,就得付出常人所不能付出的!

博文

给我一篇假论文,我能骗倒半个地球

已有 33171 次阅读 2013-11-12 20:47 |个人分类:新闻纵横|系统分类:观点评述| 论文, 钓鱼

       给我一篇假论文,我能骗倒半个地球

杨国力


      今天看到一篇好玩的文章,是今年学术界最有喜感的文章,即11月07日《南方周末》 一篇李慧翔的评论文章《给我一篇假论文,我能骗倒半个地球》。讲述的是,2013年7月4日,非洲生物学家Ocorrafoo Cobange先生在投稿两个月后收到了《自然生物制药》杂志的发稿通知,但是实际上,并没有Ocorrafoo Cobange这个人,而是哈佛大学的生物学家John Bohannon的一篇“钓鱼文章“。结果全球304个开放出版期刊(Open Access)超过一半接受了这篇文章,录用率近52%。

      这件事的背后反映的是否是学术界的业界良心,目前,是否又有许多野鸡期刊,野鸡会议还在大张旗鼓的收录这些毫无价值的文章?

      现在,在网上还有一个好玩的网址,是由美国麻省理工大学(MIT)计算机专业的三位研究生出于对学术界“野鸡会议”(指那些学术水平低下,无质量把关,只知收取昂贵注册费用替作者攒论文发表数量的学术会议)的反感和年轻人的恶搞冲动,编写的论文自动生成软件SCIgen。它能够从固定的词库中,随机抽取专业术语,以符合文法的方式生成句子。因为学术论文中大量充斥着一些专业性很强的用词和固定的句式,这种软件生成的文章乍看上去相当符合规范。再配上自动生成的漂亮图表和详细的引用文献,一篇就内容而言不知所云的文章第一眼往往能唬住不少人。      

      在网页上,只要输入作者名,点击”Generate“,电脑就可以自动为你生成一篇“SCI级别”的computer science论文,论文上abstract,introduction,literature review,experiment result,discussion,conclusion,reference,diagram一应俱全,除了内容没人能真的能看懂以外,“paper”像模像样。比起这个软件免费写的英文paper,网上代写论文广告就弱爆了,是否很神奇呢......据说,通过这样生成的论文,唬住了很多会议和期刊,目前,已发表论文数十篇。

       嘿嘿,是不是国内某些学者动心了呢?

网站地址:http://pdos.csail.mit.edu/scigen/

       喜欢的可以试试哦~



   “恭喜,你的论文已被我们录用。”2013年7月4日,非洲生物学家Ocorrafoo Cobange先生收到了这样一个好消息,在投稿两个月后,他终于收到了《自然生物制药》杂志的发稿通知。多年来,Cobange先生在坐落于厄立特里亚首都阿斯马拉的Wassee医学研究所工作,研究一种青苔提取物所具有的抗癌性能。

  《自然生物制药》杂志号称是“经过同行审议,提供高素质论文的学术杂志”,其审稿人是来自各国大学的制药学教授。能在这样一本具有相当学术地位的杂志上刊发论文,想必Cobange先生的心里,已经乐开了花。

    但显然,并没有人为这个好消息欢呼,因为根本不存在生物学家Cobange这么一个人,所谓在厄立特里亚的医学研究所也是子虚乌有。事实上,这篇“钓鱼论文”的真正作者是哈佛大学的生物学家John Bohannon。在过去的10个月里,Bohannon用假名、假单位和假论文——用他自己的话说是“任何评审者,只要拥有高中水平以上化学知识,并能读懂基本的数据图表,就应该能立刻看到论文的问题,它的实验缺陷得一塌糊涂,所有结果都毫无意义”——投给了全球304个开放出版期刊(Open Access)。

   然而,超过一半的期刊接受了这篇文章。在304家期刊中,有157家表示接受,录用率近52%。一些刊物提出修改意见,但大多限于论文格式与语法问题。只有36家杂志的审稿意见提及稿件的内容,有16份评稿意见认为论文很糟糕,但还是决定录用。

这篇“骗倒半个地球”的论文,究竟写了些什么呢?Bohannon做了精心准备。首先,他专门写了一篇“粗看起来可信的普通论文,但其中有严重的错误,让合格的评审者很容易就能发现、认定它不适合发表”。论文的基本格式是:设三个变量——某分子X,来自地衣物种Y,能抑制癌细胞Z。

接下来,通过作者设计的小程序,把各类分子、地衣物种以及癌细胞组合在一起,随机填写到上面的变量位置,于是就生成了数百篇论文,除此之外这些论文其余的部分都一样。

最后,为了避免对方对作者流利的英语水平产生怀疑,Bohannon还特意把全文用谷歌翻译翻成法语再翻回英语,然后校正了那些明显的错译,得到一篇语法正确但明显不是英语母语的人写出来的文章。论文作者的名字和其所属单位都是虚构的,用非洲地名人名拼出来的。

一旦刊物答应刊登论文,Bohannon就发信称实验出现重大错误导致结论不正确,要求退稿。但居然还有刊物回信说:“尊重您的撤稿决定,但如果您打算发表这篇论文,请告知我,随时愿意为您效劳”。总体而言,“中招”的学术期刊主要来自印度和美国,此外有神户大学这样著名学校出版的,以及学术协会的,甚至包括知名出版机构Elsevier与SAGE旗下刊物。

其实,Bohannon已经算是相当有良心的钓鱼,毕竟文章还是手写的。接下来我们要见识的,是两套计算机程序,不少人利用它们自动生成的论文,已经把学术界搅得天翻地覆。

  几年前,美国麻省理工大学(MIT)计算机专业的三位研究生编写了论文自动生成软件SCIgen。它能够从固定的词库中,随机抽取专业术语,以符合文法的方式生成论文。因为学术论文中大量充斥着一些专业性很强的用词和固定的句式,这种软件生成的文章乍看上去相当符合规范。再配上自动生成的漂亮图表和详细的引用文献,一篇就内容而言不知所云的文章第一眼往往能唬住不少人。

 SCIgen的首次亮相是在2005年,一篇由机器生成的论文被第九届“系统论、控制论与信息论多学科国际会议”收录,得知真相后,IEEE(美国电气和电子工程师协会)颜面大失,迅速删除了论文。然而,德国学生又发现了这个神器,分别于2008和2009年向在中国武汉举办的两个IEEE国际会议投稿,结果机器虚拟的Schlangemann教授被当成了知名学者,还被邀请作为会议的主持人。

 当SCIgen已经至少在世界各地的学术会议和期刊上成功“发表”了十几篇论文后,康奈尔大学数学系博士后Nate Eldredge又根据SCIgen进行了改编,做出了Mathgen——计算机论文自动生成器。

  2012年8月3日,一位来自“南部北达科他大学霍普分校”的“Marcie Rathke”教授向一份“广受赞誉”的期刊——《理论数学进展》(Advances in Pure Mathematics)投递了一篇论文。仅仅10天之后,这篇论文就被接受了,编辑还一本正经地写了5点修改意见。没错,这篇论文正是用Mathgen自动生成的。虽然论文摘要每句话都看起来牛哄哄的样子,但实际上没有任何意义。

  其实,论文钓鱼并非什么新鲜事物,自从“索卡尔事件”起,类似的事件就屡见不鲜。但钓鱼者的初衷,都包含着净化学术风气的目的——索卡尔给《社会文本》投伪科学文章是为了考验对方的学术水准和编辑责任心;SCIgen的作者是因为看不惯那些学术水平低下,无质量把关,只知收取昂贵注册费用替作者攒论文发表数量的“野鸡会议”;Bohannon是为了测试开放期刊的节操,以及揭示“同行评议甚少存在”的黑幕。

  只要靠收取高额出版费牟利的杂志还存在,只要那些淡泊学术只图名利的野鸡会议还存在,就还会有人上钩,哪怕Bohannon在论文中已经藏下了“图文不符、对照组不符”的直钩,咬钩的鱼儿依然兴趣盎然。

《南方周末》李慧翔【天下远见】给我一篇假论文,我能骗倒半个地球






投稿与审稿
https://blog.sciencenet.cn/blog-459863-741214.html

上一篇:推荐《大国重器》纪录片 展现中国装备制造业成就
下一篇:论文写作者的福音
收藏 IP: 111.40.0.*| 热度|

54 曹聪 陈小斌 金拓 赵凤光 吕喆 陈德旺 王春艳 武夷山 文锋 李泳 李建国 徐民 梁妍钰 徐耀 倪金龙 王号 胡瑞祥 苏光松 汪晓军 杨正瓴 翟远征 梁洪泽 刘少华 魏武 程南飞 于锋 徐明昆 陈玮 覃思 鲍得海 刘克 王金龙 Editage意得辑 邹桂萍 薛宇 徐长庆 余世锋 杨顺楷 高建国 陈梅 李土荣 杨学祥 周春雷 李粒 强涛 ljxm biofans uneyecat xuqingzheng xuexiyanjiu suosuosky wanfairy lynn94 EroControl

该博文允许注册用户评论 请点击登录 评论 (81 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 18:31

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部