图谋博客分享 http://blog.sciencenet.cn/u/libseeker 图谋,为图书馆学情报学谋,为图书情报事业谋。

博文

谁来规范学术规范? 精选

已有 14408 次阅读 2014-3-13 20:49 |个人分类:学海泛舟|系统分类:观点评述| 科研, 学术规范, 学术不端

   笔者近期有篇稿件被退稿,在复审环节被告知“文章后部分cnki重复率检测已高达xx%,还请学术规范。”我感觉一是非常羞愧,二是非常惊诧。个人敬畏学术,且作为较为经常写稿的人,不会有意去违反学术规范。
   随即托友人帮检测,读了检测报告感觉很“无语”。并进一步了解了一些情况,比如其依据为《学术期刊论文不端行为界定标准(公开征求意见稿)》(
http://check.cnki.net/Article/rule/2012/12/542.html)等。同时,多方求教帮“会诊”。我当前要做的:一是认真修改,“悬崖勒马”;二是下不为例,今后投稿先老老实实检测一遍。
   个人对几家不端检测软件,还是有点了解。当前cnki做的相对较好,但是问题也不少,其检测范围、界定标准等本身是有问题的。同样是我这篇论文,万方数据的检测结果是“总相似比:2.59%(参考文献相似比:1.04%,排除参考文献相似比:1.55%)”。假如用超星公司的检测系统结果肯定大不同,它是侧重图书文献(少量报纸,期刊不涉及)。
   笔者做过学术不端检测服务工作,接触过一些检测报告,用户教育工作中还讲解有关类容,此外就是不时会接触这方面的用户咨询。据笔者了解,学术不断检测软件除上述三家外还有多家(国外的亦有多家)。中文文献方面CNKI做的最早,2008年开始服务,影响力较大。
   学术期刊方面的对总文字复制比有何要求?笔者进行了了解,A刊告知“总文字复制比”10%以内,B刊透露“现在的核心刊物基本上都使用‘学术不端文献检测系统’,如果过度引用在初选时就会退稿,一般应将引用控制在30%以内(系统认为40%就是抄袭或一稿多发)。”。A刊还透露,检测系统比较机械,而且系统中的文献来自非公开出版的文献等等,期刊的难处在于有上级和第三方机构以此来考核,往往被绑架,最终的受害者,当然是作者。
   谁来规范学术规范?也许有人会认为“事不关己”。当前学术不端检测“无孔不入”,论文答辩检测、职称论文检测、学术期刊投稿检测、专著出版检测……有位作者投稿,因为其一篇博文被他人转载,被检测出“问题”,网络寻人求转载者“撤稿”,蹊跷之处是作者原始博文未在检测源中(也就是即便自引,也会被界定出问题)。有位博士的论文,引文规范工作个人认为做得相当扎实,大量注释和参考文献,经检测cnki中“总文字复制比”超过30%,超星公司的检测系统图书文献中还有6%,这两块因侧重点不同,基本不交叉。引用过程中,你引用了较为权威研究者的文献,可能其被引很多,会给你重复找出“问题”来,而且假如那篇文献曾以多种载体(专著、学术论文或PPT出现过),也会不厌其烦地给你找出“问题”来。纯粹描述性文字,类似你“吃了几碗饭,喝了几两酒”,也可能见“红”,让你给出参考文献。
   当前马上要进入学术不端检测的旺季,学士、硕士、博士,几乎士士均得试试,大多数至少检测一次(甚至3次以上),要花费不少人力、财力、物力。据笔者所知,不同机构对总文字复制比要求不同,比如有的是5%、有的是10%、有的是30%。学生时期是科学精神培养及科学研究方法训练的黄金时期,经过学术不断检测一番“调教”,莘莘学子的学术规范教育将被严重扭曲。可谓矫枉过正,背离了学术不断检测系统本意。任由学术不断检测系统来“规范”学术规范是不靠谱的!首先其依据的“界定标准”就不靠谱。


相关资料:
“ 基于PubMed数据库收录的2047篇撤稿文章的分析,发现21.3%的撤稿源于差错,67.4%的撤稿源于学术不端(其中43.4%为学术欺诈,14.2%为重复发表,9.8%为抄袭剽窃),另有11.3%的撤稿没有说明原因或为多种原因的复合。”(见:任胜利.学术不端:期刊论文被撤稿的主要原因.http://blog.sciencenet.cn/blog-38899-620122.html)
“内容要具有创新性,不能简单的罗列他人的研究成果,缺少自己的思想。现在的核心刊物基本上都使用‘学术不端文献检测系统’,如果过度引用在初选时就会退稿,一般应将引用控制在30%以内(系统认为40%就是抄袭或一稿多发)。”(信息来源:
http://blog.sina.com.cn/s/blog_674ec8250100o8vq.html ,作者为《情报资料工作》编辑)
附笔:1.博文写作过程中,收到退稿期刊方面的来信,告知“不管用不用稿子,都不存在学术不端的问题。”,多少给我一丝安慰。(拙作修改之后重投,3月19日获悉被录用。) 2.假如笔者这篇博文拿去做个检测,“总文字复制比”不知道会是多少,估计是相当高,因为相关资料中的信息也会被计量的。

进一步的思考:
1 据说目前汉字的总数8万有余而常用的只有3500字。对于一篇比较规范的学术论文,尤其是一篇数万乃至十余万字的学位论文,假如“总文字复制比”为0,或者趋于0,笔者认为是不可思议的,很可能属于严重学术不端(比如通过技术规避检测等)。
2 假如完全按照检测报告,将检测出的文献与灰色文献(包括互联网资源及互联网文档资源),统统“增补”进注释、参考文献,可能会“有效”降低“复制比”,但是属于明明白白的学术不端——假注、伪注,因为事实上研究过程中并未参考过,“如有雷同,纯属巧合”。
3 “充分”标注是不可能的。一是因为“检测范围”中的内容总体上虽然是在动态增长且有变化(比如过去存在,现在不存在),但永远无法做到“完整”,事实上仍未检全,更未检准。二是你会发现涉及政策法规、定律原理、“经典文献”,被引量相当大,那些“同被引文献”也会出现在报告中,让你看着办。三是你刚刚检测过的文献都可能被其比对库“收割”,再次检测时,会告诉你“雷同”。如此等等。

      特此提出以上“问题”,供各界共同关注与思考。

 



https://blog.sciencenet.cn/blog-213646-775697.html

上一篇:[转载]顾建新:张厚生先生与东南大学图书馆
下一篇:再说谁来规范学术规范?
收藏 IP: 114.237.126.*| 热度|

32 武夷山 周健 刘桂锋 赵美娣 刘少华 张云扬 褚昭明 陈学雷 闵应骅 孙根年 陈冬生 翟自洋 陈辉 范毅方 许培扬 水迎波 吕喆 李东风 LetPub编辑 李宇斌 徐晓 李孔斋 曹聪 郑小康 周春雷 文克玲 彭渤 李志俊 任胜利 孙学军 zhouguanghui lrx

该博文允许注册用户评论 请点击登录 评论 (42 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-20 19:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部