||
学位论文和期刊论文查重是为了防止抄袭剽窃他人成果、自我抄袭和过量引用。
论文重复率的控制原则有哪些?
如何降低重复率?
这些都是科研人员在写作时需要注意的问题。
查重(similarity check)是使用连接到各文献数据库的查询对比软件检查文章与已发表文献的重复程度。例如,有的查重软件规定,一句话中有连续13个字与发表文献相同就会被计为重复,这种重复具有抄袭或剽窃的嫌疑。对全文进行检测后,查重软件会给出关于重复率(又称相似率)的各种指标。
全文总重复率等于复写率、他引率、自引率、专业术语占有率之和。复写率是与其他文献相同的内容占全文的百分比(不算引用内容)。他引率是引用他人的内容占全文的百分比,如果未正确标注引用,会计入复写率。自引率是引用自己已经发表的内容占全文的百分比,如果未正确标注引用,也会计入复写率。专业术语是指行业用语、法律条文和公理定理等占全文的百分比。自写率等于1减全文总重复率,反映了原创内容占全文的百分比。
多数国际期刊在将论文送交同行评议前或在论文被接受前会进行查重。多数期刊对可以接受的全文总重复率控制在30%以下,少数期刊控制在20%以下,通常会在投稿须知里标示。国内期刊对重复率有类似要求。例如,《中国机械工程》原则上不录用重复率大于30%的论文。如果重复率过高,则认为论文引用的内容超过了正常数量,或具有抄袭风险,会被拒稿或让作者修改。
很多查重软件设置了灵敏度阈值,例如中国知网设置为5%。如果引用或抄袭的单篇文献内容总和在检测段落内达到了阈值(例如,检测段落有1000字,引用单篇文献大于50字),查重软件会提示引用过多或有抄袭嫌疑。每个学校对毕业论文的重复率限值具有不同的规定。
需要注意的是,重复率是指论文与一篇或多篇已发表文章重复比率的累计值。重复率高,不一定意味着抄袭。例如,当论文有30%的重复率时,可以是与一篇文章有30%重复,也可以是论文的1%部分与30篇不同的文章有重复。另外,在根据重复率判定抄袭时,需要具体检查重复发生在论文的哪些部分。在材料和方法部分,由于很多内容是关于常见的测试方法和仪器的,在描述时没有太大的新意,就可能会产生较高的重复率,这种情况通常可以被宽容。
由于不同的查重系统所包含的文献数据库有所不同,对内容相似度的算法也各有不同。国外的查重系统主要包括iThenticate和Turnitin等。iThenticate是科研人员和期刊经常使用的查重软件。Turnitin是学生和教师经常使用的查重软件。国内常用的查重软件包括中国知网和维普。大部分高校指定使用中国知网对学位论文进行查重。
很多查重系统是收费的,而且价格不菲。例如iThenticate的查重价格是100美元一篇。国内有的高校会为学生提供1-2次免费查重机会,这个机会非常宝贵。如果学生需要在由学校查重论文之前想自查论文,需要注意选择正规渠道查重,通常需要付费。然后根据检测结果对论文进行降重处理,避免由于被学校查出学位论文的重复率过高而影响毕业。另外,市场上还有大量的免费查重系统,也充斥着各种假冒的查重系统。如果使用不可靠的查重系统,论文可能被盗。
降重分为非法降重和合法降重两种。对抄袭的内容不注明引用文献来源而降重叫抄袭或剽窃,属于非法降重,必须避免。引用的内容无需降重,只需注意控制引用量满足学校毕业论文或期刊投稿的重复率要求。合法降重是对非抄袭内容(自己的原创内容)变换写法,避免与已经发表的文章重复。在使用降重服务时,必须注意避免非法降重,只能使用合法降重。
由于完成学位论文和发表期刊论文是强需求,市面上的论文查重软件和降重服务市场非常火爆。对于东拼西凑抄袭剽窃(包括原样照抄或盗取意思)的论文,试图通过降重服务蒙混过关,属于学术不端的错误做法。
很多科研人员受英语水平所限,在撰写引言的文献综述部分时,过度参考甚至抄袭他人的论述;或者在发表自己的系列论文时,对容易雷同的部分(例如材料和方法)采用相同的语言。这两种情况会导致论文的重复率过高,需要降重。
① 合法降重的第一个方法(也是最好的方法)是复述,即用自己的语言把检测为重复的内容重写一遍。
世界上没有完全相同的两片树叶。一般来讲,自己写出来的话与他人发表的内容不会相同。唯一需要注意的是,在自己发表的系列论文中不要使用相同的句子,因为每个人都有自己的习惯表达方式,这是最容易出现雷同的原因。另外,如果必须引用,最好只引用核心语句,对其余内容用自己的话复述。复述的常用手法包括语态变换(将主动语态变成被动语态或反之)、颠倒因果关系顺序、改变状语从句位置、调整句子结构和断句、替换同义词等。
② 合法降重的第二个方法是纠正查重软件对参考文献和引语的错误标记。
格式错误的参考文献会被查重软件视为正文而标记为重复内容,而格式正确的参考文献不会被查重软件作为抄袭内容来标记和统计。
③ 合法降重的第三个方法是使用人工智能软件对语言自动进行修改。
这种方法大概能将重复率降低几个百分点,但是需要人工润色,纠正软件的错误。
④ 合法降重的第四个方法是中外语种互译,利用翻译软件(例如有道翻译或谷歌翻译)的人工智能优点自动选择用词和句子结构。
例如,先将中文里的重复部分用翻译软件译成英语、日语、德语或法语,然后再将外语译回中文。经过这两次转换,中文用词和句子结构已经大不相同,能够有效减少雷同。但是,翻译软件可能会出错,因此需要人工润色纠正。
⑤ 合法降重的第五个方法是把数据和公式放进插图或表格,因为很多查重系统目前只能检测文字,尚不具备详细检查图表内容的功能。
这个方法只适合处理自己发表的一系列论文中的相同数据和公式,并且需要引注,避免自我抄袭。如果将这个方法用于别人的数据和公式,而且不引注,试图避免被查出重复内容,那实际上是抄袭剽窃。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 21:42
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社