虽然知网查重系统对比其他系统已经非常之好了,但仍有可能发生。 所幸的是,几乎所有的评审机构对于重复率要求都是留有余量的。 所以再次声明,重复率余量不是默认可以抄袭的量,是留给引用和检测偏差的。
知网比万方查重的重复率相差很大。 这个大不是指知网一定比万方查重的重复率高多少;或者是说知网一定比万方查重的重复率低多少。 这个大是指无法根据万方的重复率来推断出知网的重复率多少。 因为万方数据和知网查重是2个完全不一样的查重软件。
知网和维普查重准确率较高,两次均处于前三名。 由此可见即使是同一个数据库,不同的文章查重准确率方面也会存在波动。 究其原因,最关键的还是每个查重软件所包含的数据库不一样。 接下来,我们就来看看不同查重软件的数据库情况。 再讲数据库之前我们先来简单介绍一下查重软件之所以能够检测重复率的基本原理。 每个查重软件都会有自己的对比库,上传进行检测的论文都会与对比库中的资料进行对比,来检测论文内容是否重复。 不同查重软件有不同的对比库数据库,且不同的查重软件所能调用的数据库数量不同。
再次,二者在计算规则上也存在较大差异,尽管二者都是采用切字符分割法计算重复率,但是万方是按照连续十字以上重复计算,而知网则是按照连续十三字以上重复计算,从该计算规则上来看,似乎万方相较于知网而言更为严格,实则不然,究其原因在于二者的数据库覆盖范围不同,导致万方可比对的数据较少。 最后,笔者认为,相较于 知网查重 而言,万方查重由于其数据库涵盖范围有限导致其标准过于宽泛,对于知网查重而言只具有借鉴意义,而且万方查重不包括英文数据库,一旦文章中涉及到英文,无法使用万方对其进行查重。