目前大多数学校用的都是知网的查重软件来进行定稿,同时知网的数据库更新也是最快的,它的算法也是最新的。 首先,它会将上传的论文进行格式分段检测,以句子作为最小单位来进行检测, 一个句子里面如果有13个字符重复的时候,该句子就会被标红 。
下面CNCNKI查重网就为毕业生们归纳下知网最新查重规则及原理如下,这个原理适用于市面所有检测系统的: 1、知网查重是连续13字符相似就会判为重复,13字符就相当于6-7个中文汉字。
知网查重,是以“连续13个字重复”做为识别标准。 如果找不到连续13个字与别人的文章相同,就检测不到重复。 (3)
封面、摘要、绪论、第一章、第二章、等等这样一系列的都会各自分成一个片段来检测,每一个片段都计算出一个相似度,再通过这样每章的相似度来计算出整篇论文的总重复率。 当知网查重系统识别到你论文中有某句话涉嫌抄袭的时候,它就会对这句话的前面后面部分都重点进行模糊识别,这个时候判断标准就变得更严格,仅仅加一些副词或虚词 (比如“的”、“然后”、“但是”、“所以”此类词语)是能够识别出来的。 在知网查重进行中,检测系统只能识别文字部分,论文中的图片、word域代码、mathtype编辑的公式、是不检测的,因为检测系统尚无法识别这些复杂的内容格式。