1.源不足全面学术舞弊检测系统覆盖范围为中国学术期刊网络出版数据库、中国博士论文全文数据库、中国优秀硕士论文全文数据库、中国重要会议论文全文数据库、中国重要报纸全文数据基点优先出版中国专利全文数据库、互联网资源、英语数据库、香港澳台学术文献库、文献库、互联网文献资源等。显然,考虑到文献的类型,资源库不能覆盖所有资源类型。例如,最常用的科学研究书不包含在对源中。从单一类型的文献中不能完全整合单一类型的资源。以期刊资源为例,来自《威普斯日报资源》的统计数据集成服务平台-期刊区域分布指南《我国各省发行的期刊总数达到14758种,《中国知识网期刊》8013种国内学术介绍了杂志。
页期刊资源整合服务平台和中国知道网没有数据提供商。这些都收录了中文出版杂志。两者之间有6745之差。因此,从期刊列表根据文献类型,了解网络查重中的背景资源总量明显不足。2.网络检查的结果包括参考文献部分检查系统的设计检查结果。未包含引用的字符总数。相应文本的复制率不反映参考部分。在论文检测过程中,出现了参考计算现象。
包括引用增加文章复制比例,影响正文正常复制显示。3.因为网络报道的列表不正确,所以网络检索的重量系统的检测范围包含互联网资源。在搜索结果中,网络上的文章列表只显示年份,而不显示具体时间。此外,通常在检测到时间范围后一览显示文档。
对这样的现象,经过多篇文章的测试,发现这些网络文章的显示没有改变整体的复制比例,但是网络文献的系统误解对结果没有太大的影响。4.论文中提取的失真,经过对这些论文的报告的详细调查,发现问题来源于从这篇论文中提取的失真事实。
从网络数据库中直接选择选定的论文,以确保论文的原始状态。考试中,发现了很多结果出乎预料。主要形式如下。①显示乱码。
系统调用数据库的原始检测文件,全文报告表显示为字符化。显示了搜索结果的字符总数和整个文本的复制比,但在乱码比较中明显无效。②部分抽取。当检测到
篇论文时,系统会错误地调用数据库中的文本。如果只提取论文的第一页或最后一页,不可避免地会导致调查结果的单方面结果。报表中的字符总数与实际字符数非常不同。
对应的整个文字的复制率也是部分的。不能如实地反映文章的实际情况③页面被误读。如果编辑器不满足完整的版式,
将充分利用每一个版式,其余部分将由另一篇文章的页面补充。这篇文章有几种PDF的原创版本。其中有其他文章的内容。如果您调用这样的原始文本,结果将显示字符总数的递增量,并且相应的整个文本的复制率会失真。
.网络检索的结果中,文章本身包含在几篇文章中。报告会在重复的文章列表中显示文章本身。也就是说,文章本身会重复查找文档。排除原始文本,降低文本复制率。
.同一篇论文根据时间的不同,调查同一篇论文,但时间段不同。网络检索的结果也有差异。在不同的时间查阅同一篇文章,锁定的检查时间范围一致。7.引用表示不被识别①有几篇论文的作者举例说明了论文的几个部分在写论文时使用了别人的观点。
检测系统不能从意思的角度判断,总是将该部分作为复制定位。②制作了标准参考标记的论文的检查系统的程序设计的参考部分可以不复印,但是即使参考标记清楚,系统也有很多无法识别的情况。这是不正确的判断。③经常有人把别人的意见作为自己论文的论据,或者支持自己的论文。
这个部分用引号括起来。检测系统不将引号定义为参考标识符,搜索结果与文档列表相同。引用标记通常用于复制处理。