百万彩票

当前位置: 百万彩票 > 查重资讯 > 知网查重 > 关于知网查重系统和原理这些你可能还不知道

关于知网查重系统和原理这些你可能还不知道

时间:2020-03-20 22:28:15 编辑:毕业帮

知网查重原理?

我们都知道,在知网查重系统中,是以「连续多个字重复」做为识别标准。

各大高校使用最多的一般都是知网检测系统,要降重首先我们需要了解一下查重的原理,掌握这个原理可有效降低重复率。

1.1 对比库

在知网中有一个对比库,我们的论文上传后都会与对比库中的资料进行对比,以检测内容是否涉及抄袭。

这个对比库是由国家专门指定的,来源基本都是中国的学术期刊文库,中国的硕博士论文数据库等,库中内容基本上都是专业性比较强的内容,因此有很多书本内容以及国外的资料都不在库中。

疑问

说到这,可能有些小伙伴会问,既然论文库不包括书本,那我干脆疯狂抄书不就不会重复啦?首先要夸你一句——你可真是个小机灵鬼,可惜已经有其他机灵鬼用过这个方法了,他们的论文也早已收入了论文库,所以你懂得。

而且,现在的情况是不仅识别文字,还可以识别图片、代码、mathtype 编辑的公式,并将论文中的图片、代码、公式通通还原到报告单中。

此外,2019 10 26 日,知网查重系统进行了一次重大升级,算法更加严格,检测范围更广,还增加了一个对比库——源代码库。就说瘆人不瘆人!

1.2 检测标准

知网检测系统,对论文的分节是以「章」作为判断分节的。封面、摘要、绪论、第一章、第二章等等这样一系列的都会各自分成一个片段来检测,每一个片段都计算出一个相似度,再通过这样每章的相似度来计算出整篇论文的总重复率。

1.3 抄袭/引用标准

对于抄袭或者引用,知网查重时设定了一个阀值——3%,即规定了以论文的一个章节的字数来算,如果其中与对比库中重复的内容不超过字数的 3%,就不会被判定为抄袭。

问?

说到这,可能又有部分小伙伴问,如果通过修改,让自己的论文任意一句话都找不到连续多字与别人的文章相同,这样不就检测不到啦?

这次恭喜你,这个方法还真可行,如果能抓住这个特点,让你的论文任何一句话都找不到连续多字相同或相似,那么重复率自然能降下来,只不过这个修改过程可得花费不少功夫。