毕业论文怎么降重?有什么技巧么?算法
论文降重实际上是一件很简单的事,摸清套路后彻底不须要花费太多精力。可是知乎上目前好像没有技术帖讲清楚,因此我分享一下具体经验。因为知网价格很高,终稿以前通常都是用其余查重网站查重。这里给出一个评测文章,介绍了十个查重网站,颇有参考价值。亲测10个论文查重平台,告诉你哪一个最靠谱! 我根据这个帖子体验了几个查重网站,最终发现确实是papertime和paperfree最为价廉物美。这两个网站貌似是同一家公司的,都送新用户10000+字,因此咱们能够用包括但不限于父母、叔叔阿姨、爷爷奶奶等全家人的手机号注册新用户,而后就不再用花钱了。根据给出的重复对象来源能够看出这个网站的算法和重复率比较靠谱。构成鲜明对比的是格子达,给出的重复文献来源能够与我写的句子八杆子搭不到边。最后根据经验,若是在paperfree/time能降到10如下,在知网应该就稳了。我我的从初稿的20%降到如今的3.76%。(更新:同份文本在学校知网检测的结果为1.2%,多是由于知网的单句检测算法不如papertime严格。其实还有降低空间,只不过不必再改了…)值得一提的是,这两个网站均可以在线改重。对比红/黄句和重复文献来源以及句子类似度,能够针对性地修改,边改边查效率很是高。手把手降重攻略1、首先摸清楚查重的算法。Papertime的算法是:整体类似度 = 类似字数 / 检测字数被系统自动识别出来的非正文部分(如目录,标题,公式,图表,参考文献等)不参与检测,检测字数通常略小于论文字数。类似字数 =(句子1字数 * 句子1类似度 + 句子2字数 * 句子2类似度 + ...... + 句子n字数 * 句子n类似度),句子类似度范围0.00~1.00,绿色句子类似度按照0计算。红色句子为重度类似(80%~100%),建议修改;橙色句子为轻度类似(50%~80%),可酌情修改;绿色句子表示没有检测到类似语句。简单概括:(其中i句类似度>50%为有效,<50%记做0)简单理解:查重时把文章分解为一个个小句,根据某个算法算出单句类似度。把其中类似度大于50%的句子的类似字数加总再除以论文总字数即为重复率。单句类似度这个概念彷佛比较玄学,网站没有明确说明算法,可是咱们也能够简单理解一下,大概就是“我写的某个句子和已有文献句子的相同字数占该句子总字数的百分比”之类的东西。最重要的一个信息是:类似度>50%的句子才会被标黄,类似度>80%的句子会被标红。类似度<50%的被标绿而且类似度被计为0.2、那咱们的降重目标就很清晰了,一共有两个途径:①下降每句类似字数,以下降总类似字数;②把句子的类似度下降到50%如下,那么这句类似字数直接就变为0了。咱们发现这两个途径其实同样。可是②的效果更显著,由于能直接把句子变绿(要坚强)从而大幅降重,因此对于大多数句子,咱们的目标显然是用方法②把他变绿。。。固然还有一些句子很是坚强,好比“根据图2-1咱们能够看到,...”这种句子就比较难绿,可是整体而言难绿的句子很少,因此把重复率降到5%如下是不难的。3、具体措施咱们目前看到的大多数降重思想都局限在方法①,即没有目的地用同义词替换、把字句被字句转换等方法尽力下降类似字数。可是有了科学思想的指导,咱们的修改方向就更清晰了。1.首要争取对象——50出头像这种类似度50%出头的黄色句子是首要争取对象,由于只要改几个字就能变绿,从50直接变成0,于是在降重工程中最受欢迎(你们都争着绿他,非常可怜)。
改为“这进一步说明了IIT现象更易发生于初始要素禀赋相近的国家间”后,绿化成功。2.短句合并成长句增长分母这种定义引用类的红色句子,类似度88%,应该无可救药了吧?可是查重分解句子是会根据标点的,我删去句子后面的逗号,将短句连成长句以增长该句的分母,对语序作了调整,最终居然硬生生把这句定义给绿化成功了(请叫我绿化小达人)。修改后的句子:“SITC分类规定的相同组别中具备必定生产或消费替代程度的产品的双向流动”,绿化成功√。我也不知道这样一改类似度怎么就降到50%如下了,可是这种思路能够借鉴,就是短句并长句增长分母。同理也能够经过扩句增长分母,其精髓在于用本身的语言稀释干货(注水绿化法),以下降类似度。如“A致使了B”改为“C带来的A致使了D现象的产生最终形成B的结果”,其中C和D能够扯得越长越好,这样句子类似度会大大下降。
3.长句分解为短句弃卒保帅总有些专业词组几乎不可能修改,并且在句子中占的比重过大,须要战略性地放弃修改这些部分,把他们独立成一个短句分离出去以方便后面句子的绿化工程。例如:Nuno 和Faustino(2009)运用面板数据模型对葡萄牙和金砖国家贸易中的产业内贸易水平影响因素进行的实证分析代表,一国资源禀赋的数量与该国产业内贸易发展程度存在负相关性。这个长句子开头部分的“Nuno 和Faustino(2009)...”一堆字符是没法改变的(名字换成中文也一样被人写过了),很是占空间,即使把后面的内容加长不少也很难把整个句子的类似度降到50%如下。这个时候能够放弃小部分的降重,把前半句改为独立的句子“Nuno 和Faustino(2009)一样对IIT影响因素进行了研究。”后面也改写成独立的句子“他们应用面板数据模型进行的实证研究发现,在葡萄牙与金砖国家的双边贸易中,初始的天然资源对该国对外贸易的IIT指数具备负面的影响效应”。这样虽然前面的句子依然重复,可是舍弃了大段没法改变的重复字符后,后面的句子就有了被绿化的可能,总体的重复率仍是会下降。4.无可救药型直接删去下面这个红色的句子估计被无数人用过了,你们也极可能已经尝试过用各类姿式♂绿他,因而知难而退,索性直接删掉,也不影响文章的意思。
4、经验总结总之在线改重功能很是好用,可是仍存在该网站和知网查重率不一致的问题,在一些状况下查重率误差很大。重复率有差别的缘由主要在两处:一是算法严格程度差别;二是网站背后的数据库大小差别。知网本科论文查重与其余网站的最大区别在于知网pmlc有【大学生论文联合对比库】,这个数据库收录了各学校历年的毕业论文。若是大量引用被知网数据库收录而未被其余网站收录的语段,那么在其余网站检测出的重复率就会显著低于知网重复率。可是若是主要内容都是本身认真写的,那么知网查重结果和其余网站结果不会有太大差异。事实上因为其余网站为了弥补数据库较小的问题,一般会采用更加严格的算法使重复率往接近知网的方向修正,所以认真写的论文在知网的重复率极可能比其余网站更低。(案例A:某同窗前几天私信我说paperpass重复率39%,可是他说本身真的是认真写的。我就建议他在学校知网上试一次,结果出来居然是6.9%(固然在用知网查以前他本身也修改过一些)!这说明在某些状况下paperpass的算法过于严格)相信大多数同窗仍是坚持原创,那么用paper系列确定能知足需求了,降到5~10%不是什么难事。对于大量借鉴的同窗来讲,在paper系列网站在线改重也是有帮助的。上面的降重技巧也一样可借鉴。数据库