在毕业之前,一个固定的查重率数字是每篇论文的必经考验。根据教育部发布的《本科毕业论文(设计)抽检办法(试行)》,自2021年1月1日起将每年进行一次本科毕业论文抽检,抽检对象为上一学年度授予学士学位的论文,抽检比例原则上应不低于2%。这也意味着,对于各高校的本科毕业生来说,2021年将成为需要提交毕业论文查重报告的第一年。
教育部关于印发
《本科毕业论文(设计)抽检办法(试行)》的通知
“抄袭更可恶的地方或许在于,很难证明它的存在、尤其很难确证它的存在。”厦门大学法学院的教授的周赟老师也曾经面对过查重中令人哭笑不得的局面——自己合计25.5万字的结题成果,计算机查重显示全文重复比例达8.9%。机器认为他的成果中超过2万字是抄袭的,这让周赟老师十分尴尬和恼火。
学术研究需要对既有理论和研究进行对话,依附于以往的研究加以深入,但是没有人知道如何用最精准的方式锁定学术不端。一边对学术不端的谴责从未停止,一边对查重的声讨也愈加火热。一届又一届毕业生们困在了被不信任的怪圈中,试图证明自己的学术“清白”。
01
火爆的查重:翟天临动了谁的蛋糕?
2019年,演员翟天临在微博发布了自己被北京大学光华管理学院博士后科研站录用的信息。而后不久,他却在一次直播中却反问网友“知网是什么东西”,一时激起众全网的愤怒。翟天临事件引发了学术界对学术不端行为的重视和整顿,还有网友戏称2019年为“天临元年”。
翟天临事件直播截图
事实上,在翟天临事件出现之前,国内高校对学术不端现象也早有重视。据中国教育报报道,清华大学自2018年秋季学期开始将为全校教师提供教学过程中课程作业的查重服务,系全国首个对学生课程作业查重的高校。查重系统包括横向检测、纵向检测、校内互检,防止学生课程作业存在的各类内容抄袭现象发生。
我国对于硕博论文的抽检工作主要来自于国家出台的两份文件规定。2014年,国家出台《关于加强学位与研究生教育质量保证和监督体系建设的意见》,明确提出要开展博士、硕士学位论文抽检工作。同年,国务院学位委员会和教育部联合发布了《博士硕士学位论文抽检办法》。根据相关规定,硕博士论文抽检出问题后,论文作者、导师、研究生院都会面临相应的处罚。论文作者会被撤销学位,导师也会被停止招生。这也是高校对论文抽检工作高度重视的原因。
“没有人年年恨天临,但年年有人恨天临”。翟天临事件引起了全社会对学术不端现象的广泛关注,使得一众高校对学术不端的现象尤为重视,而这也是翟天临年年活跃在毕业季话题的主要原因。以复旦大学对本科生论文、厦门大学对研究生论文的查重率要求为代表,部分高校的毕业论文查重率要求有着较为明显的提高。其中,清华大学的要求相对严格,以本科生8%、研究生5%的查重率作为毕业的基本要求。
随着2021年年初教育部《本科毕业论文(设计)抽检办法(试行)》的施行,高校的毕业论文查重标准与审核要求大幅提高,很多毕业生对“天临三年”的“本科毕业论文第一年提交查重报告”这一要求本身也表现出了很多不适应。毕业生小唐是上海某高校广播电视学专业的班长,她作为消息的“中转站”帮助学院教务老师传递关于毕业的各项重要事宜。面对着“第一次本科毕业”和“第一年本科查重”,不仅她和同学们,老师们也显得有些手足无措。她认为“学院的教务老师对于这方面的工作也是摸着石头过河,例如提交全文报告还是简洁版报告不够清楚、对学校提供的查重机会说明不够等等,同学们也遇到了很多问题,非常麻烦。”
小唐认为“学校给的查重机会只有两次,如果第二次查重还没有达到要求的话,就要面临着无法答辩的局面。”由于学校提供的查重次数有限,为了防止论文重复率过高不合格,大多数学生都会提前自行查重。这便导致了查重服务的巨大需求。
查重服务的巨大需求产生还在于忽视不同学科的特定,追求使用查重率评定的“一刀切”之中。和小唐同一个学院的小宇是广播电视编导专业的本科毕业生,他选择拍摄纪录片作为自己的毕业设计。对于查重,小宇也苦不堪言:“我的毕设是拍片子,应该把我的片子作为毕业考核的标准。可是我的创作阐述也要查重,如果超过15%的查重率就不能评定优秀毕业设计,这太不合理了。”
当我们在大谈特谈抵制学术不端的口号以及查重的硬性指标时,鲜有人关注的“查重产业”这块蛋糕正在悄悄做大。根据第七次人口普查报告显示,目前我国具有大学文化程度的人口为万人,其中2021年高校毕业生将达到909万。根据教育部预测,2022年高校毕业生将超过1000万人,在未来,查重产业的需求将会更加惊人。如果按照每位毕业生查重两次、每份约50元的价格粗略估算,每年将会产生约2000万份报告、花费约10亿元人民币——而这相当于中央财政每年用于奖励4.5万名优秀全日制研究生的国家奖学金总额。
由于查重要求变得更严、需求不断增长的现实,查重服务变得更贵几乎成为了必然,一些商家有了涨价的充足底气。半月谈微博发起的关于“大学生为论文查重降重需要花多少钱”的投票显示,有1/3的人选择了“千元左右”这一选项。据统计,在诸如毕业季的需求旺期查重价格直线攀升,越临近论文提交的截止日期,价格越高,差距甚至达到了5到10倍。
然而,面对飙升的价格,令人更加触目惊心的是查重机会的来源渠道和背后的违法勾当。CNKI(知网)科研诚信管理系统研究中心官网的公告上显示,鉴于学术不端检测的严肃性,知网学术不端检测系统一直仅向机构提供服务,不针对个人提供服务。因此,市面中可以被购买的知网查重机会,大多数来自各掌握知网资源的部门,甚至来自于盗取学生账号售卖其中的免费查重机会。
CNKI(知网)科研诚信管理系统研究中心发布的公告
2018年广东中山市警方就曾接到过此类报案。警方调查发现,当地高校账号被盗用的学生人数多达两百余人。同时,还有商家用山寨网站提供虚假查重报告进行诈骗、将学生提交的查重论文进行转卖等违法行为。据新华网报道,2018年6月广西某大学的研究生二年级学生小杨的毕业论文遭到查重平台的泄露被转卖,陷入了自己“抄袭”了自己的尴尬境地。
02
降重的大赛:拿什么拯救我标红的论文?
相较于国内,国外的学术不端检测起步较早,发展相对成熟。Turnitin软件从2000年开始开展防抄袭服务,是全球最权威的英文检测系统,现被90多个国家7000多所高校采用。而我国学术不端检测软件最早于2008年研制成功并投入使用,包括中国知网、万方、PaperPass等。目前,国内提供学术不端检测服务的机构有10余家,各具所长。
那么,我们该选什么样的查重平台?和小唐同班的毕业生小晴告诉我们,她进行了三次查重。一次自费在PaperPass进行查重,一次使用了万方平台为毕业生提供的免费查重机会,最后使用并提交在学校提供的知网查重系统中,总共花费了几十元。但是,平台之间的查重率略有不同——“万方和知网查重差不多,浮动在1—2%之间。但是PaperPass的查重就会比他们高5%的样子。”
在惊人的数据差异背后,是各大查重平台不尽相同的数据库。例如,本科毕业论文知网查重中的“大学生论文联合对比库”。这是知网系统独有的一个资源对比库,主要收录的是历届本科毕业生的优秀毕业论文。除去本科毕业论文,其他的论文(期刊论文或者研究生硕博论文)则不需要经过此数据库的对比,而这是众多本科毕业论文的查重数值在知网中飙升的主要原因。
无独有偶,翟天临的硕士毕业论文《“英雄”本是“普通人”——试论表演创作中的英雄形象与人性》也存在这样的现象。同样的论文文本,在目前六家主流查重平台上最大差距可以达到62个百分点。据澎湃新闻报道,该论文以陈坤本科毕业论文《性格化表演之我见》引用占比最高(17.6%),涉嫌抄袭,全文还存在至少20处出现错别字、重复、语句不通等问题。
同时,各大查重平台的算法也不尽相同。以使用较多的万方查重系统为例,万方采用的是“句子级正交软聚类倒排索引算法”,这意味着万方平台可识别长句相似、长短句混合相似、基于词组相似以及连续多个小短句相似。但是,各平台的算法模型都是一个个未被打开的黑箱,并没有告知一个客观的标准。毕业生在与系统“抗争”的过程中,总结出了一套判断重复的规律,例如以句子为最小单位、连续13个字重复、句子中心意思和关键词、段落中超过5%的相似将被检测等等。
在查重平台算法的统治下,毕业生的论文写作变成了一场“降重大赛”。众多网友在互联网社交平台中贡献了自己的降重智慧。小晴表示,“一些普遍的表述,甚至是你自己写的东西都会标红(意为查重系统判定为抄袭的语句)”。中国青年报·中青在线记者2018年就调查发现,已有大量的商家具备一条规避查重软件的专业化、流程化的生产线。在一些网站及网上店铺,不到一分钟即可得到根据论文抄袭程度和修改要求得出的“合理”估价。一篇总长字,要求查重率从22%降到5%的论文,店铺的报价从840元到860元不等。
降重操作不等于万事大吉。“我的论文绝对原创,一点抄袭都没有,结果为了降重,把名人名言、专业名词全改了,还让不让人好好写论文了?”有些论文经过降重修改后往往变得面目全非,令人啼笑皆非。例如一些论文中无法更改的专有名词、目录、甚至致谢在算法中也被标红。对此小晴也深有体会——她论文中的谢辞“感谢老师的帮助让我能够顺利完成本科阶段的学习”被查重报告大大地标红,不禁感慨“知网就不能能把谢辞刨掉再进行查重吗?”
03
信任的螺旋:因不信任而起,因不信任而终
毕业生小谷是翟天临“锲而不舍的黑粉”,她曾在社交媒体痛斥“通宵的第三天,翟天临,恨你恨得那么深”。而这缘于翟天临2021年6月24日凌晨发布的微博——“我知道写论文的过程挺难的,如果骂我能帮助大家缓解论文季的压力,那我觉得被骂也是一件有意义的事。希望大家文明宣泄,宣泄完了加把劲儿,加油!保过(保佑过)”。
翟天临发布微博
时值新一年毕业季,和小谷一样的毕业生们也开启了新一轮对翟天临的声讨。从某种意义上来说,翟天临的微博评论区已经成了当代毕业生的一面“互联网哭墙”,被无数的毕业生攻占。在采集的条以“翟天临查重”为关键词的转发微博中,包含“允悲”表情的占据了大多数,网友更多的是以情感宣泄为目的。在#翟天临,睡了吗#这一话题下,有网友戏称“翟天临只有设立查重基金,才能获得大家的原谅”。
当骂翟天临时,我们都在骂些什么?以“翟天临查重”为关键词的微博中,网友依然关注翟天临的学术不端问题,但随着时间的发展,人们开始关注查重乱象、学术要求提高、是否该以查重率作为决定性的评判标准等更深层次存在的问题。
翟天临热度居高不下的原因,在于人们对学术不端行为的重视。我国对学术不端的关注开始于上世纪90年代。1996年专注于揭发我国学术不端行为的“新语丝”网站创办,之后我国学术界开始出现对学术不端现象的相关解释性研究。指标作为决策工具,其功能是帮助决策者评估价值。而查重指标是最易操作、也是当前最流行的学术不端防治手段。可以说,查重是因不信任而起的产物。
经过十余年的发展,查重系统在实践中不断进步,算法、操作、服务等方面均有所改进,但仍然存在相似度判定盲区等问题,如此唯论数据亦会阻碍学术的发展。究其根本,因不信任而起、因不信任而终的螺旋是我们不信任的标准,以及标准不信任的我们。
04
结语:查重率为谁而降?
查重率为谁而降,我们都清楚并不是为了翟天临。对查重率带来的困境,一味的迷信指标无疑是残忍的。在冷冰的数字背后,被隐匿的是“不应如此”却“不得不如此”的学术发展之路。
翟天临的出现是毕业生们的发泄口,也是查重率指标的警示器。它真正警示我们的,是如何揭开论文抄袭常态的怪圈、如何推动学术生态的建设。学术“不信任螺旋”产生的真正原因,或许正是不带思考地加入“辱骂翟天临的狂欢”的我们。
(文中小唐、小宇、小晴、小谷均为化名;
数据来源图中均有标注;部分图片来自互联网)
参考资料
[1]澎湃新闻:马上评|我被“查重”逼得去改名人名言了
[2]中华人民共和国教育部:教育部关于印发《本科毕业论文(设计)抽检办法(试行)》的通知
[3]南风窗:论文查重是个什么鬼
[4]中国教育报:清华大学今秋开始对学生课程作业查重,预防学术不端行为
[5]中华人民共和国教育部:《关于加强学位与研究生教育质量保证和监督体系建设的意见》等文件
[6]人民日报:研究生学位论文将抽检博士论文抽检10%硕士论文抽检5%
[7]中华人民共和国中央人民政府:图表:第七次全国人口普查主要数据
[8]中国青年网:2021届高校毕业生总规模预计909万人同比增加35万
[9]中华人民共和国教育部:高校研究生奖助政策问答(一)研究生国家奖学金
[10]CNKI科研诚信管理系统研究中心
[11]重案组37号:论文查重“黑市”:电商售价几元到上千,有商家以山寨网站欺骗消费者
[12]左边社科学术圈右边:明明是自己写的论文,怎么被别人发表了?
[13]郭卫兵,&叶继元.(2019).学术失范、不端检测软件的功能、局限与对策——以学术研究规范为视角.图书馆论坛(3),2-9.
[14]澎湃新闻:翟天临学术不端调查:硕士论文被指抄袭陈坤本科论文
[15]中国青年报:论文查重火爆背后:降重代写成公开秘密,用文字游戏掩饰抄袭
[16]郭卫兵,&叶继元.(2019).学术失范、不端检测软件的功能、局限与对策——以学术研究规范为视角.图书馆论坛(3),2-9
[17]张乾友.“被指标治理”模式的生成及其治理逻辑[J].探索与争鸣,2021(02):107-116+179+181.
[18]半月谈:论文查重是为防止学术不端,不能让其异化为逐利工具
数据来源
教育部公开文件、各高校及其学院公开文件、各查重平台公开信息、早检测网、新浪微博自采数据、慢慢买比价网、知乎公开问答等
作者团队
刘佳琪张宇昭
联系方式
指导老师
卞清
同济大学艺术与传媒学院出品