layout: post
title: "SCIgen与野鸡期刊的梗"
date: 2019-04-28 19:06:21 +0800
---
做者:吴甜甜
我的博客网站: wutiantian.github.iogit
SCIgen 这个程序的诞生,就是为了戏耍学术界的那些“野鸡期刊”。
这些只以盈利为目的的野鸡期刊也叫掠夺性期刊(Predatory journals),学术质量与信誉都很低。github
由于平常不堪骚扰,麻省理工学院(MIT)计算机科学与人工智能实验的几个学生就看不过去了。
2005年,Dan Aguayo、Max Krohn 和 Jeremy Stribling三人,决定向这种”水”得不行的期刊和会议宣战。post
SCIgen 的原理很简单,有些相似于填词游戏。网站
学术论文的格式是很是类似的,它自己就充满了专业词汇和固定的句式。而 SCIgen 则可以从固定的词库中,随机抽取出这类计算机领域内的专业术语,以符合语法的方式生成文本。再加上一些漂亮的图表和详细的参考文献等,就能骗过很多外行。人工智能
但这个软件真没多厉害,内行人一看就知道全文是在“胡说八道”。orm
要怪,就怪一些期刊和会议灌水得太过度了。blog
不出所料,他们第一篇自动生成的论文就攻破了 WMSCI(World Multiconference on Systemics, Cybernetics and Informatics)会议的防线。这篇论文名为《Rooter:处理接入点与冗余的典型合一方法》,看似高大上其实内容根本不知所云。
而 WMSCI 会议,不但接受了这篇假论文,还邀请做者出席会议做报告。游戏
这下可高兴坏了 MIT 三剑客。ci
毕竟在这以前,他们就据说 WMSCI 会议以接受水货著称,但没真想到他们竟然这么水。pdo
因而,他们便把 SCIgen 攻陷 WMSCI 的事情通过发到网上。
一波嘲讽下来,这在科研圈立马引发了普遍的关注。
毕竟你们早就看不惯这些掠夺性期刊和会议。
愈来愈多人开始使用 SCIgen 产出的“钓鱼文”在其余学术期刊“试水”。
而他们留下的这款软件,则将学术界搅得天翻地覆。
如今 SCIgen 的访问量依然惊人。每一年的浏览量仍超过 60 万次,无数钓鱼文在源源不断地产出。
这致使了这个页面,隔几个月就要崩溃一回。
https://pdos.csail.mit.edu/archive/scigen
我也试着打开网页,输入本身的名字拼音,生成了一篇Deconstructing Voice-over-IP的文章。
发现增长几我的名,效果仍是关于这个相似主题,因此每一个人名不会给几篇形成混乱。
看了这7页文章,貌似也比较正规,外行人特别是大二学生知识量如下的极有可能被忽悠。文章关于“IP”与“语音”周边的概念与公式,例如信息量公式摆上去貌似增长理论依据,其实仅仅是周边概念的拼凑。
但这一论文思路也提供了一个思路:想投SCI这种高级期刊,就要有极大的“创新”。什么是创新?别人没想到的,就是彻底不相干的东西拼凑,若是这拼凑符合逻辑那就是优秀,若是不能予以证实那就是水货。