恭喜,你的论文已被我们录用。”2013年7月4日,非洲生物学家Ocorrafoo Cobange先生收到了这样一个好消息,在投稿两个月后,他终于收到了《自然生物制药》杂志的发稿通知。多年来,Cobange先生在坐落于厄立特里亚首都阿斯马拉的Wassee医学研究所工作,研究一种青苔提取物所具有的抗癌性能。
《自然生物制药》杂志号称是“经过同行审议,提供高素质论文的学术杂志”,其审稿人是来自各国大学的制药学教授。能在这样一本具有相当学术地位的杂志上刊发论文,想必Cobange先生的心里,已经乐开了花。
但显然,并没有人为这个好消息欢呼,因为根本不存在生物学家Cobange这么一个人,所谓在厄立特里亚的医学研究所也是子虚乌有。事实上,这篇“钓鱼论文”的真正作者是哈佛大学的生物学家John Bohannon。在过去的10个月里,Bohannon用假名、假单位和假论文——用他自己的话说是“任何评审者,只要拥有高中水平以上化学知识,并能读懂基本的数据图表,就应该能立刻看到论文的问题,它的实验缺陷得一塌糊涂,所有结果都毫无意义”——投给了全球304个开放出版期刊(Open Access)。
然而,超过一半的期刊接受了这篇文章。在304家期刊中,有157家表示接受,录用率近52%。一些刊物提出修改意见,但大多限于论文格式与语法问题。只有36家杂志的审稿意见提及稿件的内容,有16份评稿意见认为论文很糟糕,但还是决定录用。
这篇“骗倒半个地球”的论文,究竟写了些什么呢?Bohannon做了精心准备。首先,他专门写了一篇“粗看起来可信的普通论文,但其中有严重的错误,让合格的评审者很容易就能发现、认定它不适合发表”。论文的基本格式是:设三个变量——某分子X,来自地衣物种Y,能抑制癌细胞Z。
接下来,通过作者设计的小程序,把各类分子、地衣物种以及癌细胞组合在一起,随机填写到上面的变量位置,于是就生成了数百篇论文,除此之外这些论文其余的部分都一样。
最后,为了避免对方对作者流利的英语水平产生怀疑,Bohannon还特意把全文用谷歌翻译翻成法语再翻回英语,然后校正了那些明显的错译,得到一篇语法正确但明显不是英语母语的人写出来的文章。论文作者的名字和其所属单位都是虚构的,用非洲地名人名拼出来的。
一旦刊物答应刊登论文,Bohannon就发信称实验出现重大错误导致结论不正确,要求退稿。但居然还有刊物回信说:“尊重您的撤稿决定,但如果您打算发表这篇论文,请告知我,随时愿意为您效劳”。总体而言,“中招”的学术期刊主要来自印度和美国,此外有神户大学这样著名学校出版的,以及学术协会的,甚至包括知名出版机构Elsevier与SAGE旗下刊物。
其实,Bohannon已经算是相当有良心的钓鱼,毕竟文章还是手写的。接下来我们要见识的,是两套计算机程序,不少人利用它们自动生成的论文,已经把学术界搅得天翻地覆。
几年前,美国麻省理工大学(MIT)计算机专业的三位研究生编写了论文自动生成软件SCIgen。它能够从固定的词库中,随机抽取专业术语,以符合文法的方式生成论文。因为学术论文中大量充斥着一些专业性很强的用词和固定的句式,这种软件生成的文章乍看上去相当符合规范。再配上自动生成的漂亮图表和详细的引用文献,一篇就内容而言不知所云的文章第一眼往往能唬住不少人。
SCIgen的首次亮相是在2005年,一篇由机器生成的论文被第九届“系统论、控制论与信息论多学科国际