学术不端,狭义来讲,主要包含抄袭/剽窃(把别人的当做自己的)、造假(篡改数据或无中生有);广义来说,不符合学术道德规范的行为,都是学术不端,比如说发表论文时挂空名、乱挂名、一稿多投等等。其中,造假问题多出在自然科学论文,因为数据为实验获得,而实验的可重复性成为论文造假与否的试金石(比如河北科技大学的韩春雨基因编辑实验无法重复)。相对于社会科学而言,由于大量研究使用的是公共数据,即作者并不接触原始数据的生产过程(不排除在对公共数据进行处理之后进行造假,比如运用计量工具的过程中通过变量或样本的操作以控制显著水平等),但是出现了“天下文章一大抄”的诟病,也就是抄袭的问题。
抄袭跟剽窃怎么区分呢?剽窃,就是别人的东西,而且是不允许你借用的,比如人家写好了准备要发表的文章,结果还没发表的时候被你看到了,你偷过来,署上自己的名字,当成自己的东西发表了,这就是典型的剽窃(比如湖大刘梦洁剽窃云师大案)。可以看出来,剽窃这个事,伤害了知识产权的所有者,也就是说,剽窃过程中你制造出了一个受害者,所以说,各种学术不端中,剽窃是罪名非常重的。
抄袭,简单来说,就是不具名的引用。比如你用了别人文章的一个观点,这个时候你应该进行引用标注。如果你没有标注原作者,无论你是蓄意的,还是不小心遗漏了,都构成了抄袭的嫌疑。为什么说是嫌疑,而不是直接“定罪”?比如有人抄袭了一句话,他可以不承认抄袭,坚持宣称这句话是他自己写的,只不过与别人一摸一样,巧了!有没有巧的情况?即两个作者想到一块去了,措辞也一样,最后真的写出了一摸一样的句子,但是确实谁也没抄谁?这样的情况是可能存在的。这样的话,还怎么分辨是不是抄袭呢?
这个时候复制比/重复率的概念就出场了:一句话你有概率完全重复,那么一段话你还有可能完全重复吗?一个章节的文字呢?重复的越多,抄袭的嫌疑就越大,也就越容易被“定罪”。所以,有一句话一模一样也许说明不了什么,但是如果一篇文章跟另外一篇文章的重复率超过10%,我们就有理由相信其中存在抄袭;如果超过15%,那么抄袭的问题就较为严重了,如果超过20%,是必须要追究责任的(当然,不同的单位、学科,对复制比的要求可能不一样,但总体而言,都会要求在30%或35%以下,越好的单位或期刊要求也越严格)。
这么来看,是不是复制比在10%,甚至在5%以下,就万事大吉了呢?
也未必。如果你是一个学术界的名人,就如同被放在了聚光灯之下,再小的错误,都会被圈内的舆论所放大:“2004年,美国哈佛大学法学院著名宪法学教授却伯被爆出,在其1985年出版的著作《上帝拯救这个尊崇的法院》中,有几处借用了政治学家亨利·亚伯拉罕1974年的名著《大法官与总统》的文字。事实上,却伯的这篇著作只是针对普通读者的通俗文章,并非学术文章,所以未在文章中标有脚注和尾注,只是在背景文献中提及亚伯拉罕教授的那部著作。即便如此,却伯的这个疏忽仍被旁人抓住把柄,成为攻击对象。却伯后来痛定思痛,向亚伯拉罕教授和学术界公开致歉。哈佛大学也未护短,成立调查委员会处理,发表报告认为却伯违反学术伦理。(http://xscx.scu.edu.cn/info/1004/3449.htm)”
“有几处”、“非学术”、“背景文献提及”,都不行,只因“未在文章中标有脚注和尾注”的引用,可见,若是站在学术之巅,连鞋里的沙子都容不下。
综上所述,所谓学术不端,是存在一个灰色过渡地带的,并不是“触碰了就会死”,还得看你触碰到什么类型和什么程度。就我国学术圈而言,最近十年是不断加强规范的十年,但在过去这几十年中,圈内人也了解,我们是经历了一个“从不规范到规范的逐步发展的过程”,如果非要用今天的严格标准去算历史旧账,恐怕要伤及极大一批对规范“从懵懂到恪守”的“学术良民”。当然,若你是学术巨擘,你的意义就超出了自身,而是对学术届的形象负有义不容辞的责任,那么你的历史旧账也会被“格外关注”,相比之下,我们普通的“学术民工”们,对曾经的学术不规范之处怀有敬畏之心,在今后的学术道路上严格要求自己,这就算是对我们自己和我们这个时代的一个合理回应了。
图片来自: