AICon全球人工智能与机器学习技术大会8折特惠,购票立减¥960! 了解详情
写点什么

华人计算机博士在美自杀,遗书称导师逼其学术造假,“唯论文论”是时候反思了

2021 年 3 月 23 日

华人计算机博士在美自杀,遗书称导师逼其学术造假,“唯论文论”是时候反思了

悲剧背后,论文压力大,学术造假等问题,是时候引起足够的反思和重视了。

中国计算机博士在美自杀案调查结果披露

近日,伴随着调查结果对外披露,中国计算机博士在美自杀案件再次引发关注。


2019 年 6 月 12 日,美国佛罗里达大学电子与计算机工程博士留学生陈慧祥失踪。次日,他被发现于办公室内上吊自杀。


根据美国当地媒体报道,陈慧祥临走前曾给自己的家人发送过定时邮件。邮件中提到,2018 年 12 月,陈慧祥写了一篇论文准备发表,而他在审查后发现其中有重大问题,很多理论完全说不通,导致整篇论文没有任何学术价值,相当于一张废纸,除非重写。


陈慧祥找到导师李某,要求撤回论文,而李某执意要发表。最终,陈慧祥选择结束自己的生命。


陈慧祥在遗书中提到,初稿的实验设计和现象,与宣称的结论不一样,因此在初稿投中以后,他便开始疯狂完善和修改,但却在这一过程中发现了许多无法纠正的地方,以致于文章完全无法自圆其说。


“全部都错了!”如果要修改只能推倒重来,但是要在截稿日期前完成却是不现实的。遗书中,陈慧祥提到,这些数据不合理的情况,导师李某是默许的,然而陈慧祥却不愿意这篇论文给自己今后的学术生涯留下污点,“我反复考虑到了所有的情况,觉得真的无路可走。所以我通过自杀的方式来弥补我的过失。”


自杀发生后,美国计算机协会(ACM)和电器电子工程师学会(IEEE)展开了调查。


2021 年 2 月 8 日,调查团队公开对外表示,此次事件中的论文之所以能通过审核,是由于一些人故意违反会议的同行评审程序。他们联合起来共同支持某一篇文章。同时,一些明确的证据表明,尽管一位作者已经意识到论文有重大错误,也多次表达了对发布结果的担忧,但另一位作者仍然执意要发表该论文。


据国外媒体报道,陈慧祥自杀的根本原因是精神压力太大。这篇论文在短时间内成稿,随后向 ISCA(计算机体系结构国际研讨会)投稿,并通过了审核。该会是计算机体系结构的三个顶级会议之一。在陈慧祥的邮件中写道,论文能被选中的原因,是因为 6 个审稿人中有 4 个都是导师李某的朋友。


如今,调查委员会决定对所有涉及违反程序的人员采取不同程度的处罚措施。最严厉的一位被判处在接下来的 15 年内禁止在美国任何计算机协会期刊上发表文献,并且不得担任任何评审、编辑、或项目委员会的职务。这是 ACM 有史以来执行的最严厉的处罚。但在处罚结果中并未明确指出最严厉的受罚者是否为涉案导师李某。


据红星新闻报道,陈慧祥哥哥表示,目前导师李某已被停职,但家属对于学校和导师李某的态度感到寒心,拟起诉学校和李某。


据美国当地媒体报道,目前,学校允许李某继续领取 153238 美元的年薪,每学年工作 9 个月。


该事件登上微博热搜榜,引起热议。对于此事,网友们大多表示惋惜,认为不值得因为一纸论文结束自己的生命,且该事件中的错误根源不在自身。


但也有网友认为,站在陈慧祥的角度,此举实属无奈。博士生涯的巨大压力与导师的胁迫交汇,让原本就孤单的科研生活显得举步维艰,最终一纸论文成为压死骆驼的最后一根稻草。


近几年,高校博士由于论文压力过大而自杀的事件频频发生。


2014 年,在中国科学院大学的单人宿舍里,张东文服下了 1 克足以致命的毒素秋水仙素,结束了年轻的生命。生前曾称,“工作不能胜任,压力无处不在”。2015 年 11 月 7 日,武汉大学博士杨志高疑因博士论文无法通过、压力过大,在家中用一根电线结束了自己的生命。2017 年 12 月 26 日,西安交通大学博士生杨宝德被发现溺亡在西安灞河中,后来警方查明,系自杀。

论文发表学术不端现象频发,AI 顶会论文灌水尤其严重

陈慧祥的悲剧在令人惋惜的同时,也透视出了当下学界存在的学生写论文压力大,学术造假等问题,这些问题是时候引起足够的反思和重视了。


这两年,论文学术不端的现象频频出现,尤其是在 AI 顶会论文上,注水、抄袭、造假等现象屡见不鲜,令人咋舌。


去年 3 月,一位 ICML 审稿人的《自白信》火了,他在信中“怒吼”— 停止向大会提交未完稿的论文!


当我审阅到这些未完稿的论文时,我感受到了来自作者的不尊重。


这位审稿人吐槽,他所审阅的超过一半的投稿都是未完稿的论文,且这些论文存在明显的错误。而审阅这样一篇论文需要花费 6-7 小时,多则 10 多个小时。


在 IJCAI 2020 大会所提交的 5147 篇提交论文中,有 2191 篇论文被拒稿,拒稿率高达 42%,很多论文止步在了 summary reject 阶段,连正式审稿过程都没进入。这意味着有近半数的论文在质量上不达标,水分很大。


2019 年 11 月,荷兰、瑞士两位学者合著的入选 SIGIR 2019 的论文被指抄袭,部分内容与被 RecSys 2018 收录的一篇论文高度相似,仅改动个别用词,多处语句对比几乎一字不差,很难令人相信这不是抄的。


一位很有自知之明的网友认真总结了“写水论文是一种怎样的体验”,下面的评论,清一色的表示认同“过于真实”。



“有些论文水到不忍直视”,网友 A 君 吐槽道,“吹性能、编算法... 论文中很多表述简直在胡扯”。除了包含错误、论文不完整、凑字数等基础性的硬伤,根据知乎上一些大神级网友的总结,一般顶会上的灌水文还经常玩转各种套路,例如,对同一套算法换数据集,同一个问题换模型,把现有的模型 / 求解方法组合嵌套,优化问题换个 loss、 换个 regularization ,把 2 范数换 1 范数、1 范数换非凸等。


深度学习大神李沐曾这样总结灌水文的特征:小白文一般来说是基于前面的工作,做一点细微的改动,然后有理有据的把结果写下来。这样一方面通过实际动手熟悉这个领域,另一方面练习写作。但从读者的角度来说,这些小白文十有八九是灌水。


他还提到了一组耐人寻味的数据,如果回翻任一顶会前 10 年的论文集,会发现,90% 论文的主要是给作者练手,剩下的 9% 可能会启发数个人,真正能启发很多人的论文就是那 1%。


曾在学术界深耕多年后投身工业界的 AI 专家郑凛之(化名)对 AI 前线称:


即便是顶会,大部分文章都没有什么实质性创新,这称之为‘Borderline 文章’,有运气的成分在里面。

根源在于科研评价体系机制设置不合理

与论文质量下降形成鲜明对比的是,这几年 AI 顶会的论文规模实质上是不断攀升的。AI 研究热潮带动了顶会论文数量爆发式增长,规模激增后,难免有很多水论文滥竽充数。


NLP 领域专家杨明然(化名)向记者描述了他观察到的一些怪象:


一些人做科研急功近利,工作做的不扎实、不深入,很多问题没有研究或阐释清楚就着急出手,更有甚者错误连篇,文章犹如粗制滥造,对他人形成了误导。


他认为,顶会论文灌水背后与学术界的评审机制、价值取向、社会风气等因素有关。现在很多学校和机构盲目强调论文数量,且新的顶会、期刊层出不穷,论文越收越多。


在上世纪 80-90 年代,一位名校教授到退休时一般研究论文在 30 篇左右,而现在一个刚博士毕业的人年产 20-30 篇论文已如稀松平常,可见搞学术的门槛越来越低了。


唯论文论让很多学生压力山大。


如今,在顶会发论文,已成了申博的必要条件之一,对很多学生来说,如果没有在顶会发表过论文,很可能意味着很难继续申请到博士学位,也找不到好的工作。去 1 月,一位丹麦科技大学的机器学习研究生 Andreas Madsen,因为没有发表过顶会论文,申请博士学位失败找工作也四处碰壁,最终他下定决心闭关了 8 个月,终于成功在顶会上发表了一篇论文。


学术科研变得越来越现实,能够保持纯粹科研初心的学者少之又少了。


只有极少数学者想做真正的研究,大部分人都不热爱研究,只是当作一项工作而已,而业内论文导向又是事实,因此‘刷’论文”成了常态化。


郑凛之还提到国内学术界另一个常见现象:有些导师为了自己评职称,要求学生一定要发好论文,而且第一作者一定要是导师。他调侃自己“不入流”:


我属于从不给学生指标也从不抢一作的导师。


去年 2 月,深度学习先驱 Bengio 在自己的博客发文直指当下顶会论文发表模式的弊病 — 被拒再投,一稿多投,大家都在 Dealine 之前疲于赶场。他认为,这种“会议发表”模式对提升研究质量来说弊大于利,迫切需要变革。


杨明然认为,媒体对 AI 的过分炒作也助长了水论文增长。“学研工作一有点噱头,各种媒体就争相报道,完全忽视了领域专家的严格评审,扩大影响力的同时也促进了论文中稿”。


评审人质量下降被认为是顶会论文水化的另一个关键原因。不久前, ICLR 2020 的评审引发争议,在这次大会的审稿人中,有 47% 的人没有在相关领域发表过论文。跨领域审稿,显然无法保证专业度。


现在随着各个 AI 领域细分度增加,找到合适的审稿专家并不容易。有些审稿人仅是硕士水平,甚至很多审稿人并未在顶会发表过论文... 香港中文大学助理教授周博磊回顾了自己十年来投稿 CVPR 的经历,他表示,确实感受到会议的审稿意见变得越来越随机,不负责任的审稿人越来越多。


南京大学周志华教授在社交平台发出“警言”,如果投稿量远远大于合格投稿人所能承受的程度,会令顶会逐渐垮塌,或者最终只好回到期刊去了。

灌水风气如何破局?

这些顶会是国内外 AI 学者发表自己研究成果的最高舞台,如果这些会议上的论文品控不达标,注水频发,长期以往,必然会透支 AI 顶会的影响力和信任值。做不出创新性的技术研究,也会成为人工智能发展的“绊脚石”。


为了改变注水之风,一些会议已注意到在论文评审机制上做出改进,如设置过滤机制、要求提交源代码等。


IJCAI2020 今年首次引入了 desk reject 机制,SPC 会在 5-10 分钟内通判论文情况,质量不合格的直接过滤掉,这大大减轻了审稿人的压力,但因为在第一阶段就过滤掉了近一半的论文,该机制引起争议,甚至有网友表示要抵制 IJCAI。


“我学生赶 deadline,修改增加了一些文字,时间一着急就提交了,最后论文没审就被‘干’掉了,后来发现是因为论文多了一行,这样的格式问题其实也能理解”,郑凛之觉得 desk reject 机制肯定存在“误杀”的情况,但他认为为防灌水,要改进顶会论文的审稿机制其实挺难的。


评价本身很难客观,一些论文评价机制本身没有错,但执行上却并不容易,实际中就变成了‘数数’。


ICML 2019 、ICLR 、 NeurIPS 等会议也在尝试将增加实验代码和数据作为论文提交的一个选项。此前大部分投稿人并不提供研究源代码,这让复现工作难以实现。2018 年一项针对某 2 个顶会的调查显示,会议上发表的 400 篇 AI 论文,仅 6%的论文包含算法的代码,约 30%包含测试数据,54%包含伪代码。


“要是必须公开代码的话,掺水论文还怎么发表”,要求提交源代码,能在一定程度上减少论文的水分。但到底应不应该提交源代码?


有观点认为,无法复现就没有意义,迟早得强制,只追求高影响因子,不追求高可复现性的学术氛围是时候做出改变了。但也确实存在因为涉及到核心技术、数据所有权等知识产权不能公开的情况。因此综合来看,现阶段,搞“一刀切”强制提交代码不太人性化,但推出一些鼓励机制鼓励公开代码是可以的。


值得一提的是,今年以来,科技部多次发文表示要改进科技评价体系,1 月底,科技部下发通知要求科研人员“把论文写在抗击疫情的第一线,把研究成果应用到战胜疫情中”。


2 月 23 日,科技部正式印发了《关于破除科技评价中“唯论文”不良导向的若干措施(试行)》通知,通知的核心目标是改进科技评价体系,明确要求破除科技评价中过度看重论文数量多少、影响因子高低等“唯论文”不良导向。


变革不是一日之功,学术研究经年累积形成的风气和制度体系可能很难在短时间内改变,正如一位网友所担忧的“副作用”,


评价体系不好改,总不能学校养着一堆教授“摸鱼”吧?


这些改进举措是否有成效还需要时间来验证,但令人欣慰地是,科研评价体系的各个参与方已经在做出努力,期待这些不良学术风气能够在不久的将来有所改善。


最后,借用周博磊教授的一句话作为本文的结语:


保持对科研的敬畏和好奇,这条路才能越走越宽,越走越远。


(应受访人要求,文中人名均为化名)。

 

2021 年 3 月 23 日 15:142624
用户头像

发布了 69 篇内容, 共 14.2 次阅读, 收获喜欢 69 次。

关注

评论 2 条评论

发布
用户头像
觉得内容与题目不符,内容本意应该表现的是 打假。
2021 年 03 月 24 日 10:33
回复
用户头像
感觉需要一个科学的方法评判科学研究的工作成果,至少先有一个评判的方向
2021 年 03 月 24 日 09:54
回复
没有更多了
发现更多内容

中年危机,我们如何面对?

石云升

新人怎么寻求解决问题的方法

波波

编程 职场 新人

LeetCode 153. Find Minimum in Rotated Sorted Array

隔壁小王

算法

1分钟理解M2M和IoT概念

老任物联网杂谈

物联网 M2M IoT

断章取义,不一样的C/C++语言的学习策略

C语言技术网-码农有道

C/C++

从2009到2020,世界编程语言排行榜分析

C语言技术网-码农有道

编程语言

基于大疆无人机SDK二次开发

sydMobile

android 无人机

言简意赅,聊聊RPC的123事

一叶而不知秋

RPC

部署Hexo博客到VPS

ini

零基础、非计算机相关专业的如何转型程序员

C语言技术网-码农有道

程序员 转型

企业招聘的需求决定了C/C++程序员的学习方向

C语言技术网-码农有道

C/C++

new[]和delete[]为何要配对使用?

helloworld

c c++ C#

游戏夜读 | 有哪几种游戏玩家?

game1night

Centos的初步配置

玉龙BB

Docker Linux Docker-compose Centos 7

从草根到百万年薪C/C++程序员的二十年风雨之路

C语言技术网-码农有道

c++ 编程语言 C语言

终端Terminal:程序员是如何查询天气预报的?

lmymirror

GitHub 工具 命令行 terminal 终端工具

DataGrip常用快捷键

fliter

源码分析shared_ptr实现

helloworld

c c++ C#

MyBatis 3 解析mybatis-config.xml配置

杨家昌

深度解析 mybatis 初始化 XMLConfigBuilder Configuration

IT培训机构那些不得不说的事儿

C语言技术网-码农有道

IT培训机构

职场发展的思考

子不语

生涯规划 职业规划

Flutter 中SharedPreferences 的初始化?

三爻

flutter android

原创 | 类应该是匀称和均匀的

编程道与术

LeetCode 565: Array Nesting

隔壁小王

算法

MyBatis 3 XML配置

杨家昌

mybatis mybatis-config.xml XML配置 配置

Netty 源码解析(六): Channel 的 register 操作

猿灯塔

Linux初学-01

Flychen

产品周刊 | 第 13 期(20200503)

Herbert

产品 设计 产品经理 产品设计

如何消除写作过程中的痛苦,让写作变成一种享受

董一凡

写作

我们迫切需要块状时间

Neco.W

效率 时间分配 时间管理 工作效率 提升效率

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (一)什么是单元测试

编程道与术

华人计算机博士在美自杀,遗书称导师逼其学术造假,“唯论文论”是时候反思了-InfoQ