最近南开大学校长、中国工程院院士曹雪涛被曝出40多篇论文涉嫌学术造假,数据图有PS痕迹。 曹院士是免疫学大牛,在全世界的学术地位都极高!但学术界是一个特别容不得造假的地方。这一锤下去,半个科研圈都惊得信仰崩溃了。 微博网民一开始喷曹院士骗子,再喷南开药丸,后来质疑曹的这个院士头衔估计也是骗来的。 但我坦率地说,大部分网友一不知道曹院士是谁,二吃不懂学术瓜,喷得很不理性。今天请允许我以我浅薄的学术水平,在此详细分析一下曹院士的前前后后。01 事件的时间线 事情起源于11月14日,美国生医领域学术打假专业户Elizabeth Bik在推上表示,发现某中国大牛的论文图片有问题。她讲得很隐晦,没有点名。 随后我国打假专业户方舟子直接点名:此人是南开大学校长曹雪涛院士,有18篇论文被发现数据造假。 方在推里只配了4张图,并没有指明18篇论文是哪18篇。在国内传得最多那条微博就是方舟子的机器人小号,但我看这种阴阳怪气挺不爽的。 什么“创下世界纪录”、“墙内禁止报道”、“硕士研究气功”,净胡扯。人家硕士课题是《白细胞介素Ⅱ激活的肿瘤浸润性淋巴细胞抗肿瘤作用的实验研究》。气功的事我们后面会单说。 Elisabeth将她对曹院士数据的质疑陆续发在了论文评审网站PubPeer上。简单给大家科普一下PubPeer是啥。 论文发表的流程是:科研人员做实验-写paper-投给学术期刊-审稿通过-发表。一旦正式发表,就向全世界公开了你的科研成果。 但如果你觉得其他人的成果有问题,你就可以在PubPeer上质疑他的paper。大家都可以在这讨论,作者也可以回应。 Elisabeth一口气质疑了47篇,从2003年质疑到2019年,从水刊质疑到Science和Nature子刊,问题主要包括: 有些地方两次实验结果图像竟然完全一致!好比你说你画了两幅画,竟然每个细节都一毛一样,那我只能认为你是复印的,不可能是画的; 同一个实验图中,把部分点复制粘贴了一下,就变成了新图,这属于瞎编数据; 有些图有增添、删减的PS痕迹; 还有些是纯学术提问,这不属于我们本次关注的学术道德范畴。 论文都分为Introduction /Experiment /Results & discussion /Conclusion四部分。学术伦理要求每个科研人员都必须真实地做实验,真实地记录原始数据和图像,然后再把原始数据处理成图表,最终形成自己的成果。绝对不允许自己凭空捏造数据,否则你就是在欺骗全世界了。 但曹院士的很多paper显然捏造数据了。比如下面圈出来的几坨点,这么复杂的图居然能长得一毛一样!目测一个图是实验做的,另一个图部分是凭空P的,这就是造假实锤,跟玩连连看似的。 下面圈出来的那两大坨,也是一毛一样,目测就是复制粘贴,基本没得洗。 还有个比较扯的,他们把其中一个图转了个角度以为别人就不认识了,这种造假下次得注意不要这么明显。 曹院士昨天给出了回应:“我现在刚到上海实验室,要把这些事情查一下。我知道大家关注这个事情,查完了,我会给大家一个回复。” 昨天夜里,我发现曹院士在PubPeer上亲自下场回复了。 大概意思是:Bik博士,那些paper的确是我发的。我已经把这件事列为最高优先级,仔细检查我们的原始数据和实验记录。如果调查发现有任何问题,我们会和期刊合作处理。但我对我们成果的有效性、重现性充满信心!我的确监督疏忽,这没有任何借口。我将利用这一宝贵的学习机会,不仅在推进科学方面做得更好,而且在维护科学的准确性和完整性方面也会做得更好。 看起来很有自信的样子。吃瓜群众既然想要吃这口科学的瓜,就要学会如何科学地吃瓜。鲁迅先生说过,学术瓜得吃第一手的。下面我们就去pubpeer上看看,曹院士被锤的文章究竟有多大的问题,曹本人要负多大责任。 02 就事论事,仔细分析 (1)锤他的Elisabeth是什么人? Elisabeth是微生物和免疫领域的博士,早年在斯坦福搞了15年科研,2016年辞职专门搞学术打假[1]。 她2016年还发过一篇paper[2],专门吐槽了生物医学领域普遍有改数据的陋习,“不当图像复制(Inappropriate Image Duplication)”。 她还专门讲过国家与数据造假之间的关系:中国、印度的paper出问题的比例高,法德日美比较低。虽然很丢脸,但也没办法,就像我们平时做科研的时候碰到三哥的paper肯定都是绕着走的。 (2)曹院士的锤有多实? 先说结论:挺实的。 我上pubpeer统计了目前全部被锤的paper,记录了期刊名、发表年份、被质疑的问题、曹组同学的回应。展示如下: 一共被质疑了54篇,其中Elisabeth对学术不端质疑了47篇,主要质疑原因是一图多用和改动图片,也就是疑似把其中一张图的数据用在了其他的图里,以为别人看不出来,或者是把数据图进行了裁剪和修饰。 目前有5篇得到了曹院士或他的学生的解答,其余42篇还没下文。 我们来抽几个案例给大家说明。 比如这篇《The STAT3-binding long noncoding RNA lnc-DC controls human d |