博名知识网

您现在的位置是: 首页 > 问问经典

每天有100多篇论文,人工智能无法替代它!辞去医学研发总监职务后,她成为一名大学警察

2020-06-19 17:41:09博名知识网
大数据文摘作者:戴琼琼,奥地利vi阿林强烈警告!首先让我们感受一下连连看的地狱水平:这是16个小数据块。您可以看到哪些块相似吗?消化细菌会头晕一阵子,但是,您相信吗?有人可以用肉眼立即看到相似之处,这是她的日常工作。“连连看大师”是伊丽莎白·比克(ElisabethBik),他被称为跨国论文欺诈之王,专门研究论文中的异常现象。现在,他对超过49个

  

  大数据文摘

  作者:戴琼琼,奥地利vi阿林

  强烈警告!

  首先让我们感受一下连连看的地狱水平:这是16个小数据块。 您可以看到哪些块相似吗?

  

  消化细菌会头晕一阵子,但是,您相信吗?有人可以用肉眼立即看到相似之处,这是她的日常工作。

  

  “连连看大师”是伊丽莎白·比克(Elisabeth Bik),他被称为跨国论文欺诈之王,专门研究论文中的异常现象。 现在,他对超过49个国家/地区的研究学者公开发表的论文提出了质疑。

  她的特殊技能是可以用肉眼浏览许多生物医学论文,并寻找可重复使用的图像。 这些重复的图像包括通过复制,翻转,移动或旋转图像的一部分来创建“新的”实验数据。

  2019年11月,在南开大学大学校长曹雪涛教授在PubPeer(可以匿名讨论论文的网站)上,获得了40多篇论文的实验图像数据,并被怀疑重复出现异常。(曹教授的质询此后已被更正)

  到2020年2月,她质疑我国三大医院的400多篇论文作为工厂写作。 论文中的实验图像数据和写逻辑存在问题。

  本月初,比克对中国医学科学院动物研究所所长秦川团队提出了质疑。 在《自然》上发表的论文有重复的图像。 五天后,秦川团队回应:病理实验数据图片的误用已提交给Nature进行纠正。

  没错,她发现这些异常现象的原因是瞪眼。

  在走上防伪之路之前,Bik还是一名普通研究人员。

  1997年,Bik结束了在荷兰乌得勒支大学的研究工作,从理学硕士到博士后。 2002年,她进入斯坦福大学担任助理研究员。 她从事人类和哺乳动物研究已有15年。微生物组的发展方向,直到2019年“全职”防伪工作开始。

  小事故声名远播

  Bik论文的防伪工作始于2013年,当时发生了一次小事故。当时,出于好奇,Bik搜索了他发表的论文中引用的参考文献。 出乎意料的是,其他人没有遵循学术规范来指明参考文献。

  然后,在审查博士学位论文时,她发现了其中一个实验图像:蛋白质印迹的分布非常奇怪。 更奇怪的是,她还在论文的另一章中看到了该图像。此图像是两个不同实验的结果,但是Bik认为该图像不仅是一个问题,而且还用于两个不同的实验。

  因为该论文已经公开发表,所以为了防止其他研究人员由于此错误论文而开始错误的研究,她向该期刊的编辑发送了一封电子邮件以解释该问题,并于6月在PubPeer网站上发布了该论文。 同年。对该文件进行了匿名审查。

  经过一番调查,相关的论文被撤回,涉嫌篡改数据的这篇论文使Bik声名远播。

  接下来,Bik迷上了伪造的实验图片。 由于阅读论文非常耗时,因此她辞去了一家制药公司的研发总监的工作,而专注于防伪。

  比她在工作中,Bik对伪造文件更感兴趣。 她每次提出一个以上的问题,甚至提出数百个打包的问题,并通过与该期刊的编辑联系,迅速纠正或撤回异常的论文。草案。

  魔眼:防伪渠道

  由于论文数量众多,她还找到志同道合的朋友一起工作。 Bik负责筛选论文,并将筛选出的问题论文的结果传递给两个朋友:微生物学家Arturo和Fang进行审查,就像论文是假装配线一样。

  他们对20,000余篇论文进行了抽样调查,发现782篇论文具有重复图像。芳说:“比克就像魔术师,只有指出后才能看到纸上的问题。”

  Bik的日常生活是早上开始阅读报纸。 有一天,她收到了比利时一位科学家的要求信。 信中写道:请帮助我看看附件中的实验图像是否有问题?

  Bik仔细查看了该图像,发现Western blot图像异常。 通常,Western印迹带分布(检测生物样品中蛋白质的一般测试结果)是模糊的,类似于光滑的黑色毛毛虫,但是图像的边缘非常清晰,像素化特征非常明显。

  正常的实验图像可能具有相似的印记分布,但不太可能会出现完全相同的分布。

  当然,可能存在压缩图像的痕迹,或者研究人员在准备图像数据时不小心上传了重复的图像,而旧显微镜上的斑点会在每张照片上造成奇怪的斑点。她还需要参考本文的其他部分,以确定重复图像是否存在问题。

  坚持和苦恼:“做一个诚实的科学家真的很困难”

  尽管她在自传中称自己是直率和卑鄙的人,但同时又极为克制。

  她成名后,许多人向她发送了电子邮件和消息。 我希望她能帮助您查看已发表的论文是否存在任何问题。由于人数众多,她不禁发布推文:由于询问的人太多,她可能无法及时跟进。在这些帮助信息中,团队或同事之间仍然存在不信任感:“做一个诚实的科学家真的很困难。”

  尽管Bik对当前的防伪工作充满热情,但他仍将受到威胁和骚扰。例如,他们经常被私人消息骂,Twitter经常离线,并向前同事写电子邮件说坏话。

  您知道,散文防伪行业不仅是她作为杂文警察,而且还使用她的真实姓名来发布防伪信息。

  她开始在每篇文章的开头写道:本文不是对学术不端行为的批评。

  随着Bik继续打击假货,她的歌迷人数在一年内增长了两倍。她不仅自己搜索问题,还找到了有问题的论文,该论文已预先发布在Twitter上,看谁能先找到问题,然后召集所有人一起找出错误,这是第一个正确解决问题的人 得到了奖励,甚至粉丝也发现了她没有发现的隐藏蛋。

  她保守地估计至少有172篇论文被拒绝,并进行了300多次修订。

  每天阅读100篇论文,并建立图像复制检查系统

  Bik每天可以密集阅读约100篇论文,并将1到20个匹配数据添加到她的数据库中。当重复出现的问题图像反复出现并再次出现熟悉的问题图像时,系统将提示。当收集到足够的图像数据时,系统可以自行总结法律,例如,反复遇到问题的研究人员将专注于审查。(敲黑板警告)

  尽管Bik说她没有针对任何人,但数据库中问题最严重的研究人员的国籍是中国和印度,而且重复出现的图像更倾向于影响力较小的期刊。

  根据该数据库,Bik正在与计算机科学家合作开发一种自动重新检查图像的软件,以期在数百万篇论文中找到重复的图像。

  纽约雪城大学的计算机科学家丹尼尔·阿库纳说:“不幸的是,我们不能克隆伊丽莎白·比克。” 他的团队专门研究有问题的图像检测算法。 尽管Bik擅长在单张纸中查找重复图像,但计算机可以通过比较数十万或数百万张纸来帮助查找两张纸之间的重复,这对人类来说几乎是不可能完成的任务。

  2018年,Acuna的团队在bioRxiv预印本服务器上发布了分析的初步结果。 分析结果从760,000篇论文中提取了200万张图像。

  可以更换AI吗?

  事实证明,计算量太大,无法将每个图像相互比较,但是该团队研究了同一位作者在论文中和整个论文中的图像重复。 在手动检查了由软件标记的3,700多个匹配图像的样本后,研究人员确定了40篇异常论文,其中几乎一半涉及同一幅图像,用于代表不同论文的不同结果。

  当前的技术擅长检测重复,翻转或旋转的相同副本。Resis具有可以检测纸张是否使用重复图像的软件。问题是,例如,两个图像共享一个小的重叠区域,但在其他方面却完全不同。此时,该软件无效。

  Bik为Acuna提供了更多样本数据以训练机器学习算法,该算法包含大量重复的图像数据。Elsevier也正在开发相同类型的数据库。 当前有500个生物医学样本数据,主要来自缩回纸的图像数据。

  Bik对当前可用的软件不满意。她认为将来会有计算机程序要显示,但是人们总是需要检查结果,尤其是在某些情况下要检查图像,并且有一些类似的情况。

  这样,比克倒了杯咖啡,坐在桌旁继续看报纸。 落地窗到处都是果树和植物。

  https:// www。性质。com / articles / d41586-020-01363-z

  https:// scienceintegritydigest。com /

  https:// scienceintegritydigest。com / 2020/02/21 / the-tadpole-paper-mill /

  http:// www。每周一次。cn / society / 2019-11-18 / 7721shtml

  https:// mp。微信。qq。com / s / zDLgvRQ9rgUGu-CPqtEzIQ

-