2025年8月4日股莘配资,美国西北大学的里斯·理查森(Reese Richardson)等人在顶级期刊《美国国家科学院院刊》(PNAS)发表题为The entities enabling scientific fraud at scale are large, resilient, and growing rapidly(推动大规模学术造假的实体组织规模庞大、韧性强且正迅速扩张)的研究论文。作者理查森同意将论文内容摘译成中文以便中国读者阅读。论文和相关资料摘译如下(删减部分不特别注明,[ ]内为译者注):
理查森等人在PNAS发表的论文(2025年8月4日)
(https://doi.org/10.1073/pnas.2420092122)
摘要
科学的特征包括合作与协作,同时也伴随着不确定性、竞争与不平等。长期以来,人们一直担心,这些压力可能促使部分人背离科学研究的道德准则,也就是未能真实地为知识生产或专业人才培养做出贡献。不过,以往的关注大多集中在个别人的行为上。然而,近年来关于协同作假的报道有所增加。有观点认为,互联网的通信便利性和开放获取出版制度为某些实体的出现创造了条件——例如论文工厂(批量制造低质量和伪造研究的卖方)、中介(连接造假研究的生产者和出版者的渠道)、掠夺性期刊(对稿件不进行任何质量审查)。这些实体共同推动了系统性学术造假的发展。在本文中,我们通过案例研究展示:1)一些人合作在多个期刊中发表了最终被撤回的论文;2)中介机构大规模地促成了这些论文在目标期刊上的发表;3)在一个学科领域内,并非所有学科同等地受到造假活动的侵害。我们的结果揭示了这些促进科学造假实体如何规避干预的策略。最终的分析表明,这种规避能力正在推动造假出版物的数量以远超正规科学出版的速度增长。
前言
过去四个世纪以来,科学知识的生产日益成为国家和社会的重要事务。科学家与国家之间的“契约”可以概括为:科学家为国家创造有用的新知识,并培养能够运用这些知识的专业人才;作为交换,社会为科学家提供有保障的职业发展、优厚的薪资待遇和公众认可。这一契约的成功推动了科学事业在规模和范围上的空前扩展,也使其在全球范围内被广泛采纳。事实上,一些研究表明,一个国家的财富与其产出的研究数量和质量密切相关。
国家资助下的科学事业可以理想化地视为一个公共物品博弈(public goods game)[这种博弈探讨了在社会合作中个人利益与集体利益的冲突],涉及众多不同的利益相关者。由于知识的复杂性和专业化程度不断提高,这一体系日益依赖于对所有参与者做出真实贡献的善意假设。科学家依赖其他科学家披露可供继续研究的知识,依赖其他科学家和出版机构对研究进行筛选,依赖出版机构传播其成果,依赖资助机构和大学提供支持。大学和资助机构依赖科学家评估同行的研究成果,并依赖国家和社会的财政支持。私营企业依赖大学培养具备知识能力的劳动力。国家和社会则依赖科学家生产能改善福祉与国家安全的知识。
如果某些利益相关者未能公平地履行分配给他们的职责,这种模式的成功将会面临威胁。随着科学事业在规模和范围上的扩大,衡量利益相关者贡献程度的方式越来越依赖一些可能具有误导性的替代指标。尽管这些替代指标存在争议,它们却迅速成为衡量机构和个人影响力的主要工具,导致竞争日趋激烈,资源与奖励的分配愈加不平等,从而使科学事业更易受到“背离行为”的侵蚀。
所谓“学术背离”(scholarly defection),是指在未对知识生产或专业人才培养做出真实贡献的情况下,仍从科学契约中获益的行为。一项于2002年对美国国立卫生研究院(NIH)资助科学家进行的调查显示,0.2%的中期职业研究人员和0.5%的初级研究人员承认在过去三年中伪造过研究数据。一项对1995年至2014年间发表的两万多篇论文的系统分析发现,其中3.8%的论文存在不当图像重复,其中至少一半的案例显示出蓄意篡改的迹象。
有一类专门从事大规模科学造假的实体,通常被称为“论文工厂”,它们销售批量生产的低质量或伪造的研究论文。在2022–2023年间对中国西南地区三级医院住院医师进行的一项调查中,46.7%的受访者自述参与过买卖论文、代写或被代写的行为。一些出版商报告称,他们收到的稿件中最多有七分之一可能来源于“论文工厂”。近期有报道指出,“论文工厂”的代理人不仅试图贿赂期刊编辑,甚至在某些期刊中“劫持”(hijack)了整个编辑流程。
许多公共物品博弈的研究告诉我们,在某些条件下,参与者的贡献倾向于随着时间推移而减少,且当“背离者”(即不合作者)数量增加时,整体贡献会大幅下降。为了阻止背离行为并维持合作体系,公共物品博弈必须引入抑制背离行为的机制。为此,科学界已经建立了一些正式的惩戒机制来制裁背离行为者。资助机构可以对个体研究者或大学施加制裁,例如罚款或取消其参与资助项目的资格。大学可以解除研究人员的聘用合同。期刊可以通过撤稿的方式对作者进行惩罚。数据库可以通过将期刊“剔除”(即撤销其索引资格)来施加惩罚。除了正式惩罚之外,还有一些非正式措施,例如将背离者排除在科学家的私人信任网络之外、公开羞辱,以及在发表后审查平台上记录问题等。然而,已有的证据表明,这些机制尚未能有效遏制背离行为的蔓延。
在本文,我们展示了可以通过现有文献中留下的痕迹,识别出由众多合作个体和实体组成、从事大规模学术造假的网络。我们发现,有一些人在期刊中从事编辑或审稿工作,并与作者合作,促成一些稿件的发表,而这些稿件后来被专家(包括期刊编辑)认定为与作者或编辑不当行为有关。我们证明了这些制造虚假科研成果的组织,在被识别和清除之前,能够确保其论文在多个出版商旗下的期刊上成功发表。我们还发现,这些参与可疑稿件生产的组织能够逃避现有的科研诚信和质量控制机制(如剔除期刊),并能精准地锁定某些学科进行投机性操作,同时避开或忽略与之密切相关的其他学科。最后,我们展示了,造假论文的数量正以远超正常论文增长的速度迅速增加。
材料与方法
(略)
结果
有问题的出版物的编辑处理中的异常模式
许多科研人员想当然地认为,学术造假是一种罕见现象,通常仅由个别个体行为所致。然而,越来越多的证据表明,学术造假可能是一种更为广泛的现象;背离科研诚信者会有选择地“瞄准”特定期刊,以便推动大规模虚假科研的发表。为了验证这种可能性,我们分析了几个会公开责任编辑姓名的期刊的数据,并检验是否存在某些编辑比随机概率更频繁地处理问题论文。
PLOS ONE是公开责任编辑信息的期刊之一。自2006年以来,该刊共发表了276,956篇论文,其中702篇被撤回,2,241篇在PubPeer上被评论。我们统计了PLOS ONE中18,329位编辑各自接受发表的论文数量,以及这些论文在每个出版年份中最终被撤稿的数量。
我们发现有22位编辑处理的论文被撤稿的频率显著高于随机期望;若将PubPeer评论纳入考量,则被标记的编辑人数上升至33位。我们进一步分析是否有作者比随机预期更频繁地将稿件投至这些被标记的编辑手中。我们再次使用泊松二项检验,并调整了编辑在不同时间段的活跃程度。在我们可明确识别身份的PLOS ONE作者中(占总作者数的8.8%),有21人更倾向于被已标记的“撤稿编辑”发表,18人更倾向于被“PubPeer编辑”发表,达到统计学显著性。
我们标记出的45位PLOS ONE编辑仅占总编辑数的0.25%,却处理了1.3%的论文,并关联了30.2%的撤稿论文。而在这45人中,有超过一半(25人)自己发表的论文也曾被PLOS ONE撤稿。
为了揭示这些人之间的关联,我们构建了一个网络,描绘他们在PLOS ONE期刊中的出版关系。尽管我们无法获取他们在其他期刊上的关系信息,仍能在 2020 至 2023 年期间识别出一个密集连接的编辑群体。这些编辑分别隶属于四个不同国家的机构,但他们大多数互相处理稿件,而非随机分配给其他编辑。在该编辑群体所接收的论文中,超过一半已被撤回,且撤稿声明几乎一模一样:“此为一系列投稿中的一篇,我们对其作者归属、利益冲突和同行评审存在担忧。”为验证结果稳健性,我们采用更严格的显著性标准进行复核,结果未发生变化。
图1:PLOS ONE中编辑与作者协同发表可疑论文的证据。(C)发现编辑接受了异常数量的论文,这些论文后来被撤回(第二行),后来在PubPeer中被评论(第三行)。圆圈表示一位编辑,圆圈的面积与他们接受的论文数量成正比。(E)被标记为撤回的个人之间的出版互动和/或PubPeer评论。圆圈来表示一个人,圆圈的大小与他们作为编辑处理的接受论文的数量成正比(范围1至852篇)。圆圈内的黑色楔形表示该编辑接受的论文中后来被撤回的部分。标记为PubPeer评论的个体具有蓝色边界,标记为两者的个体具有紫色边界。个体由从作者指向编辑的箭头连接,每个箭头的宽度与该编辑为该作者服务的论文的总数成比例被标记的个人经常处理彼此向PLOS ONE提交的论文,特别是在2020年至2023年的编辑组中(右下角的集群)。
这些异常现象并非PLOS ONE独有。Hindawi系列期刊同样公开每篇论文的责任编辑。在附录中,我们展示了对撤稿数与PubPeer评论最多的十种Hindawi期刊的分析结果。在这些期刊中股莘配资,我们发现有53位编辑被标记为频繁接收最终被撤稿论文(其中6位在多个期刊中出现);52位频繁接收被PubPeer评论论文(4位跨期刊)。
协调生产虚假科研成果
异常模式不仅存在于同行评审的编辑处理环节。事实上,可以认为“论文工厂”具备大规模制造虚假研究的能力。因此,我们进一步探究:虚假科研成果的生产是否存在协同操作,以及论文工厂是否通过协作控制期刊,并在科学文献中留下可识别的痕迹。
为开展此项研究,我们利用了造假研究的一个典型特征:图像重复。我们构建了一个网络,其中包含2,213篇因图像重复被标记的论文(作为节点),以及它们之间的 4,188 条图像重复记录(作为边)。尽管图像重复意味着这些研究没有按照文中描述的进行,但至今仅有34.1%的相关论文被撤稿。
按照我们的工作假设,论文工厂通常是批量生产和发表论文。在这种模式下,每一批论文可能重复使用同一组图像,从而在图像共享网络中表现为同一个模块。这一假设还意味着,每个模块内的论文倾向于在相同时间段、发表在相同或相近的期刊上。我们发现,几乎所有模块中共享图像的论文出版时间高度集中,并集中出现在特定出版商旗下的期刊中。
我们观察到的这些异常模式,与如下运作方式高度一致:论文工厂与中介合作(或自身充当中介),通过掌控目标期刊的部分决策权,从而在同一时间内将一整批造假论文送入同一刊物发表。正如前文所示,只需少数期刊层面的“背离者”配合,这种策略即可成功实施。
期刊瞄准与“跳跃”行为
前述工作假设的一个推论是,论文工厂具备在特定期刊和出版商体系中“保证发表”的能力。然而,随着时间推移,部分期刊可能不再受到论文工厂客户的青睐,或因其他原因变得不中用。例如,某个被论文工厂广泛使用的期刊若被WoS或Scopus剔除,则对许多仅认可索引期刊的学术机构来说,该期刊的吸引力将大幅下降。因此,我们预期论文工厂所利用的期刊组合会随时间变化。这种适应性行为我们称之为“期刊跳跃”(journal hopping)。
我们识别出一个具有上述行为的实体:ARDA。该组织在官网上公开宣传其提供“会议与研讨会”“期刊发表”“论文写作”等服务。截至2024年6月,ARDA官网宣称其已参与“4,565+篇发表成果”。2018年1月以来,ARDA网站上共列出过188本可供客户选择的不同期刊,该列表随时间不断变化。这些期刊中,有106本被Scopus收录,51本被WoS收录,29本同时被两者收录。值得注意的是,ARDA的业务明显扩张:从2018年1月的14本期刊增长至2024年3月的86本。在这些期刊中,有17本(9.0%)被怀疑是“被劫持期刊”(即原本为合法期刊,但后来被论文工厂接管编辑权并控制其内容)。
图2 ARDA业务保持着不断发展的目标期刊组合
被ARDA列出的期刊被剔除的概率远高于所有期刊的基线水平。具体而言,2020年被ARDA列出的39本Scopus索引期刊中,有13本(33.3%)随后被剔除;而当年所有活跃[未停刊的]Scopus期刊的剔除率仅为0.5%。ARDA对期刊组合的调整常常与期刊被剔除密切相关。例如,一批在2020或2021年被Scopus剔除的期刊,于2021年5月被从ARDA网站上下架,并被新期刊取代。据我们所知,这是首次有证据显示一个涉及欺诈性出版的实体本身存在“期刊跳跃”行为。部分被这些组织“瞄准”的期刊,其年度发表量迅速上升,这一现象进一步支持“期刊跳跃是一种普遍行为”的假设。
在ARDA所列期刊中发表的许多论文,其内容远远超出了该期刊的既定研究范围。例如,一篇关于烘焙榛子的论文出现在一本关于艾滋病护理的期刊上;一篇关于恶意软件检测的论文出现在一本特殊教育期刊中。我们对五本期刊进行全面审查,发现其中有34.0%至98.7%的论文内容与期刊的声明范围不符。在这些期刊中,有不少论文的作者来自多个国家(占比10.1%),这支持“论文工厂出售作者署名位置”的假设。这一发现与另一个假设形成对比:即论文工厂产品的特征是缺乏国际合作。论文工厂、掠夺性期刊和中介机构很可能采用多种作者招募模式,包括针对本地学者的模式(导致缺乏国际合作),以及向全球学者出售署名权的模式(导致出现不合理的国际合著现象)。
不同学科领域中造假的分布差异
如果虚假科研成果的传播是有组织且系统性的,那么其在科学领域中的分布也不会是随机的。相反,某些学科可能成为重点攻击对象,而其他领域则相对“幸免”。我们发现,问题论文高度集中在少数几个学科。最严重的问题论文集中出现在那些论文工厂和中介明确提供服务的学科。这些领域包括“计算机科学”、“教育”、“商业与管理”。
我们识别出ARDA所涉期刊涵盖的56个学科。其中,数学、商业、管理、会计和工程领域中的ARDA论文占比异常高。最严重受影响的学科并不总是符合直觉。例如,“营养与饮食学”、“药理学”等领域虽然看起来并非论文工厂的“理想靶标”,但它们受到的影响非常严重。这些领域中,不少出现了问题论文比例的突然上升。例如,“临床药理学”领域中,自2019年以来发表的论文占了该领域所有PubPeer评论与撤稿论文的75%以上。
图3 与生物医学研究密切相关的学科的勘误率与其他领域相似,但撤回率不同。关于lncRNA和miRNA与癌症的研究的撤回率的峰值约为4%,这种错误率不太可能解释为善意的错误,而是指向学术造假。
我们还发现某些学科的问题论文密度极高,远高于该领域论文总体的平均水平。例如,“分子医学”领域中,不仅有大量论文被PubPeer用户指出存在问题,其撤稿论文也占该领域总撤稿量的一半以上。
造假论文的增长速度
从参与学术造假的实体的协调程度和规模来看,我们发现期刊的撤稿通知现在主要是以10篇以上的论文为一批发布。人们可能会认为同时发布的撤稿通知是出于相关原因。
我们还发现,在过去的30年里,撤回论文的数量呈指数级增长。值得注意的是,我们发现在PubPeer被评论的论文数量也呈指数级增长,这证明了出版后同行评议工作的巨大影响。我们注意到,撤回的论文和在PubPeer被评论的论文的数量分别每3.3年和每3.6年翻一番,而出版物的总数每15.0年翻一番。然而,可疑的论文工厂产品每1.5年翻一番。值得注意的是,可疑的论文工厂产品现在超过每年撤回的论文,预计很快就会超过在PubPeer被评论论文的数量。
图4 造假论文的增长率明显高于整体
如前所述,剔除期刊是一种强大的机制,可用于捍卫科学文献的完整性。文献数据库可以索引数万种活跃的出版期刊。为了回应对编辑实践的担忧,其中一些数据库会剔除期刊。WoS和Scopus每年剔除约100种期刊。虽然这看起来是一个很大的数字,却只是出版论文工厂产品的期刊数量的不到十分之一。
对有限的资金和工作岗位的竞争,促使科学家和雇用他们的组织不断努力提高规模、效率、影响力,并评估这些指标的增长。虽然处于科学事业顶峰的一组选定的国家、组织和个人可以获得这种非凡增长所需的资源,但更多国家并不具备这周条件。研究表明,感知到的不公正与研究不当行为有关,缺乏机会和培训通常被认为是不当行为的驱动因素。因此,资源可获得性的日益不平等可能导致学术造假的规模不断扩大。然而,即使有了资源,研究仍然是一项高风险的活动,人们事先并不知道一项研究是否会成功。当人们只需支付相对较少的费用即可轻松获得原本需要大量工作才能产出的出版物和引文时,为什么还要冒着研究失败和职业发展受挫的风险呢?
与不同利益相关方的讨论表明,目前许多人认为系统性的学术造假只发生在“真正的”科学事业的边缘,即经合组织国家(OECD)[由38个国家组成的国际经济组织,主要为发达国家]之外。越来越多的证据表明,系统地生产低质量和造假的科学可能发生在任何地方。此外,正如我们在这项研究中所表明的那样,北美和欧洲的大型出版商及其任命的编辑为这些做法提供了背书。在科学事业刚刚起步的国家,这些做法的影响可能会更直接、更强烈地感受到,但这种影响绝不局限于这些国家。
我们揭示的趋势预示着科学事业未来的严重风险。大量编辑和作者似乎合作促进了出版欺诈。连接起的欺诈论文网络表明已经形成了工业规模的生产。中介在预测并对抗数据库的剔除和其他干预措施。某些领域的文献可能已经因造假而受到不可挽回的损害。
学术造假的活动规模已经超出了当前旨在防止造假的惩罚措施的范围。目前实施的惩罚措施并没有解决学术造假的蔓延。首先,在剔除期刊上发表的论文仍然是一些数据库中科学文献记录的一部分。其次,撤稿的情况仍然相对较少,远低于人们对[期刊处置]明显造假论文的合理预期 。在我们语料库中疑似论文工厂的产品只有28.7%被记录已撤回。根据当前趋势推断,我们估计只有大约25%的可疑论文工厂产品会被撤回,只有大约10%的可疑论文工厂产品发表的期刊将来会被剔除。总的来说,这些发现表明,现有科学记录和未来科学的完整性正在因科学家们推断彼此工作的可信度的系统的缺陷而受到损害。
改变科学文化和激励机制是一个缓慢的过程。许多利益相关者的参与是改变所必需的,他们是从现状中受益的人。然而,在我们看来,鉴于局势的严重性,需要采取紧急行动。(我们的研究所依赖的)是由勇敢但孤立的个人带头的。有些人被指控“私设刑堂”,有些人失去工作,其他人则受到法律诉讼的威胁。我们需要建立一个更健全、更系统的制度,更难解雇或欺负那些提供造假证据的人。首先,也是最重要的,我们需要将公正的问责制度所要求的不同任务分开:发现、调查和制裁。
这些任务中的每一项都需要从潜在利益冲突的当事人手中移除。期刊编辑已经获得了快速出版选定手稿的大量报酬,并且协调编辑行动已经涉及到提高期刊影响因子的努力。同样,研究机构在调查自己的科学家时存在利益冲突。此外,在问题所需的规模上进行检测不能留给少数孤立的志愿者。它需要人力和技术资源,至少,需要更多的研究来描述控制系统性学术造假的不同实体,以及开发一个统一和全面的词汇来描述它们。
一个主要挑战是缺乏针对我们在这里报告的行为类型的综合框架。科学中的不道德行为通常被视为个人的品格失败,而不是由一群个人和实体实施、促成和促进的事情。事实上,即使是“论文工厂”等现在标准术语的定义仍然模糊不清。我们描述的一些组织可能更适合被描述为“中介”而不是论文工厂。我们也无法确定我们的观察结果在哪些方面是由于商业化的论文工厂的参与,或者它们是在哪些情况下由于在非商业基础上运作的不太正式的同行网络而产生的。这种复杂性就是我们建议使用背离的博弈论概念的原因。我们认为这是一个有用的观点,因为它不是从伦理的角度而是从理性的角度来构建某些行为。然而,“背离”一词意味着从规范行为到非规范行为的重新调整。对于许多低年级博士生和崭露头角的科学家来说,[他们无法改变,]从事[被定义为的]背离行为可能会成为他们工作中新的常态。
最后,明确强调大规模学术造假对新兴尖端方法构成的风险是很重要的。“机器科学家”和大语言模型(LLM)都有望帮助科学家和公众使用科学文献中的知识。然而,这种方法还不能区分高质量的科学与低质量的或欺诈性的科学,并且随着欺诈性的科学出版物的数量增加,这项任务只会变得更加困难。
理查森的博客:科学事业生死攸关的时刻(2025年8月4日)
(https://reeserichardson.blog/2025/08/04/a-do-or-die-moment-for-the-scientific-enterprise/)
今天,我们的文章“大规模实现学术造假的实体规模庞大、有弹性且增长迅速”发表在PNAS 上。该文章现已完全开放获取!在PNAS上查看和下载。
(略)
如果说公共产品游戏模型提供了任何预测,那就是当前的范式,即学术背离才是制胜策略,真正做贡献的人一定会被淘汰。我们都会因此而变得更糟。任何研究过工业化学术造假的人都看到了我们科学事业的未来,任何被美国政府取消资助的人也是如此,任何被告知必须每年发表 X 篇论文的人也是如此,任何曾经购买过论文工厂产品的人也是如此。
我看到了科学的未来。它由激烈的竞争而不是合作、华丽而不是探索所统治。聪明的头脑开始从事科学事业,将被教导要贬低他们的训练,因为苦差事地追求毫无意义的指标。那些愿意为真正的问题而苦苦挣扎的人必然会输给那些能够提供廉价答案的人。
全世界的许多科学家已经生活在这种现实中。所以,我们都可以。如果这一愿景成为现实,人类将失去其最强大的进步引擎和最丰富的奇迹源泉。
除了每个科学家最熟悉的座右铭之外,我只剩下什么话了:我们必须立即采取行动,以免为时已晚。
《自然》杂志新闻:大型期刊PLoS ONE 确定了容易撤回的编辑
(https://www.nature.com/articles/d41586-025-02446-5)
这项研究 1 于 8 月 4 日发表在《美国国家科学院院刊》( PNAS )上,发现 45 名编辑仅处理了 PLoS ONE 在 2006 年至 2023 年发表的所有文章中的 1.3% ,但他们接受的论文占该期刊截至 2024 年初发表的 702 篇撤稿的 30% 以上。其中 25 名编辑还在 PLoS ONE 上撰写了论文,但后来被撤回。
PNAS 的作者没有透露 45 名编辑中任何一位的姓名。但是,通过独立分析来自 PLoS ONE 和撤回观察数据库的公开数据,《自然》杂志的新闻团队确定了五位编辑,他们处理了最多的论文,这些论文随后被该杂志撤回。截至 7 月 14 日,这些编辑总共接受了PLoS ONE 撤回的论文的约 15%。
“系统性欺诈在文献中留下的足迹如此之大,以至于不可能只是几个糟糕的作者,”PNAS 研究的合著者理查森说。“期刊任命的编辑内部存在共谋,导致这种情况发生。”
(下略)
博星优配提示:文章来自网络,不代表本站观点。