如果作者让人工智能完成所有工作,研究存储库ArXiv将禁止作者一年

ArXiv是一个广泛使用的预印本研究开放存储库,它正在采取更多措施来打击科学论文中粗心使用大型语言模型的行为。
尽管论文在经过同行评审之前就发布到该网站,但arXiv(发音为“存档”)已成为计算机科学和数学等领域研究传播的主要方式之一,该网站本身也已成为科学研究趋势的数据来源。
ArXiv已经采取措施打击越来越多的低质量、人工智能生成的论文,例如要求首次发帖者获得知名作者的认可。在由康奈尔大学主办20多年后,该组织正在成为一个独立的非营利组织,这应该使它能够筹集更多资金来解决人工智能溢出等问题。
在其最新举措中,arXiv计算机科学部门的主席Thomas Dietterich周四发帖称,“如果提交的内容包含无可争议的证据表明作者没有检查LLM生成的结果,这意味着我们不能相信论文中的任何内容。”
迪特里奇说,无可争议的证据可能包括“幻觉参考资料”以及法学硕士的评论等。如果发现此类证据,论文作者将面临“arXiv的1年禁令,随后要求后续提交的arXiv提交必须首先被信誉良好的同行评审场所接受”。
请注意,这并不是完全禁止使用法学硕士,而是坚持认为,正如Dietterich所说,作者对内容承担“全部责任”,“无论内容是如何生成的”。因此,如果研究人员直接从法学硕士那里复制粘贴“不恰当的语言、抄袭的内容、有偏见的内容、错误、错误、不正确的参考文献或误导性内容”,那么他们仍然要对此负责。
Dietterich告诉404 Media,这将是“一击”规则,但主持人必须标记问题,部门主席必须在实施处罚之前确认证据。作者还可以对该决定提出上诉。
最近的同行评审研究发现,生物医学研究中捏造的引文正在增加,这可能是由于法学硕士——尽管股权地说,科学家并不是唯一因使用人工智能编造的引文而被抓到的人。