12月22日消息,科学领域正掀起一场大规模的论文发表热潮,这在很大程度上得益于人工智能技术。《科学》期刊刊登的一项新研究表明,在多个学科领域里,运用ChatGPT等大语言模型(LLMs)的科研人员,论文产出数量明显增加。这项技术也在为母语非英语的科研人员提供帮助,使得科研竞争的环境更为公平。
人工智能在科研领域的应用愈发普遍,这让人们开始担忧会出现粗制滥造的研究成果以及机器生成的不实内容等问题。不过,这项新的分析也显示,利用大语言模型撰写的论文,其语言表达更为复杂,引用的文献
人工智能分析方法
为了量化人工智能对科学论文发表产生的影响,康奈尔大学和加州大学伯克利分校的研究人员,对2018年1月到2024年6月这段时间里,三大主要预印本论文平台上发布的近210万篇研究摘要展开了分析。这些论文都还没经过同行评审就已经对外公开了。
据IT之家了解,在开展分析时,研究团队借助聊天机器人模型 GPT-3.5 Turbo-0125,生成了 2023 年之前发表的论文摘要的人工智能改写版本。随后,他们从中提炼出人工智能文本区别于人类文本的特征模式。基于这些发现,团队开发出一套算法,用以扫描近年发表的论文,通过识别相似特征标记出人工智能辅助撰写的成果。研究人员还对论文作者进行了长期追踪,以此衡量他们的论文发表量变化情况。
科研产出大幅增长
研究表明,科研人员运用人工智能工具后,工作效率显著提升。具体来看,社会科学和人文科学领域的论文产出增长最为明显,高达59.8%;生物与生命科学领域的增幅是52.9%;物理学与数学领域的增幅则为36.2%。研究团队在报告里提到:“大语言模型的使用,和科研人员学术产出的大幅增加存在紧密联系。”
这项研究里有个特别值得关注的发现:母语不是英语的国家的科研人员,他们的成果产出量有了显著增长。因为多数顶尖期刊都规定投稿论文得用高水平的英文来写,这一要求长时间让这些科研人员处于比较被动的劣势地位。不过,在人工智能帮忙承担了一部分工作之后,亚洲地区的科研人员在某些学科领域的论文产出增长幅度最高达到了89%。
不过,该研究的作者同样就人工智能和论文质量之间的关联提出了警示。虽然人工智能可以让论文的表达看起来更具专业性,可这也或许会变成一个圈套。以前,出色的写作能力常常是高质量研究的象征,但现在情况有时候会完全相反。研究表明,人工智能生成的文本语言越是复杂,论文的质量反而越可能不高。也就是说,华美的文字或许会遮掩住不够扎实的学术论点。
研究作者的核心观点在于:评判论文质量时,不能再仅仅依据其语言文采。“传统的评判标准正逐渐失去效力,在此背景下,期刊编辑和审稿人或许会越来越依赖作者的学术背景、所属机构等身份标识,并将这些作为判断论文质量的依据。但颇具讽刺意味的是,这种做法会削弱大语言模型在促进科研成果民主化过程中所起到的作用。”
为了维护科研诚信,研究人员提出了一系列举措建议,具体包括:各科研机构应推行更深入的审核机制,甚至可以引入专门的“人工智能审稿智能体”,以帮助辨别文本究竟是由人类撰写还是由机器生成。