网易首页 > 网易号 > 正文 申请入驻

ChatGPT能给出有价值的同行评审意见吗?

0
分享至

自2022年底ChatGPT发布以来,有人注意到了一个趋势:ChatGPT越来越多地被用于论文的同行评审中

有几个明显的迹象。AI工具撰写的审稿意见往往语气正式、文字冗长,这通常与大语言模型(LLMs)的写作风格有关。例如,现在同行评审中诸如“commendable [值得称赞]”和“meticulous [一丝不苟]”之类的词比2022年之前多出十倍。AI生成的审稿意见往往也是肤浅而笼统的,通常没有针对该论文的特定意见,且缺乏参考文献。

来自美国斯坦福大学的研究者检查了2023-2024年约5万篇计算机领域会议论文的同行评审。根据写作风格和某些单词出现的频率,估计7-17%的句子是由LLMs撰写

原文链接:https://proceedings.mlr.press/v235/liang24b.html

时间不够可能是审稿人使用LLMs撰写审稿意见的原因之一 。在截止日期前提交的评审意见中,LLMs撰写的比例更高。这种趋势估计还会加剧。

LLMs的使用应该限于某些任务,如纠正语法、回答与论文相关的简单问题、识别某些信息。如果不负责任地随意使用,LLMs可能会破坏科学的完整性。因此,学术界亟需制定规范,以指导如何在同行评审过程中合理使用这些模型。

首先,必须认识到,目前的LLMs无法取代审稿人。尽管LLMs具有一定的能力,但它们无法进行深入的科学推理,有时还会进行无意义的回复。《NEJM AI》的一项研究显示,研究者普遍抱怨LLMs的审稿意见缺乏深度,尤其是在评审论文的研究方法时。此外,LLMs也很容易忽视论文中的错误。

原文链接:https://ai.nejm.org/doi/10.1056/AIoa2400196

LLMs可能适合某些场景。对于审稿人,AI聊天机器人可以帮助在提交审稿意见前提供建议,使得模糊的建议更具操作性;或者对论文中可能被审稿人遗漏的部分进行强调。对于编辑,LLMs可以检索和总结相关论文,以帮助他们了解研究背景,并验证论文的提交是否遵循了清单(例如,确保正确报告统计数据)。这些环节使用AI的风险相对较低,如果实施得当,可以节省编辑和审稿人的时间。

不过,即使在执行低风险的信息检索和任务总结时,LLMs也可能会犯错。因此,LLMs输出的内容应被视为起点,而不是最终答案。用户仍应对LLMs输出的内容进行检查

期刊和会议可能会尝试使用AI算法来检测同行评审和论文中LLMs的使用情况,但其效果有限。此类检测可以突出显示AI生成的文本,但很容易产生误报。例如,将非英语母语研究者撰写的文本标记为“AI生成”。检测器通常很难区分LLMs的合理使用(如论文润色)和不恰当使用(如使用聊天机器人撰写整篇报告)。

归根结底,防止AI主导同行评审的最佳方法可能是在此过程中促进更多的互动。OpenReview(网址:https://openreview.net/)等平台鼓励审稿人和作者进行匿名互动,通过多轮讨论解决问题,目前已被一些会议和期刊采用。

在学术写作和同行评审中使用LLMs是无法阻止的。为应对这一转变,期刊和会议应制定明确的指南。期刊至少应要求审稿人披露在审稿过程中是否以及如何使用LLMs。还需要适应AI时代的创新型交互式同行评审平台,从而能够限制LLMs的任务范围。与此同时,还需开展更多研究,以探索AI如何更精准地协助完成同行评审任务。建立规范将有助于确保LLMs既有利于编辑、审稿人和作者,又不损害科学完整性。

本文整理自:https://www.nature.com/articles/d41586-024-03588-8

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/阅读下一篇/

高中生4天发表3篇SCI?疑为大学教授与留学机构合作生产论文

返回网易首页 下载网易新闻客户端
相关推荐
热点推荐
不同意没收!违建“英之园”一夜被拆,背后原因流出律师正义发声

不同意没收!违建“英之园”一夜被拆,背后原因流出律师正义发声

梦史
2025-05-29 08:24:42
为什么大家宁愿等网约车,也不愿坐招手即停的出租车?原因很现实

为什么大家宁愿等网约车,也不愿坐招手即停的出租车?原因很现实

娱乐督察中
2025-05-28 16:04:48
不讲条件、不找借口!中央巡视组交办问题,省长赴现场督导整改

不讲条件、不找借口!中央巡视组交办问题,省长赴现场督导整改

政知新媒体
2025-05-28 20:28:09
1967年,走投无路的阿拉法特,带着4000多士兵和40万难民,投奔约旦

1967年,走投无路的阿拉法特,带着4000多士兵和40万难民,投奔约旦

南权先生
2025-05-28 15:23:30
时隔13年!比肩旧三少!⚡️雷霆绅士横扫杀入总决赛!

时隔13年!比肩旧三少!⚡️雷霆绅士横扫杀入总决赛!

直播吧
2025-05-29 11:04:16
联合国也慌了!国际调解院落户于东方大国!

联合国也慌了!国际调解院落户于东方大国!

老友科普
2025-05-28 21:51:00
利好突袭!深夜,大涨!

利好突袭!深夜,大涨!

证券时报
2025-05-29 00:14:05
32周孕妈顺产去世,知情人透露:是开超市老板娘,试管要的双胞胎

32周孕妈顺产去世,知情人透露:是开超市老板娘,试管要的双胞胎

八斗小先生
2025-05-29 09:32:40
中国宣布藏南主权后,藏南同胞高喊:我们要回家,印军离开藏南

中国宣布藏南主权后,藏南同胞高喊:我们要回家,印军离开藏南

一个有灵魂的作者
2025-05-28 16:16:57
唐朝真的以胖为美?杨贵妃真实体重被公布后,现代女孩笑不出来了

唐朝真的以胖为美?杨贵妃真实体重被公布后,现代女孩笑不出来了

大千世界观
2025-05-28 09:32:36
40岁的保罗依然获多队青睐!这无疑就是SGA效应!

40岁的保罗依然获多队青睐!这无疑就是SGA效应!

田先生篮球
2025-05-28 08:55:34
独行侠CEO:卢卡交易前90分钟接到老板电话,当时我非常清醒

独行侠CEO:卢卡交易前90分钟接到老板电话,当时我非常清醒

雷速体育
2025-05-29 07:45:45
阿萨姆邦独立:中国藏南主权回归的“破局密码”?

阿萨姆邦独立:中国藏南主权回归的“破局密码”?

别人都叫我阿腈
2025-05-29 01:04:54
家中的床不可空置?观音菩萨说:无人睡时,也要摆放这3样物品

家中的床不可空置?观音菩萨说:无人睡时,也要摆放这3样物品

风起青萍之未
2025-05-27 17:23:24
厅长李洪亮,任上被查

厅长李洪亮,任上被查

新京报政事儿
2025-05-29 09:37:30
之前西方32国仅6个国家愿出兵乌克兰,现在可能连一个都没有了!

之前西方32国仅6个国家愿出兵乌克兰,现在可能连一个都没有了!

凯撒谈兵
2025-04-26 12:19:26
法网32强诞生16席!出现五个意料之外,郑钦文上榜,萨巴伦卡送蛋

法网32强诞生16席!出现五个意料之外,郑钦文上榜,萨巴伦卡送蛋

侃球熊弟
2025-05-29 07:11:52
中央巡视组进驻期间,李洪亮任上被查

中央巡视组进驻期间,李洪亮任上被查

政知新媒体
2025-05-29 09:52:35
男子深夜与情人在车上“翻云覆雨”,情人一阵抽搐昏死过去,最终抢救无效死亡

男子深夜与情人在车上“翻云覆雨”,情人一阵抽搐昏死过去,最终抢救无效死亡

张晓磊
2025-05-29 07:59:30
魔鬼镜头又来了!芭莎盛典怼脸拍太真实,杨幂干脆躲开不让拍正脸

魔鬼镜头又来了!芭莎盛典怼脸拍太真实,杨幂干脆躲开不让拍正脸

萌神木木
2025-05-28 20:35:34
2025-05-29 11:19:00
医咖会
医咖会
生动有趣的形式传递医学新进展
2448文章数 10867关注度
往期回顾 全部

科技要闻

英伟达财报炸裂 黄仁勋却叹退出中国太可惜

头条要闻

老人误将女主播视频当告白 守村口"等国家发的老婆"

体育要闻

东决G4的哈利交出了一场无瑕疵的比赛

娱乐要闻

19岁荣梓杉和混血美女疑似恋情曝光

财经要闻

美联邦法院阻止特朗普4月2日关税政策生效

汽车要闻

高阶智驾/起售12.98万 小鹏MONA M03 Max上市

态度原创

家居
艺术
健康
房产
手机

家居要闻

暖色复古 温馨小资情调

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

唇疱疹和口腔溃疡是"同伙"吗?

房产要闻

荣耀封顶 | 天正·三亚湾壹号匠筑海居生活新图景

手机要闻

小屏旗舰一加 13T,性能拉满,游戏体验超丝滑!