网易首页 > 网易号 > 正文 申请入驻

只因论文「碰瓷」,ICLR 2025区域主席直接拒稿!最强rebuttal,赢回荣耀

0
分享至

新智元报道

编辑:KingHZ

【新智元导读】1%合成数据,就能让AI模型瞬间崩溃!如此颠覆性发现,只因未引用他人论文,ICLR区域主席直接拒稿,好在作者成功rebuttal,论文最终选为Spotlight。而背后,竟是一桩图灵奖得主Yann Lecun关注的学界争议!

ICLR 2025,公开审稿,多级反转!

只因没有引用COLM 2024会议的一篇论文,区域主席根据公开评论,竟建议拒绝投稿论文!

虽然最终论文《强模型崩溃》(Strong Model Collapse)被接受,并选为亮点论文(Spotlight),但过程可谓危险至极!

来自Meta等研究机构证实:1%合成数据,就能让模型瞬间崩溃。

作者将文章投稿ICLR 2025后,审稿人对这篇论文的评价一致为正面。

区域主席(Area Chair),基于公开评论建议拒绝该论文,只因缺少对COLM 2024论文的引用。

即便在OpenReview上的私下讨论(公众无法查看)中,审稿人最终决定,缺少这篇引用不能成为拒绝的唯一依据。

但区域主席推翻了审稿人的意见,建议拒绝了此论文。

收到投诉后,ICLR决定审查此案。

调查后,一致决定支持审稿人的意见,因此最终接受了这篇论文。

任何平均得分高于阈值的论文,将自动考虑作为亮点论文。

评审意见主页:https://openreview.net/forum?id=et5l9qPUhm

公开评审:李鬼倒打李逵?

对ICLR论文提出疑问的斯坦福大学CS博士生Rylan Schaeffer,他是COLM 2024下列论文的作者。

他强调,ICLR 2025的论文《强模型崩溃》作者,故意不引用COLM 2024论文:

1.他们明确知晓有一篇先前的已发布工作,直接与他们的叙述和科学主张相矛盾;

2.他们使用了该先前工作中提出的方法论,而同时又侮辱了该工作并未给予应有的致谢。

他坚持认为ICLR 2025投稿论文是故意压制矛盾证据,混淆对模型崩溃(潜在)危害的理解。

ICLR的作者就是赤裸裸的学术不端,是科学界的耻辱!

特别是对于ICLR没有引用他写作的COLM 2024论文,他认为这无法忍受。

我们恳请评审专家和区域主席要求《强模型崩溃》的作者解决以下问题:

1.此项工作与现有关于避免模型崩溃文献的关系,

2.如何解释看似矛盾的结论产生的不同建模假设,以及哪种假设最能反映现实场景。

评估哪些假设最符合现实场景对于评估这项工作的实际影响至关重要。

在去年,Rylan Schaeffer就表示,如果对模型崩溃(model collapse)有兴趣,强烈要求阅读他们的COLM 2024论文。

反驳:Rylan Schaeffer才是抄袭者

在得到会议程序委员会及历任主席一致认同后,ICLR论文一作Elvis Dohmatob,在X上公开回应了Rylan Schaeffer的指责,认为Rylan Schaeffer存在严重的不当行为:

抄袭我们的先前工作,

论文内容主要由人工智能生成(是的,作者将我们的论文输入到LLM中生成了另一篇论文),

违反伦理审查委员会(IRB)规定等。

在长时间的双方沟通中,这些问题逐步被揭露出来。

在帖子后,ICLR 2025官方账号,澄清了提交论文4488评审的过程,真如开头所言。

NYU教授还原全过程

去年,《强模型崩溃》的作者Julia Kempe和「李鬼」Rylan Schaeffer多次沟通,公开了论文其他作者的道歉邮件。

特别是,模型崩溃、混合原始数据与合成数据等领域已有很多优秀论文的情况下(包括在《自然》杂志上发表的文章),当Gerstgrasser等人首次向发送他们《模型崩溃是不可避免的吗?》的v1版本时,很少有对一发表论文的相关讨论。

甚至有Rylan Schaeffer的合著者表示论文粗制滥造, 就是赶鸭子上架:

他们斯坦福的导师跟他们来往并不密切。

学生赶在截止日期前,马上提交论文。我们对论文粗制滥造的关切,几乎被漠视了。

可悲的是,这已经成为他们的文化的一部分。

至于没有引用相关论文的原因,我直到现在仍然不明白。

更加惊讶的是,「李鬼」Rylan Schaeffer所谓的「模型坍塌必读理论」,是Julia Kempe之前定理的一个微不足道的推论,而且Rylan Schaeffer的论文还具有误导性。

但奇怪的是,这些公式化的表述与论文中的语言相似,符号也古怪地相似:

左:「李逵」的论文符号,右:「李鬼」的论文符号

然而,随后Julia Kempe等明白了!

在指出了最明显的遗漏后,「李鬼」论文的作者等人发送了一份报告,暗示Julia Kempe等人的反馈,被AI用来合成论文。

Julia Kempe等人被当作免费劳动力使用,这令Julia Kempe大开眼界!

但可悲的是,Rylan Schaeffer等人的论文虽被COLM 2024接受,但仍然包含误导性结论。

在涉及到个人学术声誉的斗争中,Julia Kempe也得到了同事的支持,甚至得到了图灵奖得主、AI大佬Yann Lecun的关注和支持!

模型崩溃与合成数据

双方的焦点在于「模型崩溃」。

第1点:关于Gerstgrasser等人的论文与先前工作的科学矛盾。

Gerstgrasser等人的论文,并没有以任何有意义的方式避免模型崩溃。

正方Julia Kempe等人,在ICLR 2025论文中,明确将「模型崩溃」定义为「AI模型性能的重大下降」。

避免模型崩溃意味着:缩小使用真实数据和合成数据训练时的性能差距。

反方Rylan Schaeffer、Gerstgrasser等人,将避免模型崩溃定义为:「在多次训练模型时,防止发生递归性退化」。

该论文承认,尽管当样本逐渐积累时,性能退化是有界的,但仍然存在性能损失。

这一定义仅代表了缩小真实数据和合成数据之间差距的部分条件。从这个意义上讲,Gerstgrasser等人并未解决或缓解模型崩溃问题。

在关于模型崩溃的大多数文献中,主流观点认为,缩小性能差距是避免模型崩溃的主要标准。

从实际角度来看,缩小真实数据与合成数据之间的差距,是避免模型崩溃的更具操作性和相关性的定义。

仅仅确保性能不出现发散,仍然可能导致模型无法匹配合成数据生成器的质量,从而使合成数据对性能造成损害。

只有当性能差距完全缩小时,合成数据的负面影响才能完全减轻。

由于定义和理由上的差异,考虑到缩小性能差距是正确的定义,通过这一广泛接受的视角,正方Julia Kempe等人已经重新审视了所有关于模型崩溃的相关工作。

第二点:与Gerstgrasser等人的先前互动

不幸的是,公开评论似乎破坏了审稿过程的匿名性。

正反双方的确有过互动。

以下是该互动的简要总结:

  1. 技术上不足:Gerstgrasser等人的论文只是增量性的技术贡献,而且非常薄弱。它不过是对已有论文的已有设定和论点的轻微修改。其结果是已有定理的简单推论。

  2. 误导性/不准确的结论:Gerstgrasser等人的论文并未以任何合理的方式解决模型崩溃问题(请参见上文关于定义的讨论)。

不幸的是,Gerstgrasser等人,基本上忽视了互动的建设性批评,甚至将评论仅作为脚注,附在论文的末尾。

因此,在目前的状态下,正方仍然认为Gerstgrasser等人的论文,在科学上并不成立,因此没有觉得有必要引用。

最终的论文结果,说明荣耀应该归于Julia kempe等人。

这也与此前领域内专家的意见一致。

参考资料:

https://x.com/dohmatobelvis/status/1911107171078615088

https://x.com/KempeLab/status/1817135401124934089

https://x.com/RylanSchaeffer/status/1911153029509992859

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
东莞:卢炽华主动投案

东莞:卢炽华主动投案

南方都市报
2026-06-02 09:41:55
突发!黄仁勋拿下宇树科技

突发!黄仁勋拿下宇树科技

李东阳朋友圈
2026-06-02 13:43:42
六神新包装撞脸人民币!网友不淡定了

六神新包装撞脸人民币!网友不淡定了

李东阳朋友圈
2026-06-02 18:16:17
中日在香会激烈交锋!小泉信口开河讽刺中国,被韩方问得哑口无言

中日在香会激烈交锋!小泉信口开河讽刺中国,被韩方问得哑口无言

井普独白
2026-06-02 13:38:25
血压飙升!上海父亲晒聊天记录,“巨婴”儿子强行索要2万旅游费

血压飙升!上海父亲晒聊天记录,“巨婴”儿子强行索要2万旅游费

火山詩话
2026-06-02 14:27:07
1夜4大转会!伊涅斯塔获官宣,法蒂告别巴萨,枪手酝酿多笔补强!

1夜4大转会!伊涅斯塔获官宣,法蒂告别巴萨,枪手酝酿多笔补强!

田先生篮球
2026-06-02 09:10:56
割四赔五后续:麦客撤了,麦烂了,农户跪了,这锅谁背?

割四赔五后续:麦客撤了,麦烂了,农户跪了,这锅谁背?

番外行
2026-06-02 14:19:47
形势到底有多严峻?国人心心念念的特斯拉竟会裁员,评论区炸锅…

形势到底有多严峻?国人心心念念的特斯拉竟会裁员,评论区炸锅…

慧翔百科
2026-06-02 08:27:57
广厦三核79分拒横扫:胡金秋30分大爆发 双小外49+14+15制胜

广厦三核79分拒横扫:胡金秋30分大爆发 双小外49+14+15制胜

醉卧浮生
2026-06-02 21:32:14
福建一县委书记任上被查,昨天还参加走访慰问

福建一县委书记任上被查,昨天还参加走访慰问

人民资讯
2026-06-02 21:13:30
娶妻娶贤又娶色,真的绝妻!

娶妻娶贤又娶色,真的绝妻!

贵圈真乱
2026-06-02 12:02:35
阿迪达斯“在城里办事”文案已删除,回应“进城办事”T恤被网友催上架:目前还没有售卖,后续可关注门店

阿迪达斯“在城里办事”文案已删除,回应“进城办事”T恤被网友催上架:目前还没有售卖,后续可关注门店

19楼
2026-06-02 15:37:57
挪威深海发现载有中国瓷器的18世纪沉船:大量青花瓷碗重见天日,文物达数千件,目前正开展船只溯源工作并努力还原历史真相

挪威深海发现载有中国瓷器的18世纪沉船:大量青花瓷碗重见天日,文物达数千件,目前正开展船只溯源工作并努力还原历史真相

大风新闻
2026-06-02 12:15:18
这4个行业,已经发不出工资了!真的很严重了

这4个行业,已经发不出工资了!真的很严重了

细说职场
2026-06-02 21:15:53
央视再曝新毒物!长期用会致癌,已流窜至全国,不少婴儿孕妇中招

央视再曝新毒物!长期用会致癌,已流窜至全国,不少婴儿孕妇中招

做一个合格的吃瓜群众
2026-06-02 14:36:43
诺贝尔经济学奖得主克鲁格曼:对中国经济的评估

诺贝尔经济学奖得主克鲁格曼:对中国经济的评估

生命可以承受之轻
2026-06-02 15:57:17
夏补钾,不疲惫,建议大家:夏天多吃这3种“补钾高手”,精神好

夏补钾,不疲惫,建议大家:夏天多吃这3种“补钾高手”,精神好

阿龙美食记
2026-05-31 20:23:07
肇庆男童深山走失13天奇迹生还!靠野果生存,获救紧搂救援者

肇庆男童深山走失13天奇迹生还!靠野果生存,获救紧搂救援者

奇思妙想草叶君
2026-06-02 19:15:06
25万亿!国家启动史无前例超级大基建,信号强烈

25万亿!国家启动史无前例超级大基建,信号强烈

前瞻网
2026-06-02 10:49:44
男子自驾青海失联9个月,家属再赴事发地寻找 救援人员计划向牧民发寻人信息寻找目击者

男子自驾青海失联9个月,家属再赴事发地寻找 救援人员计划向牧民发寻人信息寻找目击者

红星新闻
2026-06-02 17:40:41
2026-06-02 23:56:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15368文章数 66896关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

教育
本地
家居
亲子
公开课

教育要闻

“你知道几号高考吗?”18岁纹身女孩的生日美照,诠释了物以类聚

本地新闻

用剪纸的方式,打开江苏扬州

家居要闻

流线型轮廓 包容多元身形

亲子要闻

进口针一支1.7万,年生长11厘米,国人怒了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版