网易首页 > 网易号 > 正文 申请入驻

OpenAI 遭实锤:研究称其AI模型“记住”了受版权保护的内容

0
分享至

IT之家 4 月 6 日消息,一项新研究似乎为 OpenAI 至少使用部分受版权保护内容来训练其人工智能模型的指控提供了依据。

IT之家注意到,OpenAI 正面临由作家、程序员以及其他版权持有者提起的诉讼,这些原告指责该公司在未经许可的情况下,使用他们的作品 —— 包括书籍、代码库等,来开发其模型。尽管 OpenAI 一直声称其享有合理使用的抗辩理由,但原告方则认为美国版权法中并无针对训练数据的豁免条款。

该研究由华盛顿大学、哥本哈根大学和斯坦福大学的研究人员共同撰写,提出了一种新方法,用于识别像 OpenAI 这样通过应用程序接口(API)提供服务的模型所“记忆”的训练数据。

AI 模型本质上是预测引擎,通过大量数据训练,它们能够学习各种模式,从而生成文章、照片等。虽然大多数输出并非训练数据的逐字复制,但由于模型的“学习”方式,部分内容不可避免地会被模型记忆下来。此前已有研究发现,图像模型会重复生成其训练数据中电影的截图,而语言模型则被观察到存在剽窃新闻文章的行为。

该研究的核心方法依赖于研究人员提出的“高意外性”词汇,即在大量作品中显得不常见的词汇。例如,在句子“Jack and I sat perfectly still with the radar humming”中,“radar”(雷达)一词被认为是高意外性的,因为从统计学角度来看,它出现在“humming”(嗡嗡作响)之前的可能性比“engine”(引擎)或“radio”(收音机)等词要低。

共同作者对包括 GPT-4 和 GPT-3.5 在内的几种 OpenAI 模型进行了测试,通过从虚构小说片段和《纽约时报》文章中移除高意外性词汇,然后让模型尝试“猜测”被屏蔽的词汇,来寻找记忆迹象。研究人员认为,如果模型能够成功猜出这些词语,则很可能表明该模型在训练过程中记忆了这些片段。

根据测试结果,GPT-4 显示出记住了流行小说书籍的部分内容,包括一个包含受版权保护电子书样本的数据集 BookMIA 中的书籍。结果还表明,该模型记住了《纽约时报》文章的部分内容,尽管比例相对较低。

华盛顿大学的博士生、该研究的共同作者阿比拉沙・拉维奇汉德(Abhilasha Ravichander)对 TechCrunch 表示,这些发现揭示了模型可能接受训练的“有争议的数据”。

长期以来,OpenAI 一直倡导放宽对使用受版权保护数据开发模型的限制。尽管该公司已经达成了一些内容许可协议,并提供了允许版权所有者标记不希望其用于训练的内容的退出机制,但该公司一直在游说多个政府将围绕人工智能训练方法的“合理使用”规则编入法典。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
优必选0借款入主锋龙股份,人形机器人“一哥”巨亏下的资本暗战

优必选0借款入主锋龙股份,人形机器人“一哥”巨亏下的资本暗战

钛媒体APP
2025-12-25 20:37:10
湖北一大妈跳了20多年广场舞后,拿100多个金镯子去卖,说家里还有金项链没拿,我人好,都是别人送的

湖北一大妈跳了20多年广场舞后,拿100多个金镯子去卖,说家里还有金项链没拿,我人好,都是别人送的

LULU生活家
2025-12-24 18:51:10
主动投案,安徽一县副县长被查!

主动投案,安徽一县副县长被查!

网易安徽
2025-12-25 19:06:19
郑州保时捷一夜空店!10万定金打水漂,三朵金花早跳槽,内幕曝光

郑州保时捷一夜空店!10万定金打水漂,三朵金花早跳槽,内幕曝光

你食不食油饼
2025-12-25 22:35:09
新加坡总统:中国不要自给自足,海南封关将会砸了新加坡的铁饭碗

新加坡总统:中国不要自给自足,海南封关将会砸了新加坡的铁饭碗

精彩一网打尽
2025-12-24 19:28:24
支持中国分裂,拒飞内地航线,歧视大陆游客的国泰航空,如今怎样

支持中国分裂,拒飞内地航线,歧视大陆游客的国泰航空,如今怎样

小莜读史
2025-12-15 21:00:06
13分大逆转!女篮霸主掀翻劲敌豪取9连胜:冲击两连冠稳了?

13分大逆转!女篮霸主掀翻劲敌豪取9连胜:冲击两连冠稳了?

篮球快餐车
2025-12-26 00:18:35
钉在耻辱柱上!国家文物局出手,这三个跳梁小丑,彻底凉凉

钉在耻辱柱上!国家文物局出手,这三个跳梁小丑,彻底凉凉

八斗小先生
2025-12-24 09:37:51
旷世奇案,只此一件

旷世奇案,只此一件

我是历史其实挺有趣
2025-12-24 10:42:04
不接受一国两制?20万岛内武装弃械?明确台湾省最终结局?

不接受一国两制?20万岛内武装弃械?明确台湾省最终结局?

攒一兜星星
2025-12-22 22:41:48
曾是“央视名嘴”,因揭露姜昆丑闻被封杀,如今70岁处境如何?

曾是“央视名嘴”,因揭露姜昆丑闻被封杀,如今70岁处境如何?

小熊侃史
2025-12-15 10:51:25
太棒了!这穿着你是一点都不遮掩,真是太让人羡慕了

太棒了!这穿着你是一点都不遮掩,真是太让人羡慕了

章眽八卦
2025-11-29 11:58:56
当法官宣判死刑,杀了南大女研究生哥哥的凶手在法庭上疯狂嘶吼

当法官宣判死刑,杀了南大女研究生哥哥的凶手在法庭上疯狂嘶吼

诗意世界
2025-12-14 11:25:24
我国有上千万人做颈动脉超声!院士:做一次颈动脉超声,或管七年

我国有上千万人做颈动脉超声!院士:做一次颈动脉超声,或管七年

岐黄传人孙大夫
2025-12-19 09:16:53
奚梦瑶和婆婆小姑子过圣诞节!三人同框合影摆造型,曝光超大豪宅

奚梦瑶和婆婆小姑子过圣诞节!三人同框合影摆造型,曝光超大豪宅

角落的隐藏美景
2025-12-26 00:16:10
带儿子独守娘家真相大白,潘阳坦白婚姻情况,难怪看不到老公出镜

带儿子独守娘家真相大白,潘阳坦白婚姻情况,难怪看不到老公出镜

夏末的晨溪
2025-12-24 08:44:59
四个姓徐的巧合  三代人控制一条龙  南博国宝流失疑案谁来查?

四个姓徐的巧合 三代人控制一条龙 南博国宝流失疑案谁来查?

金牌舆情官
2025-12-23 16:04:38
并非回归国家队,返京收拾东西,全红婵匆忙离开,原因曝光

并非回归国家队,返京收拾东西,全红婵匆忙离开,原因曝光

乐聊球
2025-12-25 13:00:58
亲妈走了亲爹没露面:许何凌晨发文,最缺的是那一分钟的底气而已

亲妈走了亲爹没露面:许何凌晨发文,最缺的是那一分钟的底气而已

乡野小珥
2025-12-25 04:30:08
霍启刚没想到,44岁郭晶晶再传喜讯,让霍震霆和香港阔太圈沉默了

霍启刚没想到,44岁郭晶晶再传喜讯,让霍震霆和香港阔太圈沉默了

白面书誏
2025-12-23 14:10:47
2025-12-26 03:15:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
321519文章数 606845关注度
往期回顾 全部

科技要闻

小米17Ultra发布,徕卡2亿像素 ,6999元起

头条要闻

俄军中将在汽车炸弹爆炸中身亡 俄军报复

头条要闻

俄军中将在汽车炸弹爆炸中身亡 俄军报复

体育要闻

约基奇有多喜欢马?

娱乐要闻

朱孝天把阿信好意当球踢!

财经要闻

新规来了,年化超24%的小贷被即刻叫停

汽车要闻

速来!智界在上海西岸准备了年末潮流盛典

态度原创

健康
房产
数码
游戏
公开课

这些新疗法,让化疗不再那么痛苦

房产要闻

太猛了!单月新增企业4.1万家,又一波巨头涌向海南!

数码要闻

年终复盘不用愁,鸿蒙电脑让高效贯穿每一刻

逆水寒顶流主播沉迷倩女!三界的魅力藏不住了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版