网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

OpenAI：纽约时报雇黑客攻击我

2024-02-28 13:32:59　来源: 量子位

北京举报

0

分享至

梦晨发自凹非寺
量子位 | 公众号 QbitAI

堂堂AI巨头，怎么就被一家报纸雇黑客攻击了？

《纽约时报》诉OpenAI侵犯版权索赔数十亿美元案最新进展：

在最新提交的法庭文件中，OpenAI声称《纽约时报》花钱找黑客攻击ChatGPT，人为制造侵权结果。

使用欺骗性手段进行数万次尝试，才得到高度异常结果。

这项诉讼要是输了，那对OpenAI来说可能是毁灭性打击。

数十亿美元罚款都是小事了，按法律界的分析，连ChatGPT都可能被迫全部擦除，重头开始训练。

大家都知道，美国法律要遵循之前判例的原则。

在过去几十年的科技公司vs版权方的案子中，法院可并不总是站在科技公司一边。

这次OpenAI主张《纽约时报》雇佣黑客，还真的非常关键了。

纽约时报如何攻击ChatGPT

去年12月，《纽约时报》起诉OpenAI和他的微软爸爸，称ChatGPT和Copilot都未经许可利用其内容训练。

当时，《纽约时报》展示了足足100个GPT-4一字不落背出真实报道段落的例子。

这样一来，ChatGPT就可以算作报纸的竞争品。

OpenAI这边，辩称这是一个漏洞，并承诺已经在修复。

具体来说，当AI生成与训练数据非常相似的样本时，可能发生“数据回流”（regurgitation of training data），类似于人类听到上句就会条件反射般的接下句，谁也拦不住。

他们认为《纽约时报》利用这一漏洞，使用特殊的提示词要求ChatGPT输出特定文章的开头，并继续要求输出下一句话。

OpenAI预计需要反复尝试上万次才能生成这些整篇的文章，而且还不是按顺序的，而是“分散和无序的引用”。

正常人不可能这么使用ChatGPT，也不会把它当成《纽约时报》的替代品。

OpenAI指责《纽约时报》故意误导法庭，“使用省略号来掩盖”ChatGPT吐出报道片段的顺序，造成了“ChatGPT生成了文章的连续和不间断片段的错误印象”。

并且《纽约时报》从来没有披露过他们生成这些证据的具体提示词，以及是否修改了系统提示词等等细节，就挺心虚的。

至于提示词攻击算不算黑客行为，有网友表示怎么不算，如果认可提示词工程真的算一种工程，那提示词攻击就算攻击。

现在OpenAI主要从两个地方反击：

一是主张这种提示词攻击公然违反了OpenAI的产品使用条款。

二是主张互联网上公开的内容是可以被合理使用的。

这就要抱紧谷歌大腿了，20年前谷歌整了个大活，扫描数百万本图书放到搜索引擎上，被一堆出版商和作家协会给告了。

官司反反复复打了10多年，最终谷歌艰难的赢了，被判这些数据是合理使用。

当时裁决认为用户只能看到图书的简短片段，永远无法从受版权保护的书籍中恢复较长的段落。

谷歌制作书籍的数字副本以提供搜索功能是一种变革性的使用，它通过提供有关原告书籍的信息来增加公众知识，而不向公众提供书籍的实质性替代品。

不光OpenAI，同样面临版权诉讼的Stability AI等AI图像生成公司，都在坚持他们做的事与谷歌当年一样：

都是“学习训练数据中关于作品的信息，但不复制作品本身的创造性表达”。

然而还有一个有争议的地方，AIGC产品确实会产生创造性的作品，与接受训练的作品直接竞争。

所以这一批AI公司面临的危机，比谷歌当年面临危机还要大一些。

再不卖数据就晚了

实际上，像《纽约时报》这样和AI闹得不愉快的内容公司是少数。

更多互联网公司都在争先恐后出售自己的数据，反正这些AI公司又不是没钱。

Sora视频，就被找出明显有OpenAI合作伙伴Shutterstock素材的影子。

上周，“美国贴吧”Reddit刚刚跟谷歌签了协议，6千万美元一年，让谷歌可以实时获取论坛数据用于AI训练。

OpenAI这边肯定早就用上了，毕竟山姆奥特曼本人就和Reddit公司关系匪浅，而且早年比GPT-1还早的原型研究，就是在Reddit数据上训练聊天机器人。

现在Tumblr和WordPress也赶紧跟进，把用户数据出售给OpenAI和Midjourney。

虽然他们的用户听到这个消息都挺不高兴的，但是没办法，当初注册账号的时候可是必须同意使用条款，其中把数据归属早就安排明白了。

当然AI公司买过来这些数据也不是直接塞AI嘴里就好使的，学术界现在也研究如何高效利用。

刚刚还有一篇语言模型训练的数据选择综述出炉，提出用于比较和对比不同的数据选择方法的框架，还倡议：

加速数据选择研究，如开发直接评估数据质量的指标，减少对昂贵模型训练的依赖。
更好地理解数据分布的特性，以便更精确地选择数据。
将计算时间从模型训练转移到数据处理。

随着AI生成的内容在互联网上铺开，后面再训练大模型的都绕不开使用AI生成的数据了，就说多少家大模型“承认”过自己是OpenAI训练的了吧。

同样中文数据也绕不开文心一言，谷歌Gemini都闹过笑话（已修复）。

坐拥大量人类古法手打数据的互联网公司，再不抓紧卖，AI就能自给自足了。

参考链接：
[1]https://s3.documentcloud.org/documents/24443836/nysd-case-612697.pdf
[2]https://arstechnica.com/tech-policy/2024/02/openai-accuses-nyt-of-hacking-chatgpt-to-set-up-copyright-suit/
[3]https://arxiv.org/abs/2402.16827

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

马斯克四度起诉OpenAI，狙击其转向营利公司，OpenAI怒回

智东西 2024-12-02 18:33:13
2 跟贴 2
微软是如何重新崛起的？

钛媒体APP 2024-06-20 08:40:14
0 跟贴 0

Facebook第30号员工：为扎克伯格工作，我学到了什么

机器之心Pro 2024-08-29 14:55:21
0 跟贴 0

吴恩达开源Python包，统一11家顶尖大模型平台接口

量子位 2024-12-01 12:14:44
1 跟贴 1
抖音们的价值观强了，极端情绪就弱了

经济观察报 2024-07-02 21:51:05
85 跟贴 85

穿上感觉像轻了27斤！三万块一条的裤子，竟然卖爆了？谷歌孵化的公司Skip联手始祖鸟推出了全球首条

量子位 2024-08-17 13:10:59
22 跟贴 22

美国6大科技公司市值暴涨8万亿美元！ChatGPT推出两周年，大公司更强了

智东西 2024-12-02 19:27:14
25 跟贴 25
小米SUV，高端

放毒 2024-12-01 23:04:48
7 跟贴 7

年轻人抛弃搜索引擎

虎嗅APP 2024-10-09 16:10:30
1117 跟贴 1117
我，500元买了台谷歌版Mac mini，居然能畅玩LOL？

雷科技 2024-07-08 14:19:33
198 跟贴 198
亚马逊AWS CEO：AI竞赛没有终点，未来AI大模型绝不会一家独大

智东西 2024-12-03 15:52:32
2 跟贴 2
谷歌取得使用基于传感器的验证的车辆功能控制专利快报

金融界灵通君 2024-12-03 14:16:41
0 跟贴 0
硅谷AI精英人均“百万美元”薪酬，业界标配还是谣言？

钛媒体APP 2024-06-08 20:00:15
0 跟贴 0
估值一年翻17倍，巨头创企疯狂涌入，AI搜索火爆了

智东西 2024-12-02 21:53:43
1 跟贴 1
对着3个中国AI大模型，两个美国科技界大佬深聊了半小时

智东西 2024-12-03 22:25:54
0 跟贴 0
网友用喷火枪测试杯子，有装水与没装水燃烧的区别，网友：这是什么原理？

兴国融媒体中心 2024-12-03 10:57:15
1110 跟贴 1110
「LLM」这个名字不好，Karpathy认为不准确、马斯克怒批太愚蠢

机器之心Pro 2024-09-17 11:42:33
0 跟贴 0
ChatGPT拒绝谈论这个人，没人知道为什么

量子位 2024-12-02 13:07:36
1 跟贴 1
明明犯了罪，却不用接受惩罚，法律漏洞竟然还能这么钻？

噔噔悬疑社 2024-11-29 18:43:59
8 跟贴 8
原来陈梦对谁都变线，这球技莎莎怎么赢，靠刷数据迟早要露馅！

陌生人街拍 2024-12-01 08:57:49
378 跟贴 378
让ChatGPT不敢开口的名字！神秘bug引马斯克围观

量子位 2024-12-02 19:33:09
92 跟贴 92
依靠群体的力量：这家公司走出了一条不同于OpenAI的AGI路线

机器之心Pro 2024-09-27 16:13:36
0 跟贴 0
苹果微软特斯拉，最大股东都是它！

华商韬略 2024-11-27 18:03:46
0 跟贴 0
国外大叔给鸽子吹气，一开始我是不信的，谷歌看到都沉默了！

趣味搞笑工厂 2024-12-02 15:00:43
1 跟贴 1
盗版麦琳杨子pk，好抽象的cos啊

播奥爆 2024-12-02 18:49:01
0 跟贴 0
余承东：上下班70公里都用智能驾驶

财经网科技 2024-11-30 19:36:39
139 跟贴 139
苹果真有生产力了：3500元的Mac mini能跑AI大模型吗？

量子位 2024-12-03 15:54:07
8 跟贴 8
Xbox第一方SBI新作被吐槽：微软的目标用户到底是谁

游民星空 2024-12-01 23:10:11
14 跟贴 14
纽约时报分析：中国是如何成为世界最大汽车出口国的

妖鹿山小钻风 2024-12-03 17:42:26
2010 跟贴 2010
翻唱侵权风波：为何刀郎获赞汪峰挨批？

格仔娱乐圈 2024-12-02 13:45:02
1 跟贴 1
曝江苏一公园将长条椅焊上钢管市民：防止干日结的在这睡

猫头鹰视频 2024-12-03 18:22:06
21948 跟贴 21948
肌肉骨骼居然和人类一样。外网爆火的克隆机器人，灵活性超高，胸腔里还复刻了人类的心脏瓣膜，宛如《西部世

量子位 2024-10-26 12:28:00
0 跟贴 0
搭载ChatGPT的《星际穿越》机器人爆火，马斯克：想要！ ChatGPT复刻版《星际穿越》机器人T

量子位 2024-07-09 12:03:11
0 跟贴 0
老哥密码忘记了11年的34个比特币，终于找回来了！这其中也是波折

英国那些事儿 2024-10-28 23:18:49
1380 跟贴 1380
市场份额50%！ openEuler系装机量过千万国产操作系统借开源突围

量子位 2024-11-19 14:35:43
0 跟贴 0
Digital Foundry 证实：索尼正在开发新款掌机

IT之家 2024-12-03 07:57:49
55 跟贴 55
张一鸣：不甘平庸的年轻人，全都有同一个特质

互联网思维 2024-06-21 23:33:50
79 跟贴 79
宾利，史上最强

放毒 2024-12-02 15:16:52
12 跟贴 12
全世界跑得最快的人形机器人，还能跳科目三都知道波士顿动力的机器人会空翻，那你知道中国品牌宇树科技有

爱范儿 2024-07-04 20:41:36
6366 跟贴 6366
书单丨《纽约时报》评选出的21世纪100本最佳图书

笔墨之林 2024-12-02 14:03:41
0 跟贴 0

大门紧闭！工地无人！西安“地标”商业，惨遭停摆？

大门紧闭！工地无人！西安“地标”商业，惨遭停摆？

童童聊娱乐啊

2024-12-03 19:24:09

服了，拉马尔·奥多姆描述了科比·布莱恩特多么想超越迈克尔·乔丹

服了，拉马尔·奥多姆描述了科比·布莱恩特多么想超越迈克尔·乔丹

好火子

2024-12-04 03:45:06

2001年张学良在美国病逝，儿子打开银行账户，余额竟高达6亿美金

2001年张学良在美国病逝，儿子打开银行账户，余额竟高达6亿美金

阿郎历史

2024-12-03 09:44:40

形势到底有多严峻？天呢！上海已经刷新国人的认知…

形势到底有多严峻？天呢！上海已经刷新国人的认知…

慧翔百科

2024-11-21 12:03:47

“大眼仔”莫少聪迎62岁生日，晒8人大合照庆生，莫芷嫣容貌出众

“大眼仔”莫少聪迎62岁生日，晒8人大合照庆生，莫芷嫣容貌出众

娱珈歪歪鱼

2024-12-02 11:24:02

分歧严重，韩议长宣布搁置预算案

分歧严重，韩议长宣布搁置预算案

环球时报国际

2024-12-03 08:12:08

感动中国再次引发争议，网友集体不买账：演员赚那么多感动了谁

感动中国再次引发争议，网友集体不买账：演员赚那么多感动了谁

小彭谈历史

2024-10-24 13:04:06

事关电价！山东公告：下月起执行！

事关电价！山东公告：下月起执行！

琅琊新闻网

2024-12-02 21:24:49

郑州新一波演唱会来了！你最期待谁

郑州新一波演唱会来了！你最期待谁

大象新闻

2024-12-03 13:48:13

内地黑工被弃尸香港街头！警方拘捕

内地黑工被弃尸香港街头！警方拘捕

热闹吃瓜大姐

2024-12-02 23:12:56

绝杀山西，谁注意这细节？任骏飞挡拆将原帅送给徐杰，阅读太强了

绝杀山西，谁注意这细节？任骏飞挡拆将原帅送给徐杰，阅读太强了

篮球资讯达人

2024-12-04 00:23:02

成都混团在激战张本美和拜神社许愿今年年度汉字是银4年后要变金

成都混团在激战张本美和拜神社许愿今年年度汉字是银4年后要变金

劲爆体坛

2024-12-03 17:52:08

范冰冰不怕“走光”，轻薄下水只为拍摄唯美画面，当年真是敬业

范冰冰不怕“走光”，轻薄下水只为拍摄唯美画面，当年真是敬业

南城无双

2024-10-28 11:23:54

为何中国不去申请举办奥运会了？原因很简单:

为何中国不去申请举办奥运会了？原因很简单:

现代春秋

2024-11-21 19:35:37

退休金的贫富差距极大就是对人人平等的最大讽刺！

退休金的贫富差距极大就是对人人平等的最大讽刺！

逍遥论经

2024-12-01 15:14:53

又要被绿？天才亚马尔19岁新女友公开示爱K77，球迷：亚马尔真惨

又要被绿？天才亚马尔19岁新女友公开示爱K77，球迷：亚马尔真惨

侧身凌空斩

2024-12-03 06:38:11

韩军开进首尔！尹锡悦宣布戒严令，遭国会190全票否定

韩军开进首尔！尹锡悦宣布戒严令，遭国会190全票否定

项鹏飞

2024-12-04 01:32:40

你身边有不听劝又无知的人吗？网友：认知低不听劝堪比活阎王！

你身边有不听劝又无知的人吗？网友：认知低不听劝堪比活阎王！

热闹的河马

2024-12-03 16:03:16

四大援军抵达，叙利亚准备反击！巴沙尔能否力挽狂澜？

四大援军抵达，叙利亚准备反击！巴沙尔能否力挽狂澜？

朵眸咊一笔

2024-12-02 23:01:09

有人列举郑钦文2025赛季8大目标！球迷泼冷水：一个也实现不了

有人列举郑钦文2025赛季8大目标！球迷泼冷水：一个也实现不了

搏击江湖

2024-12-03 21:09:34

追踪人工智能动态

9699文章数 157449关注度

往期回顾全部

科技要闻

美国芯片慎用！中国四大行业协会发声

头条要闻

韩国教育部凌晨通知：学还是要正常上

头条要闻

韩国教育部凌晨通知：学还是要正常上

体育要闻

特鲁姆普：我还是从前那个少年

娱乐要闻

50岁林志玲生日晒娃引热议

财经要闻

梁建章:建议对生孩子家庭发10万元

汽车要闻

标配Lion5.0科技座舱风云A8L将于12月17日上市

态度原创

游戏

教育

旅游

艺术

军事航空

我们和三太子聊了聊《怪猎荒野》确认追加中文语音！

教育要闻

温州日报作文版作文选登：张芮熙《小猫“七七”》

旅游要闻

飞机惊现老鼠窜来窜去？旅客质疑有安全隐患

艺术要闻

故宫珍藏的墨迹《十七帖》，比拓本更精良，这才是地道的魏晋写法

军事要闻

古特雷斯就叙利亚局势发表声明

© 1997-2024 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版