网易首页 > 网易号 > 正文 申请入驻

OpenAI:纽约时报雇黑客攻击我

0
分享至

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

堂堂AI巨头,怎么就被一家报纸雇黑客攻击了?

《纽约时报》诉OpenAI侵犯版权索赔数十亿美元案最新进展:

在最新提交的法庭文件中,OpenAI声称《纽约时报》花钱找黑客攻击ChatGPT,人为制造侵权结果。

使用欺骗性手段进行数万次尝试,才得到高度异常结果。

这项诉讼要是输了,那对OpenAI来说可能是毁灭性打击。

数十亿美元罚款都是小事了,按法律界的分析,连ChatGPT都可能被迫全部擦除,重头开始训练

大家都知道,美国法律要遵循之前判例的原则。

在过去几十年的科技公司vs版权方的案子中,法院可并不总是站在科技公司一边。

这次OpenAI主张《纽约时报》雇佣黑客,还真的非常关键了。

纽约时报如何攻击ChatGPT

去年12月,《纽约时报》起诉OpenAI和他的微软爸爸,称ChatGPT和Copilot都未经许可利用其内容训练。

当时,《纽约时报》展示了足足100个GPT-4一字不落背出真实报道段落的例子

这样一来,ChatGPT就可以算作报纸的竞争品。

OpenAI这边,辩称这是一个漏洞,并承诺已经在修复。

具体来说,当AI生成与训练数据非常相似的样本时,可能发生“数据回流”(regurgitation of training data),类似于人类听到上句就会条件反射般的接下句,谁也拦不住。

他们认为《纽约时报》利用这一漏洞,使用特殊的提示词要求ChatGPT输出特定文章的开头,并继续要求输出下一句话。

OpenAI预计需要反复尝试上万次才能生成这些整篇的文章,而且还不是按顺序的,而是“分散和无序的引用”。

正常人不可能这么使用ChatGPT,也不会把它当成《纽约时报》的替代品。

OpenAI指责《纽约时报》故意误导法庭,“使用省略号来掩盖”ChatGPT吐出报道片段的顺序,造成了“ChatGPT生成了文章的连续和不间断片段的错误印象”。

并且《纽约时报》从来没有披露过他们生成这些证据的具体提示词,以及是否修改了系统提示词等等细节,就挺心虚的。

至于提示词攻击算不算黑客行为,有网友表示怎么不算,如果认可提示词工程真的算一种工程,那提示词攻击就算攻击。

现在OpenAI主要从两个地方反击:

一是主张这种提示词攻击公然违反了OpenAI的产品使用条款

二是主张互联网上公开的内容是可以被合理使用的

这就要抱紧谷歌大腿了,20年前谷歌整了个大活,扫描数百万本图书放到搜索引擎上,被一堆出版商和作家协会给告了。

官司反反复复打了10多年,最终谷歌艰难的赢了,被判这些数据是合理使用。

当时裁决认为用户只能看到图书的简短片段,永远无法从受版权保护的书籍中恢复较长的段落。

谷歌制作书籍的数字副本以提供搜索功能是一种变革性的使用,它通过提供有关原告书籍的信息来增加公众知识,而不向公众提供书籍的实质性替代品。

不光OpenAI,同样面临版权诉讼的Stability AI等AI图像生成公司,都在坚持他们做的事与谷歌当年一样:

都是“学习训练数据中关于作品的信息,但不复制作品本身的创造性表达”

然而还有一个有争议的地方,AIGC产品确实会产生创造性的作品,与接受训练的作品直接竞争。

所以这一批AI公司面临的危机,比谷歌当年面临危机还要大一些。

再不卖数据就晚了

实际上,像《纽约时报》这样和AI闹得不愉快的内容公司是少数。

更多互联网公司都在争先恐后出售自己的数据,反正这些AI公司又不是没钱。

Sora视频,就被找出明显有OpenAI合作伙伴Shutterstock素材的影子。

上周,“美国贴吧”Reddit刚刚跟谷歌签了协议,6千万美元一年,让谷歌可以实时获取论坛数据用于AI训练。

OpenAI这边肯定早就用上了,毕竟山姆奥特曼本人就和Reddit公司关系匪浅,而且早年比GPT-1还早的原型研究,就是在Reddit数据上训练聊天机器人。

现在TumblrWordPress也赶紧跟进,把用户数据出售给OpenAI和Midjourney。

虽然他们的用户听到这个消息都挺不高兴的,但是没办法,当初注册账号的时候可是必须同意使用条款,其中把数据归属早就安排明白了。

当然AI公司买过来这些数据也不是直接塞AI嘴里就好使的,学术界现在也研究如何高效利用。

刚刚还有一篇语言模型训练的数据选择综述出炉,提出用于比较和对比不同的数据选择方法的框架,还倡议:

  • 加速数据选择研究,如开发直接评估数据质量的指标,减少对昂贵模型训练的依赖。
  • 更好地理解数据分布的特性,以便更精确地选择数据。
  • 将计算时间从模型训练转移到数据处理。

随着AI生成的内容在互联网上铺开,后面再训练大模型的都绕不开使用AI生成的数据了,就说多少家大模型“承认”过自己是OpenAI训练的了吧。

同样中文数据也绕不开文心一言,谷歌Gemini都闹过笑话(已修复)。

坐拥大量人类古法手打数据的互联网公司,再不抓紧卖,AI就能自给自足了。

参考链接:
[1]https://s3.documentcloud.org/documents/24443836/nysd-case-612697.pdf
[2]https://arstechnica.com/tech-policy/2024/02/openai-accuses-nyt-of-hacking-chatgpt-to-set-up-copyright-suit/
[3]https://arxiv.org/abs/2402.16827

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大门紧闭!工地无人!西安“地标”商业,惨遭停摆?

大门紧闭!工地无人!西安“地标”商业,惨遭停摆?

童童聊娱乐啊
2024-12-03 19:24:09
服了,拉马尔·奥多姆描述了科比·布莱恩特多么想超越迈克尔·乔丹

服了,拉马尔·奥多姆描述了科比·布莱恩特多么想超越迈克尔·乔丹

好火子
2024-12-04 03:45:06
2001年张学良在美国病逝,儿子打开银行账户,余额竟高达6亿美金

2001年张学良在美国病逝,儿子打开银行账户,余额竟高达6亿美金

阿郎历史
2024-12-03 09:44:40
形势到底有多严峻?天呢!上海已经刷新国人的认知…

形势到底有多严峻?天呢!上海已经刷新国人的认知…

慧翔百科
2024-11-21 12:03:47
“大眼仔”莫少聪迎62岁生日,晒8人大合照庆生,莫芷嫣容貌出众

“大眼仔”莫少聪迎62岁生日,晒8人大合照庆生,莫芷嫣容貌出众

娱珈歪歪鱼
2024-12-02 11:24:02
分歧严重,韩议长宣布搁置预算案

分歧严重,韩议长宣布搁置预算案

环球时报国际
2024-12-03 08:12:08
感动中国再次引发争议,网友集体不买账:演员赚那么多感动了谁

感动中国再次引发争议,网友集体不买账:演员赚那么多感动了谁

小彭谈历史
2024-10-24 13:04:06
事关电价!山东公告:下月起执行!

事关电价!山东公告:下月起执行!

琅琊新闻网
2024-12-02 21:24:49
郑州新一波演唱会来了!你最期待谁

郑州新一波演唱会来了!你最期待谁

大象新闻
2024-12-03 13:48:13
内地黑工被弃尸香港街头!警方拘捕

内地黑工被弃尸香港街头!警方拘捕

热闹吃瓜大姐
2024-12-02 23:12:56
绝杀山西,谁注意这细节?任骏飞挡拆将原帅送给徐杰,阅读太强了

绝杀山西,谁注意这细节?任骏飞挡拆将原帅送给徐杰,阅读太强了

篮球资讯达人
2024-12-04 00:23:02
成都混团在激战张本美和拜神社许愿 今年年度汉字是银4年后要变金

成都混团在激战张本美和拜神社许愿 今年年度汉字是银4年后要变金

劲爆体坛
2024-12-03 17:52:08
范冰冰不怕“走光”,轻薄下水只为拍摄唯美画面,当年真是敬业

范冰冰不怕“走光”,轻薄下水只为拍摄唯美画面,当年真是敬业

南城无双
2024-10-28 11:23:54
为何中国不去申请举办奥运会了?原因很简单:

为何中国不去申请举办奥运会了?原因很简单:

现代春秋
2024-11-21 19:35:37
退休金的贫富差距极大就是对人人平等的最大讽刺!

退休金的贫富差距极大就是对人人平等的最大讽刺!

逍遥论经
2024-12-01 15:14:53
又要被绿?天才亚马尔19岁新女友公开示爱K77,球迷:亚马尔真惨

又要被绿?天才亚马尔19岁新女友公开示爱K77,球迷:亚马尔真惨

侧身凌空斩
2024-12-03 06:38:11
韩军开进首尔!尹锡悦宣布戒严令,遭国会190全票否定

韩军开进首尔!尹锡悦宣布戒严令,遭国会190全票否定

项鹏飞
2024-12-04 01:32:40
你身边有不听劝又无知的人吗?网友:认知低不听劝堪比活阎王!

你身边有不听劝又无知的人吗?网友:认知低不听劝堪比活阎王!

热闹的河马
2024-12-03 16:03:16
四大援军抵达,叙利亚准备反击!巴沙尔能否力挽狂澜?

四大援军抵达,叙利亚准备反击!巴沙尔能否力挽狂澜?

朵眸咊一笔
2024-12-02 23:01:09
有人列举郑钦文2025赛季8大目标!球迷泼冷水:一个也实现不了

有人列举郑钦文2025赛季8大目标!球迷泼冷水:一个也实现不了

搏击江湖
2024-12-03 21:09:34
2024-12-04 04:03:00
量子位
量子位
追踪人工智能动态
9699文章数 157449关注度
往期回顾 全部

科技要闻

美国芯片慎用!中国四大行业协会发声

头条要闻

韩国教育部凌晨通知:学还是要正常上

头条要闻

韩国教育部凌晨通知:学还是要正常上

体育要闻

特鲁姆普:我还是从前那个少年

娱乐要闻

50岁林志玲生日晒娃引热议

财经要闻

梁建章:建议对生孩子家庭发10万元

汽车要闻

标配Lion5.0科技座舱 风云A8L将于12月17日上市

态度原创

游戏
教育
旅游
艺术
军事航空

我们和三太子聊了聊 《怪猎荒野》确认追加中文语音!

教育要闻

温州日报作文版作文选登:张芮熙《小猫“七七”》

旅游要闻

飞机惊现老鼠窜来窜去?旅客质疑有安全隐患

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

军事要闻

古特雷斯就叙利亚局势发表声明

无障碍浏览 进入关怀版