AI搜索赛道的明星公司Perplexity,在以80 亿美元估值寻求新一轮融资之际,遭遇多家出版机构的内容剽窃指控。
先是《纽约时报》10月初向Perplexity发出侵权告知函,要求其停止访问和使用《纽约时报》的内容。据《华尔街日报》看到的告知函,《纽约时报》警告Perplexity创建摘要和输出其他内容的过程中,侵犯了其版权。
紧接着在当地时间10月21日,Perplexity遭遇传媒大亨默多克旗下的道琼斯和《纽约邮报》两家公司的起诉。诉讼的理由不仅包含版权侵权,还涉及对两家公司商标权的侵犯——这是现有针对大模型公司诉讼案件中,一项不同以往的指控。
指控:版权、商标权侵权
根据道琼斯和《纽约邮报》向纽约南区地方法院提交的诉状,原告方从AI搜索训练数据输入、响应用户指令进行内容输出两个维度来论证版权侵权的依据。
原告称,Perplexity未经授权或支付报酬,访问并复制了大量包含受版权保护的网页作品,并将这些作品用于RAG(检索增强生成),即从外部知识库中检索相关信息,然后输入大模型,以增强模型处理知识密集型任务的能力。Perplexity大规模复制原告的作品,并将这些提供给庞大的“检索增强生成”数据库。可以看出其中明显的商业目的,而不属于合理使用。
为用户输出答案时,Perplexity经常原封不动地呈现原告的新闻和评论文章的全文或部分内容。尤其对高级服务的订阅用户来说,他们可以更频繁地访问这些内容的原文。即便不是原文照搬,Perplexity也会对版权内容进行同义词替换,或提供摘要,这实际上构成对版权作品的替代性使用。
Perplexity在输出的答案中,复现了版权作品内容。图:起诉状
从输出端进一步引申,原告发现,Perplexity生成的内容中,除了包含原告方对版权作品,还会因大模型“幻觉”原因,凭空捏造虚构的信息,并把这些内容归类到原告商标标识名下。原告称,这可能会引起用户混淆或误解,让公众认为原告与“幻觉”而生成的虚构信息存在关联,使得原告的商标被模糊或玷污。
Perplexity生成的内容中出现了“无中生有”情况。图:起诉状
原告由此援引《兰哈姆法》(美国《商标法》)为依据,指控Perplexity构成商标权侵权。
损失:出版商沦为AI的牺牲品?
经营损失层面,原告论述说,与传统互联网搜索引擎为内容网站提供导流的模式不同,Perplexity的商业模式剥夺了内容创作者的变现机会,损害到原告进行内容授权、付费订阅和广告收入等多项收入来源。
今年5月,道琼斯和《纽约邮报》背后的新闻集团和OpenAI签订5年协议,授权后者使用新闻集团旗下媒体的内容。这也是OpenAI应对接踵而至的版权诉讼危机时,不得不采取的应对之举,因此可以看到大量的出版机构同OpenAI有类似版权授权合作。
“内容创作者和AI公司之间并不是零和游戏,二者可以通过合作实现互利共赢。”但本案两位原告提到,2024年7月,原告致信Perplexity,告知其未经授权使用原告受版权保护的作品,并提出讨论潜在的许可协议,而Perplexity没有理会。
《纽约时报》10月初发出警告信时,Perplexity曾对外回应称:“我们非常有兴趣与每家出版商合作,我们不想成为任何人的对手。”
实际上,Perplexity此前曾向内容出版机构让步。6月中旬,《福布斯》杂志公开批评Perplexity大篇幅抄袭《福布斯》的文章,并且对原始文章的引用不够突出,可能导致一些读者误以为该内容由Perplexity撰写。6月下旬,著名科技媒体《连线》杂志也站出来指控Perplexity剽窃其报道文章。
受到外界压力的Perplexity,随后于7月30日发布一项和内容出版机构的收入分成计划。分成的收益来自Perplexity的广告收入:当Perplexity从引用出版商内容的AI搜索互动中获得广告收入时,出版商可以得到一定比例的分成。加入这项计划的首批出版商,包括《时代》《明镜周刊》《财富》《企业家》《得克萨斯论坛报》和 WordPress.com。(详见:回应剽窃指控,这家AI搜索明星公司决定与出版商分享收益)
Perplexity成立于2022年8月,曾获亚马逊创始人贝索斯投资,当前正是AI搜索这一细分赛道的新锐力量。外界常常将其视为谷歌在搜索领域的挑战者。
今年4月下旬,Perplexity完成6270万美元的第三轮融资,公司估值已超过10亿美元。据彭博社6月下旬的消息,当时Perplexity的估值攀升至30亿美元。另据《华尔街日报》10月20日披露,Perplexity正在以80亿美元的估值开始融资谈判,计划筹资约5亿美元。
AI搜索带来的出版商和AI公司利益冲突,已在多国引起关注。
今年7月17日,日本新闻协会曾发布声明炮轰AI搜索服务提供商,指控谷歌、微软等公司推出的AI搜索功能,未经许可使用新闻内容作为信息源,AI搜索给出的许多答案与原始新闻文章相似,有侵犯著作权之虞。而且,许多用户对AI生成的答案感到满意后,不会访问推荐的网站,这给新闻机构带来了明显不利。该协会要求AI搜索服务提供商必须获得出版机构许可并支付补偿,同时呼吁日本政府尽快修法,完善著作权法等法律。
8月中旬,知网发函警告AI搜索初创公司秘塔科技,未经许可在AI搜索结果中呈现学术文献题目、目录及摘要内容,构成严重侵权。秘塔随后表示,不再收录知网文献的题录及摘要数据。秘塔科技首席运营官王益为此前告诉南都记者,日常的版权合规管理上,秘塔科技按照不低于国内搜索大厂的合规标准来操作,“违反数据抓取协议的事肯定不干”;另外,如果版权方要求不收录,秘塔科技愿意配合。(详见:提供论文摘要涉嫌侵权?秘塔AI搜索遭知网投诉)
采写:南都记者 杨柳
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.