剽窃指控不断，这家AI搜索明星公司卷入诉讼漩涡|侵权|原告|版权

剽窃指控不断，这家AI搜索明星公司卷入诉讼漩涡

2024-10-23 11:29:12　来源: 南方都市报

广东举报

分享至

AI搜索赛道的明星公司Perplexity，在以80 亿美元估值寻求新一轮融资之际，遭遇多家出版机构的内容剽窃指控。

先是《纽约时报》10月初向Perplexity发出侵权告知函，要求其停止访问和使用《纽约时报》的内容。据《华尔街日报》看到的告知函，《纽约时报》警告Perplexity创建摘要和输出其他内容的过程中，侵犯了其版权。

紧接着在当地时间10月21日，Perplexity遭遇传媒大亨默多克旗下的道琼斯和《纽约邮报》两家公司的起诉。诉讼的理由不仅包含版权侵权，还涉及对两家公司商标权的侵犯——这是现有针对大模型公司诉讼案件中，一项不同以往的指控。

指控：版权、商标权侵权

根据道琼斯和《纽约邮报》向纽约南区地方法院提交的诉状，原告方从AI搜索训练数据输入、响应用户指令进行内容输出两个维度来论证版权侵权的依据。

原告称，Perplexity未经授权或支付报酬，访问并复制了大量包含受版权保护的网页作品，并将这些作品用于RAG（检索增强生成），即从外部知识库中检索相关信息，然后输入大模型，以增强模型处理知识密集型任务的能力。Perplexity大规模复制原告的作品，并将这些提供给庞大的“检索增强生成”数据库。可以看出其中明显的商业目的，而不属于合理使用。

为用户输出答案时，Perplexity经常原封不动地呈现原告的新闻和评论文章的全文或部分内容。尤其对高级服务的订阅用户来说，他们可以更频繁地访问这些内容的原文。即便不是原文照搬，Perplexity也会对版权内容进行同义词替换，或提供摘要，这实际上构成对版权作品的替代性使用。

Perplexity在输出的答案中，复现了版权作品内容。图：起诉状

从输出端进一步引申，原告发现，Perplexity生成的内容中，除了包含原告方对版权作品，还会因大模型“幻觉”原因，凭空捏造虚构的信息，并把这些内容归类到原告商标标识名下。原告称，这可能会引起用户混淆或误解，让公众认为原告与“幻觉”而生成的虚构信息存在关联，使得原告的商标被模糊或玷污。

Perplexity生成的内容中出现了“无中生有”情况。图：起诉状

原告由此援引《兰哈姆法》（美国《商标法》）为依据，指控Perplexity构成商标权侵权。

损失：出版商沦为AI的牺牲品？

经营损失层面，原告论述说，与传统互联网搜索引擎为内容网站提供导流的模式不同，Perplexity的商业模式剥夺了内容创作者的变现机会，损害到原告进行内容授权、付费订阅和广告收入等多项收入来源。

今年5月，道琼斯和《纽约邮报》背后的新闻集团和OpenAI签订5年协议，授权后者使用新闻集团旗下媒体的内容。这也是OpenAI应对接踵而至的版权诉讼危机时，不得不采取的应对之举，因此可以看到大量的出版机构同OpenAI有类似版权授权合作。

“内容创作者和AI公司之间并不是零和游戏，二者可以通过合作实现互利共赢。”但本案两位原告提到，2024年7月，原告致信Perplexity，告知其未经授权使用原告受版权保护的作品，并提出讨论潜在的许可协议，而Perplexity没有理会。

《纽约时报》10月初发出警告信时，Perplexity曾对外回应称：“我们非常有兴趣与每家出版商合作，我们不想成为任何人的对手。”

实际上，Perplexity此前曾向内容出版机构让步。6月中旬，《福布斯》杂志公开批评Perplexity大篇幅抄袭《福布斯》的文章，并且对原始文章的引用不够突出，可能导致一些读者误以为该内容由Perplexity撰写。6月下旬，著名科技媒体《连线》杂志也站出来指控Perplexity剽窃其报道文章。

受到外界压力的Perplexity，随后于7月30日发布一项和内容出版机构的收入分成计划。分成的收益来自Perplexity的广告收入：当Perplexity从引用出版商内容的AI搜索互动中获得广告收入时，出版商可以得到一定比例的分成。加入这项计划的首批出版商，包括《时代》《明镜周刊》《财富》《企业家》《得克萨斯论坛报》和 WordPress.com。（详见：回应剽窃指控，这家AI搜索明星公司决定与出版商分享收益）

Perplexity成立于2022年8月，曾获亚马逊创始人贝索斯投资，当前正是AI搜索这一细分赛道的新锐力量。外界常常将其视为谷歌在搜索领域的挑战者。

今年4月下旬，Perplexity完成6270万美元的第三轮融资，公司估值已超过10亿美元。据彭博社6月下旬的消息，当时Perplexity的估值攀升至30亿美元。另据《华尔街日报》10月20日披露，Perplexity正在以80亿美元的估值开始融资谈判，计划筹资约5亿美元。

AI搜索带来的出版商和AI公司利益冲突，已在多国引起关注。

今年7月17日，日本新闻协会曾发布声明炮轰AI搜索服务提供商，指控谷歌、微软等公司推出的AI搜索功能，未经许可使用新闻内容作为信息源，AI搜索给出的许多答案与原始新闻文章相似，有侵犯著作权之虞。而且，许多用户对AI生成的答案感到满意后，不会访问推荐的网站，这给新闻机构带来了明显不利。该协会要求AI搜索服务提供商必须获得出版机构许可并支付补偿，同时呼吁日本政府尽快修法，完善著作权法等法律。

8月中旬，知网发函警告AI搜索初创公司秘塔科技，未经许可在AI搜索结果中呈现学术文献题目、目录及摘要内容，构成严重侵权。秘塔随后表示，不再收录知网文献的题录及摘要数据。秘塔科技首席运营官王益为此前告诉南都记者，日常的版权合规管理上，秘塔科技按照不低于国内搜索大厂的合规标准来操作，“违反数据抓取协议的事肯定不干”；另外，如果版权方要求不收录，秘塔科技愿意配合。（详见：提供论文摘要涉嫌侵权？秘塔AI搜索遭知网投诉）

采写：南都记者杨柳

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.