《纽约时报》揭秘：ChatGPT如何绕过付费墙？

发表时间: 2024-03-13 08:47

纽约时报去年对OpenAI 和微软发起诉讼，声称对方公司 AI 侵权，而 OpenAI 称该报“黑”了 ChatGPT 以便针对他们来生成具有误导性的诉讼证据。

现在，纽约时报对 OpenAI 关于“黑客入侵”的说法作出了回应，指责 OpenAI 歪曲事实，从而转移公众注意力。

“OpenAI 错了，”纽约时报在一份法院文件中反复辩称，“OpenAI 试图转移注意力的说法，即‘纽约时报黑了其产品’这种说辞毫无意义且站不住脚”。

此外，纽约时报在为其用提示引导 ChatGPT 吐出记忆（即训练数据，包括 100 多篇《纽约时报》文章）的策略辩护时指出，ChatGPT 用户经常使用该工具生成整篇文章以绕过付费墙。

纽约时报辩称，他们目前并不知道有多少篇文章已经被用来训练 GPT-3 和 OpenAI 后续的 AI 模型，也不知道 OpenAI使用了哪些特定文章，因为 OpenAI “没有公开披露用于训练其人工智能模型的数据集构成”。

纽约时报强调，他们并不是为了提起诉讼，而是通过提示 ChatGPT 来发现证据，以试图追踪“该工具侵犯版权的全部范围”。

法院文件显示，为了弄清楚 ChatGPT 是否侵犯了某些文章的版权，纽约时报“通过向 GPT-4 提供《纽约时报》文章的开头几个单词或句子来引出其记忆的例子”。

OpenAI 辩称，“在现实世界中，人们不会使用 ChatGPT 或任何其他 OpenAI 产品从付费墙后面的文章中生成精確的文本”，而纽约时报辩称“使用 ChatGPT 绕过付费墙” 的行为已经“被广泛报道”。

纽约时报在法院文件中提到，“根据 OpenAI 的说法，《纽约时报》发现 OpenAI 盗窃了《纽约时报》自己的版权内容，从而犯下了不法行为”“OpenAI 真正的不满并不是我们如何进行调查，而是调查揭露了什么：被告通过大规模复制《纽约时报》的内容来训练他们的产品 —— 这是 OpenAI 既不承认也无法否认的事实。”

IT之家附前情提要：

2023 年 12 月 27 日，纽约时报对 OpenAI 和微软发起诉讼，声称对方公司“未经授权而使用了数百万”文章来训练其 AI 模型，导致其 AI“可以生成逐字背诵的《纽约时报》内容，对其进行总结并模仿其表达风格进行输出”，这“破坏了它与读者之间的关系”，同时也剥夺了其“订阅、许可、广告和附属收入”。

2024 年 1 月 7 日，OpenAI 针对《纽约时报》的侵权指控回应称：该机构一直在文章的开头提示 GPT 模型，导致模型产出的文本十分接近原文，从而增加了侵犯版权的可能性，可谓是“鼓励侵权”。

2024 年 1 月 17 日，OpenAI 阿尔特曼回应被《纽约时报》起诉：他们也不想用新闻出版商提供的训练数据，而且OpenAI 正在与包括 CNN、福克斯公司和时代周刊在内的出版商洽谈新闻内容授权事宜。

2 月 28 日，OpenAI 要求美联邦法官驳回《纽约时报》对其提起的部分版权诉讼，声称《纽约时报》黑入了 ChatGPT 等 AI 系统，为此前的诉讼生成了“具有误导性”的证据。

本文源自IT之家

《纽约时报》揭秘：ChatGPT如何绕过付费墙？

热门阅读

推荐阅读