《纽约时报》揭露:ChatGPT通过非黑客手段突破付费墙

发表时间: 2024-03-13 07:58

IT之家 3 月 13 日消息,纽约时报去年对 OpenAI 和微软发起诉讼,声称对方公司 AI 侵权,而 OpenAI 称该报“黑”了 ChatGPT 以便针对他们来生成具有误导性的诉讼证据。

现在,纽约时报对 OpenAI 关于“黑客入侵”的说法作出了回应,指责 OpenAI 歪曲事实,从而转移公众注意力。

“OpenAI 错了,”纽约时报在一份法院文件中反复辩称,“OpenAI 试图转移注意力的说法,即‘纽约时报黑了其产品’这种说辞毫无意义且站不住脚”。

此外,纽约时报在为其用提示引导 ChatGPT 吐出记忆(即训练数据,包括 100 多篇《纽约时报》文章)的策略辩护时指出,ChatGPT 用户经常使用该工具生成整篇文章以绕过付费墙。

纽约时报辩称,他们目前并不知道有多少篇文章已经被用来训练 GPT-3 和 OpenAI 后续的 AI 模型,也不知道 OpenAI 使用了哪些特定文章,因为 OpenAI “没有公开披露用于训练其人工智能模型的数据集构成”。

纽约时报强调,他们并不是为了提起诉讼,而是通过提示 ChatGPT 来发现证据,以试图追踪“该工具侵犯版权的全部范围”。

法院文件显示,为了弄清楚 ChatGPT 是否侵犯了某些文章的版权,纽约时报“通过向 GPT-4 提供《纽约时报》文章的开头几个单词或句子来引出其记忆的例子”。

OpenAI 辩称,“在现实世界中,人们不会使用 ChatGPT 或任何其他 OpenAI 产品 从付费墙后面的文章中生成精確的文本”,而纽约时报辩称“使用 ChatGPT 绕过付费墙” 的行为已经“被广泛报道”。

纽约时报在法院文件中提到,“根据 OpenAI 的说法,《纽约时报》发现 OpenAI 盗窃了《纽约时报》自己的版权内容,从而犯下了不法行为”“OpenAI 真正的不满并不是我们如何进行调查,而是调查揭露了什么:被告通过大规模复制《纽约时报》的内容来训练他们的产品 —— 这是 OpenAI 既不承认也无法否认的事实。”

IT之家附前情提要:

2023 年 12 月 27 日,纽约时报对 OpenAI 和微软发起诉讼,声称对方公司“未经授权而使用了数百万”文章来训练其 AI 模型,导致其 AI“可以生成逐字背诵的《纽约时报》内容,对其进行总结并模仿其表达风格进行输出”,这“破坏了它与读者之间的关系”,同时也剥夺了其“订阅、许可、广告和附属收入”。

2024 年 1 月 7 日,OpenAI 针对《纽约时报》的侵权指控回应称:该机构一直在文章的开头提示 GPT 模型,导致模型产出的文本十分接近原文,从而增加了侵犯版权的可能性,可谓是“鼓励侵权”。

2024 年 1 月 17 日,OpenAI 阿尔特曼回应被《纽约时报》起诉:他们也不想用新闻出版商提供的训练数据,而且 OpenAI 正在与包括 CNN、福克斯公司和时代周刊在内的出版商洽谈新闻内容授权事宜。

2 月 28 日,OpenAI 要求美联邦法官驳回《纽约时报》对其提起的部分版权诉讼,声称《纽约时报》黑入了 ChatGPT 等 AI 系统,为此前的诉讼生成了“具有误导性”的证据