《纽约时报》在对开放AI和微软的诉讼中占据优势-彭博报道

Noah Feldman

2023-12-28

只是试图保持活着。

摄影师：Mario Tama/Getty Images/Getty Images

纽约时报对OpenAI和微软提起的侵犯版权诉讼将传统媒体机构与新技术提供者对立起来。象征性地，这个案件承诺了巨头之间的冲突：人力新闻采集与由人工智能产生的信息之间的对抗。但在法律上，这个案件代表了不同的东西：传统法律与新兴技术之间的滞后现象。

版权法是一套可以追溯到印刷机时代的规则，它并不是为了覆盖ChatGPT这样的大型语言模型而设计的。法院将不得不有意识地对其进行演变，或者由国会进行修正，以适应我们当前的情况。

案件中的关键法律问题将是被称为公平使用的原则。在1976年版权法案中被编纂，公平使用告诉你何时可以使用他人版权的文本。公平使用测试有四个因素。教育和非营利性使用更有可能被认为是公平使用。创意作品比技术写作或新闻获得更多的版权保护。被复制的作品的数量很重要，被复制的材料对被复制的作品的核心性也很重要。对于时报的诉讼来说，法院还会考虑复制是否会损害被复制作品的现在或未来市场。

一旦你了解了法律，你就可以大致猜测案件中的法律论点会是什么样的。《时代》将指出用户向ChatGPT或必应提问，它们回复的内容与《纽约时报》的文章非常相似的例子。该报将观察到ChatGPT是商业的一部分，并收取访问其最新版本的费用，必应是微软业务的核心部分。《时代》将强调新闻业的创造性方面。最重要的是，它将主张，如果你可以向由LLM驱动的搜索引擎询问当天的新闻，并直接从《纽约时报》获取内容，这将严重损害甚至可能摧毁《时代》的商业模式。

这些观点大多是合理的法律论点。但OpenAI和微软将为此做好准备。他们可能会回应说，他们的LLM并不是复制；相反，它是学习并进行统计预测以产生新的答案。如果我读了《纽约时报》的一篇文章，然后就同一主题写了一篇彭博观点专栏，那并不构成侵犯版权，尽管我可能从《时报》那篇文章中学到了很多，并依赖那些信息来形成自己的观点。因此，许多版权专家一直在推测，LLM从现有的在线材料中学习，即使这些材料受版权保护，也不可能构成版权侵权。被告还可以预计会主张新闻由事实组成，因此应该比创造性材料更宽容地对待。

但微软和OpenAI将很难反驳最后一点 —— 他们的产品依赖于《时代》等新闻业务，将损害这些企业。ChatGPT和其他LLM无法走出去收集和审核新的事实。在可预见的未来，它们受限于从已经发表的信息中“学习”。

由此可见，要使LLMs提供有用的信息，必须有其他人 — 也就是人类LLM — 首先收集信息，确定其准确性，然后发布。这就是新闻采集的本质。要做到这一点是很昂贵的。

更重要的是，为了知道我们可以依赖新闻，我们需要它来自一个我们可以信任的机构 — 一个有着良好记录和商业利益的声誉。否则，我们将不会有新闻。我们将会有一个与现实脱节的迭代回音室。

这就是公共利益在维护新闻自由方面与公平使用问题相关的地方。如果你可以从LLM那里以比从《纽约时报》更便宜的方式获取信息，你可能会取消订阅。但如果每个人都这样做，就根本不会有《纽约时报》了。换句话说，OpenAI和微软需要《纽约时报》和其他新闻机构的存在，才能作为其服务的一部分提供可靠的新闻。因此，从理性和经济的角度来看，他们应该有义务为他们使用的信息付费。

将这种强大的公共利益纳入版权法将对法院来说并不简单。直接复制是最容易惩罚的侵权形式。在普通的法律情况下，如果LLMs改变了足够的词语以进行概括而不是复制，那就削弱了《纽约时报》的案件。然而，用不同的词语进行概括仍足以摧毁《纽约时报》和类似的组织 — 并让我们失去新闻。

法院将需要对所有这些保持敏感。如果他们做不到，国会将不得不采取行动。新闻基础设施已经摇摇欲坠。如果我们彻底摧毁它，民主将是输家。

更多彭博观点：

神秘的聊天机器人开发者正在犯一个大错误：戴夫·李
不要让ChatGPT写太多粉丝小说：斯蒂芬·卡特
在揭开人工智能黑匣子方面迈出了一小步，但这是受欢迎的：帕米·奥尔森

想要更多彭博观点吗？OPIN <GO>。 或者订阅****我们的每日新闻简报。