OpenAI正在与数十家出版商进行许可内容的谈判 - 彭博社

Shirin Ghaffary

2024-01-05

OpenAI表示正在与数十家出版商进行谈判，以许可他们的文章，这是一项比之前所知更广泛的努力，因为这家初创公司正在寻找内容来训练其人工智能模型。

“我们正在与许多出版商进行许多谈判和讨论。这些谈判正在进行中。他们非常积极。进展顺利，”OpenAI的知识产权和内容负责人汤姆·鲁宾告诉彭博新闻社。“你已经看到了宣布的交易，未来还会有更多。”

OpenAI最近与Politico的母公司Axel Springer SE签署了一项为期多年的许可协议，金额为数千万美元，一位知情人士此前告诉彭博社。今年7月，OpenAI宣布与美联社达成了一项未公开金额的协议。这些交易对于OpenAI的未来至关重要，因为它需要更新、准确的数据来构建其模型，同时也面临着越来越多关于数据来源的审查。

但上周，OpenAI曾进行谈判的一家公司纽约时报公司起诉了OpenAI和微软公司，指控他们未经许可使用了该出版物的文章。

这场诉讼对OpenAI的业务构成了一种生存挑战。如果时报公司赢得这场官司，OpenAI可能不仅需要支付数十亿美元，还可能被迫销毁包含时报公司作品的任何训练数据，这是一项昂贵且复杂的任务。然而更紧迫的是，这场诉讼使OpenAI与媒体行业的交易努力变得更加复杂。

“当前情况与出版商过去在搜索引擎和社交媒体面临的情况大不相同，”鲁宾说。“在这里，内容被用来训练模型。它不是用来复制内容。也不是用来替换内容。”

然而，《纽约时报》不同意OpenAI的立场，认为ChatGPT在未付费的情况下直接复制了其记者的工作。在诉讼中，该出版商展示了ChatGPT输出了几乎一模一样的段落，而这些段落几乎完全复制了《纽约时报》的文字（尽管有人指出，在某些例子中，它明确要求ChatGPT复制《纽约时报》的内容）。该出版商认为这证明了OpenAI使用了《纽约时报》的数据。

“如果微软和OpenAI想要将我们的作品用于商业目的，法律要求他们首先获得我们的许可，”《纽约时报》在一份声明中表示。“他们没有这样做。”