OpenAI正在与数十家出版商进行许可内容的谈判 - 彭博社
Shirin Ghaffary
OpenAI表示正在与数十家出版商进行谈判,以许可他们的文章,这是一项比之前所知更广泛的努力,因为这家初创公司正在寻找内容来训练其人工智能模型。
“我们正在与许多出版商进行许多谈判和讨论。这些谈判正在进行中。他们非常积极。进展顺利,”OpenAI的知识产权和内容负责人汤姆·鲁宾告诉彭博新闻社。“你已经看到了宣布的交易,未来还会有更多。”
OpenAI最近与Politico的母公司Axel Springer SE签署了一项为期多年的许可协议,金额为数千万美元,一位知情人士此前告诉彭博社。今年7月,OpenAI宣布与美联社达成了一项未公开金额的协议。这些交易对于OpenAI的未来至关重要,因为它需要更新、准确的数据来构建其模型,同时也面临着越来越多关于数据来源的审查。
但上周,OpenAI曾进行谈判的一家公司纽约时报公司起诉了OpenAI和微软公司,指控他们未经许可使用了该出版物的文章。
这场诉讼对OpenAI的业务构成了一种生存挑战。如果时报公司赢得这场官司,OpenAI可能不仅需要支付数十亿美元,还可能被迫销毁包含时报公司作品的任何训练数据,这是一项昂贵且复杂的任务。然而更紧迫的是,这场诉讼使OpenAI与媒体行业的交易努力变得更加复杂。
“当前情况与出版商过去在搜索引擎和社交媒体面临的情况大不相同,”鲁宾说。“在这里,内容被用来训练模型。它不是用来复制内容。也不是用来替换内容。”
然而,《纽约时报》不同意OpenAI的立场,认为ChatGPT在未付费的情况下直接复制了其记者的工作。在诉讼中,该出版商展示了ChatGPT输出了几乎一模一样的段落,而这些段落几乎完全复制了《纽约时报》的文字(尽管有人指出,在某些例子中,它明确要求ChatGPT复制《纽约时报》的内容)。该出版商认为这证明了OpenAI使用了《纽约时报》的数据。
“如果微软和OpenAI想要将我们的作品用于商业目的,法律要求他们首先获得我们的许可,”《纽约时报》在一份声明中表示。“他们没有这样做。”