OpenAI不想在《纽约时报》上进行训练，CEO阿尔特曼表示-彭博社

Brad Stone, Jake Rudnitsky

2024-01-17

人工智能不需要像《纽约时报》这样的出版商提供大量的训练数据，这是OpenAI首席执行官萨姆·奥尔特曼对其初创公司涉嫌窃取受版权保护的材料的指控做出的回应。

“有些人认为你需要所有我的训练数据，我的训练数据非常有价值，”奥尔特曼在达沃斯世界经济论坛年会的彭博大厦上周二表示。“实际上，情况通常并非如此。例如，我们不希望在《纽约时报》的数据上进行训练。”

ChatGPT的制造商OpenAI正在大力推动获取新闻内容的访问权限，此前《纽约时报》起诉了这家初创公司以及其最大的投资者微软公司，指控其涉嫌侵犯版权造成数十亿美元的损失。这样的合作伙伴关系对于OpenAI的未来至关重要，因为它需要及时准确的数据来开发其模型，同时也要面对公众对数据来源的质疑。

OpenAI首席执行官萨姆·奥尔特曼和该公司全球事务副总裁安娜·马坎朱在达沃斯的彭博大厦与彭博的布拉德·斯通进行交谈。

据悉，OpenAI正在与包括CNN、福克斯公司和时代在内的出版商进行许可新闻内容的谈判。该公司的知识产权和内容负责人此前告诉彭博，该初创公司正在进行数十项潜在的许可协议。

“我们想要与出版商合作——如果他们愿意的话——当我们的用户问，达沃斯今天发生了什么，我们就能够说，这是彭博社的一篇文章，这是《纽约时报》的一篇文章，” 阿尔特曼说。“有些人想要与我们合作，有些人不想。”

在诉讼之前，OpenAI和《纽约时报》自4月以来一直在就许可问题进行接触，但未能达成协议。这家人工智能公司还面临来自包括喜剧演员莎拉·西尔弗曼、《权力的游戏》作者乔治·R·R·马丁和普利策奖得主迈克尔·查邦在内的作家的集体诉讼。

其他出版商更愿意合作。OpenAI与美联社签订了一项协议，以获取该新闻机构的部分档案。它在12月与阿克塞尔·施普林格集团达成了一项为期三年的协议，使用该德国传媒公司的作品，金额未公开。

“我们的很多研究都是关于如何从少量但质量很高的数据中学到更多，” 阿尔特曼说。