OpenAI正在就许可CNN工作以训练ChatGPT进行谈判,同时纽约时报提起诉讼 - 彭博报道
Shirin Ghaffary, Graham Starr, Brody Ford
OpenAI正在与CNN、福克斯公司和时代进行许可谈判,以获取新闻内容,以构建其人工智能产品,同时面临着侵犯版权材料的指控。
这家开发ChatGPT的初创公司是一款让用户能够通过简单提示快速生成文本、代码和其他内容的工具,正在寻求与众多新闻、视频和其他数字媒体制作商达成协议,以使AI聊天机器人更准确、相关和及时。OpenAI还在与涉及版权侵权的诉讼进行斗争。
OpenAI正在讨论与华纳兄弟探索公司旗下的CNN许可文章,用于训练ChatGPT,并在OpenAI的产品中展示CNN的内容,根据知情人士透露,这位知情人士要求匿名讨论私人事务。CNN和福克斯拒绝置评。
时代首席执行官杰西卡·西布利在一份声明中表示,该出版商“正在与OpenAI进行讨论,我们对达成反映我们内容公平价值的协议持乐观态度。” OpenAI与这三家出版商的谈判此前尚未有报道。
OpenAI上周告诉彭博新闻社,它正在与数十家出版商就许可协议进行谈判,但没有提及具体公司。这些合作伙伴关系对OpenAI的未来至关重要,因为它需要平衡获取更新、准确数据来开发其模型的需求,同时还要面对公众对数据来源的审查。这家人工智能初创公司曾与纽约时报进行谈判,但上个月底,这家公司以及微软被纽约时报起诉,指控未经许可使用该出版物的文章。
作为对出版商谈判的回应,OpenAI的发言人指出了该公司最近的博客文章,其中提到了“与新闻机构的持续合作”。
OpenAI在周一的博客文章中表示:“我们的目标是支持健康的新闻生态系统,成为良好的合作伙伴,并创造互惠互利的机会”,并反击了《纽约时报》的诉讼。该公司表示,它“与新闻机构合作”来训练其人工智能系统,使用“非公开内容”并在ChatGPT中展示“带有归属的实时内容”。
OpenAI表示,他们正在与代表全球2200多家媒体机构的行业组织News/Media Alliance进行讨论,“探索机会,讨论他们的关切,并提供解决方案”。这家人工智能初创公司最近还与《纽约时报》报道的Gannett、News Corp.和IAC进行了交流。纽约时报。
一些其他大型媒体公司准备与OpenAI进行谈判。“我们之前与包括OpenAI在内的广泛开发者进行了对话,我们预计现在可能会转入关于使用我们的新闻来构建和推动他们的产品的商业讨论,”《卫报》的母公司Guardian News & Media在一份声明中表示。
OpenAI最近与Politico的母公司Axel Springer SE签订了为期多年的许可协议,据Bloomberg先前报道,金额达数千万美元。今年7月,OpenAI宣布与美联社达成协议,金额未公开。
并非所有大型出版商都在与OpenAI进行谈判。然而,《华盛顿邮报》的发言人表示,该出版商最近几个月没有与OpenAI进行过接触。一位匿名的媒体高管表示,他们的公司正在考虑采取针对OpenAI的法律行动,类似于《纽约时报》的做法。
出版商的一个关键关注点是补偿问题。《信息》此前报道称,OpenAI向出版商提供每年100万至500万美元的许可费来使用其文章。据知情人士称,这一范围对某些顶级出版商来说过低。一些媒体公司愿意接受更接近阿克塞尔·施普林格(Axel Springer)所获得的范围,一位知情人士表示。
一位匿名的媒体高管对能否与人工智能公司达成富有成效的协议持怀疑态度,直到法院澄清版权法如何适用于生成式人工智能。业内一些人士还呼吁美国国会介入。
周三,参议院司法委员会的一个小组委员会就新闻业中人工智能的监督举行了听证会。在听证会上,康泰纳仕(Condé Nast)首席执行官罗杰·林奇敦促国会颁布规定,即商业生成式人工智能必须获得版权内容的许可才能使用。他说:“当前的生成式人工智能工具是用偷来的货物建立起来的。”
一些熟悉媒体谈判的人士还强调了OpenAI将如何展示出版商内容以及有多少流量将被引导回媒体网站以增加其受众的重要性。OpenAI表示,其谈判的目标之一是以带有归属声明的方式展示出版商的实时内容。
OpenAI维护对受版权保护的作品的访问权利至关重要。在本月提交给英国上议院的文件中,OpenAI表示“如果不能使用受版权保护的材料,训练当今领先的人工智能模型将是不可能的”,因为如今有多少在线内容受版权保护。
“将训练数据限制在公共领域的图书和一个多世纪前创作的图纸可能会产生有趣的实验,”该公司表示,“但不会提供满足当今公民需求的人工智能系统。”