YouTube表示，OpenAI使用其视频训练Sora将违反规定 - 彭博社

Davey Alba, Emily Chang

2024-04-05

尼尔·莫汉，YouTube首席执行官

摄影师：凯尔·格里洛特/彭博社使用YouTube视频来训练OpenAI的文本到视频生成器将违反该平台的服务条款，YouTube首席执行官尼尔·莫汉表示。

在这个话题上首次公开发表讲话时，莫汉表示，他并没有第一手了解OpenAI是否确实使用了YouTube视频来完善其名为Sora的人工智能视频创作工具。但如果是这样的话，那将是YouTube服务条款的“明显违规”，他说。

“从创作者的角度来看，当一个创作者将他们的辛勤劳动上传到我们的平台时，他们有一定的期望，”莫汉在接受彭博原创节目主持人Emily Chang采访时说。“其中之一就是服务条款将会被遵守。它不允许下载剧本或视频片段，这是我们服务条款的明显违规。这些是我们平台内容的规则。”

YouTube表示，使用视频来训练OpenAI的Sora违反规定

关于OpenAI使用什么材料来训练ChatGPT和DALL-E等流行内容创作产品背后的AI模型，已经引起了公众广泛的讨论。Sora和其他生成式AI工具通过吸收来自网络各处的各种内容，并将这些数据作为工具生成新内容的基础，包括视频、照片、叙事文本等。随着OpenAI、谷歌等公司竞相开发更强大的人工智能，它们正在寻求尽可能多地获取内容来训练他们的AI模型，以获得更高质量的结果。谷歌和YouTube是Alphabet Inc.的子公司。

OpenAI，由微软公司支持，尚未立即回应评论请求。OpenAI首席技术官米拉·穆拉蒂（Mira Murati）在上个月接受《华尔街日报》的采访中表示，她不确定Sora是否是在YouTube、Facebook和Instagram上的用户生成视频上进行训练的。《华尔街日报》本周报道称，OpenAI已经讨论过在公开YouTube视频的转录上训练其下一代大型语言模型GPT-5，引述了知情人士的话。

莫汉表示，谷歌会遵守YouTube与创作者的个别合同，然后再决定是否使用平台上的视频来训练公司自己的强大AI模型Gemini。

“许多创作者在我们平台上的内容有不同类型的许可合同，”莫汉说。尽管“YouTube的一部分语料库可能被用来”训练像Gemini这样的模型，但谷歌和YouTube确保使用这些视频作为谷歌AI的训练数据是“与创作者事先签署的服务条款或合同一致的”，他说。