YouTube表示,OpenAI使用其视频训练Sora将违反规定 - 彭博社
Davey Alba, Emily Chang
尼尔·莫汉,YouTube首席执行官
摄影师:凯尔·格里洛特/彭博社使用YouTube视频来训练OpenAI的文本到视频生成器将违反该平台的服务条款,YouTube首席执行官尼尔·莫汉表示。
在这个话题上首次公开发表讲话时,莫汉表示,他并没有第一手了解OpenAI是否确实使用了YouTube视频来完善其名为Sora的人工智能视频创作工具。但如果是这样的话,那将是YouTube服务条款的“明显违规”,他说。
“从创作者的角度来看,当一个创作者将他们的辛勤劳动上传到我们的平台时,他们有一定的期望,”莫汉在接受彭博原创节目主持人Emily Chang采访时说。“其中之一就是服务条款将会被遵守。它不允许下载剧本或视频片段,这是我们服务条款的明显违规。这些是我们平台内容的规则。”
YouTube表示,使用视频来训练OpenAI的Sora违反规定
关于OpenAI使用什么材料来训练ChatGPT和DALL-E等流行内容创作产品背后的AI模型,已经引起了公众广泛的讨论。Sora和其他生成式AI工具通过吸收来自网络各处的各种内容,并将这些数据作为工具生成新内容的基础,包括视频、照片、叙事文本等。随着OpenAI、谷歌等公司竞相开发更强大的人工智能,它们正在寻求尽可能多地获取内容来训练他们的AI模型,以获得更高质量的结果。谷歌和YouTube是Alphabet Inc.的子公司。
OpenAI,由微软公司支持,尚未立即回应评论请求。OpenAI首席技术官米拉·穆拉蒂(Mira Murati)在上个月接受《华尔街日报》的采访中表示,她不确定Sora是否是在YouTube、Facebook和Instagram上的用户生成视频上进行训练的。《华尔街日报》本周报道称,OpenAI已经讨论过在公开YouTube视频的转录上训练其下一代大型语言模型GPT-5,引述了知情人士的话。
莫汉表示,谷歌会遵守YouTube与创作者的个别合同,然后再决定是否使用平台上的视频来训练公司自己的强大AI模型Gemini。
“许多创作者在我们平台上的内容有不同类型的许可合同,”莫汉说。尽管“YouTube的一部分语料库可能被用来”训练像Gemini这样的模型,但谷歌和YouTube确保使用这些视频作为谷歌AI的训练数据是“与创作者事先签署的服务条款或合同一致的”,他说。