Meta知道他们在训练人工智能时使用了盗版书籍，作者们表示 | 路透社

Blake Brittain

2025-01-10

2023年1月9日（路透社）- Meta(META.O)使用了盗版的受版权保护的书籍版本来训练其人工智能系统，并得到了首席执行官马克·扎克伯格的批准，一组作者在最近公开的法律文件中声称。塔-内希西·科茨、喜剧演员莎拉·西尔弗曼和其他起诉Meta侵犯版权的作者在周三在加利福尼亚联邦法院公开的文件中提出了这些指控。他们表示，Meta在发现过程中产生的内部文件显示，该公司知道这些作品是被盗版的。

Meta的代表没有对此事发表评论。

作者们在2023年起诉Meta，认为这家拥有Facebook和Instagram的公司不当使用了他们的书籍来训练其大型语言模型Llama。

此案是多个声称受版权保护的作品在未获许可的情况下被用于开发人工智能产品的案件之一。被告辩称他们对材料的使用属于合理使用。

作者们声称新的证据显示Meta使用了AI训练数据集LibGen，该数据集据称包含数百万部盗版作品，并通过点对点的torrent进行分发。

起诉书称Meta的内部通信显示，扎克伯格“批准了Meta使用LibGen数据集，尽管公司人工智能执行团队（以及Meta的其他人）对此表示担忧，认为LibGen是‘我们知道是盗版的数据集’”。

去年，美国地区法官文斯·查布里亚驳回了关于Meta的聊天机器人生成的文本侵犯版权的指控，并认为Meta非法删除了其书籍的版权管理信息（CMI）。

查布里亚在本周四的听证会上表示，将允许作家提交更新的投诉，但对这些投诉的合理性表示怀疑。

((翻译编辑部圣保罗, 55 11 56447753))

路透社 AAJ

建议主题：
科技