中国提议为生成式人工智能模型制定培训数据黑名单

Reuters

2023-10-12

人工智能词语出现在这幅插图中，拍摄于2023年3月31日。路透社/Dado Ruvic/插图

北京，10月12日(路透社) - 中国已经发布了针对提供由生成式人工智能驱动的服务的安全要求，包括不能用于训练AI模型的来源黑名单。

生成式人工智能，由OpenAI的ChatGPT聊天机器人的成功所推广，学习如何从过去的数据中采取行动，并创建新内容，如文本或图像，基于该训练。

这些要求是由国家信息安全标准化委员会于周三发布的，该委员会包括来自中国国家互联网信息办公室(CAC)、工业和信息化部以及警方的官员。

该委员会建议对用于训练面向公众的生成式人工智能模型的每个内容进行安全评估，其中包含“超过5%的非法和有害信息”的内容将被列入黑名单。

这样的信息包括“宣扬恐怖主义”或暴力，以及“颠覆社会主义制度”，“损害国家形象”，以及“破坏国家统一和社会稳定”。

草案规定，中国互联网上审查的信息不应该用于训练模型。

该规定的发布时间距离监管机构允许包括搜索引擎巨头百度(9988.HK)在内的几家中国科技公司向公众推出其生成式人工智能驱动的聊天机器人仅有一个多月。

自4月以来，CAC表示希望企业在向公众推出生成式人工智能服务之前向当局提交安全评估。

7月，网络空间监管机构发布了管理此类服务的措施，分析人士表示，这些措施远不及4月草案中概述的措施繁琐。

周三发布的草案安全要求要求训练这些AI模型的组织寻求个人同意，其中包括用于训练目的的个人信息，包括生物识别数据。

他们还详细阐述了如何避免知识产权侵犯的指南。

全球各国都在努力为这项技术设定监管框架。中国视人工智能为一项希望与美国竞争的领域，并计划在2030年成为该领域的世界领导者。