OpenAI推出新系列具备“推理”能力的AI模型 | 路透社

Katie Paul,Anna Tong

2024-09-13

OpenAI 标志在2024年5月20日的插图中可见。路透社/Dado Ruvic/插图/档案照片9月12日（路透社） - 微软支持的(MSFT.O) OpenAI 周四表示，它正在推出其“草莓”系列 AI 模型，旨在花更多时间处理查询的答案，以解决难题。这些模型，首次由路透社报道，能够推理复杂任务，并且能够解决比以前的科学、编码和数学模型更具挑战性的问题，该 AI 公司在一篇博客文章中表示。OpenAI 在内部将代号“草莓”用于该项目，同时将周四宣布的模型命名为 o1 和 o1-mini。该公司表示，o1 将从周四开始在 ChatGPT 及其 API 中提供。

OpenAI 的研究员 Noam Brown 专注于提高公司模型的推理能力，他在社交媒体平台 X 上的帖子中确认，这些模型与草莓项目是相同的。

“我很高兴与大家分享我们在 OpenAI 的努力成果，创造出能够进行真正一般推理的 AI 模型，”Brown 写道。

在其博客文章中，OpenAI 表示，o1 模型在国际数学奥林匹克的资格考试中得分为 83%，而其之前的模型 GPT-4o 的得分为 13%。

该模型在竞争编程问题上的表现也有所提高，并在科学问题的基准测试中超越了人类博士级别的准确性，该公司表示。

布朗表示，这些模型能够通过采用一种被称为“链式思维”的推理技术来实现这些分数，该技术涉及将复杂问题分解为更小的逻辑步骤。

研究人员注意到，当这种方法作为提示技术使用时，AI模型在复杂问题上的表现往往会有所改善。OpenAI现在已经自动化了这一能力，使得模型能够自主分解问题，而无需用户提示。

“我们训练这些模型在回应之前花更多时间思考问题，类似于人类的思考方式。通过训练，它们学会了完善自己的思维过程，尝试不同的策略，并识别自己的错误，”OpenAI表示。

路透社是第一个报道OpenAI在推理项目上工作的媒体，当时称为Q*，在2023年11月。它在7月报道该项目已被称为草莓。通过“竞选之路”通讯，获取关于美国选举的每周新闻和分析，以及这些对世界的影响。请在这里注册。