OpenAI推出新系列具备“推理”能力的AI模型 | 路透社
Katie Paul,Anna Tong
OpenAI 标志在2024年5月20日的插图中可见。路透社/Dado Ruvic/插图/档案照片9月12日(路透社) - 微软支持的(MSFT.O) OpenAI 周四表示,它正在推出其“草莓”系列 AI 模型,旨在花更多时间处理查询的答案,以解决难题。这些模型,首次由路透社报道,能够推理复杂任务,并且能够解决比以前的科学、编码和数学模型更具挑战性的问题,该 AI 公司在一篇博客文章中表示。OpenAI 在内部将代号“草莓”用于该项目,同时将周四宣布的模型命名为 o1 和 o1-mini。该公司表示,o1 将从周四开始在 ChatGPT 及其 API 中提供。
OpenAI 的研究员 Noam Brown 专注于提高公司模型的推理能力,他在社交媒体平台 X 上的帖子中确认,这些模型与草莓项目是相同的。
“我很高兴与大家分享我们在 OpenAI 的努力成果,创造出能够进行真正一般推理的 AI 模型,”Brown 写道。
在其博客文章中,OpenAI 表示,o1 模型在国际数学奥林匹克的资格考试中得分为 83%,而其之前的模型 GPT-4o 的得分为 13%。
该模型在竞争编程问题上的表现也有所提高,并在科学问题的基准测试中超越了人类博士级别的准确性,该公司表示。
布朗表示,这些模型能够通过采用一种被称为“链式思维”的推理技术来实现这些分数,该技术涉及将复杂问题分解为更小的逻辑步骤。
研究人员注意到,当这种方法作为提示技术使用时,AI模型在复杂问题上的表现往往会有所改善。OpenAI现在已经自动化了这一能力,使得模型能够自主分解问题,而无需用户提示。
“我们训练这些模型在回应之前花更多时间思考问题,类似于人类的思考方式。通过训练,它们学会了完善自己的思维过程,尝试不同的策略,并识别自己的错误,”OpenAI表示。
路透社是第一个报道OpenAI在推理项目上工作的媒体,当时称为Q*,在2023年11月。它在7月报道该项目已被称为草莓。通过“竞选之路”通讯,获取关于美国选举的每周新闻和分析,以及这些对世界的影响。请在这里注册。