Meta推出名为“Llama”的大型语言模型AI - 彭博社

Kurt Wagner, Dina Bass

2023-02-25

摄影师：Michael Nagle/BloombergMeta平台公司推出了一款用于构建基于人工智能的聊天机器人和其他产品的研究工具，旨在为其自身的技术在最近专注于互联网竞争对手谷歌和微软公司

该工具LLaMA是Meta在大型语言模型领域的最新尝试，首席执行官马克·扎克伯格在周五的Instagram帖子中表示：“这些模型在生成文本、进行对话、总结书面材料以及解决数学定理或预测蛋白质结构等更复杂任务方面表现出了很大的潜力。”

目前LLaMA尚未在Meta的产品中使用，包括社交网络Facebook和Instagram，据一位发言人称。该公司计划向AI研究人员提供这项技术。

扎克伯格写道：“Meta致力于这种开放式的研究模式。”

大型语言模型是庞大的人工智能系统，吸收大量的数字文本——来自新闻文章、社交媒体帖子或其他互联网来源——并利用这些书面材料训练软件，使其在给定提示或查询时能够预测和生成内容。这些模型可用于撰写文章、撰写推文、生成聊天机器人对话并建议计算机编程代码等任务。

这项技术近几个月来变得越来越受欢迎，也引起了争议，因为越来越多的公司开始构建这些模型并推出基于这些模型的产品测试，突显了科技巨头之间的新竞争领域。微软正在向OpenAI投资数十亿美元，后者是运行ChatGPT聊天机器人的大型语言模型GPT-3的制造商。这家软件制造商本月推出了运行在OpenAI聊天技术上的必应搜索引擎的测试版本，这立即引起了人们对其有时不当回应的担忧。

Alphabet 公司的 Google 拥有一个名为 LaMDA 的模型，或者对话应用语言模型。这家互联网搜索和广告领导者正在测试一款名为 Bard 的基于聊天的、由人工智能驱动的搜索产品，该产品仍然存在一些故障。

Meta 先前推出了一个名为 OPT-175B 的大型语言模型，但 LLaMA 是一个更新且更先进的系统。Meta 去年末发布的另一个模型 Galactica，在研究人员发现它经常向使用者分享偏见或不准确信息后迅速撤回。

Zuckerberg 已经将人工智能作为公司的重中之重，经常在收益电话会议和采访中谈论其对改进 Meta 产品的重要性。虽然 LLaMA 目前并未用于 Meta 产品，但未来有可能会使用。目前，Meta 依靠人工智能进行各种功能，包括内容管理和排名出现在用户动态中的材料。

开源 LLaMA 模型使外部人员更清楚地了解系统的运作方式，调整它以满足自己的需求，并在相关项目上进行合作。去年，Big Science 和 Hugging Face 发布了一个名为 BLOOM 的开源 LLM，旨在使这种技术更易获取。

阅读更多： ChatGPT 重新点燃了谷歌和微软之间的搜索之战