Meta发布了其Llama 3人工智能模型的早期版本 | 路透社

Katie Paul

2024-04-19

Meta首席执行官马克·扎克伯格在Meta Connect活动上发表讲话，屏幕上显示人工智能的字样，地点为Meta总部，位于美国加利福尼亚州门洛帕克，2023年9月27日。路透社/卡洛斯·巴里亚/文件照片纽约，4月18日（路透社）- Meta平台 (META.O)于周四发布了其最新大型语言模型Llama 3的早期版本，以及一个图像生成器，可以在用户输入提示时实时更新图片，以赶上生成式人工智能市场领导者OpenAI。这些模型将集成到其虚拟助手Meta AI中，该公司将其推销为最复杂的免费同行产品之一，引用了在推理、编码和创意写作等主题上与包括字母表的竞争对手在内的对手的性能比较，如谷歌和法国初创公司Mistral AI。更新后的Meta AI助手将在Meta的Facebook、Instagram、WhatsApp和Messenger应用程序中获得更突出的位置，以及一个新的独立网站，使其更直接地与微软支持的OpenAI的热门产品ChatGPT竞争。该网站上迎接访客的登陆页面提示他们尝试让助手创建度假装备清单，与他们一起玩1990年代音乐问答游戏，提供作业帮助，并绘制纽约市天际线的图片。

Meta一直在竭力推出生成式人工智能产品，以挑战OpenAI在技术领域的领先地位，这涉及到对计算基础设施的昂贵改造以及之前独立的研究和产品团队的整合。这家社交媒体巨头一直在公开发布其Llama模型，供开发人员在构建人工智能应用程序时使用，作为其赶上步伐的努力的一部分，因为强大的免费选项可能会阻碍竞争对手通过其专有技术赚取收入的计划。这一策略引起了批评者的安全担忧，他们担心不道德的行为者可能会利用该模型进行构建。

Meta为Llama 3配备了新的计算编码能力，并在训练过程中输入了图像和文本，尽管目前该模型只会输出文本，Meta首席产品官克里斯·考克斯在接受采访时表示。

他补充说，更先进的推理能力，比如制定更长的多步计划的能力，将在随后的版本中推出。Meta在博客文章中表示，计划在未来几个月发布的版本还将具备“多模态”功能，意味着它们可以生成文本和图像。

“最终的目标是帮助减轻你的负担，只是帮助让你的生活更轻松，无论是与企业互动，还是写作，还是计划旅行，”考克斯说。

考克斯表示，将图像纳入Llama 3的训练将增强今年推出的Ray-Ban Meta智能眼镜的更新。使用眼镜制造商Essilor Luxoticca(ESLX.PA)制造的产品，使Meta AI能够识别佩戴者所见物体并回答有关它们的问题。周四晚间，Meta股价上涨了1.8%。

Meta还宣布与谷歌合作，将其实时搜索结果纳入助手的回应中，补充了与微软必应搜索引擎的现有安排。

Meta AI助手正在扩展到美国以外的十多个市场，包括澳大利亚、加拿大、新加坡、尼日利亚和巴基斯坦。Cox表示，Meta正在“努力寻找在欧洲这样做的正确方式”，那里的隐私规定更为严格，即将出台的AI法案可能会要求披露模型的训练数据等要求。生成式AI模型对数据的贪婪需求已经成为技术发展中的一大紧张源。Meta首席执行官马克·扎克伯格在一段附带公告的视频中提到了与OpenAI的竞争，他称Meta AI为“您可以自由使用的最智能的AI助手”。

扎克伯格表示，现在推出的Llama 3的两个较小版本，分别具有80亿和700亿参数，在常用于评估模型质量的性能基准上得分优异。他说，Llama 3的最大版本仍在训练中，具有4000亿参数。

这些结果“无疑令人印象深刻”，但也表明了免费和专有模型之间性能差距不断扩大，AI初创公司Air Street Capital的创始人Nathan Benaich表示。

开发人员抱怨说，模型的上一个Llama 2版本未能理解基本上下文，将关于“杀死”计算机程序的查询与请求指导如何犯罪混淆在一起。竞争对手谷歌也遇到了类似问题，并最近暂停使用其Gemini AI图像生成工具，因为该工具因生成不准确的历史人物形象而受到批评。Meta表示，通过使用“高质量数据”来让Llama 3识别细微差别，已经减少了这些问题。虽然Meta没有详细说明使用的数据集，但它表示，与Llama 2相比，它向Llama 3输入的数据量增加了七倍。

Technology Roundup通讯将最新消息和趋势直接发送到您的收件箱。在这里注册。