谷歌的Gemini：ChatGPT比较，人工智能能力，开发者访问 - 彭博社

Davey Alba, Shirin Ghaffary

2023-12-06

Alphabet Inc.的谷歌发明了支撑当前人工智能热潮的技术，但其产品在流行度上落后。这家搜索巨头希望通过备受期待的Gemini发布来改变这一状况，这是公司迄今构建的“最大、最有能力的AI模型”。

自从OpenAI去年推出了具有话语聊天机器人ChatGPT的轰动成功以来，越来越多的公司开始尝试生成式人工智能，这种技术可以根据用户的要求自动完成编码、总结报告或创建营销活动等任务。在产品周三发布之前的一次演示中，谷歌强调Gemini是其迄今为止最灵活的模型，因为它有不同的尺寸，包括可以直接在智能手机上运行的版本。这使该程序与其他竞争对手有所区别。

这种人工智能模型是一种用于支撑各种生成式人工智能应用的系统，将有三个版本。它们分别是Gemini Ultra、Gemini Pro和Gemini Nano。谷歌DeepMind的产品副总裁Eli Collins表示，这种多样性意味着Gemini“能够在从移动设备到大规模数据中心的各种设备上运行。”

“长期以来，我们一直希望构建一代新的人工智能模型，受到人们理解和与世界互动方式的启发——一种更像是有帮助的合作者，而不是聪明的软件。”Collins在与记者通话时表示。“Gemini让我们离这个愿景更近了一步。”

在该模型发布之前，公司对Gemini进行了一系列标准行业基准测试，并表示在八项测试中，Gemini Pro在六项中超过了OpenAI的GPT-3.5模型。谷歌表示，Gemini还在对通用语言理解、推理、数学和编码进行的八项基准测试中，超过了OpenAI最新版本GPT-4的七项。与此同时，谷歌估计，该公司最新的生成式人工智能产品AlphaCode 2能够解释和生成代码，在竞争性编程领域超过了85%的竞争对手。该公司将发布一份技术报告，更深入地解释Gemini的模型架构、训练过程和评估。

从星期三开始，想要为智能手机和平板电脑构建Gemini驱动应用程序的Android开发人员将能够注册使用“纳米”版本的AI模型，该模型可以直接在这些设备上运行。谷歌还表示，它立即在其旗舰手机Pixel 8 Pro上启用了Gemini，它将为新的生成式AI功能提供动力，比如能够总结录音电话对话中的要点。下周，谷歌将通过其Vertex AI和AI Studio平台向云客户提供Gemini Pro，该公司表示。

谷歌的AI模型Gemini Ultra将首先在开发人员和企业公司的早期访问计划中提供，有关该计划的详细信息将在下周公布。它将在明年初向公众更广泛地推出。

Gemini还将能够通过Bard与谷歌庞大的应用程序和服务进行集成——Bard是该公司的对话聊天机器人，也是OpenAI的ChatGPT的竞争对手。此前，Bard使用了谷歌的PaLM 2模型，这是该公司在五月份的年度开发者大会上宣布的一个大型语言模型。宣布。

观看：OpenAI灵魂之战内幕

在过去的一年里，谷歌一直面临着重塑其核心搜索业务并应对人工智能程序崛起的压力。尽管该公司长期以来一直被视为人工智能研究的先驱，但一些人批评其管理层在人工智能产品上市方面行动缓慢，特别是在像ChatGPT和图像生成器Dall-E这样的产品取得病毒式成功之后。自从OpenAI在三月份发布了GPT-4以来，谷歌一直在努力重新确立其在该领域的领导地位，包括将其日益成熟的搜索业务注入新技术。

Gemini是公司对市场压力的回应。谷歌表示，这款人工智能模型“本质上是多模态的”，这意味着它从一开始就经过预训练，可以处理用户基于文本和图像的提示。例如，在一个视频演示中，谷歌展示了家长如何通过上传一张数学问题的图片以及工作纸上解决问题的照片来帮助孩子做作业。

“Gemini不仅可以解决这些问题，”谷歌软件工程师泰勒·阿普尔鲍姆在演示中说道，“它还可以阅读答案，理解对错之处，并解释需要更多澄清的概念。”该公司还表示，其“搜索生成体验”——谷歌搜索引擎的实验版本，将在明年整合Gemini的新功能。

然而，公司代表警告称，Gemini仍然容易出现“幻觉”，即由生成式人工智能产生的虚假或捏造信息。柯林斯称这种现象是“一个尚未解决的研究问题”。公司向记者展示的演示是预先录制的。

柯林斯表示，Gemini“拥有任何谷歌人工智能模型中最全面的安全评估”。为了对Gemini进行安全评估，他说，谷歌将人工智能模型暴露于对抗性测试中，即模仿恶意行为者试图利用该程序的提示。测试包括“真实毒性提示”，这是由艾伦人工智能研究所开发的测试，其中包含了来自网络的超过10万个提示，旨在帮助人工智能研究人员检查大型语言模型中的仇恨言论和政治偏见。

该公司还强调该工具将会非常快速。Gemini使用了新的基础超级计算机架构和更新的处理芯片，使其比之前的较小型号运行速度更快，该公司表示。谷歌正在使用新版本的云芯片，云张量处理单元（TPU），这些芯片是公司内部设计的，可以比之前的模型训练快2.8倍。谷歌的机器学习副总裁阿明·瓦达特表示，这种方法为谷歌提供了“对未来标准人工智能基础设施的新视角”。他补充说，该公司仍然使用第三方人工智能芯片来运行其Gemini模型。

Gemini将集成到Bard中，Bard是谷歌的生成式人工智能聊天机器人，于三月份推出，使其能够利用公司最受欢迎的服务，包括Gmail、地图、文档和YouTube。推出将分两个不同阶段进行：从周三开始，Bard将由Gemini Pro提供动力，这将实现高级推理、规划、理解和其他功能。它将能够在170个国家和地区以英语运行，但显然不包括欧洲或英国，该公司表示正在与当地监管机构合作。

明年初，该公司计划推出Bard Advanced，它将由性能更强大的Gemini Ultra模型提供动力。谷歌表示，将很快启动一个可信的测试者计划，以在向公众更广泛推出Bard Advanced之前改进其性能。

谷歌Bard产品副总裁Sissie Hsiao表示，“通过Gemini，Bard将获得迄今为止最大最好的升级，它将开启人们创造、互动和协作的新方式。”