谷歌为ChatGPT竞争对手展示的演示受到一些员工的批评 - 彭博社

Shirin Ghaffary, Davey Alba

2023-12-08

桑达尔·皮查伊在五月份于加利福尼亚州山景城举行的Google I/O开发者大会上。

摄影师：大卫·保罗·莫里斯/彭博社本周，谷歌用一段视频演示其新的ChatGPT竞争对手，令观众大为震惊。然而，在某些情况下，这项技术并不像人们想象的那样有效。但首先…

三件事值得知道：

• 欧盟代表们在近24小时的辩论后仍然在人工智能规则上存在分歧• 一家AI驱动的驶入式系统的热门供应商在审核订单时严重依赖人工• 一家航空航天领域的AI初创公司在新融资中估值约3亿美元

谷歌的鸭子问题

当谷歌推出其期待已久的ChatGPT竞争对手Gemini时，最令人瞠目结舌的用例可能涉及一只鸭子。在周三分享的预先录制视频演示中，一个无形的手展示了绘制这种动物。AI系统似乎实时分析着绘制的图像，并以人类声音与用户进行对话。

谷歌CEO桑达尔·皮查伊推广了这段视频，写道：“了解Gemini潜在的惊人能力的最佳方式是亲眼目睹，快来看看⬇️。” X上的其他人表示这个演示“令人惊叹”和“不真实”。

Eli Collins，Google DeepMind产品副总裁告诉彭博社，绘制鸭子的演示仍然是研究级能力，目前至少不在Google的实际产品中。周三发布的Gemini是Google今年全力追赶OpenAI的ChatGPT并重新夺回在人工智能行业中无可争议的领导地位的结果。但是鸭子演示突显了Google人工智能技术的承诺与用户目前能够体验到的差距。Google表示，Gemini是迄今为止其最大、最有能力和灵活的人工智能模型，取代了今年5月发布的PaLM 2。该公司表示，Gemini在30项32个基准测试中超过了领先的人工智能模型，测试包括推理、数学、语言和其他指标。据Google称，Gemini在其中七项基准测试中特别击败了OpenAI最近的人工智能模型GPT-4，尽管其中一些边际很小。Gemini还是多模态的，这意味着它可以理解视频、图像和代码，这使其与只能输入图像和文本的GPT-4有所区别。“对我们来说，这是一个新时代，”Collins在活动结束后接受采访时说。“从研究角度来看，这是V1。这只是个开始。”

Google正在分阶段推出Gemini。Gemini Ultra是最有能力的版本，据该公司称在大多数测试中优于GPT-4，将在明年初发布。其他功能，比如鸭子视频中演示的功能，仍在开发中。

在内部，一些Google员工一直在讨论未在显著位置披露视频是否会误导公众。在公司范围内的论坛上，一名Google员工分享了一个暗示鸭子视频被欺骗性编辑的表情包。另一个表情包展示了荷马·辛普森的卡通形象，自豪地站在他的内裤上，标题是：“Gemini演示”。它与同一姿势的荷马的不那么令人愉快的背面照片形成对比，他的松弛皮肤被挤在一起。标题是：“真实的演示”。

另一位谷歌员工在评论中说，“我猜视频创作者更看重‘讲故事’的方面。”

ChatGPT 对 Gemini：亲身体验

目前，用户可以在谷歌的免费聊天机器人 Bard 中体验 Gemini 的中级版本。该公司表示，这个版本在八项行业基准测试中有六项超过了 OpenAI 的 GPT 模型（GPT 3.5）的可比版本。

在我们自己对新改版的 Bard 进行的有限测试中，我们发现它大多数情况下与 ChatGPT 3.5 相当或更好，并且在某些方面比旧版的 Bard 更好。然而，在某些任务上它仍然不可靠。

在我们用七道 SAT 数学和推理问题来询问 Bard 时，它正确回答了四道，错误回答了两道，并且表示不知道一道的答案。它还正确回答了三道阅读理解问题中的一道。当我们测试 GPT 3.5 时，它得到了类似的结果，但它能够回答一道让 Bard 无法回答的问题。

像所有大型语言模型一样，Bard 仍然会偶尔产生幻觉或提供错误信息。例如，当我们问 Bard 它运行在哪个 AI 模型上时，它错误地告诉我是 PaLM2，而实际上是它之前使用的版本。

在一些规划导向的任务上，Bard 的能力似乎明显优于产品的上一个版本，并且与 ChatGPT 相比也有所改进。例如，当询问如何规划一次迈阿密的女生之旅时，Bard 给出了一个有用的按天分隔的早上、下午和晚上行程安排。第一天，它从当地餐厅的“美味古巴早餐”开始，然后是比斯坎湾的船游和南海滩的夜生活。当我给 ChatGPT 3.5 相同的提示时，答案更长，也不太具体。

为了测试Bard的创造力，我们要求它写一首关于OpenAI最近董事会混乱的诗。它想出了一些忧郁的句子，包括：“OpenAI，在混乱的掌控中/看到愿景破灭，联盟分裂。” GPT 3.5的诗没有很好地捕捉到情绪，因为它只能访问到2022年初的在线信息。“然而，购买ChatGPT 4的人可以获得实时信息，它的诗更贴近主题：“Sam Altman，一个名字，被放在头条/一个受质疑的领导者，一个广阔的未来。”

在我们的采访中，DeepMind的Collins说Bard现在是“世界上最好的免费聊天机器人”之一，拥有Gemini升级。根据我们有限的测试，他可能是对的。

**有关AI的问题？**给我发电子邮件，Shirin Ghaffary，我会尽量在未来的新闻简报中回答你的问题。

本周人物语录

“当我们真正想要的只是能够正常运作的东西时，我们被技术束缚住了。”

道格拉斯·亚当斯，作家### 值得关注的人物

先进微设备推出了新的“加速器芯片”，以比其竞争对手更快地运行AI软件，与芯片巨头英伟达竞争
Meta和IBM与40家公司合作创建了一个致力于开源AI工作的行业组织
众议院共和党人阻止了一项旨在加快芯片开发的法案，这是美国商务部长吉娜·雷蒙多的重要优先事项
埃隆·马斯克的xAI初创公司正寻求筹集10亿美元的股权
阿里巴巴的“Animate Anyone”图像到视频模型据说是在刮取了著名TikToker的视频进行训练的

彭博社更多内容

获取科技日报以及更多彭博科技周刊，直接发送到您的收件箱：

网络安全简报涵盖黑客和网络间谍的阴影世界
游戏动态报道视频游戏行业
动力源提供苹果独家新闻、消费者科技动态等
银幕时光报道好莱坞和硅谷的碰撞
声音碎片报道播客、音乐行业和音频趋势