谷歌为ChatGPT竞争对手展示的演示受到一些员工的批评 - 彭博社
Shirin Ghaffary, Davey Alba
桑达尔·皮查伊在五月份于加利福尼亚州山景城举行的Google I/O开发者大会上。
摄影师:大卫·保罗·莫里斯/彭博社本周,谷歌用一段视频演示其新的ChatGPT竞争对手,令观众大为震惊。然而,在某些情况下,这项技术并不像人们想象的那样有效。但首先…
三件事值得知道:
• 欧盟代表们在近24小时的辩论后仍然在人工智能规则上存在分歧• 一家AI驱动的驶入式系统的热门供应商在审核订单时严重依赖人工• 一家航空航天领域的AI初创公司在新融资中估值约3亿美元
谷歌的鸭子问题
当谷歌推出其期待已久的ChatGPT竞争对手Gemini时,最令人瞠目结舌的用例可能涉及一只鸭子。在周三分享的预先录制视频演示中,一个无形的手展示了绘制这种动物。AI系统似乎实时分析着绘制的图像,并以人类声音与用户进行对话。
谷歌CEO桑达尔·皮查伊推广了这段视频,写道:“了解Gemini潜在的惊人能力的最佳方式是亲眼目睹,快来看看⬇️。” X上的其他人表示这个演示“令人惊叹”和“不真实”。
Eli Collins,Google DeepMind产品副总裁告诉彭博社,绘制鸭子的演示仍然是研究级能力,目前至少不在Google的实际产品中。周三发布的Gemini是Google今年全力追赶OpenAI的ChatGPT并重新夺回在人工智能行业中无可争议的领导地位的结果。但是鸭子演示突显了Google人工智能技术的承诺与用户目前能够体验到的差距。Google表示,Gemini是迄今为止其最大、最有能力和灵活的人工智能模型,取代了今年5月发布的PaLM 2。该公司表示,Gemini在30项32个基准测试中超过了领先的人工智能模型,测试包括推理、数学、语言和其他指标。据Google称,Gemini在其中七项基准测试中特别击败了OpenAI最近的人工智能模型GPT-4,尽管其中一些边际很小。Gemini还是多模态的,这意味着它可以理解视频、图像和代码,这使其与只能输入图像和文本的GPT-4有所区别。“对我们来说,这是一个新时代,”Collins在活动结束后接受采访时说。“从研究角度来看,这是V1。这只是个开始。”
Google正在分阶段推出Gemini。Gemini Ultra是最有能力的版本,据该公司称在大多数测试中优于GPT-4,将在明年初发布。其他功能,比如鸭子视频中演示的功能,仍在开发中。
在内部,一些Google员工一直在讨论未在显著位置披露视频是否会误导公众。在公司范围内的论坛上,一名Google员工分享了一个暗示鸭子视频被欺骗性编辑的表情包。另一个表情包展示了荷马·辛普森的卡通形象,自豪地站在他的内裤上,标题是:“Gemini演示”。它与同一姿势的荷马的不那么令人愉快的背面照片形成对比,他的松弛皮肤被挤在一起。标题是:“真实的演示”。
另一位谷歌员工在评论中说,“我猜视频创作者更看重‘讲故事’的方面。”
ChatGPT 对 Gemini:亲身体验
目前,用户可以在谷歌的免费聊天机器人 Bard 中体验 Gemini 的中级版本。该公司表示,这个版本在八项行业基准测试中有六项超过了 OpenAI 的 GPT 模型(GPT 3.5)的可比版本。
在我们自己对新改版的 Bard 进行的有限测试中,我们发现它大多数情况下与 ChatGPT 3.5 相当或更好,并且在某些方面比旧版的 Bard 更好。然而,在某些任务上它仍然不可靠。
在我们用七道 SAT 数学和推理问题来询问 Bard 时,它正确回答了四道,错误回答了两道,并且表示不知道一道的答案。它还正确回答了三道阅读理解问题中的一道。当我们测试 GPT 3.5 时,它得到了类似的结果,但它能够回答一道让 Bard 无法回答的问题。
像所有大型语言模型一样,Bard 仍然会偶尔产生幻觉或提供错误信息。例如,当我们问 Bard 它运行在哪个 AI 模型上时,它错误地告诉我是 PaLM2,而实际上是它之前使用的版本。
在一些规划导向的任务上,Bard 的能力似乎明显优于产品的上一个版本,并且与 ChatGPT 相比也有所改进。例如,当询问如何规划一次迈阿密的女生之旅时,Bard 给出了一个有用的按天分隔的早上、下午和晚上行程安排。第一天,它从当地餐厅的“美味古巴早餐”开始,然后是比斯坎湾的船游和南海滩的夜生活。当我给 ChatGPT 3.5 相同的提示时,答案更长,也不太具体。
为了测试Bard的创造力,我们要求它写一首关于OpenAI最近董事会混乱的诗。它想出了一些忧郁的句子,包括:“OpenAI,在混乱的掌控中/看到愿景破灭,联盟分裂。” GPT 3.5的诗没有很好地捕捉到情绪,因为它只能访问到2022年初的在线信息。“然而,购买ChatGPT 4的人可以获得实时信息,它的诗更贴近主题:“Sam Altman,一个名字,被放在头条/一个受质疑的领导者,一个广阔的未来。”
在我们的采访中,DeepMind的Collins说Bard现在是“世界上最好的免费聊天机器人”之一,拥有Gemini升级。根据我们有限的测试,他可能是对的。
**有关AI的问题?**给我发电子邮件,Shirin Ghaffary,我会尽量在未来的新闻简报中回答你的问题。
本周人物语录
“当我们真正想要的只是能够正常运作的东西时,我们被技术束缚住了。”
道格拉斯·亚当斯,作家### 值得关注的人物
在最新一期的AI IRL中,彭博社探讨了音乐家、出版商和版权所有者对生成式人工智能快速发展的一些最具争议的担忧。彭博社### 深度学习
- 先进微设备推出了新的“加速器芯片”,以比其竞争对手更快地运行AI软件,与芯片巨头英伟达竞争
- Meta和IBM与40家公司合作创建了一个致力于开源AI工作的行业组织
- 众议院共和党人阻止了一项旨在加快芯片开发的法案,这是美国商务部长吉娜·雷蒙多的重要优先事项
- 埃隆·马斯克的xAI初创公司正寻求筹集10亿美元的股权
- 阿里巴巴的“Animate Anyone”图像到视频模型据说是在刮取了著名TikToker的视频进行训练的
彭博社更多内容
获取科技日报以及更多彭博科技周刊,直接发送到您的收件箱:
- 网络安全简报涵盖黑客和网络间谍的阴影世界
- 游戏动态报道视频游戏行业
- 动力源提供苹果独家新闻、消费者科技动态等
- 银幕时光报道好莱坞和硅谷的碰撞
- 声音碎片报道播客、音乐行业和音频趋势