谷歌内部人士质疑Bard AI聊天机器人的实用性 - 彭博社

Davey Alba

2023-10-11

谷歌巴德AI聊天机器人网站在智能手机上。

摄影师：Gabby Jones/Bloomberg数月来，Alphabet Inc.的谷歌和Discord Inc.一直为巴德的重度用户运行一次邀请制聊天。谷歌的产品经理、设计师和工程师们正在使用这个论坛公开讨论AI工具的效果和效用，一些人质疑投入到开发中的巨大资源是否值得。

“我的经验法则是，除非我能独立验证，否则不要相信LLM的输出，”巴德的高级产品经理Dominik Rabiej在七月份在Discord聊天中写道，LLM指的是大型语言模型——这些AI系统是在大量文本上训练的，构成了巴德和OpenAI Inc.的ChatGPT等聊天机器人的基础。“希望能把它发展到一个可以的程度，但目前还没有达到。”

“我仍在思考的最大挑战是：LLMs在帮助方面真正有用吗？”谷歌的用户体验主管Cathy Pearl在八月份说。“真的能产生影响。待定！”

巴德的Discord服务器截图。提供给彭博社自谷歌在三月份发布巴德以来，作为对OpenAI流行的ChatGPT机器人的回应，它已经为该产品添加了一系列新功能，包括AI工具分析照片和在数十种语言中生成查询响应的能力。上个月，谷歌推出了迄今为止最雄心勃勃的更新：将巴德连接到其最受欢迎的服务，如Gmail、地图、文档和YouTube。该公司从9月19日开始推出应用集成，首先是英语。

但随着谷歌进一步将Bard整合到其核心产品中，该公司也遭受了有关该工具生成虚构事实并提供潜在危险建议的投诉。公司推出应用程序扩展的同一天，还宣布在Bard上增加了谷歌搜索按钮，以帮助人们通过与其搜索引擎的结果对比来双重检查该工具生成的AI响应的真实性。

其他专家对数千名低薪承包商培训Bard的工作条件提出了担忧，这些承包商根据工人们所说的复杂指示被要求在几分钟内完成。在公司内外，这家互联网搜索巨头因提供低质量信息以赶超竞争对手的举动而受到批评，同时忽视了伦理关切。

对于谷歌来说，确保其Bard AI聊天机器人的成功至关重要。该公司在搜索领域遥遥领先，这是其母公司Alphabet约80%收入的财务命脉。但随着生成式AI迅速崛起，谷歌的搜索主导地位受到挑战，一些人预测来自OpenAI和其他初创公司的新潮工具可能会颠覆谷歌在市场上的强势地位。

谷歌巴德社区在聊天平台Discord上的两名参与者与彭博社分享了从7月到10月的讨论细节。彭博社审查的数十条消息提供了一个独特的窗口，展示了巴德如何被最了解它的人使用和批评，并显示即使负责开发这个聊天机器人的公司领导人对该工具的潜力也感到矛盾。在谈到“不信任”大型语言模型生成的回复时，Rabiej进一步阐述了关于将人们对巴德的使用限制在“创意/头脑风暴应用”上的建议。 Rabiej说，将巴德用于编码也是一个不错的选择，“因为你不可避免地会验证代码是否有效！”

谷歌在一份声明中表示，在谷歌的Discord频道上关于巴德的限制和潜力的辩论是产品开发的“例行且不足为奇的”部分。 “自从将巴德作为一个实验推出以来，我们一直渴望听取人们对他们喜欢的内容以及我们如何进一步改进体验的反馈，”谷歌发言人Jennifer Rodstrom说。 “我们与使用Discord的人进行讨论的频道是我们这样做的众多方式之一。” 公司补充说，它在将其更广泛地提供之前，已经以邀请制社区的形式推出了Discord服务器。在巴德推出时，公司坦率地谈到了它的局限性，包括AI工具可能生成令人信服的谎言的可能性。每当有人使用巴德时，谷歌都会在工具上包含一项免责声明，其中指出：“巴德可能显示不准确或冒犯性信息，这些信息不代表谷歌的观点。” 公司代表也表示，在巴德推出之前，谷歌进行了对抗性测试 —— 旨在探究如何应对潜在的恶意行为者 —— 并且公司预计随着公众继续使用，将会了解更多。阅读更多：谷歌的AI机器人由“害怕、紧张、待遇不佳”的工人训练

Discord 服务器是在7月份开始的，当时向Bard公司外部的频繁用户发送了数千份邀请。“与Bard背后的团队直接分享想法和观点，提前获得有关产品更新的通知，并与其他人工智能爱好者联系”，7月10日发送的邀请如此说道。服务器描述将该频道称为Bard用户的“官方”社区，Bard的高级产品总监Jack Krawczyk在工具在欧洲推出时向社区发送了自拍视频。

Bard高级产品总监Jack Krawczyk的自拍视频，发布在Discord上。提供给彭博社Discord没有回应有关聊天的请求。

目前有将近9,000人是这个在线社区的成员，其中一些聊天的管理员是Discord的员工。大多数讨论围绕着为Bard和人工智能加油；一些用户对该工具的能力提出了奇幻而可能是误导性的说法，包括他们使用Bard构建了一个量子国际象棋计算机，或者他们可以使用这个机器人在网络上搜索棒球投注赔率数据并运行复杂的模拟。（谷歌员工在Discord聊天中表示Bard没有这些功能。）

丹尼尔·格里芬（Daniel Griffin）是加州大学伯克利分校的最新博士毕业生，他研究网络搜索，并于9月加入了Discord群组，他说，对于开源软件和小型搜索引擎工具来说，为爱好者提供非正式聊天并不罕见。但是格里芬曾批评谷歌如何塑造公众对其产品的解释，他说他对聊天有些保密感到“不舒服”。批评性地写道。

巴德Discord聊天可能只是一个“未公开的、规模庞大且持久的焦点小组或AI爱好者社区，但谷歌的力量和对这些新工具进行公开讨论的重要性让我停下来思考，”他补充道，指出公司的其他社区反馈努力，比如谷歌搜索联络，对公众更加开放。

在巴德论坛上，用户提出了其他棘手的与谷歌相关的问题，揭示了这家科技巨头如何努力减轻公众批评。七月中旬，该群体的一名成员提出了“尼姆布斯计划”这一议题，这是一项价值12亿美元的合同，谷歌和亚马逊公司将向以色列军方提供人工智能工具，根据彭博社对这些消息的审查。该成员对谷歌在促成人工智能致命用途方面的角色提出了担忧，随即被该群体封禁，版主告诉用户他们必须避免在聊天中讨论“政治、宗教或其他敏感话题”。

同月，另一位用户质疑为什么谷歌依赖“待遇不佳且过度劳累的承包商”来完善巴德的回应。尽管公司公开表示并不仅仅依赖承包商来改进巴德的人工智能，而且还有许多其他方法来提高其准确性和质量，但巴德产品管理总监特里斯·瓦肯汀通过强调人类输入对训练巴德算法的重要性做出了回应。

“人类的精炼至关重要，这样巴德才能成为每个人的产品；另一种选择是用户无法引导产品的功能，这在我看来将是一个巨大的错误，” Warkentin 在聊天中写道。“我们不需要一个‘象牙塔’产品 —— 我们需要一款适合每个人使用的产品！”

人们还就维护大型语言模型所需的巨额成本的后果交换了意见。“有没有在减少LLM惊人资源成本方面进行工作？” Discord 服务器中的一位用户问道。“特别是每次查询的用水量，以及对GPU的巨大需求（需要大量的采矿来生产）？”

“我有点把它看作芯片设计… 或者超级计算机，” 巴德用户体验负责人 Pearl 回答道。“我相信我们将继续找到用更少资源实现相同行为的方法。”

巴德的 Discord 服务器截图。提供给彭博社关于巴德准确性的担忧也在聊天中广泛存在。产品经理 Warkentin 在讨论巴德的虚构内容时强调，自从这款人工智能工具发布以来，谷歌已经取得了进展。“我们非常专注于减少幻觉，增加事实性；这是我们的关键成功指标之一，” 他说。“自发布以来，我们已经有了相当大的改进，但这是持续性的工作，所以请继续尝试并在出现问题时向我们发送反馈！”

在九月底，Discord 上的官方巴德账号发布了一个“办公时间”活动的问答总结，旨在回答社区关于巴德与谷歌应用新整合的问题。对于有关巴德在总结电子邮件时是否有偏离现实的可能性的问题，官方巴德账号表示：“我们已经尽力确保这种情况尽可能少发生。但由于巴德仍在学习和成长，这种情况可能会发生。” 人们应该检查巴德使用的来源，并参考它们，账号表示。“如果巴德在任何整合中产生幻觉，请在错误报告频道中告诉我们！”

Rabiej，巴德产品经理，还强调了AI工具新的“双重检查回复”按钮的重要性。他在十月份说：“它会用橙色突出显示可能不正确的内容。”他还重申，巴德并不真正理解其摄入的文本，而是工具根据用户的提示生成更多文本：“记住，巴德，就像任何大型语言模型一样，是生成式的——它不是在查找内容并为您总结，而是在生成文本。”

其他员工对生成式人工智能的态度更加矛盾。在Discord社区中，为巴德设计用户体验的詹姆斯表示：“尽管我通常对Gen AI可能产生的影响持消极态度，但我认为教育是这项技术中最有趣和可能产生最大‘益处领域’之一。”

詹姆斯说，高等和低等教育机构可能会利用这项技术，“通过几乎全天候获得不同学科支持来为学生创造更丰富的体验”，“一旦人们对它的普遍恐惧消失。”